撰文 | 小不董
編輯 | 李信馬
題圖 | 毫末智行
自動駕駛也安排上“GPT”了。
4月11日,毫末智行正式官宣首個應用GPT模型和技術邏輯的自動駕駛算法模型,中文名“雪湖·海若”。
微軟CEO納德拉曾說:“深度學習在過去20年或10年取得了巨大進展,大模型將是下一個大事件。”當下國內外人工智能技術大爆發(fā),大模型正在迅速向我們的生活中拓展延伸,相對來說,國外科技巨頭的步伐更快一步,但在自動駕駛領域,毫末智行所發(fā)布的DriveGPT,卻是全球首個自動駕駛生成式大模型,這在讓人欣喜的同時,也不禁產生疑問:自動駕駛也需要GPT嗎?DriveGPT是真的“為天下先”,還是噱頭居多?
I、何為“雪湖·海若”?
海若,出自《莊子·秋水》,河伯請教北海若,何謂大小之分,北海若教導,不因天地而覺大,不因毫末而覺小。因此,毫末把DriveGPT中文名命名為“雪湖·海若”,寓意智慧包容、海納百川。
要回答上面兩個問題,首先要回答,雪湖·海若是不是“GPT”?
GPT,全稱Generative Pre-trained Transformer,即生成式預訓練大模型,本質上是在求解下一個詞出現的概率,這是它的數學原理,每一次調用都是從概率分布中抽樣并生成一個詞,這樣不斷地循環(huán),就能生成一連串的字符,用于各種下游任務。
其實在ChatGPT大火之前,GPT就已經用在了其他領域,比如2021年7月的CodeX,也就是CodeGPT,可以用于代碼生成,提升寫代碼的效率,還有2021年12月發(fā)布的WebGPT,可以讓GPT利用搜索引擎,主動搜索結果并匯總整理出答案,也就是近期微軟發(fā)布的New Bing搜索。所以,GPT本身是一種非常通用的建模范式,能應用的領域非常之多。
DriveGPT整體的訓練邏輯和使用的算法,與ChatGPT大體相似,不過由于領域不同,所以只在自己的特定條件下實行,性質不完全相同,但仍是“GPT”。
自動駕駛也需要GPT嗎?
這個問題其實在數年前就有企業(yè)進行了探索。當前,全球范圍內有機會沖擊1億公里級運營里程俱樂部的有兩家企業(yè):一個是特斯拉,基于百萬級車主的參與,其FSD累積行駛里程將沖向1億英里;另一個就是毫末智行。
2019年,時任特斯拉AI總負責人安德魯·卡帕西(Andrej Karpathy)提出,特斯拉自動駕駛要像人一樣開車,要在2021年取消激光雷達,并引入“大模型”對特斯拉的自動駕駛系統(tǒng)進行訓練,同年發(fā)布了Dojo超級計算系統(tǒng)(Dojo是特斯拉自研的超級計算機系統(tǒng),能夠利用海量視頻數據,完成“無人監(jiān)管”的標注和訓練)。
2020年,特斯拉宣布將基于深度神經網絡的大模型引入其自動駕駛之中,到現在已實現了純視覺FSD Beta的大規(guī)模公測。特斯拉FSD系統(tǒng)即全自動駕駛系統(tǒng),包括了自動駕駛導航、自動變道、自動泊車、召喚和交通燈以及停車標志控制等功能。截止到2022AI DAY,特斯拉已在超過16萬輛車上進行了FSD Beta版系統(tǒng)測試,僅一年內就訓練了7.5萬個神經網絡模型。
在國內,毫末智行率先引入了Transformer的技術,之后也是最早建立自己超算中心的自動駕駛企業(yè)。2021年,毫末智行在推出數據智能體系MANA的同時,也宣布要借助大模型提升數據處理能力,從而加速HPilot智能輔助駕駛產品的進化。
今年1月5日,毫末智行舉辦AI DAY,在自動駕駛數據智能體系MANA(雪湖)的基礎上,推出了新的智算中心MANA OASIS(雪湖·綠洲)。毫末智行董事長張凱在現場說到:“隨著自動駕駛企業(yè)向3.0時代邁進,大模型+大數據的數據驅動模式,成為自動駕駛技術進化的關鍵,而驅動大模型和海量數據訓練的超算中心將成為自動駕駛企業(yè)的入門配置?!?/p>
2、加速進入自動駕駛3.0時代
如果將自動駕駛的發(fā)展分為三個階段,那么在自動駕駛3.0時代,DriveGPT可以說是應運而生。
1.0時代是硬件驅動的,從谷歌等科技巨頭的初代無人車開始的自動駕駛1.0時代,這一階段硬件就是自動駕駛的能力上限,特別是雷達傳感器,其數量越多、性能越強,對應的自動駕駛智能化程度就越高。其明顯問題就是,整車成本居高不下,改造成本動輒上百萬;以及智能化程度較低,行駛里程較短,在100萬公里內。
2.0時代是軟件驅動的,自2016年AlphaGo戰(zhàn)勝李世石后,掀起了一陣以深度學習為基礎的AI技術潮,大幅降低了單車成本的同時,自動駕駛里程逐漸增加至上千萬公里。
圖片來源:IC Photo
而3.0時代是數據驅動的,AI依然是核心技術,不同就在于AI對數據的要求發(fā)生了質變,“大模型”成為新的技術基石。
工信部數據顯示,2022上半年L2 級輔助駕駛乘用車新車市場滲透率達到 30%,同比增加 12.7%。中國自動駕駛在多方也取得了突破,來自2022世界智能網聯汽車大會的消息顯示,全國開放各級測試公路超過7000公里,實際道路測試里程超過1500萬公里,自動駕駛出租車、無人巴士、自主代客泊車、干線物流以及無人配送等多場景示范應用有序開展。
技術方面呈現了一個新的趨勢:不再是硬件或者軟件驅動,不再是測試道路下的數據驅動,而是以真實道路行駛場景為核心的數據驅動,這便是自動駕駛3.0。
隨著用戶更高頻地開啟輔助駕駛功能,智駕行駛的行駛里程和使用頻率呈現指數級提升,足夠規(guī)模和多樣化的數據帶來數據積累的優(yōu)勢,可以更好驅動自動駕駛技術的快速迭代升級。生成式大模型已成為自動駕駛系統(tǒng)進化的關鍵,基于Transformer大模型訓練的感知、認知算法,將逐步在車端進行落地部署?;谧詣玉{駛數據的大規(guī)模增長,以及大模型的深入應用,也讓智算中心成為自動駕駛行業(yè)的“新基建”。
3、DriveGPT是怎樣煉成的?
DriveGPT自動駕駛認知大模型也采用了RLHF(人類反饋強化技術)算法,通過不斷輸入真實人駕接管數據,持續(xù)優(yōu)化自動駕駛決策模型,簡單來說就是它會借鑒海量真實駕駛數據,從而做出自己的最優(yōu)解。
不同路況、天氣和變量下,自動駕駛如何應變?這就需要一個強大的模擬人類思維的模型,GPT相關的AI軟件就是為此而生。
首先,把感知和認知相關大模型能力統(tǒng)一整合到DriveGPT——也就是自動駕駛生成式大模型中;其次,計算基礎服務針對大模型訓練在參數規(guī)模、穩(wěn)定性和效率方面做了專項優(yōu)化,并集成到OASIS當中。增加了使用NeRF技術的數據合成服務,降低Corner Case數據的獲取成本;另外,毫末智行還針對多種芯片和多種車型的快速交付難題,優(yōu)化了異構部署工具和車型適配工具。
自動駕駛中不可或缺的視覺感知上,其核心目的就是恢復真實世界的動靜態(tài)信息和紋理分布,毫末智行對視覺自監(jiān)督大模型做了一次架構升級,將預測環(huán)境的三維結構,速度場和紋理分布融合到一個訓練目標里面,強迫模型練好內功,之后面對各種具體任務都能“胸有成竹”。
據現場演講介紹,DriveGPT雪湖·海若具有三個能力:
DriveGPT雪湖·海若的一個關鍵設計,就是場景的Token化表達,毫末智行把這種方式叫做Drive Language。
目前毫末智行Token的詞表空間是50萬個左右,DriveGPT雪湖·海若就像一部推理機器,你告訴它過去發(fā)生了什么,它按概率推理出未來多個可能。通過對于不同場景“優(yōu)勝劣汰”,DriveGPT最后把參數更新到一個備份模型(Active Model)中,通過強化學習的方式,生成的效果就會有一個明顯地提升。
圖片來源:毫末智行
相比特斯拉FSD的百萬+量產車下線,中國企業(yè)與之的距離相去甚遠。要突破自動駕駛的長尾效應,就要不斷擴大道路行駛場景。毫末智行CEO顧維灝在現場說到:“DriveGPT雪湖·海若可以逐步應用到城市NOH、捷徑推薦、智能陪練以及脫困場景中。有了DriveGPT的加持,車輛行駛會更安全;動作更人性、更絲滑,并有合理的邏輯告訴駕駛者,車輛為何選擇這樣的決策動作。對于普通用戶來說,車輛越來越像老司機?!?/p>
4、大考之年,枕戈待旦
2022年,中國市場乘用車高級別輔助駕駛前裝搭載率升至29.40%,前裝標配交付585.99萬輛。毫末智行曾在去年預估,到2025年高級別輔助駕駛搭載率超過70%。這意味著從今年開始,智駕產品進入一個快速增長的全線爆發(fā)期。
這也說明,城市導航輔助駕駛產品在2023年將圍繞量產交付發(fā)力,幾個主要玩家的城市導航輔助駕駛產品將會進入到真實用戶交付和多城市并行落地的比拼中。其次,行泊一體和無人車的商業(yè)化將成為自動駕駛公司深耕的重點。搭載低成本行泊一體功能的智駕產品將迎來一個前裝量產的高潮,高速導航輔助駕駛、自主泊車等產品的體驗也會迎來全面升級,車主的使用頻率和滿意度將成為產品競爭力的主要衡量標準。
在這些趨勢之下,毫末智行迎來了它的沖刺大考之年。
圖片來源:毫末智行
據了解,毫末智行DriveGPT雪湖·海若大模型的成果將首發(fā)落地在搭載毫末智行HPilot3.0的新摩卡DHT-PHEV上,此款車型上市后,我們就能看到,DriveGPT是否真的能提供優(yōu)秀的駕駛體驗。
圖片來源:毫末智行
“很多人問我,為什么毫末智行要探討雪湖·海若?背后是毫末智行踏踏實實的在做技術,踏踏實實的實現未來。毫末智行成立到現在接近三年半時間。這三年多時間,很多事物都發(fā)生了變化,但是毫末智行對技術的堅定投入始終未變。我們始終熱愛技術,枕戈待旦,全力沖刺。再難,我們都不會放棄。”顧維灝總結道。