地平線陳黎明:2025年,自動(dòng)駕駛將迎來(lái)ChatGPT時(shí)刻

7月14日消息,在2024中國(guó)汽車論壇上,地平線總裁陳黎明發(fā)表了主題為《產(chǎn)研向高而行,解鎖高階智駕新思路》的演講。

地平線總裁 陳黎明

陳黎明本次演講的核心觀點(diǎn)包括:

1、2025年,自動(dòng)駕駛將迎來(lái)ChatGPT時(shí)刻。當(dāng)下的城區(qū)NOA大部分還處于可用階段,還沒(méi)有達(dá)到好用的階段。

2、真正“好用”的智駕2.0的系統(tǒng),要提供擬人化的智駕體驗(yàn)。用戶亟需好用的城區(qū)NOA 2.0系統(tǒng),需要實(shí)現(xiàn)通行效率、駕駛擬人、場(chǎng)景通過(guò)率的全面突破。

3、智駕系統(tǒng)要做到“好用”,要解決“Scale Out”和“Scale Up”難題。所謂scale up,在特定、固定、受控的小ODD范圍內(nèi)實(shí)現(xiàn)性能最優(yōu),能夠處理很多復(fù)雜的場(chǎng)景。追求的目標(biāo),是要實(shí)現(xiàn)在一個(gè)能夠scale up更好的上限,同時(shí)在所有的地方都能夠開。要解決這個(gè)問(wèn)題核心的要素就是四個(gè):算法、算力、數(shù)據(jù)、工程能力。算法是決定了整個(gè)系統(tǒng)的性能的上限,算力和數(shù)據(jù)是決定了技術(shù)迭代速度,工程能力決定了整個(gè)量產(chǎn)化的規(guī)模和用戶的體驗(yàn)。

4、從規(guī)則驅(qū)動(dòng)到數(shù)據(jù)驅(qū)動(dòng),算法技術(shù)迭代的“蹺蹺板效應(yīng)”無(wú)法全面提升系統(tǒng)能力。無(wú)論是基于規(guī)則,還是數(shù)據(jù)驅(qū)動(dòng)的端到端系統(tǒng),單一都無(wú)法全面提升系統(tǒng)能力,不得不在系統(tǒng)上限的提升和系統(tǒng)下限的保障二者之間做取舍。

以下為陳黎明演講全文:

尊敬的各位嘉賓、各位業(yè)界同仁,大家上午好!我是地平線陳黎明,今天要給大家匯報(bào)的題目是:產(chǎn)研向高而行,解鎖高階智駕新思路。

首先我們來(lái)看一下,大家都知道現(xiàn)在正處在新能源汽車下半場(chǎng),也就是我們講的高階自動(dòng)駕駛和智能座艙。我們看到目前20萬(wàn)以上的車NOA的配備率還在不斷的增加,從22年到23年,20到30萬(wàn)之間的車NOA的裝配率增長(zhǎng)了24個(gè)百分點(diǎn),30萬(wàn)以上的車NOA的裝配率增長(zhǎng)了19個(gè)百分點(diǎn)。而且今年目前我們看到大概前十個(gè)高端車型當(dāng)中有八款都配備了NOA,所以我們看到高階自動(dòng)駕駛正在迎來(lái)增長(zhǎng)的拐點(diǎn)。

另外我們?cè)賮?lái)看一下關(guān)于行業(yè)里近期熱聊的端到端。大家都知道2022年初的時(shí)候openAI的ChatGPT在AlphaGo之后又帶來(lái)了很大的驚喜,充分展現(xiàn)了AI的能力和巨大的潛能,今年特斯拉推出了基于端到端大模型的FSD v12.3,在自動(dòng)駕駛領(lǐng)域也給我們比較驚艷的亮相,讓我們看到了端到端大模型在自動(dòng)駕駛應(yīng)用上的潛能,并且開始落地。

我們認(rèn)為,2025年,自動(dòng)駕駛將迎來(lái)ChatGPT時(shí)刻。

什么是ChatGPT時(shí)刻?我們認(rèn)為它不光是整個(gè)的性能,最關(guān)鍵的是產(chǎn)品的體驗(yàn),是產(chǎn)品的可用性與好用性。

目前我們看到當(dāng)下的城區(qū)NOA大部分還處于可用階段,還沒(méi)有達(dá)到好用的階段。主要的問(wèn)題還是在于比較“慫”,還有一個(gè)問(wèn)題是比較魯莽,再有一個(gè)是通過(guò)率比較低。

我們都知道終端用戶需要一個(gè)更好用的智能駕駛系統(tǒng)。它應(yīng)該是能夠帶來(lái)更加擬人的智駕感受。我們講的智能駕駛1.0“可用”,只是解決了物理安全的問(wèn)題?!昂糜谩辈坏鉀Q物理安全的問(wèn)題,還要解決用戶心理安全的問(wèn)題。所以在實(shí)現(xiàn)通行效率、擬人駕駛、場(chǎng)景通過(guò)率方面都要進(jìn)行全面的突破。

當(dāng)然除了“好用”之外,還要做到"愛(ài)用",需要進(jìn)一步普及到每個(gè)用戶,使得每個(gè)人都可以用,就是我們講的高階自動(dòng)駕駛的平權(quán)化。這些思考不僅僅是技術(shù)思維,更多的是產(chǎn)品思維、是用戶價(jià)值思維。以用戶價(jià)值為先,驅(qū)動(dòng)我們?nèi)ソ怄i高階智駕新思路。

要解決“好用”的問(wèn)題,我們認(rèn)為首先要解決自動(dòng)駕駛的scale up和scale out的難題。所謂scale up,在特定、固定、受控的小ODD范圍內(nèi)實(shí)現(xiàn)性能最優(yōu),已經(jīng)達(dá)到了很高的性能,能夠處理很多復(fù)雜的場(chǎng)景。但是在于廣泛的場(chǎng)景應(yīng)用里面,我們能夠看到性能的上限非常的低,就是剛才我們講的慫、魯莽這些行為。使得整個(gè)自動(dòng)駕駛的應(yīng)用還受限于一些相對(duì)小的范圍,在大范圍上體驗(yàn)不好。

我們追求的目標(biāo)是要實(shí)現(xiàn)在一個(gè)能夠scale up更好的上限,同時(shí)在所有的地方都能夠開。

要解決這個(gè)問(wèn)題核心的要素就是四個(gè):算法、算力、數(shù)據(jù)、工程能力。算法是決定了整個(gè)系統(tǒng)的性能的上限,然后算力和數(shù)據(jù)是決定了技術(shù)迭代速度。工程能力決定了整個(gè)量產(chǎn)化的規(guī)模和用戶的體驗(yàn)。

我們看一下算法方面,目前兩大主要的開發(fā)范式:一個(gè)是基于Rule-based,我們講的是Conventional開發(fā)范式,Software 1.0。還有一個(gè)基于數(shù)據(jù)驅(qū)動(dòng)的開發(fā)范式,業(yè)界叫做Software 2.0。兩個(gè)各有利弊,軟件1.0基于大量人工規(guī)則,系統(tǒng)上限低,下限可控;軟件2.0,數(shù)據(jù)驅(qū)動(dòng)的端到端系統(tǒng),實(shí)現(xiàn)信息無(wú)損傳遞,系統(tǒng)上限高,而下限不可控。所以這里就出現(xiàn)了兩種開發(fā)范式和路徑的“翹翹板”,無(wú)論是rule-based,還是數(shù)據(jù)驅(qū)動(dòng)的端到端系統(tǒng),單一都無(wú)法全面提升系統(tǒng)能力,不得不在系統(tǒng)上限的提升和系統(tǒng)下限的保障二者之間做取舍。

對(duì)于自動(dòng)駕駛來(lái)說(shuō),我們既要能夠有很好的技術(shù)體驗(yàn),同時(shí)又要非常安全,再加上能夠快速地去推廣應(yīng)用,這是我們的既要又要且要。

從地平線來(lái)講,我們認(rèn)為采用一個(gè)端到端和交互博弈的解決方案,能夠比較好地解決scale out和scale up的難題。我們采用了“三網(wǎng)合一”的端到端大模型,在這個(gè)大模型里面它能夠把傳感器的數(shù)據(jù)和地圖和導(dǎo)航信息輸入大模型進(jìn)行訓(xùn)練。在這個(gè)模型里面它通過(guò)不丟失信息的情況下對(duì)周邊世界進(jìn)行更好的感知,通過(guò)動(dòng)靜態(tài)的推理還有數(shù)據(jù)的訓(xùn)練,能夠產(chǎn)生出動(dòng)靜態(tài)目標(biāo)。除此之外還能夠輸出一個(gè)機(jī)器能讀懂的高維特征級(jí)信息,給到下一個(gè)模塊,也就是交互博弈模塊。這個(gè)模塊有兩個(gè)部分組成:一個(gè)是神經(jīng)網(wǎng)絡(luò)的模塊,再一個(gè)是基于Rule-based的模塊。神經(jīng)網(wǎng)絡(luò)能夠提高整個(gè)系統(tǒng)上限,同時(shí)基于Rule-based的模塊可以做好安全兜底,確保系統(tǒng)下限。

通過(guò)“三網(wǎng)合一”端到端,再加上交互博弈架構(gòu)和算法,能夠比較好的解決scale out和scale up。

地平線作為一家軟件算法基因出身的公司,我們首先考慮問(wèn)題還是從軟件的方面考慮怎么解決自動(dòng)駕駛的問(wèn)題。在過(guò)去九年當(dāng)中,地平線在創(chuàng)新技術(shù)方面也有很多的積累,在這里給大家做幾個(gè)分享。

2022年地平線提出了Sparse4D的架構(gòu),它是行業(yè)比較領(lǐng)先的高性能,高效率,長(zhǎng)時(shí)序、純稀疏融合感知架構(gòu),它通過(guò)長(zhǎng)時(shí)序純稀疏還有端到端很好解決了之前或者現(xiàn)在用的BEV+Transformer架構(gòu)里面的感知范圍和精度以及與計(jì)算效率的矛盾,打造了一個(gè)比較好的端到端的感知基座。同時(shí)它在各方面的性能表現(xiàn)都遠(yuǎn)好于其他的架構(gòu),特別是在nuScenes公開數(shù)據(jù)集排行榜第一。所以它是接棒“BEV+Transformer”的下一代架構(gòu)。通過(guò)和BEVFormer的對(duì)比,可以看到在夜間城區(qū)密集人群的精準(zhǔn)感知、遠(yuǎn)距離及時(shí)感知的場(chǎng)景下,Sparse4D的感知結(jié)果都更精準(zhǔn)。

另外地平線學(xué)者在2022年底的時(shí)候發(fā)表了一篇自動(dòng)駕駛大模型UniAD的文章,也是首次實(shí)現(xiàn)了整體框架下的端到端訓(xùn)練。在9000多篇論文里面獲得了去年計(jì)算機(jī)視覺(jué)和模式識(shí)別CVPR大會(huì)的最佳論文,這也是第一次自動(dòng)駕駛領(lǐng)域的文章在CVPR年會(huì)上獲得最佳論文。

UniAD它首次將檢測(cè)、跟蹤、建圖、軌跡預(yù)測(cè)、占據(jù)網(wǎng)格預(yù)測(cè)以及規(guī)劃整合到一個(gè)基于Transformer框架里面的大模型里面,實(shí)現(xiàn)感知的一體化,它相對(duì)于黑盒的我們講的端到端,它更可控、可解釋、可拓展,是一個(gè)比較好的架構(gòu)。它在NuScenes數(shù)據(jù)集上獲得了SOTA(state of the art),評(píng)測(cè)結(jié)果最優(yōu)。同時(shí),我們這個(gè)算法也在業(yè)界作為一個(gè)Benchmark,當(dāng)下產(chǎn)業(yè)界的很多端到端都有受UniAD啟發(fā)開啟端到端的上車應(yīng)用,學(xué)術(shù)與科研界也以UniAD作為標(biāo)桿去benchmark。

除此之外,同時(shí)地平線還采用了模仿強(qiáng)化混合學(xué)習(xí)技術(shù),在這方面進(jìn)行深度創(chuàng)新和積累,使得整個(gè)自動(dòng)駕駛更擬人、更安全。

基于模仿的開環(huán)學(xué)習(xí)方式不能很好的解決長(zhǎng)尾問(wèn)題。交互式的規(guī)控學(xué)習(xí)采用混合強(qiáng)化學(xué)習(xí)方式,一方面通過(guò)模仿學(xué)習(xí)提高學(xué)習(xí)效率,另一方面通過(guò)閉環(huán)強(qiáng)化學(xué)習(xí)克服模仿學(xué)習(xí)在長(zhǎng)尾等方面存在的缺陷,可以很好地解決長(zhǎng)尾問(wèn)題。這樣使得整個(gè)交互博弈當(dāng)中能夠更好的進(jìn)行跟周邊的交互,同時(shí)實(shí)現(xiàn)更好的擬人性,整個(gè)安全性和舒適度都得到了很大的提升。

那么再好的算法如果沒(méi)有相應(yīng)的芯片來(lái)承載,實(shí)際上是無(wú)法變成產(chǎn)品的。所以接下來(lái)我就介紹一下地平線在硬件、技術(shù)和產(chǎn)品方面的最新的一些結(jié)果。

這個(gè)是地平線2016年提出來(lái)一個(gè)“智能計(jì)算的新摩爾定律”。

這個(gè)為我們地平線也是為其他行業(yè)的同仁提供了一個(gè)芯片設(shè)計(jì)和性能提升的方向,定義智能計(jì)算最優(yōu)解。新摩爾定律的公式也很簡(jiǎn)單,是一個(gè)簡(jiǎn)單的乘法。就是說(shuō)我把單位成本下的計(jì)算性能作為目標(biāo),把這個(gè)目標(biāo)分解成三個(gè)因子:

第一個(gè)因子就是大家耳熟能詳?shù)腡OPS per dollar,花每塊錢能買多少算力,這是經(jīng)典的理論峰值計(jì)算效率,通常來(lái)講要靠?jī)杉虑閬?lái)做到,第一個(gè)就是摩爾定律,第二就是創(chuàng)新型的硬件架構(gòu)設(shè)計(jì);

第二個(gè)指標(biāo)是叫Utilization rate(有效利用率),有了計(jì)算資源,怎么樣充分利用?涉及到編譯器、Runtime等等軟件和硬件的協(xié)同優(yōu)化,充分提升計(jì)算利用率;

第三是算法效率。每TOPS算力上能實(shí)現(xiàn)的算法效率,這取決于算法先進(jìn)性來(lái)實(shí)現(xiàn)計(jì)算效率提升。

可以說(shuō),地平線“三項(xiàng)全能”——在硬件的架構(gòu)、軟件中間層的優(yōu)化、算法的創(chuàng)新上,都聚焦于軟硬協(xié)同,永遠(yuǎn)以更低的成本去獲得更高的計(jì)算性能。

前面講了我們?cè)谒惴ㄉ嫌泻芏嗟姆e累,這些積累就是指導(dǎo)我們?nèi)ピO(shè)計(jì)我們的硬件架構(gòu)。

這體現(xiàn)在這幾個(gè)方面,一個(gè)是通過(guò)三級(jí)存儲(chǔ)架構(gòu),多脈動(dòng)的立方加速引擎,還有多項(xiàng)數(shù)據(jù)流動(dòng)等等來(lái)減少核內(nèi)核間以及片間的數(shù)據(jù)的流動(dòng),提高它的使用率,同時(shí)降低對(duì)帶寬的占用。另外通過(guò)虛擬化,數(shù)據(jù)變換引擎等等這些,來(lái)支持先進(jìn)的算子和加速計(jì)算。同時(shí)通過(guò)所有這些優(yōu)化,大大降低對(duì)計(jì)算的功耗,也使得我們整個(gè)芯片的性能能夠保持在一個(gè)非常好的水平。

軟硬結(jié)合,超越摩爾定律。我們?cè)賮?lái)看一下“新摩爾定律”帶來(lái)性能的提升,左邊是傳統(tǒng)的摩爾定律,在6年可以看到它的性能提升16倍?;谲浻步Y(jié)合的“新摩爾定律”,我們BPU的計(jì)算性能對(duì)于傳統(tǒng)主流的CNN神經(jīng)網(wǎng)絡(luò)它在6年里面提升了246倍。對(duì)于現(xiàn)在的Transformer來(lái)講,在三年里面提升了27倍。實(shí)際上我們通過(guò)軟件和硬件的優(yōu)化,遠(yuǎn)超摩爾定律提升的速度。

總結(jié)一下,我們用軟硬結(jié)合的技術(shù)實(shí)力推動(dòng)智能駕駛從“可用”到“好用”最后到“愛(ài)用”。最主要的是通過(guò)端到端的技術(shù),通過(guò)深度學(xué)習(xí)人類的駕駛行為和擬人的體驗(yàn)帶來(lái)心理安全,更加擬人、更像老司機(jī)。通過(guò)交互博弈,通過(guò)舉一反三處理極限的場(chǎng)景,更好的適應(yīng)客觀世界的復(fù)雜性,能夠做到每時(shí)每刻。

再就是通過(guò)我們產(chǎn)品BPU,我們的芯片,提升它的性能,同時(shí)降低成本,來(lái)使得我們的高階自動(dòng)駕駛更快的普及到我們每個(gè)駕駛員,使得每個(gè)人都可以用得起。

接下來(lái)我再把通過(guò)我們技術(shù)的積累,最新的產(chǎn)品給大家做一個(gè)介紹。今年四月份我們發(fā)布了兩款產(chǎn)品,一個(gè)是硬件產(chǎn)品,一個(gè)是軟件產(chǎn)品。硬件產(chǎn)品就是征程6系列,相對(duì)于之前的三代產(chǎn)品征程2、征程3、征程5都是單芯片,征程6是一個(gè)家族,總共有6款芯片,主要覆蓋低中高階智能駕駛應(yīng)用。所以在整個(gè)智能駕駛的應(yīng)用當(dāng)中,總有一款芯片適合我們的合作伙伴,它帶來(lái)的好處是基于同樣的開發(fā)環(huán)境、開發(fā)工具鏈能夠大大提升我們合作伙伴的開發(fā)效率,同時(shí)降低開發(fā)成本,能夠加速整個(gè)自動(dòng)駕駛的應(yīng)用落地。

再一個(gè)我們發(fā)布了第二個(gè)產(chǎn)品,我們叫做Horizon SuperDrive,這個(gè)是全場(chǎng)景智能駕駛解決方案,我們希望基于我們的軟件、算法研究還有我們最新芯片的基礎(chǔ)上打造一個(gè)“樣板間”,充分展現(xiàn)在技術(shù)上限上,自動(dòng)駕駛能夠解決什么樣的問(wèn)題,能夠怎么樣更好的來(lái)解決我們目前遇到的很多困難的場(chǎng)景。通過(guò)我們?nèi)W(wǎng)合一端到端的技術(shù),還有交互博弈,還有征程6的芯片,我們追求的是像老司機(jī)一樣優(yōu)雅和從容的駕駛。它會(huì)覆蓋全場(chǎng)景,包括城區(qū)、高速和泊車產(chǎn)品,實(shí)現(xiàn)全場(chǎng)景無(wú)差別的高階智駕。

下面看一下我們的SuperDrive在復(fù)雜場(chǎng)景里面的表現(xiàn),左上角是交通很擁堵的時(shí)候換道,是我們自車和其他汽車的博弈,我們的系統(tǒng)實(shí)在過(guò)不去會(huì)讓一下,如果有縫就會(huì)很自信的插進(jìn)去。

第二個(gè)是路口的左轉(zhuǎn)交互博弈,大家可以看到車流量很大,這個(gè)場(chǎng)景化左邊的車實(shí)際上很多,這個(gè)時(shí)候要見(jiàn)縫插針能夠轉(zhuǎn)過(guò)去,沒(méi)有一定的技術(shù)的上限,沒(méi)有這種自信,你是沒(méi)有辦法在這個(gè)情況下進(jìn)行左轉(zhuǎn)的。

右邊是一個(gè)城區(qū),城市里面的一個(gè)環(huán)島,這個(gè)里面也是非常復(fù)雜的場(chǎng)景,它有反向的車、也有人,有一些場(chǎng)景你是沒(méi)有辦法第一時(shí)間看到,這個(gè)時(shí)候需要車跟路上的博弈,跟路邊的行人、車輛等等博弈。

左下是在擁堵路況下,精準(zhǔn)搜索匯入空擋,高效安全博弈,成功匯入主路。

右下是禮讓行人,需要比較篤定能夠自信開的時(shí)候,它能夠去博弈,需要謙讓的時(shí)候必須要禮讓行人和其他的道路的使用者。

目前在過(guò)去的九年里面,我們的產(chǎn)品也得到了主機(jī)廠的認(rèn)可,目前我們跟100多個(gè)合作伙伴一起服務(wù)20多家主機(jī)廠。目前我們有差不多230多個(gè)量產(chǎn)開發(fā)項(xiàng)目,有110多款車型已經(jīng)量產(chǎn)。目前我們已經(jīng)出貨了500萬(wàn)片芯片給客戶,也積累了百億公里的駕駛里程,為客戶提供安全的駕駛體驗(yàn)。

地平線是堅(jiān)定的定位Tier2,我們還是希望攜手行業(yè)所有的伙伴一起,來(lái)推動(dòng)自動(dòng)駕駛向高而行,通過(guò)我們的硬件和算法賦能我們的合作伙伴,與我們的合作伙伴一起,共同讓自動(dòng)駕駛可用、好用,使我們的用戶更愛(ài)用。

最后,地平線希望跟我們的合作伙伴一起。征程與共,開放共贏!

我的分享就到這里,謝謝大家!

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-07-14
地平線陳黎明:2025年,自動(dòng)駕駛將迎來(lái)ChatGPT時(shí)刻
在2024中國(guó)汽車論壇上,地平線總裁陳黎明發(fā)表了主題為《產(chǎn)研向高而行,解鎖高階智駕新思路》的演講。

長(zhǎng)按掃碼 閱讀全文