AI大模型降本提效,“通用”和“泛化”成為智能駕駛關(guān)鍵問題

隨著生成式人工智能的爆發(fā),AI大模型持續(xù)升溫成為當(dāng)下最熱的風(fēng)口,這股熱潮也影響到了自動駕駛行業(yè)。雖然AI大模型目前發(fā)展尚不成熟,仍存在邏輯錯誤,數(shù)據(jù)偏見,算力需求高等問題,但在算法、數(shù)據(jù)閉環(huán)、仿真等技術(shù)環(huán)節(jié),AI大模型或?qū)⑷尜x能自動駕駛。

近期,由辰韜資本主辦、中信證券協(xié)辦的“未來以來 創(chuàng)見未見”第二屆智能駕駛商業(yè)化落地與產(chǎn)業(yè)發(fā)展趨勢主題研討會在北京舉行。在主題為“AI大模型如何賦能智能駕駛”的焦點(diǎn)對話環(huán)節(jié),清華大學(xué)人工智能研究院視覺智能研究中心主任鄧志東教授、北京極佳視界科技有限公司CEO黃冠博士、北京愷望數(shù)據(jù)科技有限公司CEO于旭、蘇州智加科技有限公司首席科學(xué)家崔迪瀟博士參與了討論。

在AI大模型的深度賦能下,未來整個智能駕駛行業(yè)將以更高的效率發(fā)展,行業(yè)將迎接更多可能性和更大想象空間。在場的多位專家均表示,大模型之于自動駕駛來說,核心是解決了整個研發(fā)過程中技術(shù)迭代的效率問題,而大模型真正發(fā)揮其價值,還需面對通用性和泛化能力的問題。

擴(kuò)寬自動駕駛產(chǎn)業(yè)道路,大模型為行業(yè)帶來更多可能

盡管AI不能算是新事物,大模型也不是新事物,但AI、大模型跟智能駕駛結(jié)合在一起,它就變成了新鮮事物。隨著AI大模型的快速發(fā)展,其有望完全改變自動駕駛的開發(fā)方式。

“自動駕駛大模型是必須的?!北本O佳視界科技有限公司CEO黃冠博士表示:整個自動駕駛行業(yè)發(fā)展經(jīng)歷了三個階段和變革。第一階段是Waymo帶來的L4 Robotaxi進(jìn)行了一套系統(tǒng)化解決方案;第二個階段是特斯拉那一套靠視覺和AI帶來行業(yè)成本的降低和泛化性的提升;而第三次則是這次大模型給行業(yè)帶來的想象,它會把這個行業(yè)的上限無限撐高,走向L4或者AGI,并且同時提升數(shù)據(jù)、研發(fā)、測試等各個層面的效率?!癆I大模型將成為自動駕駛發(fā)展的新引擎?!?/p>

來自清華大學(xué)鄧志東教授表示:“大模型賦能自動駕駛,需要以人類的自然語言、人類的思維貫穿智能駕駛的感知、預(yù)測、規(guī)劃、決策、規(guī)控等整個鏈條和環(huán)節(jié),同時還需要綜合運(yùn)用多模態(tài)的視覺語義、常識以及專業(yè)知識,讓它有跨任務(wù)、跨領(lǐng)域、跨場景的泛化能力。它會帶來一場大的變化?!?/p>

“有大模型,相應(yīng)的就有小模型、普通模型,那說明一定有一些問題是普通模型解決不了的,需要用大模型去解決。我更多會站在應(yīng)用的角度去看大模型,比如它是否能做一些普通模型做不了的事情,以及它是否能做得更好、更快、更便宜?!贝薜蠟t博士表示,如果要將大模型賦能到自動駕駛的研發(fā)中,核心要看的是在整個技術(shù)研發(fā)迭代過程中,大模型是否能讓自動駕駛研發(fā)效率提高,研發(fā)成本降低,還能讓性能持續(xù)穩(wěn)步地提升。

而在清華大學(xué)人工智能研究院視覺智能研究中心主任鄧志東看來,現(xiàn)在各家車企做的大模型或小模型,可以看成是一只家養(yǎng)的狗,而真正的智駕大模型應(yīng)該是野生的狗?!耙肮房偙燃茵B(yǎng)的狗生存能力要強(qiáng)很多,它們生存在野外,接觸到的環(huán)境遠(yuǎn)比家狗接觸到的要惡劣、復(fù)雜,即它不能囿于家養(yǎng)的環(huán)境和數(shù)據(jù),而是在真正意義上的開放域海量數(shù)據(jù)之上產(chǎn)生的?!?/p>

真正的智駕大模型是在真正意義上的開放域海量數(shù)據(jù)里產(chǎn)生。愷望數(shù)據(jù)CEO于旭表示:“大量參數(shù)的涌現(xiàn)讓我們在自動駕駛可以用新的思考、新的方式帶來行業(yè)的規(guī)模化,包括這些新的體驗(yàn)感。大模型是帶來了曙光,我們認(rèn)為這個曙光可以分階段地進(jìn)入到自動駕駛行業(yè)里,比如可能先從局部進(jìn)入再逐步發(fā)展到全局,這是一個長線的過程?!?/p>

盡管,大模型目前在自動駕駛領(lǐng)域應(yīng)用還不成熟,但AI大模型能助力自動駕駛技術(shù)迭代升級,加速高級別自動駕駛的落地,自動駕駛更快迎來奇點(diǎn)時刻。

通用性和泛化能力,自動駕駛未來發(fā)展的無限可能

對于智駕大模型來說,其核心關(guān)鍵是解決通用性和泛化能力。就AI大模型的通用性、泛化性等新開發(fā)范式而言,其能夠大幅提高研發(fā)效率,壓縮設(shè)計(jì)和迭代的過程,從而帶來顯著的效率提升。

聊到智駕大模型的核心技術(shù),智駕科技崔迪瀟博士提出:“大模型需要有通用性,本質(zhì)上要解決跨任務(wù)的通用性,意味著它需要能解決不同的任務(wù),有跨知識領(lǐng)域的通用性。GPT里面就有通用性,能夠把所有不同的任務(wù)統(tǒng)一到自然語言處理的框架中?!?/p>

“通用性與泛化性是關(guān)鍵,成熟的自動駕駛大模型一定要結(jié)合語言模型和多模態(tài)。而要具備通用性,需要結(jié)合一套自監(jiān)督的范式去實(shí)現(xiàn)壓縮物理世界?!睒O佳科技CEO黃冠博士也肯定了這兩種能力必為自動駕駛發(fā)展的關(guān)鍵。

那么,該如何解決智駕大模型通用性與泛化性這一核心問題呢?

對此,黃冠博士提出:“第一,需要把語言引進(jìn)來,因?yàn)檎Z言有很強(qiáng)的認(rèn)知能力,比如我知道我開車我不能走懸崖。現(xiàn)在這一套自動駕駛方案既識別不了懸崖,也不知道能不能走懸崖,但是語言的大模型是知道不能走下懸崖的。第二,需要針對物理世界場景,尤其是視覺場景需要有一套方式去進(jìn)行自監(jiān)督地壓縮。多模態(tài)則是認(rèn)識各種懸崖的,它可以再跟自動駕駛結(jié)合起來,加強(qiáng)自駕大模型對世界的泛化認(rèn)知和感知理解能力。”

智加科技崔迪瀟博士也強(qiáng)調(diào),智駕大模型更多是汽車行業(yè)的垂直模型,它們分布在各個智駕技術(shù)棧,或者是特定場景的端到端;既要強(qiáng)調(diào)泛化性,也要強(qiáng)調(diào)可控性,同時它的一致性也是要保證的?!暗聦?shí)上系統(tǒng)泛化能力提升會帶來一些問題,比如它的某些涌現(xiàn)可能對智駕系統(tǒng)是不可控的、也是不可接受的。所以,我并不認(rèn)為在智駕領(lǐng)域存在真正意義上的大模型。”

針對智駕大模型在未來發(fā)展,崔迪瀟博士認(rèn)為:“當(dāng)前自動駕駛行業(yè),大模型已經(jīng)在發(fā)揮一些作用,比如感知端、駕駛決策端,我們都看到了大量很好的技術(shù)演示和應(yīng)用。但必須要提醒一個事實(shí),即大模型依然沒有脫離深度學(xué)習(xí)框架,不可避免地會存在統(tǒng)計(jì)性和概率性問題,大規(guī)模應(yīng)用中一定有它處理不了的場景。對于所有做L4的同事和同行來說,必須要保持警醒,大模型可以加速L4到來,但它不能解決所有L4的問題。”

即使大模型現(xiàn)在仍不成熟,但其發(fā)展?jié)摿σ驯恍袠I(yè)緊盯。于旭表示:“大模型讓我們看到算法的門檻變低了,這個時候就像過去的移動互聯(lián)網(wǎng)一樣,當(dāng)時有很多的APP,現(xiàn)在在算法新的時代里面,又有非常多的AI應(yīng)用。我們在創(chuàng)造更好的大模型,這個技術(shù)手段也希望能應(yīng)用到更多的商業(yè)場景中,使得AI應(yīng)用有不斷的提升。它給我們帶來了很多希望,我還是非??春眠@一技術(shù)的?!?/p>

在當(dāng)下,AI大模型的強(qiáng)勢賦能自動駕駛領(lǐng)域,為自動駕駛領(lǐng)域注入一針“強(qiáng)心劑”,更是給自動駕駛未來帶來無限可能。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )