AI 技術(shù)在理解層和決策層中賦能自動(dòng)駕駛
自動(dòng)駕駛是一種類人駕駛,即計(jì)算機(jī)模擬人類的駕駛行為,其功能的實(shí)現(xiàn)同樣分為感知、理解、決策和執(zhí)行四個(gè)層次,由各類傳感器、ECU和執(zhí)行器來實(shí)現(xiàn)。
在整個(gè)自動(dòng)駕駛實(shí)現(xiàn)的流程中,1)感知層主要依賴激光雷達(dá)和攝像頭等傳感器設(shè)備所采集的信息感知汽車周圍環(huán)境,以硬件設(shè)備的精確度、可靠性為主要的衡量標(biāo)準(zhǔn)。2)執(zhí)行層通過汽車執(zhí)行器,包括油門、轉(zhuǎn)向和制動(dòng)(剎車)等,實(shí)現(xiàn)車輛決策層輸出的加速、轉(zhuǎn)向和制動(dòng)等決策,主要依靠機(jī)械技術(shù)實(shí)現(xiàn)。3)AI技術(shù)主要應(yīng)用于理解層和決策層,擔(dān)任駕駛汽車“大腦”的角色。
理解層對(duì)感知層數(shù)據(jù)進(jìn)行解析,AI 算法技術(shù)優(yōu)勢(shì)盡現(xiàn)
依據(jù)感知層傳感器的不同,理解層主要完成兩個(gè)任務(wù):車輛的高精度定位,以及物體識(shí)別和追蹤。
高精度定位任務(wù)的實(shí)現(xiàn)主要是通過GPS或視覺的算法實(shí)現(xiàn)非常精準(zhǔn)的車輛定位,目前主要的技術(shù)路線有三種:慣性傳感器(IMU)和GPS定位、基于視覺里程計(jì)算法定位、基于雷達(dá)的定位。
AI 算法在理解層最主要的應(yīng)用是物體的識(shí)別和追蹤。物體跟蹤和識(shí)別包括靜態(tài)物體識(shí)別和動(dòng)態(tài)物體識(shí)別,對(duì)于動(dòng)態(tài)物體還需要對(duì)其軌跡進(jìn)行追蹤,基于追蹤的結(jié)果預(yù)測(cè)其下一步的位臵,計(jì)算出安全的行車空間。自動(dòng)駕駛車輛需要實(shí)時(shí)進(jìn)行多個(gè)物體的識(shí)別和追蹤,典型的物體包括車輛、行人、自行車等。
激光雷達(dá)和計(jì)算機(jī)視覺是實(shí)現(xiàn)物體識(shí)別/跟蹤的兩種途徑,Google 和Tesla分別代表了這兩種不同的技術(shù)路線。
激光雷達(dá)生成的點(diǎn)云數(shù)據(jù)包含物體的3D 輪廓信息,同時(shí)通過強(qiáng)度掃描成像獲取物體的反射率,因此可以輕易分辨出草地,樹木,建筑物,路燈,混凝土,車輛等。識(shí)別軟件算法簡單,很容易達(dá)到實(shí)時(shí)性的要求。
計(jì)算機(jī)視覺的方法是利用深度學(xué)習(xí)對(duì)攝像頭圖像進(jìn)行處理,從像素層面的顏色、偏移和距離信息提取物體層面的空間位臵(立體視覺法)和運(yùn)動(dòng)軌跡(光流法)?;谝曈X的物體識(shí)別和跟蹤是當(dāng)前的研究熱點(diǎn),但是總體來說輸出一般是有噪音,如物體的識(shí)別有可能不穩(wěn)定,可能有短暫誤識(shí)別等。
決策層如何應(yīng)對(duì)復(fù)雜情形是自動(dòng)駕駛的關(guān)鍵瓶頸
在理解層的基礎(chǔ)上,決策層解決的問題是如何控制汽車行為以達(dá)到駕駛目標(biāo)。在一個(gè)具有障礙物并且動(dòng)態(tài)變化的環(huán)境中,按照一定的評(píng)價(jià)條件尋找一條從起始狀態(tài)到目標(biāo)狀態(tài)的無碰撞路徑。自動(dòng)駕駛汽車的決策包括全局性導(dǎo)航規(guī)劃、駕駛行為決策和運(yùn)動(dòng)軌跡規(guī)劃。1)全局導(dǎo)航規(guī)劃在已知電子地圖、路網(wǎng)以及宏觀交通信息等先驗(yàn)信息下,根據(jù)某優(yōu)化目標(biāo),選擇不同的道路。2)駕駛行為決策根據(jù)當(dāng)前交通狀況、交通法規(guī)、結(jié)構(gòu)化道路約束,決定車輛的目標(biāo)位臵,抽象化為不同的駕駛行為,如變換車道、路口轉(zhuǎn)向等。3)運(yùn)動(dòng)軌跡規(guī)劃是基于駕駛行為決策,躲避障礙物,對(duì)到達(dá)目標(biāo)位臵的路線進(jìn)行規(guī)劃。
基于規(guī)則的傳統(tǒng)算法,在應(yīng)對(duì)復(fù)雜情形下的決策仍存在挑戰(zhàn)。道路上的交通參與者(車輛、行人、自行車等)的狀態(tài)和意圖具有不確定性,決策算法需要在這樣的環(huán)境下,以較短的時(shí)間進(jìn)行行為決策,無疑是個(gè)技術(shù)難點(diǎn)。當(dāng)前自動(dòng)駕駛的決策算法多基于規(guī)則,如有限狀態(tài)機(jī)算法、決策樹等算法等。需要開發(fā)者利用專業(yè)知識(shí)對(duì)特定問題進(jìn)行抽象和建模,實(shí)際上這種方式缺乏靈活性,特別是在復(fù)雜情形下,交通參與者的不確定性更高,算法更是難以做到面面俱到。
強(qiáng)化學(xué)習(xí)在自動(dòng)駕駛決策層具有應(yīng)用前景。強(qiáng)化學(xué)習(xí)的目的是通過和環(huán)境交互學(xué)習(xí)到如何在相應(yīng)的觀測(cè)中采取最優(yōu)行為。行為的好壞可以通過環(huán)境給的獎(jiǎng)勵(lì)來確定。不同的環(huán)境有不同的觀測(cè)和獎(jiǎng)勵(lì)。例如,駕駛中環(huán)境觀測(cè)是攝像頭和激光雷達(dá)采集到的周圍環(huán)境的圖像和點(diǎn)云,以及其他的傳感器的輸出。駕駛中的環(huán)境的獎(jiǎng)勵(lì)根據(jù)任務(wù)的不同,可以通過到達(dá)終點(diǎn)的速度、舒適度和安全性等指標(biāo)確定。當(dāng)前增強(qiáng)學(xué)習(xí)的算法在自動(dòng)駕駛汽車決策上的研究還比較初步,有試錯(cuò)次數(shù)多、算法可解釋性差等弱點(diǎn)。
深度學(xué)習(xí)算法在自動(dòng)駕駛中廣泛應(yīng)用,端到端自動(dòng)駕駛?cè)跃咛魬?zhàn)
車輛的道路行駛環(huán)境非常復(fù)雜,需要處理大量非結(jié)構(gòu)化數(shù)據(jù)。深度學(xué)習(xí)算法能夠高效的處理非結(jié)構(gòu)化數(shù)據(jù),并自動(dòng)地從訓(xùn)練樣本中學(xué)習(xí)特征,當(dāng)訓(xùn)練樣本足夠大時(shí),算法能夠處理遇到的新的狀況以應(yīng)對(duì)復(fù)雜決策問題。以基本的車輛識(shí)別問題為例,在用足夠多的汽車圖像對(duì)算法進(jìn)行訓(xùn)練后,算法具備了識(shí)別汽車的能力。
深度學(xué)習(xí)在自動(dòng)駕駛中的應(yīng)用可以分為兩個(gè)學(xué)派:端到端式(End-to-End architecture)和問題拆解式(SemanticAbstraction)。與人類相比,在端到端式的構(gòu)架中,一個(gè)DNN網(wǎng)絡(luò)模擬了人的整個(gè)駕駛行為;而在問題拆解式的構(gòu)架中,每個(gè)DNN網(wǎng)絡(luò)僅模擬了人的一部分駕駛行為。
端對(duì)端式不需要人工將問題進(jìn)行拆解,只需要一個(gè)深度神經(jīng)網(wǎng)絡(luò)(DNN),在經(jīng)過訓(xùn)練后,基于傳感器的輸入信息(如照片),直接對(duì)車輛的加減速和轉(zhuǎn)向等進(jìn)行控制。
問題拆解式需要人工將問題進(jìn)行拆解,分別訓(xùn)練多個(gè)DNN網(wǎng)絡(luò),實(shí)現(xiàn)諸如車輛識(shí)別、道路識(shí)別、交通信號(hào)燈識(shí)別等功能。然后基于各個(gè)DNN網(wǎng)絡(luò)的輸出,再對(duì)車輛的加減速和轉(zhuǎn)向進(jìn)行控制。
目前,問題拆解式深度學(xué)習(xí)在自動(dòng)駕駛領(lǐng)域得到廣泛的應(yīng)用,主要是進(jìn)行圖像識(shí)別。如識(shí)別行駛途中遇到的車輛、行人、地上的交通標(biāo)志線、交通信號(hào)燈等。在KITTI2數(shù)據(jù)集上,排名第一的車輛識(shí)別算法已經(jīng)能夠達(dá)到92.65%的準(zhǔn)確率3。以色列Mobileye是這個(gè)領(lǐng)域的領(lǐng)軍人物,其推出的基于攝像頭的圖像識(shí)別解決方案EyeQ得到了業(yè)內(nèi)的認(rèn)可,被10多家汽車制造商超過100種車型所采用。眾多創(chuàng)業(yè)公司也試圖從這個(gè)角度切入自動(dòng)駕駛領(lǐng)域,提供圖像識(shí)別算法,如商湯科技、圖森互聯(lián)、地平線科技等。
NVIDIA在測(cè)試車上通過端到端式的深度學(xué)習(xí)實(shí)現(xiàn)了對(duì)車輛轉(zhuǎn)向的控制,百度在2017年CES上推出了開源的端對(duì)端的自動(dòng)駕駛平臺(tái)Road Hackers及訓(xùn)練數(shù)據(jù)。目前端到端方案需要大量的數(shù)據(jù)進(jìn)行模型訓(xùn)練(模型參數(shù)更多),算法的可解釋性變差,難以進(jìn)行錯(cuò)誤排查,在可靠性上也存在一定問題,仍處在較為初級(jí)的階段。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )