2022 年的 3 月,或?qū)⒈粚懭胱詣?dòng)駕駛史冊(cè)——美國(guó)頒布無人駕駛法規(guī),中國(guó)也許將從政策層面允許 L3 自動(dòng)駕駛乘用車上路,國(guó)內(nèi)首條支持自動(dòng)駕駛的快速路通車運(yùn)營(yíng)…… 毫無疑問,自動(dòng)駕駛已經(jīng)逐漸從快速迭代邁入大規(guī)模落地階段。在這個(gè) “臨門一腳” 的關(guān)鍵時(shí)刻,想要讓汽車本身的算法做到處理更多、更復(fù)雜的場(chǎng)景,不可或缺的是海量的場(chǎng)景數(shù)據(jù)支撐。
通過對(duì)話國(guó)內(nèi)唯一 A 股上市數(shù)據(jù)服務(wù)商—海天瑞聲,透視 AI 數(shù)據(jù)在助推自動(dòng)駕駛實(shí)現(xiàn)的路上,所面臨的機(jī)會(huì)與挑戰(zhàn)。
一、自動(dòng)駕駛數(shù)據(jù)迎來爆發(fā)期
2022 年將會(huì)是自動(dòng)駕駛商業(yè)化轉(zhuǎn)折點(diǎn)。
回溯 2021 年底,北京成為國(guó)內(nèi)首個(gè)明確認(rèn)可 「 RoboTaxi 」 商業(yè)化試點(diǎn)的城市,標(biāo)志著國(guó)內(nèi)自動(dòng)駕駛賽道迎來商業(yè)化運(yùn)營(yíng)階段。
相關(guān)數(shù)據(jù)和圖片來自 36 氪、漢能投資發(fā)布的《2022 中國(guó)自動(dòng)駕駛行業(yè)研究報(bào)告》
Gartner 公司 2022 年汽車行業(yè)十大業(yè)務(wù)趨勢(shì)
常規(guī)自動(dòng)駕駛汽車服務(wù)啟動(dòng),挑戰(zhàn)隨之而來,也是值得關(guān)注的業(yè)務(wù)趨勢(shì)之一
目前,自動(dòng)駕駛主流算法模型主要以有監(jiān)督學(xué)習(xí)為主,這需要大量的標(biāo)注數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練和調(diào)優(yōu)。只有通過各個(gè)場(chǎng)景的數(shù)據(jù)迭代,自動(dòng)駕駛才可能真正落地。
是否能高效獲取大量標(biāo)注數(shù)據(jù)直接決定了各家能否獲得自動(dòng)駕駛市場(chǎng)上的先發(fā)優(yōu)勢(shì)。
盡管一些行業(yè)頭部企業(yè)已經(jīng)內(nèi)部搭建起數(shù)據(jù)標(biāo)注團(tuán)隊(duì),訓(xùn)練數(shù)據(jù)服務(wù)商依然是它們背后無法忽略的存在。
作為國(guó)內(nèi)訓(xùn)練數(shù)據(jù)行業(yè)的領(lǐng)頭羊,海天瑞聲近幾年也開始與一些傳統(tǒng)車企、造車新勢(shì)力以及頭部自動(dòng)駕駛技術(shù)公司合作,探索如何幫助合作伙伴最大程度釋放自動(dòng)駕駛數(shù)據(jù)的價(jià)值。
IDC 預(yù)測(cè),到 2025 年,中國(guó)人工智能數(shù)據(jù)采標(biāo)服務(wù)市場(chǎng)規(guī)模將達(dá)到 123.4 億元人民幣。市場(chǎng)的發(fā)展驅(qū)動(dòng)力一方面來源于人工智能市場(chǎng)的迅猛發(fā)展,另一方面來源于行業(yè)用戶加大數(shù)據(jù)采集力度。
IDC 數(shù)據(jù)顯示,自動(dòng)駕駛也是 AI 基礎(chǔ)服務(wù)市場(chǎng)當(dāng)中最具增長(zhǎng)潛力的行業(yè)
二、把好「第一關(guān)」:數(shù)據(jù)方案的設(shè)計(jì)能力
與智能家居、新零售、安防等垂直領(lǐng)域相比,自動(dòng)駕駛的數(shù)據(jù)需求格外“苛刻”,對(duì)數(shù)據(jù)服務(wù)商也提出了新的挑戰(zhàn)。
例如,數(shù)據(jù)樣本豐富度層面,場(chǎng)景覆蓋全面的數(shù)據(jù)集對(duì)自動(dòng)駕駛系統(tǒng)安全性至關(guān)重要。想象一下,如果高速路上突然出現(xiàn)一群野象,或者突然有人橫穿馬路,自動(dòng)駕駛汽車該如何應(yīng)對(duì)?
這類 Corner case 數(shù)據(jù)很難采集,我們不可能真的找一群野象去高速上漫步,然后采集數(shù)據(jù)。
對(duì)于這些現(xiàn)實(shí)生活中完全有可能發(fā)生的情況,系統(tǒng)如果識(shí)別不了,將會(huì)導(dǎo)致嚴(yán)重的后果甚至生命損失。所以,相應(yīng)的數(shù)據(jù)必不可少,無論是通過技術(shù)手段合成還是模擬,數(shù)據(jù)方案的設(shè)計(jì)能力都尤為重要。
此時(shí),海天瑞聲作為綜合數(shù)據(jù)服務(wù)商的顯著優(yōu)勢(shì)就凸顯出來:總的說來,行業(yè)現(xiàn)階段訓(xùn)練數(shù)據(jù)采集標(biāo)注的定制化需求較多,海天瑞聲在基礎(chǔ)研究上的多年積累,使得其能夠更好把握現(xiàn)有技術(shù)方向,深入了解客戶對(duì)訓(xùn)練數(shù)據(jù)的運(yùn)用邏輯和需求痛點(diǎn),保證客戶算法取得盡可能好的落地效果。
具體到自動(dòng)駕駛項(xiàng)目需求上,海天瑞聲在項(xiàng)目啟動(dòng)前會(huì)安排專業(yè)團(tuán)隊(duì)先根據(jù)需求設(shè)計(jì)好訓(xùn)練數(shù)據(jù)集結(jié)構(gòu),讓容量有限的訓(xùn)練數(shù)據(jù)集能夠覆蓋盡可能多的現(xiàn)象,并制定相應(yīng)合理的數(shù)據(jù)比例。
比如,項(xiàng)目如果涉及卡車,覆蓋高速路場(chǎng)景的比例會(huì)很高,上下閘道之類的相關(guān)場(chǎng)景也要考慮到;如果涉及市內(nèi)乘用車,設(shè)計(jì)方案時(shí)需要覆蓋各種路口情況,諸如三叉路的十字路口、轉(zhuǎn)向線等,有沒有掉頭的,或者不是兩側(cè)掉頭的,甚至左轉(zhuǎn)道在最右側(cè)等罕見情況,都要覆蓋到。
為了讓數(shù)據(jù)集更完整、豐富,諸如道路兩側(cè)場(chǎng)景、路上障礙物,車輛擁擠、稀疏以及行人多少之類情況也要提前考慮,特別是一些突發(fā)情況,比如突然橫穿馬路,盡管這種場(chǎng)景的覆蓋難度會(huì)更大。
海天瑞聲自動(dòng)駕駛數(shù)據(jù)業(yè)務(wù)的主要內(nèi)容
有時(shí),客戶也并不清楚什么樣的數(shù)據(jù)方案更符合算法需求。例如較之經(jīng)驗(yàn)相對(duì)豐富的互聯(lián)網(wǎng)大廠,傳統(tǒng)車企更需要擁有豐富方案設(shè)計(jì)經(jīng)驗(yàn)的服務(wù)商,幫忙引導(dǎo)、梳理并細(xì)化出具體需求。
比如,面對(duì)突發(fā)狀況司機(jī)踩剎車,對(duì)于自動(dòng)駕駛決策系統(tǒng)來說,急剎車之前多少秒的數(shù)據(jù)更有價(jià)值?低可視度惡劣天氣場(chǎng)景的數(shù)據(jù)量需要多少?需要以何種方式采集?以多少秒一幀的速度采集?
通過技術(shù)對(duì)技術(shù)、算法層面的反復(fù)溝通,海天瑞聲可以幫助客戶找到更加貼合使用場(chǎng)景的數(shù)據(jù)方案,縮減研發(fā)周期、加快落地進(jìn)程,同時(shí)避免客戶花費(fèi)更多成本。
三、「人機(jī)耦合」下的精度、效率與規(guī)模
高質(zhì)量自動(dòng)駕駛訓(xùn)練數(shù)據(jù),除了來自樣本豐富度的“刁難”,還要面臨標(biāo)注過程高精度、高效率規(guī)?;鳂I(yè)帶來的挑戰(zhàn)。
舉例來說,同樣是 99% 精準(zhǔn)度,對(duì)語音合成任務(wù)中的大多場(chǎng)景來說已經(jīng)足夠優(yōu)質(zhì),但對(duì)于自動(dòng)駕駛場(chǎng)景來說,卻極有可能埋下安全隱患。
基于對(duì)安全性的嚴(yán)苛要求,智能駕駛數(shù)據(jù)(主要是艙外)正朝著多模態(tài)的方向發(fā)展,所謂多模態(tài),是指多維時(shí)間、空間、環(huán)境數(shù)據(jù)的感知與融合。比如,一輛車可能配置少則 4-5 個(gè)、多則十幾個(gè)攝像頭,外加雷達(dá)(激光雷達(dá)、毫米波雷達(dá)、超聲波雷達(dá)等)。
市面采用的激光雷達(dá)基本都是 64 線甚至以上,受限于各種硬件設(shè)備,傳回來的數(shù)據(jù)很難做到完全同步。由于點(diǎn)云是一個(gè)連續(xù)幀的概念,標(biāo)注多路數(shù)據(jù)如果不一致,會(huì)影響到算法模型訓(xùn)練。另一方面,3D 激光雷達(dá)數(shù)據(jù)和 2D 普通攝像頭數(shù)據(jù)標(biāo)注如何同步,也是一個(gè)難點(diǎn)。這些都成為橫亙?cè)诟呔葮?biāo)注需求面前的難題。
與此相對(duì)應(yīng)的卻是標(biāo)注環(huán)節(jié)生產(chǎn)力的落后。
訓(xùn)練數(shù)據(jù)生產(chǎn)過程示意圖
《2019 年中國(guó)人工智能基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)白皮書》分析指出,2010-2016 年早期數(shù)據(jù)標(biāo)注需求激增,加之入行門檻低,涌入了大量玩家,魚龍混雜。直到今天,絕大部分?jǐn)?shù)據(jù)服務(wù)商還處于解決「數(shù)據(jù)標(biāo)注工具有無」的階段。
很多團(tuán)隊(duì)依靠開源工具完成絕大部分項(xiàng)目,不僅沒有點(diǎn)云標(biāo)注工具,基本流程管理也沒有(比如,哪類數(shù)據(jù)應(yīng)該被篩選?質(zhì)量不合格的標(biāo)注該怎么辦?),根本不可能交付自動(dòng)駕駛所需的高質(zhì)量、高精度數(shù)據(jù)集。
而伴隨 AI 在出行領(lǐng)域的深入落地,智能駕駛級(jí)別越高,所需的傳感器數(shù)量則越多、精度要求也越高,相應(yīng)的數(shù)據(jù)量就會(huì)急劇增加,一個(gè)項(xiàng)目動(dòng)輒數(shù)百萬條的數(shù)據(jù)處理量,早已不是作坊式作業(yè)可以應(yīng)對(duì)。
例如,Waymo Open Dataset 有 16.7 個(gè)小時(shí)的視頻數(shù)據(jù),3,000 個(gè)駕駛場(chǎng)景,60 萬視頻幀,將近 200 萬 3D 多邊形和 2200 萬 2D 多邊形標(biāo)注,而這只是 Waymo 大量私有自動(dòng)駕駛數(shù)據(jù)集的一小部分。
快速變化的市場(chǎng)環(huán)境,對(duì)數(shù)據(jù)交付工期的要求也更為苛刻,只有更加自動(dòng)化、智能化、平臺(tái)化的數(shù)據(jù)服務(wù),才能更好地滿足客戶需求。
作為浸潤(rùn)行業(yè)十幾年的頭部服務(wù)商,海天瑞聲從成立之初,就在摸索各環(huán)節(jié)人機(jī)協(xié)作的可能,實(shí)現(xiàn)數(shù)據(jù)標(biāo)注服務(wù)質(zhì)量、速度和規(guī)?;淖罴哑胶?。
一體化數(shù)據(jù)處理平臺(tái)示意圖
其十多項(xiàng)核心技術(shù)應(yīng)用于訓(xùn)練數(shù)據(jù)生產(chǎn)的設(shè)計(jì)、采集、加工、質(zhì)檢中,自主研發(fā)一體化數(shù)據(jù)處理平臺(tái),將項(xiàng)目流程管理、質(zhì)量把控、數(shù)據(jù)安全管理融入其中,并嵌入上千款自主開發(fā)積累的,適用于各種業(yè)務(wù)場(chǎng)景訓(xùn)練數(shù)據(jù)處理需求的工具,充分提高了數(shù)據(jù)訓(xùn)練的生產(chǎn)效率與質(zhì)量控制水平。
具體到自動(dòng)駕駛場(chǎng)景,一般人眼中,3D 點(diǎn)云只是一片點(diǎn)狀物,很難直觀看出具體是什么。但資深標(biāo)注員會(huì)就同一個(gè)連續(xù)幀的前、后幾幀來回看,有時(shí)還會(huì)搭配 2D 圖片一起看,「腦補(bǔ)」點(diǎn)云數(shù)據(jù)無法呈現(xiàn)的部分。
海天瑞聲自動(dòng)駕駛標(biāo)注平臺(tái)有一個(gè)叫做「輔助構(gòu)建物體腦補(bǔ)框」的工具,能幫助標(biāo)注員進(jìn)行更為精確的「腦補(bǔ)」。比如,拉框后,系統(tǒng)會(huì)自動(dòng)就同一個(gè)連續(xù)幀的前、后幾幀內(nèi)容進(jìn)行預(yù)判,還會(huì)給出一些諸如車輛大小的參考。
其次,這一標(biāo)注平臺(tái)覆蓋自動(dòng)駕駛場(chǎng)景下不同類型數(shù)據(jù)的標(biāo)注工具,能夠大幅提升標(biāo)注效率。例如,平臺(tái)支持 3D 點(diǎn)云標(biāo)注、3D 點(diǎn)云連續(xù)幀標(biāo)注、3D 連續(xù)幀與 2D 聯(lián)合的標(biāo)注、3D 語義分割等,還可根據(jù)客戶的個(gè)性化需求對(duì)平臺(tái)工具進(jìn)行二次開發(fā),當(dāng)屬業(yè)內(nèi)領(lǐng)先。
海天瑞聲 3D 點(diǎn)云標(biāo)注平臺(tái)
3D 點(diǎn)云連續(xù)幀標(biāo)注時(shí),前兩幀標(biāo)注的物體,自動(dòng)化工具會(huì)在第三幀上自動(dòng)預(yù)測(cè)物體位置。由于算法會(huì)先介入做判斷,標(biāo)注員的工作很大程度上是一個(gè)校正過程,效率和準(zhǔn)確率都有極大的保證。
最后,一體化數(shù)據(jù)處理平臺(tái)的先進(jìn)性不僅在于提供了統(tǒng)一入口和統(tǒng)一風(fēng)格,有助于提升數(shù)據(jù)采集、加工效率,還將公司多年行業(yè)深耕經(jīng)驗(yàn)沉淀到平臺(tái)上,不僅簡(jiǎn)化并統(tǒng)一了訓(xùn)練數(shù)據(jù)生產(chǎn)流程,模塊式的項(xiàng)目生成和管理方式使得生產(chǎn)人員可以根據(jù)實(shí)際項(xiàng)目需求有機(jī)結(jié)合、靈活調(diào)整。
四、系統(tǒng)化平臺(tái):落腳質(zhì)保與安全
除了精度、效率和規(guī)?;惑w化平臺(tái)還能為數(shù)據(jù)標(biāo)注質(zhì)量保駕護(hù)航。
質(zhì)量檢測(cè)和控制理念被嵌入到平臺(tái)各環(huán)節(jié)工具之中:比如在采集環(huán)節(jié),采集工具可對(duì)原始數(shù)據(jù)質(zhì)量進(jìn)行即時(shí)質(zhì)檢,不符合要求的原始數(shù)據(jù)會(huì)被系統(tǒng)工具提示因某項(xiàng)要求不達(dá)標(biāo),無法錄入;中端加工環(huán)節(jié),運(yùn)用自動(dòng)標(biāo)注工具 + 人工校對(duì)檢驗(yàn)的方式,對(duì)數(shù)據(jù)標(biāo)注情況進(jìn)行檢查,提升數(shù)據(jù)質(zhì)量;在后端大規(guī)模質(zhì)檢環(huán)節(jié),運(yùn)用全自動(dòng)校驗(yàn)技術(shù),實(shí)現(xiàn)大規(guī)模訓(xùn)練數(shù)據(jù)集 100% 的質(zhì)檢需求。
目前,海天瑞聲一體化平臺(tái)已經(jīng)沉淀數(shù)百個(gè)質(zhì)檢點(diǎn),可滿足所有日常業(yè)務(wù)場(chǎng)景需求,如檢驗(yàn)圖片、視頻文件格式是否正確、物體種類數(shù)量是否達(dá)標(biāo),打點(diǎn)標(biāo)框準(zhǔn)確率是否符合要求等。
其實(shí),人機(jī)協(xié)作下的高效率、高質(zhì)量數(shù)據(jù)標(biāo)注,只是數(shù)據(jù)服務(wù)整體流程中的一部分。數(shù)據(jù)集管理、項(xiàng)目管理、團(tuán)隊(duì)人員管理等與數(shù)據(jù)安全、合規(guī)息息相關(guān),同樣不可忽略。
與一體化數(shù)據(jù)處理平臺(tái)相配合,海天瑞聲還建立了全時(shí)日志庫及終端人管理系統(tǒng),實(shí)現(xiàn)平臺(tái)內(nèi)操作留痕、透明可追溯和平臺(tái)內(nèi)不同角色的嚴(yán)格權(quán)限分級(jí),確保數(shù)據(jù)安全。
針對(duì)不同安全等級(jí)的訴求,海天瑞聲可以提供不同級(jí)別的解決方案??蛻艨梢园褦?shù)據(jù)放在海天的平臺(tái)上來做,也可以部署到自己服務(wù)器,甚至還能提供入場(chǎng)標(biāo)注。
隨著國(guó)家大舉培養(yǎng)數(shù)據(jù)要素市場(chǎng)、數(shù)據(jù)流通持續(xù)改善,《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》與《個(gè)人信息保護(hù)法》等上位法的陸續(xù)發(fā)布,數(shù)據(jù)安全與隱私保護(hù)也得到社會(huì)各界越來越多的關(guān)注。
海天瑞聲也率先通過了 ISO/IEC 27701 認(rèn)證,這意味著,其數(shù)據(jù)生產(chǎn)過程中個(gè)人隱私信息安全管理和保護(hù)能力符合「重要的全球性隱私保護(hù)標(biāo)準(zhǔn)」,也通過了「最嚴(yán)苛資質(zhì)的審核」。
如今,個(gè)人信息從設(shè)計(jì)、采集、處理、質(zhì)檢到交付均已嚴(yán)格管控在平臺(tái)范圍內(nèi),并通過標(biāo)準(zhǔn)化的數(shù)據(jù)脫敏、嚴(yán)格的終端人管理系統(tǒng)、隱私程度分級(jí)及權(quán)限隔離、全時(shí)自動(dòng)監(jiān)控等措施全流程保障個(gè)人隱私信息的安全。
長(zhǎng)遠(yuǎn)來看,只有在安全、合規(guī)的角度下樹立數(shù)據(jù)服務(wù)標(biāo)桿,才能在行業(yè)里實(shí)現(xiàn)良幣驅(qū)逐劣幣,真正讓人工智能成為新一輪技術(shù)革命的引擎。
五、面對(duì)未知:摸石頭過河的底層能力
對(duì)數(shù)據(jù)生產(chǎn)效率、數(shù)據(jù)質(zhì)量保證和數(shù)據(jù)隱私安全的嚴(yán)格把控,幫助海天瑞聲在市場(chǎng)競(jìng)爭(zhēng)中脫穎而出。
除了這些,還有一項(xiàng)異常重要的底層能力—與客戶一起摸著石頭過河、共同探索全新業(yè)務(wù)挑戰(zhàn)的實(shí)力與勇氣。
20 年前,人工智能商業(yè)落地還處在起步階段,真實(shí)場(chǎng)景下的泛化能力有限。
海天瑞聲歷經(jīng)數(shù)千個(gè)項(xiàng)目的打磨,服務(wù)全球 500 余家大型科技公司、頭部 AI 企業(yè)和科研院所,積累了大量行業(yè) Know-how,探索出幫助 AI 項(xiàng)目大幅縮短落地周期、降低成本的技術(shù)與方案能力,這也是其能夠探索 “未知” 領(lǐng)域的底氣所在。
就自動(dòng)駕駛數(shù)據(jù)標(biāo)注市場(chǎng)來說,當(dāng)前大多數(shù)客戶的痛點(diǎn)之一在于如何實(shí)現(xiàn)駕駛中的數(shù)據(jù)閉環(huán),這些數(shù)據(jù)服務(wù)商的要求已經(jīng)遠(yuǎn)遠(yuǎn)超越了簡(jiǎn)單的采集和標(biāo)注能力,需要集技術(shù)、資金、經(jīng)驗(yàn)等綜合實(shí)力于一體的數(shù)據(jù)服務(wù)商與客戶一起摸索、試錯(cuò)。
如同蒸汽時(shí)代的蒸汽機(jī)、電氣時(shí)代的發(fā)電機(jī)、信息時(shí)代的計(jì)算機(jī)和互聯(lián)網(wǎng),人工智能正成為推動(dòng)人類進(jìn)入智能時(shí)代的決定性力量。
隨著人工智能邁入「數(shù)據(jù) + 知識(shí)」雙輪驅(qū)動(dòng)的新一代,數(shù)據(jù)要素的市場(chǎng)地位被高度認(rèn)同,市場(chǎng)空間廣闊。根據(jù)艾瑞、IDC 等第三方機(jī)構(gòu)對(duì) AI 訓(xùn)練數(shù)據(jù)行業(yè)的研究,中國(guó)市場(chǎng)規(guī)模預(yù)計(jì)在 2025 年達(dá)到 100 + 億,全球訓(xùn)練數(shù)據(jù)市場(chǎng)規(guī)模約在 500 億以上。
麥肯錫中國(guó)區(qū)數(shù)字化咨詢業(yè)務(wù)近期預(yù)測(cè),未來幾年中國(guó)自動(dòng)駕駛商業(yè)化會(huì)比預(yù)期更早來臨。
在邁向商業(yè)化的征途中,海天瑞聲會(huì)與企業(yè)共同摸索出加速模型訓(xùn)練、產(chǎn)品落地和迭代更新的最佳路徑,更好地服務(wù)于未來社會(huì)。(作者:吳昕)
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )