圖源:Unsplash
文 | 智能相對(duì)論
作者 | 沈浪
由ChatGPT掀起的這股大模型浪潮,從通用領(lǐng)域席卷垂直領(lǐng)域?,F(xiàn)階段,越來(lái)越多的行業(yè)都在開(kāi)發(fā)專用垂直細(xì)分賽道的大模型產(chǎn)品,以加速AI應(yīng)用的場(chǎng)景化落地進(jìn)程。
譬如,在電商領(lǐng)域,平臺(tái)和商家正在利用大模型重塑各個(gè)零售環(huán)節(jié)。如智能導(dǎo)購(gòu),可基于消費(fèi)者的海量消費(fèi)數(shù)據(jù)為其提供商品推薦、商品挑選攻略、行程建議等。同時(shí),大模型還能理解海量商品的詳情數(shù)據(jù),快速生成電商運(yùn)營(yíng)需要的商品主圖、營(yíng)銷(xiāo)海報(bào)、詳情頁(yè)等等。
除此之外,電商垂類(lèi)大模型在智能客服、供應(yīng)鏈優(yōu)化等場(chǎng)景上也都能基于海量數(shù)據(jù)的深度學(xué)習(xí),快速掌握特定的售前售后話術(shù)、供應(yīng)鏈訂單處理等,全方位革新電商領(lǐng)域的零售模式和消費(fèi)體驗(yàn)。
隨著應(yīng)用成果的落地,垂直行業(yè)大模型的價(jià)值正在釋放,數(shù)字生產(chǎn)力持續(xù)提升。而作為人工智能三駕馬車(chē)之一的數(shù)據(jù)要素也在這個(gè)時(shí)刻被提上新的戰(zhàn)略高度——不難發(fā)現(xiàn),垂直行業(yè)大模型的價(jià)值釋放離不開(kāi)海量數(shù)據(jù)的支持。
對(duì)應(yīng)的,上游的AI數(shù)據(jù)服務(wù)商已經(jīng)針對(duì)數(shù)據(jù)層面提出了新的解決方案。在2023年中國(guó)國(guó)際服務(wù)貿(mào)易交易會(huì)期間,國(guó)內(nèi)頭部AI數(shù)據(jù)服務(wù)廠商云測(cè)數(shù)據(jù)在去年發(fā)布的“AI工程化的數(shù)據(jù)解決方案”基礎(chǔ)上全面升級(jí),重點(diǎn)面向垂直行業(yè)大模型提出了全生命周期的AI數(shù)據(jù)解決方案,為大模型應(yīng)用落地提供關(guān)鍵支撐。
以大模型應(yīng)用為支點(diǎn),在大量市場(chǎng)場(chǎng)景需求的撬動(dòng)下,人工智能產(chǎn)業(yè)鏈上下游的板塊正在迎來(lái)全新變革,數(shù)據(jù)層面的升級(jí)已經(jīng)躍然紙上。
大模型應(yīng)用“封神”的背后,是什么樣的AI數(shù)據(jù)服務(wù)在支持?
大模型的爆發(fā)加速了人工智能的應(yīng)用進(jìn)程,同時(shí)也對(duì)整個(gè)算法產(chǎn)業(yè)鏈帶來(lái)了新的挑戰(zhàn)。在數(shù)據(jù)層面,過(guò)去生產(chǎn)數(shù)據(jù)、收集數(shù)據(jù)、加工數(shù)據(jù)、存儲(chǔ)數(shù)據(jù)等流程就不再適用當(dāng)前的市場(chǎng)需求,或者說(shuō)無(wú)法高效地、很好地解決新出現(xiàn)的問(wèn)題。
下游的AI應(yīng)用融入大模型技術(shù)進(jìn)行全新升級(jí),上游的AI數(shù)據(jù)服務(wù)也同樣面臨著變革。那么,什么樣的AI數(shù)據(jù)服務(wù)才是垂直行業(yè)大模型場(chǎng)景下需要的、適用的?
一、標(biāo)準(zhǔn)化
垂直行業(yè)大模型技術(shù)成果涌現(xiàn)的背后,對(duì)應(yīng)是AI數(shù)據(jù)需求大幅增長(zhǎng)。如何滿足大幅增長(zhǎng)的場(chǎng)景化數(shù)據(jù)需求,首要不是盲目擴(kuò)大數(shù)據(jù)生產(chǎn),而是提高AI數(shù)據(jù)的通用性、易用性,也就是標(biāo)準(zhǔn)化的問(wèn)題,避免AI數(shù)據(jù)服務(wù)做“無(wú)用功”,保證數(shù)據(jù)的真實(shí)、有效、易用是滿足垂直行業(yè)大模型爆發(fā)式增長(zhǎng)需求的關(guān)鍵。
譬如,在智能網(wǎng)聯(lián)汽車(chē)行業(yè),《智能網(wǎng)聯(lián)汽車(chē)激光雷達(dá)點(diǎn)云數(shù)據(jù)標(biāo)注要求及方法》(T/CSAE 213-2021)、《智能網(wǎng)聯(lián)汽車(chē)場(chǎng)景數(shù)據(jù)圖像標(biāo)注要求與方法》(T/CSAE 212-2021)等團(tuán)體標(biāo)準(zhǔn)的發(fā)布,就為智能網(wǎng)聯(lián)汽車(chē)的研發(fā)和測(cè)試提供了一套切實(shí)可行的場(chǎng)景數(shù)據(jù)點(diǎn)云標(biāo)注方法,很好地推動(dòng)了智能網(wǎng)聯(lián)汽車(chē)的研發(fā)和測(cè)試。
其中最直觀的感受則在于,過(guò)去AI數(shù)據(jù)服務(wù)行業(yè)各企業(yè)對(duì)圖像標(biāo)注的要求與方法都各不相同,標(biāo)注結(jié)果文件各異,嚴(yán)重影響后續(xù)數(shù)據(jù)的統(tǒng)一使用。隨著相關(guān)標(biāo)準(zhǔn)的發(fā)布,對(duì)標(biāo)注流程和標(biāo)注結(jié)果的保存形式都進(jìn)行了規(guī)范,進(jìn)而提升標(biāo)注數(shù)據(jù)的通用性。
而在這個(gè)過(guò)程中,行業(yè)TOP地位的廠商往往都是標(biāo)準(zhǔn)的引領(lǐng)者,促使其在接下來(lái)的市場(chǎng)規(guī)范中獲得了更大的話語(yǔ)權(quán)和主動(dòng)權(quán)。譬如,以上智能網(wǎng)聯(lián)汽車(chē)場(chǎng)景數(shù)據(jù)的兩大標(biāo)準(zhǔn),背后都有云測(cè)數(shù)據(jù)的參與。
這家頭部AI數(shù)據(jù)服務(wù)商在參與標(biāo)準(zhǔn)制定,為行業(yè)攻陷自家經(jīng)驗(yàn)和技術(shù)能力的同時(shí),也更快、更好地掌握了數(shù)據(jù)標(biāo)注相關(guān)場(chǎng)景的標(biāo)準(zhǔn)化,并應(yīng)用到自家的產(chǎn)品和解決方案中。其中,基于對(duì)行業(yè)標(biāo)準(zhǔn)化的理解,云測(cè)數(shù)據(jù)發(fā)布的面向垂直行業(yè)大模型AI數(shù)據(jù)解決方案不僅能提供大規(guī)模感知數(shù)據(jù)能力,還能智駕企業(yè)減少數(shù)據(jù)采集周期,提升數(shù)據(jù)標(biāo)注效率,降本增效,助力相關(guān)企業(yè)在數(shù)據(jù)層面實(shí)現(xiàn)研發(fā)領(lǐng)跑。
二、工程化
隨著大模型技術(shù)的融入,人工智能應(yīng)用進(jìn)程正持續(xù)加速,而在供給端,AI數(shù)據(jù)服務(wù)也面臨著數(shù)據(jù)生產(chǎn)、收集、處理、加工、存儲(chǔ)等全生命周期流程的升級(jí),從而才能滿足AI數(shù)據(jù)的大幅度增長(zhǎng)需求。簡(jiǎn)單來(lái)說(shuō),對(duì)應(yīng)AI工程化的大趨勢(shì),AI數(shù)據(jù)服務(wù)也迎來(lái)了工程化的深度升級(jí)。
這里,云測(cè)數(shù)據(jù)發(fā)布的“面向垂直行業(yè)大模型AI數(shù)據(jù)解決方案”呈現(xiàn)出來(lái)的結(jié)果就是一條相對(duì)清晰的路徑——通過(guò)豐富的數(shù)據(jù)標(biāo)注工具、成熟的API集成能力、高效的數(shù)據(jù)閉環(huán),加上人員管理及項(xiàng)目管理體系以及安全交付軟硬件支持的方式,云測(cè)數(shù)據(jù)在保證數(shù)據(jù)隱私安全的環(huán)境下,對(duì)垂直行業(yè)大模型所需的海量數(shù)據(jù)實(shí)現(xiàn)了全生命周期管理。
更直觀來(lái)說(shuō),對(duì)應(yīng)AI數(shù)據(jù)服務(wù)的各個(gè)流程環(huán)節(jié),云測(cè)數(shù)據(jù)都能提供對(duì)應(yīng)的工具、技術(shù)能力、管理體系,好似成熟的制造生產(chǎn)線一般,一步步地完成數(shù)據(jù)從無(wú)到有的生產(chǎn),從粗糙到精細(xì)的加工等目標(biāo),以供下游的垂直行業(yè)大模型用于預(yù)訓(xùn)練。
以基礎(chǔ)的數(shù)據(jù)標(biāo)注為例,云測(cè)數(shù)據(jù)目前提供了相對(duì)全面的平臺(tái)工具模塊,包括了點(diǎn)云融合跟蹤、OCR文字轉(zhuǎn)寫(xiě)、視頻標(biāo)注、語(yǔ)音轉(zhuǎn)寫(xiě)、語(yǔ)音切割、文本判斷、文本生成等等,充分滿足行業(yè)垂直大模型的多模態(tài)數(shù)據(jù)標(biāo)注需求。
三、場(chǎng)景化
今年以來(lái),市場(chǎng)的焦點(diǎn)從通用大模型轉(zhuǎn)向了垂直行業(yè)大模型,其背后是對(duì)技術(shù)應(yīng)用落地的追求,同時(shí)也釋放了一個(gè)足以撬動(dòng)整條人工智能產(chǎn)業(yè)鏈的趨勢(shì)——場(chǎng)景化。在AI數(shù)據(jù)服務(wù)領(lǐng)域,廠商不再盲目追求廣泛的海量數(shù)據(jù),而是針對(duì)某一特定領(lǐng)域或場(chǎng)景的有效數(shù)據(jù)。
場(chǎng)景的聚焦是加速垂直行業(yè)大模型落地的關(guān)鍵,同時(shí)也意味著更高要求的AI數(shù)據(jù)服務(wù)。以智能網(wǎng)聯(lián)汽車(chē)為例,云測(cè)數(shù)據(jù)為其提供的AI數(shù)據(jù)解決方案目前就包括三部分,分別為基礎(chǔ)數(shù)據(jù)庫(kù)、定制化數(shù)據(jù)采集和標(biāo)注服務(wù)以及包括數(shù)據(jù)采集標(biāo)注、數(shù)據(jù)管理的全方位數(shù)據(jù)工具鏈。
簡(jiǎn)單來(lái)說(shuō),隨著場(chǎng)景化趨勢(shì)的發(fā)展,AI數(shù)據(jù)服務(wù)的定制化將越來(lái)越深入,不僅要針對(duì)某一特定行業(yè)或場(chǎng)景提供專業(yè)服務(wù),還有可能聚焦某一公司或某一技術(shù)模塊提供高度定制化數(shù)據(jù)服務(wù)。
同時(shí),基于場(chǎng)景化的AI數(shù)據(jù)需求也遠(yuǎn)超常規(guī),隨著行業(yè)大模型的持續(xù)升級(jí),場(chǎng)景的細(xì)分也會(huì)越來(lái)越精細(xì),對(duì)應(yīng)的數(shù)據(jù)需求更加嚴(yán)格。在與「智能相對(duì)論」的交流中,云測(cè)數(shù)據(jù)總經(jīng)理賈宇航就提到,在智能網(wǎng)聯(lián)汽車(chē)領(lǐng)域,為滿足相關(guān)場(chǎng)景的豐富性,云測(cè)數(shù)據(jù)可以需要提供包含數(shù)據(jù)采集、數(shù)據(jù)生產(chǎn)、平臺(tái)工具在內(nèi)的AI數(shù)據(jù)服務(wù),從而滿足相關(guān)大模型的預(yù)訓(xùn)練需求。
總的來(lái)說(shuō),對(duì)應(yīng)人工智能產(chǎn)業(yè)鏈上下游的關(guān)系,AI數(shù)據(jù)服務(wù)需要服務(wù)于垂直行業(yè)大模型的需求?,F(xiàn)階段,垂直行業(yè)大模型加速落地,需要更多、更有效、更精準(zhǔn)的場(chǎng)景數(shù)據(jù),AI數(shù)據(jù)服務(wù)的升級(jí)有跡可循。
AI數(shù)據(jù)服務(wù)走入“深水區(qū)”,頭部廠商如何繼續(xù)保持引領(lǐng)?
市場(chǎng)趨勢(shì)的變化往往最先被行業(yè)TOP廠商所感知和反饋。在AI數(shù)據(jù)服務(wù)領(lǐng)域,云測(cè)數(shù)據(jù)提出“面向垂直行業(yè)大模型AI數(shù)據(jù)解決方案”,站在下半年垂直行業(yè)大模型進(jìn)一步爆發(fā)的節(jié)點(diǎn)上將繼續(xù)引領(lǐng)AI數(shù)據(jù)服務(wù)行業(yè)。
那么,只是純粹的進(jìn)場(chǎng)快,就能實(shí)現(xiàn)行業(yè)引領(lǐng)嗎?顯然不是。
結(jié)合垂直行業(yè)大模型發(fā)展的市場(chǎng)需求,云測(cè)數(shù)據(jù)的“面向垂直行業(yè)大模型AI數(shù)據(jù)解決方案”所呈現(xiàn)出來(lái)的更關(guān)鍵的價(jià)值在于其背后三大思維。
一、聚焦賽道,重視價(jià)值回歸
垂直行業(yè)大模型的爆發(fā)式增長(zhǎng)讓“百模大戰(zhàn)”愈演愈烈,各行各業(yè)都在做相應(yīng)的大模型產(chǎn)品,呈現(xiàn)出來(lái)的市場(chǎng)機(jī)會(huì)很多,但是對(duì)應(yīng)的AI數(shù)據(jù)服務(wù)需求也在升級(jí)。這就意味著不能用通用思維來(lái)做垂直行業(yè)大模型的AI數(shù)據(jù)服務(wù),也很難有能力把所有行業(yè)都覆蓋。
那么,在這個(gè)過(guò)程,廠商就需要有所取舍。目前,云測(cè)數(shù)據(jù)“面向垂直行業(yè)大模型AI數(shù)據(jù)服務(wù)解決方案”主要落地在零售電商、金融保險(xiǎn)、智能網(wǎng)聯(lián)汽車(chē)等領(lǐng)域。而這些都是云測(cè)數(shù)據(jù)從創(chuàng)立之初就聚焦深耕的行業(yè),具備相應(yīng)的數(shù)據(jù)積累、行業(yè)知識(shí)、項(xiàng)目經(jīng)驗(yàn)以及客戶資源等。
在云測(cè)數(shù)據(jù)總經(jīng)理賈宇航看來(lái),云測(cè)數(shù)據(jù)做垂直行業(yè)大模型的AI數(shù)據(jù)服務(wù),首要的關(guān)鍵點(diǎn)是價(jià)值考量。
一方面,要做就先做有積累、有基礎(chǔ)的領(lǐng)域——基于這個(gè)思路,云測(cè)數(shù)據(jù)在提供場(chǎng)景化數(shù)據(jù)采集方案的同時(shí),也會(huì)在微調(diào)任務(wù)后對(duì)應(yīng)行業(yè)需求提供專業(yè)的評(píng)測(cè)體系和服務(wù),讓AI數(shù)據(jù)服務(wù)更有價(jià)值。
另一方面,盡管垂直行業(yè)大模型很火,但商業(yè)化落地程度仍具有局限性。對(duì)于云測(cè)數(shù)據(jù)而言,結(jié)合過(guò)去的服務(wù)經(jīng)驗(yàn)、項(xiàng)目經(jīng)驗(yàn)篩選有市場(chǎng)需求的領(lǐng)域深耕,是對(duì)企業(yè)自身發(fā)展的負(fù)責(zé),避免在過(guò)熱的市場(chǎng)環(huán)境中迷失自我,失去發(fā)展價(jià)值。
二、縱橫升級(jí),強(qiáng)化基本功
垂直行業(yè)大模型應(yīng)用落地是一個(gè)縱橫能力協(xié)同的過(guò)程。云測(cè)數(shù)據(jù)總經(jīng)理賈宇航將這一過(guò)程理解為“搭積木”,橫向強(qiáng)化底座能力,有一個(gè)穩(wěn)定的基礎(chǔ),縱向深耕場(chǎng)景化,對(duì)應(yīng)不同的行業(yè)進(jìn)行微調(diào)、優(yōu)化,給出專業(yè)的解決方案。
具體來(lái)看,云測(cè)數(shù)據(jù)基于AI工程化的數(shù)據(jù)服務(wù)升級(jí),在橫向上就構(gòu)建了一套包括數(shù)據(jù)可視化、擴(kuò)展工具模塊、數(shù)據(jù)權(quán)限管理體系等在內(nèi)的AI數(shù)據(jù)服務(wù)解決方案,應(yīng)對(duì)大模型預(yù)訓(xùn)練本身所需要的數(shù)據(jù)需求。
縱向上則針對(duì)不同的場(chǎng)景,基于行業(yè)理解提供專精解決方案,比如對(duì)應(yīng)智能網(wǎng)聯(lián)汽車(chē)研發(fā)與測(cè)試所需要的車(chē)外環(huán)境感知、車(chē)內(nèi)智能座艙、人體動(dòng)作識(shí)別等,滿足垂直行業(yè)大模型的進(jìn)階需求。
三、堅(jiān)守底線,規(guī)避行業(yè)敏感點(diǎn)
且不說(shuō)數(shù)據(jù)領(lǐng)域本身就敏感,作為建立在海量數(shù)據(jù)之上的垂直行業(yè)大模型應(yīng)用對(duì)數(shù)據(jù)的需求就非常嚴(yán)格,數(shù)據(jù)安全是一方面,數(shù)據(jù)的獨(dú)特性、權(quán)威性、有效性則是另一方面。
對(duì)此,云測(cè)數(shù)據(jù)作為行業(yè)TOP企業(yè)始終將數(shù)據(jù)隱私安全放在業(yè)務(wù)開(kāi)展的首位。云測(cè)數(shù)據(jù)總經(jīng)理賈宇航表示,為了確保垂直行業(yè)大模型用于訓(xùn)練的數(shù)據(jù)合法合規(guī),云測(cè)數(shù)據(jù)都會(huì)與企業(yè)客戶簽訂數(shù)據(jù)授權(quán)協(xié)議。同時(shí),云測(cè)數(shù)據(jù)在過(guò)去多年的發(fā)展中也會(huì)建立具備自由版權(quán)的數(shù)據(jù)集,以幫助更多行業(yè)客戶去獲取更多的高質(zhì)量數(shù)據(jù)。此外,云測(cè)數(shù)據(jù)更是一家滿足ISO27001和ISO27701標(biāo)準(zhǔn)的AI數(shù)據(jù)服務(wù)廠商,并先后獲得ISO9001、ISO20000、CMMI3等相關(guān)認(rèn)證。
結(jié)語(yǔ)
AI數(shù)據(jù)作為生產(chǎn)資料,是推動(dòng)整個(gè)AI行業(yè)發(fā)展的必要一環(huán),也是人工智能商業(yè)化的主要驅(qū)動(dòng)力之一。換句話來(lái)說(shuō),高質(zhì)量的數(shù)據(jù)決定了AI的落地程度也不為過(guò)。云測(cè)數(shù)據(jù)總經(jīng)理賈宇航曾提出類(lèi)似的觀點(diǎn)。
而垂直行業(yè)大模型的爆發(fā)式增長(zhǎng),也就意味著AI數(shù)據(jù)需求的澎湃發(fā)展。圍繞高質(zhì)量數(shù)據(jù)為需求,垂直行業(yè)大模型的落地才有真正意義的基礎(chǔ)。這是AI數(shù)據(jù)服務(wù)廠商的機(jī)會(huì),也是人工智能產(chǎn)業(yè)突破發(fā)展的關(guān)鍵。
*本文圖片均來(lái)源于網(wǎng)絡(luò)
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 蘋(píng)果開(kāi)啟年終大促,降價(jià)1200元,被國(guó)產(chǎn)手機(jī)嚇怕了?
- 長(zhǎng)三角,如何把數(shù)據(jù)要素變成新長(zhǎng)江?
- 大模型,在內(nèi)卷中尋找出口
- 比亞迪“天神之眼”重磅升級(jí):無(wú)圖城市領(lǐng)航功能全國(guó)開(kāi)通
- 不愿成為微信的支付寶,注定失敗
- 大廠年終獎(jiǎng)全靠猜?京東帶頭透明化
- MediaTek 發(fā)布天璣 8400 移動(dòng)芯片,開(kāi)啟高階智能手機(jī)全大核計(jì)算時(shí)代
- 榮耀攜手“哪吒”鬧新春,2025魔法科技年貨節(jié)同步開(kāi)啟
- 榮耀Magic7系列全面升級(jí)大王影像,AI超級(jí)長(zhǎng)焦讓百倍望遠(yuǎn)也清晰
- 2024中國(guó)互聯(lián)網(wǎng)哈哈榜之2: 十大事件
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。