近日,AI基礎架構與數(shù)據(jù)智能平臺服務商曼孚科技宣布,已于2023年9月完成數(shù)千萬元B輪融資,本輪投資方為安樸資本。所融資金將主要用于AI基礎設施搭建、大模型標注平臺閉環(huán)更迭以及數(shù)據(jù)標注市場拓展等。
曼孚科技商業(yè)化始于2019年,是一家數(shù)據(jù)驅(qū)動的AI基礎設施平臺企業(yè),致力于從數(shù)據(jù)中獲取洞見與價值,并以更精簡方式構建人工智能應用,實現(xiàn)AI的輕量化與普惠化。
旗下主要產(chǎn)品服務包括:面向數(shù)據(jù)生命周期管理的數(shù)據(jù)智能平臺、AI數(shù)據(jù)中臺、AutoLabeling平臺、AutoML平臺以及基礎數(shù)據(jù)服務(數(shù)據(jù)標注、數(shù)據(jù)采集、數(shù)據(jù)清洗)等。
憑借從戰(zhàn)略到技術落地的一站式數(shù)據(jù)解決方案,目前已與數(shù)百家企業(yè)達成深度合作,業(yè)務場景涵蓋自動駕駛數(shù)據(jù)標注、AI數(shù)據(jù)生命周期管理等。用戶包括主機廠、造車新勢力、一線科技公司、主流算法公司以及世界頂級Tier1廠商等,2023年營收額預估將實現(xiàn)3倍以上持續(xù)性增長。
數(shù)據(jù)定義模型
AI產(chǎn)業(yè)歷經(jīng)多年發(fā)展,已逐漸步入技術與商業(yè)的交叉點。
算法模型從關注增量的建模改進,轉(zhuǎn)變?yōu)閺娬{(diào)性能的迭代與優(yōu)化,以契合商業(yè)應用場景對模型質(zhì)量更為苛刻的要求。
結構化數(shù)據(jù)已成為AI算法模型開發(fā)與迭代的基礎。AI強大“理解力”的造就,離不開結構化數(shù)據(jù)源源不斷的輸入,和對數(shù)據(jù)更為精細化的運用。
AI行業(yè)正圍繞以數(shù)據(jù)為中心進行整合,誰擁有數(shù)據(jù),誰就擁有模型的定義權。
在細分場景,自動駕駛城市NOA熱潮興起。技術范式全面革新下,自動駕駛感知算法向BEV+Transformer架構升級,端到端算法解決方案成為主流,推動自動駕駛感知算法從輕量的CNN二維感知,到基于Transformer四維感知的升維,也催生了數(shù)據(jù)需求的指數(shù)型增加。
自動駕駛在AI大模型的助力下迎來臨界點。但量變到質(zhì)變的前置條件是大規(guī)模數(shù)據(jù)的支持——Transformer大模型質(zhì)變需要數(shù)億公里標注數(shù)據(jù)的投喂,并覆蓋不斷出現(xiàn)的Corner Case,這對數(shù)據(jù)量產(chǎn)規(guī)模以及自動化水平提出了更高的要求。
自動駕駛的終極目標是完成對駕駛員的取代,但在此之前,數(shù)據(jù)標注員需要率先被神經(jīng)網(wǎng)絡所取代。
AI驅(qū)動的數(shù)據(jù)智能平臺
隨著BEV+Transformer技術路線成為新一代自動駕駛感知能力的核心架構,數(shù)據(jù)閉環(huán)能力取代算法范式,成為決定商業(yè)量產(chǎn)從1到N的勝負關鍵。
而數(shù)據(jù)閉環(huán)的每一步推進都是成本與效率的博弈,低成本AI數(shù)據(jù)量產(chǎn)能力又成為助推數(shù)據(jù)飛輪的關鍵。
作為行業(yè)領先的AI基礎架構與數(shù)據(jù)智能平臺服務商,曼孚科技以產(chǎn)品技術為核心驅(qū)動力,通過構建AI+RPA驅(qū)動的數(shù)據(jù)平臺沉淀數(shù)據(jù)Know-How能力,在業(yè)內(nèi)率先實現(xiàn)AI數(shù)據(jù)低成本、無上限、規(guī)?;慨a(chǎn)。
曼孚科技數(shù)據(jù)平臺核心產(chǎn)品體系由MindFlow SEED數(shù)據(jù)服務平臺與MindFlow AutoLabeling自動標注平臺構成,歷經(jīng)多代版本更迭,現(xiàn)已在3D、4D點云數(shù)據(jù)處理領域,建立起6-12個月的技術壁壘。
具體應用場景上,平臺支持自動駕駛等場景下2D、3D、4D全類別標注,如2/3D融合、點云分割、點云時序疊幀、BEV標注等。
針對4D點云標注場景下大規(guī)模點云適配渲染問題,曼孚科技自研地圖分片與LOD大規(guī)模點云渲染技術,4D點云車道線與4D點云分割場景均可實現(xiàn)低配置單幀數(shù)億級點云平穩(wěn)運行。
4D點云分割標注場景
作為自動化AI數(shù)據(jù)平臺,RPA與AI能力的建設是曼孚科技構建技術壁壘的核心。
RPA能力主要體現(xiàn)在流程自動化以及調(diào)度分發(fā)自動化等多個方面。而AI能力則已深入數(shù)據(jù)流轉(zhuǎn)各環(huán)節(jié),具體體現(xiàn)在:
1)覆蓋數(shù)據(jù)預處理、算法推斷至結果精修完整算法鏈路,已商用靜態(tài)道路自適應分割、動態(tài)障礙物AI預處理、AI交互式標注等數(shù)十種AI算法標注模型;
2)采用Backbone+多Head算法架構,快速適配不同場景,大幅降低多任務模型研發(fā)成本;
3)基于AutoML以及自有數(shù)據(jù)集構建AI標注模型,自我驅(qū)動完成算法迭代;
4)運用遷移學習、知識蒸餾等方式,基于小批量數(shù)據(jù)+底層通用大模型快速產(chǎn)出算法模型。
RPA與AI能力的強耦合,賦予曼孚科技以更低人力支出與邊際成本,提供更具標準化數(shù)據(jù)解決方案的能力。綜合人效平均提升80%,數(shù)據(jù)生產(chǎn)成本平均降低50%,并實現(xiàn)AI數(shù)據(jù)低成本、無上限、規(guī)?;慨a(chǎn)。
基于大模型的AI自動標注體系
作為引領人工智能新一輪躍遷式發(fā)展的全新底座,大模型正走深向?qū)?,賦能千行百業(yè)。
海量參數(shù)帶來的容量優(yōu)勢,賦予大模型更強的性能與泛化能力,為數(shù)據(jù)預處理、數(shù)據(jù)標注等傳統(tǒng)依賴人力的環(huán)節(jié),提供了全新的技術解決范式。
目前,曼孚科技已完成自動駕駛數(shù)據(jù)標注視覺大模型研發(fā)。通過引入駕駛數(shù)據(jù)建立RLHF,并基于深度學習與計算機視覺構建大模型,可實現(xiàn)復雜駕駛場景下,數(shù)據(jù)的高效處理與全自動化標注。
曼孚科技數(shù)據(jù)標注大模型的主要技術特點如下:
1)基于弱監(jiān)督與半監(jiān)督學習,通過少量人工標注數(shù)據(jù)與大量無標注數(shù)據(jù),實現(xiàn)對場景物體的高效檢測、分割與識別;
2)基于BEV多視角融合與三維重建,借助多攝像頭、激光雷達等來源數(shù)據(jù),自動生成場景物體三維信息;
3)運用遷移學習方式,對不同場景與不同模態(tài)下的數(shù)據(jù),進行統(tǒng)一表示與學習,提升模型泛化能力與適應性;
4)運用主動學習與交互式學習方式,通過與人工標注過程進行反饋,不斷優(yōu)化迭代模型性能。
上述大模型技術加持下,典型自動駕駛數(shù)據(jù)標注場景平均效率可提升4-5倍以上,引領曼孚科技率先步入自動化數(shù)據(jù)標注時代。
數(shù)據(jù)驅(qū)動的AI基礎設施
算法更新迭代的全生命周期內(nèi),從設計、訓練、評測到仿真等環(huán)節(jié)均需要海量數(shù)據(jù)不斷輸入作為支撐,其中數(shù)據(jù)標簽是整個流程的基礎與起點。
如果說互聯(lián)網(wǎng)時代是對信息流量的搬運,那么人工智能尤其是大模型時代,則是對海量數(shù)據(jù)的搬運與精細化運用。
在信息流量的基礎上,誕生了諸多影響深遠的商業(yè)模式。AI時代,任何人也均可使用數(shù)據(jù)作為“鏟子”去探索商業(yè)“金礦”。是否擁有質(zhì)量更高、數(shù)量更多的“鏟子”,是決定“淘金人”能否真正掌握主動權,淘到金子的關鍵。
AI大淘金時代,曼孚科技希望扮演起為“淘金人”服務的角色,以數(shù)據(jù)為驅(qū)動力向AI上下游延伸,打造起通用AI基礎設施。用戶可以以更精簡方式構建AI應用并管理全生命周期,同時也可以更加靈活調(diào)整模型構建流程中的每個組件,以得到更契合的需求與分析結果。
在上述愿景指引下,曼孚科技目前已在自動駕駛場景構建起AI數(shù)據(jù)閉環(huán)平臺,涵蓋DaaS數(shù)據(jù)標注平臺、數(shù)據(jù)管理平臺、AutoLabeling平臺以及AutoML平臺等,提供從數(shù)據(jù)準備到模型應用的端到端解決方案,并延伸至其他AI應用場景。
其中,數(shù)據(jù)管理平臺集數(shù)據(jù)存儲、處理、導入導出于一體,通過SDK打通數(shù)據(jù)采集平臺、數(shù)據(jù)標注平臺、模型訓練平臺與生產(chǎn)運營系統(tǒng)等外部平臺,借助AI與大數(shù)據(jù)技術加強智能標簽、分析報表、場景挖掘與自然語言搜索等功能體驗,提高數(shù)據(jù)使用與管理效率。
而AutoML平臺則是面向自動駕駛等通用視覺場景的自動訓練平臺,提供算法模型自動訓練與快速迭代功能??勺詣觾?yōu)化模型結構、參數(shù)與超參數(shù),提升性能與泛化能力,實現(xiàn)零代碼一鍵訓練,無人值守。
曼孚科技AI基礎設施架構
曼孚科技AI基礎設施解決方案全面覆蓋數(shù)據(jù)層至算法層,既可提供DaaS服務,也可提供MaaS服務。無論用戶規(guī)模大小、是否具備AI研發(fā)能力,只要存在AI需求,即可使用曼孚科技提供的基礎設施,輕松創(chuàng)建專屬AI產(chǎn)品,實現(xiàn)從數(shù)據(jù)到商業(yè)價值的轉(zhuǎn)變。
AI For Everyone
獨立自研的數(shù)據(jù)閉環(huán)平臺、AI數(shù)據(jù)量產(chǎn)能力以及對客戶業(yè)務需求的敏銳洞察,讓曼孚科技在不斷變化的市場中實現(xiàn)業(yè)務超預期增長,數(shù)據(jù)驅(qū)動的AI基礎設施在自動駕駛等行業(yè)驗證了應用價值與商業(yè)潛力。
下階段,曼孚科技將繼續(xù)深耕數(shù)據(jù)行業(yè),不斷完善AI基礎設施建設。正如AWS之于云計算,Snowflake之于數(shù)據(jù)分析一樣,曼孚科技希望在AI行業(yè)能以數(shù)據(jù)構建起通用基礎設施,幫助用戶以更精簡方式訓練與部署人工智能應用。無論是初創(chuàng)企業(yè)、成熟公司亦或是個人,均可通過簡單點擊或幾行代碼享受AI帶來的便利,實現(xiàn)真正的AI民主化與普惠化。
互聯(lián)網(wǎng)時代,谷歌憑借搜索引擎掌控了互聯(lián)網(wǎng)流量入口,微軟憑借操作系統(tǒng)掌控了PC生態(tài)鏈的上游,目前尚未出現(xiàn)挑戰(zhàn)谷歌、微軟等萬億體量的科技新貴,但AI正讓一切變得可能。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )