大華股份:年內(nèi)將推行業(yè)視覺大模型 首先應(yīng)用于城市管理

7月24日消息,近日,媒體專訪了大華股份(002236.SZ)先進技術(shù)研究院院長殷俊,他帶領(lǐng)的團隊從2019年開始負(fù)責(zé)視覺領(lǐng)域大模型的研發(fā)。殷俊透露,大華股份有望于年內(nèi)發(fā)布自己的大模型。

財聯(lián)社報道,據(jù)了解,大華沒有選擇以GPT為代表的生成式語言模型,而是選擇面向不同業(yè)務(wù)場景研發(fā)行業(yè)專屬模型,以精確度為前提,正確、客觀地識別和解析,落地行業(yè)會優(yōu)先在城市管理、電力、物流等行業(yè)展開。

殷俊認(rèn)為,應(yīng)用落地是衡量大模型成功與否的唯一標(biāo)準(zhǔn)。因此,大華專注于在已有的應(yīng)用場景加速落地,這也是目前急需突破的方向。

殷俊表示,大華從2019年開始做,那時候還不叫大模型,稱為Transformer技術(shù)。團隊用ViT技術(shù)做半自動化標(biāo)注方案,節(jié)省很多人力,2020年初就有了檢測+分割+分類的自動化標(biāo)注模型。

2023年年初大模型研討會之后,公司決策要做行業(yè)專屬大模型,并額外追投研發(fā)預(yù)算,也追加了40-50個算法人員的投入。

公司對大模型確立了三個方向:第一,大華不做主流的通用大模型,而是面向業(yè)務(wù)場景做行業(yè)專屬大模型;第二,大華不做ChatGPT那樣的文本生成式AI,還是圍繞視覺方向;第三,大華要重點投入私有化部署,因為大華客戶的很多數(shù)據(jù)是需要做到合規(guī)安全,要用到私有云。大華會在不同時間段推出各類行業(yè)大模型,2023年就會發(fā)布。

大華的大模型不是針對金融領(lǐng)域的數(shù)據(jù)分析,而是通過數(shù)智化手段提升管理質(zhì)量和效率。以城市管理為例,針對一個路口就有幾十條紛繁多樣的管理規(guī)范要求,包括出攤經(jīng)營、井蓋識別、小廣告“牛皮癬”、盲道侵占等等。大華的優(yōu)勢是有豐富的行業(yè)客戶、行業(yè)經(jīng)驗、行業(yè)的作業(yè)流程經(jīng)驗。

通用大模型對云廠家很友好,但需要非常大體量的算法去跑,采用超大規(guī)模參數(shù)的算法對用戶的使用成本太高,大華會在訓(xùn)練和推理優(yōu)化技術(shù)上做一個平衡,讓用戶在成本可控的情況下使用大模型。

殷俊表示,大模型研發(fā)難點有很多,首先是在視覺領(lǐng)域沒有可參照的模型架構(gòu),和現(xiàn)在大眾認(rèn)知的AGI、AIGC技術(shù)方向存在差異,在CV(Computer Vision計算機視覺)領(lǐng)域完全靠自己搭建。

因為選擇路徑不同,所以在數(shù)據(jù)源的處理上,也要靠自己摸索,包括數(shù)據(jù)對齊、圖像描述等。訓(xùn)練框架也是個難點,多模態(tài)大模型是由多個大模型組合的,數(shù)據(jù)輸入以視頻為主,音頻、雷達、激光數(shù)據(jù)為輔,輸出都要以文本為主,視頻轉(zhuǎn)換為文本的過程都需要自己摸索。

此外落地的難點還有如何將模型小型化,這也是大華下半年的重點,例如研發(fā)出一套100億參數(shù)的大模型,怎么用算法把它小型化,讓這個模型可以低成本地運行起來。大算力高成本的大模型很難打動客戶,我們一定要先去幫客戶考慮使用成本的問題。

之前說到大華的私有云部署,這也涉及到成本控制,公有云用戶考慮服務(wù)費用,而私有云用戶因為要自己搭建云,所以關(guān)注服務(wù)+建設(shè)兩部分的成本,對成本控制更在意。

目前大華考慮在城市管理行業(yè)優(yōu)先落地大模型,因為城市管理的需求非常多,環(huán)境千差萬別,任務(wù)需求多但需求明確;其次就是電力行業(yè),儀器儀表操作復(fù)雜、設(shè)備種類繁多且安全性要求高。此外,像物流行業(yè)中的條碼掃描,有很多遮擋、破損、污跡、移位各方面的問題,大華也想試試大模型能不能進一步提升類似的識別能力。

殷俊表示,現(xiàn)在大家都在做的通用大模型,很耗算力,大模型又在風(fēng)口上,算力很難采購,導(dǎo)致了一個爭奪算力的局面。他覺得并非算力越大模型就越好,而且大華做行業(yè)專屬大模型,不需要那么大參數(shù)量的算法體系。對大華來說,大模型已經(jīng)有雛形,重點是如何落地,大華是奔著產(chǎn)業(yè)化去的,不能只停留在技術(shù)層面,“只能看不能用”是不行的。

殷俊認(rèn)為,公司選擇做大模型,要看是否對主營業(yè)務(wù)有所升級,比如科大訊飛(002230.SZ)的大模型可以提升NLP業(yè)務(wù),百度大模型可以升級搜索引擎,恒生大模型對金融數(shù)據(jù)分析業(yè)務(wù)有提升。所以大華也會首選在現(xiàn)有業(yè)務(wù)的基礎(chǔ)上,根據(jù)客戶需求去研發(fā)大模型。

大模型技術(shù)能夠不斷增強智慧視覺等垂直應(yīng)用領(lǐng)域解決方案的競爭力,解決現(xiàn)在的問題和大量的需求,幫助大華不斷完善方案。當(dāng)然大模型的發(fā)展對公司在研發(fā)成本控制、資源整合、精細(xì)化管理等方面也有很大幫助。

未來行業(yè)肯定會洗牌,能快速產(chǎn)業(yè)化的公司才能活下來,每個細(xì)分領(lǐng)域會出現(xiàn)頭部玩家。大模型技術(shù)也會對已有的行業(yè)格局有所沖擊,布局方向?qū)Σ粚Γ懿荒苈涞?,都是很關(guān)鍵的節(jié)點。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-07-24
大華股份:年內(nèi)將推行業(yè)視覺大模型 首先應(yīng)用于城市管理
專注于在已有的應(yīng)用場景加速落地。

長按掃碼 閱讀全文