報告編委黃勇 愛分析合伙人&首席分析師 文鴻偉 愛分析高級分析師 外部專家(按姓氏拼音排序) 唐虓 艾迪普科技 融合創(chuàng)新中心總經(jīng)理
特別鳴謝(按拼音排序)
報告摘要
元宇宙作為下一代互聯(lián)網(wǎng)的典型代表,很可能將是人類數(shù)字化生存的終極形態(tài),將帶來更高維的信息密度和數(shù)據(jù)價值。從技術構(gòu)成來看,元宇宙包括基礎設施層、引擎層、交互入口層和應用層。工業(yè)元宇宙、數(shù)字人則是元宇宙在落地應用中最為熱門的兩大領域。
本報告重點選取工業(yè)元宇宙、數(shù)字人兩個市場作為研究對象,圍繞各組織的元宇宙應用實踐展開研究。
工業(yè)元宇宙
工業(yè)元宇宙,作為元宇宙+產(chǎn)業(yè)應用的典型代表,工信部也于2022年牽頭發(fā)布了發(fā)布《工業(yè)元宇宙創(chuàng)新發(fā)展三年行動計劃(2022-2025年)》,顯示了政策層面對工業(yè)元宇宙的重視與支持。工業(yè)元宇宙可以讓工業(yè)現(xiàn)場、價值鏈處于數(shù)字化及可視化的狀態(tài),有助于打破工業(yè)生產(chǎn)現(xiàn)場的物理空間與時間限制,擴大信息獲取的范圍、效率,并且可進行模擬試錯,對工業(yè)企業(yè)提升作業(yè)效率、降本增效意義重大。但受限于技術體系復雜、標準尚不統(tǒng)一等問題,工業(yè)元宇宙目前的應用廣度和深度仍舊相對有限。
產(chǎn)業(yè)界目前主要從工業(yè)現(xiàn)場的數(shù)據(jù)采集清洗與分析、展現(xiàn)以及XR設備實現(xiàn)虛實互動、數(shù)字孿生進行虛實融合等維度展開應用實踐。借助數(shù)字孿生尤其是國產(chǎn)化的圖形圖像顯示與交互技術,不僅有助于強化工業(yè)元宇宙的關鍵技術儲備,還有助于增強技術自主可控性,降低數(shù)據(jù)安全風險,從而為更多價值鏈環(huán)節(jié)、更多行業(yè)場景提供應用價值。
數(shù)字人
數(shù)字人,是融合人的外形、思維、行為三要素的數(shù)字化載體,是技術與場景深度融合的綜合產(chǎn)物。伴隨著元宇宙、Web3時代的迎面而來,數(shù)字人不僅有望成為下一代互聯(lián)網(wǎng)人機交互的重要入口,承擔信息傳遞、實時交互的重要職責,還將隨著應用的持續(xù)深入,成為人類在虛擬世界中的重要的數(shù)字資產(chǎn)甚至是情感連接紐帶。目前主要在AI新聞播報、智能陪護、智能助理、直播帶貨等場景,已服務于諸多行業(yè)應用領域,有助于低人力成本,提升了服務的人性化程度、智能化。但目前仍舊面臨智能化程度不足、制作及運營成本高昂、商業(yè)化落地情況不佳問題,本質(zhì)上是技術與產(chǎn)品,尚未在場景端形成深入、可持續(xù)的應用價值和交互體驗。
鑒于此,業(yè)界目前也在積極從單點突破、一體化解決方案兩方面進行嘗試。一方面,尋求在建模、動作捕捉、驅(qū)動、渲染等環(huán)節(jié)的單環(huán)節(jié)優(yōu)化方案;另一方面,以百度、華為、商湯科技等為代表的業(yè)界大廠也在不斷嘗試將數(shù)字人的整個創(chuàng)建、智能交互甚至運營環(huán)節(jié)打通,形成一站式數(shù)字人解決方案平臺。隨著人工智能技術的快速發(fā)展,尤其是AIGC技術的突破,將有望從制作成本、交互智能化與體驗方面給數(shù)字人的制作與應用帶來實質(zhì)性改觀,幫助數(shù)字人深入場景,扎根成長,促進數(shù)字人行業(yè)的健康、快速、可持續(xù)發(fā)展。
目錄
1. 報告綜述
2. 工業(yè)元宇宙
3. 數(shù)字人
4. 結(jié)語 1.報告綜述
元宇宙作為下一代互聯(lián)網(wǎng)的典型代表,很可能將是人類數(shù)字化生存的終極形態(tài),將帶來更高維的信息密度和數(shù)據(jù)價值。從技術構(gòu)成來看,元宇宙包括基礎設施層、引擎層、交互入口層和應用層。工業(yè)元宇宙、數(shù)字人則是元宇宙在落地應用中最為熱門的兩大領域。具體如下:
首先,工業(yè)元宇宙,作為元宇宙上層應用場景的典型代表,一直以來都是元宇宙落地的熱門方向,工信部也于2022年牽頭發(fā)布了發(fā)布《工業(yè)元宇宙創(chuàng)新發(fā)展三年行動計劃(2022-2025年)》,顯示了政策層面對工業(yè)元宇宙的重視與支持。工業(yè)元宇宙可以讓工業(yè)現(xiàn)場、價值鏈處于數(shù)字化及可視化狀態(tài),有助于打破工業(yè)生產(chǎn)現(xiàn)場的物理空間與時間限制,擴大信息獲取的范圍、提升信息獲取的時效性,還可進行模擬試錯,對工業(yè)企業(yè)降本增效、提升作業(yè)效率意義重大。但受限于技術體系復雜、標準尚不統(tǒng)一等問題,工業(yè)元宇宙目前的應用廣度和深度仍舊相對有限。借助數(shù)字孿生尤其是國產(chǎn)化的圖形圖像顯示與交互技術,不僅有助于強化工業(yè)元宇宙的關鍵技術儲備,還有助于增強技術自主可控性,降低數(shù)據(jù)安全風險,從而為更多價值鏈環(huán)節(jié)、更多行業(yè)場景提供應用價值。
其次,數(shù)字人,是融合人的外形、思維、行為三要素的數(shù)字化載體,有望成為下一代互聯(lián)網(wǎng)人機交互的重要入口,承擔著信息傳遞、實時交互的重要職責,甚至隨著應用的持續(xù)深入,數(shù)字人還將成為人類在虛擬世界中的重要的數(shù)字資產(chǎn)甚至是情感連接紐帶。但數(shù)字人目前面臨智能化程度不足、制作及運營成本高昂、商業(yè)化落地情況不佳等問題,本質(zhì)上是技術與產(chǎn)品,尚未在場景端形成深入、可持續(xù)的應用價值和良好交互體驗。隨著人工智能技術的快速發(fā)展,尤其是AIGC技術的突破,將有望從制作成本、交互智能化與體驗方面給數(shù)字人行業(yè)帶來實質(zhì)性改觀,幫助數(shù)字人深入場景,扎根成長,促進數(shù)字人行業(yè)的健康、快速、可持續(xù)發(fā)展。
綜上,本報告選取工業(yè)元宇宙、數(shù)字人兩個市場作為重點研究對象,圍繞相關組織的元宇宙應用實踐展開研究。 2.工業(yè)元宇宙
2.1工業(yè)元宇宙發(fā)展歷程
工業(yè)元宇宙是指面向工業(yè)企業(yè)降本增效、提升作業(yè)效率等需求,在新一代信息技術引領下,借助物聯(lián)網(wǎng)、數(shù)字孿生、人工智能、自然交互、區(qū)塊鏈等各類新技術群的融合,通過對設備、產(chǎn)線等要素的數(shù)字孿生鏡像構(gòu)建,實現(xiàn)工業(yè)企業(yè)全價值鏈的虛實融合,賦能工業(yè)企業(yè)的研發(fā)設計、工藝流程管控、設備運維、仿真測試、售后培訓等全鏈條場景,助力工業(yè)制造、建筑工程、能源、交通、航空航天等領域企業(yè)的智能應用深化和效能提升。其本質(zhì)是元宇宙在工業(yè)領域的垂直化應用,是數(shù)實融合發(fā)展的新型載體。
從發(fā)展過程來看,參考《工業(yè)元宇宙創(chuàng)新發(fā)展三年行動計劃(2022-2025)》并結(jié)合愛分析調(diào)研,橫向角度,工業(yè)元宇宙已在工業(yè)的研發(fā)、生產(chǎn)、管理、銷售、實訓等階段有不同程度應用;縱向角度,工業(yè)元宇宙已實現(xiàn)設備、產(chǎn)線、工廠甚至產(chǎn)業(yè)鏈級的應用,對企業(yè)提質(zhì)降本增效、服務產(chǎn)業(yè)鏈治理與供應鏈優(yōu)化起到了重要作用。
圖1:工業(yè)元宇宙的主要技術構(gòu)成示意
從技術構(gòu)成來看,首先,工業(yè)元宇宙,需要高效基礎的網(wǎng)絡和算力等基礎設施來有效支撐大范圍的工業(yè)級數(shù)據(jù)的采集與運算,將工業(yè)現(xiàn)場各部分業(yè)務系統(tǒng)的數(shù)據(jù)快速融合起來,再配合上述基礎設施進行實時、更深層次的分析處理,進而形成工業(yè)元宇宙的底層物理環(huán)境。其次,需要SCADA(數(shù)據(jù)采集與監(jiān)視控制系統(tǒng))、DCS(分散控制系統(tǒng))等工業(yè)控制系統(tǒng)及CAD\CAE傳統(tǒng)工業(yè)軟件,主要實現(xiàn)各項設備及生產(chǎn)數(shù)據(jù)的采集以及生產(chǎn)過程的自動化控制與執(zhí)行,是工業(yè)元宇宙信息采集、虛實交互的重要支撐;再次,需要人工智能技術,利用算法模型將所采集的數(shù)據(jù)進行數(shù)字化的模擬、推演去提升傳統(tǒng)工業(yè)軟件的模擬速度與精度,甚至可以做一些預測性的維護預警。最后,圖形圖像顯示與交互技術,主要是通過與物理實體環(huán)境的連接,獲取現(xiàn)場實時數(shù)據(jù)并予以可視化,同時與CAD、CAE等傳統(tǒng)工業(yè)軟件進行交叉融合,在數(shù)字空間內(nèi)完成工業(yè)生產(chǎn)現(xiàn)場的鏡像生成及交互操作,可極大提升信息密度、創(chuàng)新工業(yè)現(xiàn)場管理模式。
從應用實踐來看,國外類似達索等一些老牌工業(yè)企業(yè)、Autodesk等設計軟件公司,之前也曾介入到工業(yè)元宇宙中來,但這些企業(yè),尤其是老牌工業(yè)企業(yè),其更多是基于多年來積淀而來的行業(yè)經(jīng)驗,通過與一些新興的技術的融合,面向集團內(nèi)部所進行的一些方案創(chuàng)新,到后來才對外輸出一些整體化解決方案。由于涉及到的技術領域復雜繁多,在國內(nèi),能夠提供全套的、比較完整方案的機構(gòu),目前還相對比較少。
2.2工業(yè)元宇宙目前面臨的主要問題和挑戰(zhàn)
工業(yè)元宇宙的發(fā)展,其背后,本質(zhì)上反應的是工業(yè)發(fā)展的完整歷程,即從機械化、電氣化、信息化到目前的數(shù)字化與智能化時代。工業(yè)元宇宙即是數(shù)字化與智能化大背景下,依托多技術群對提升工業(yè)生產(chǎn)及管控效能目標的一個復雜、系統(tǒng)化落地的過程,整體在國內(nèi)還處于相對初級的階段。
當前來看,國內(nèi)工業(yè)元宇宙還面臨如下主要問題:
1)技術儲備仍舊不足。工業(yè)元宇宙需要硬件設施、基礎軟件、虛擬平臺、內(nèi)容生產(chǎn)、人工智能圖形圖像顯示與交互等多種技術的深刻融合,國內(nèi)目前在基礎軟件、人工智能、圖形圖像顯示與交互等關鍵技術方面,仍舊存在短板,且技術間的深度融合仍需突破。
2)缺乏統(tǒng)一的標準體系。國內(nèi)的工業(yè)元宇宙起步相對晚,應用也并不廣泛,目前還缺乏諸如標準化路線圖、技術架構(gòu)標準、數(shù)據(jù)接口協(xié)議及標準等均還缺乏完備的標準體系,從架構(gòu)搭建、數(shù)據(jù)獲取兩大維度對國內(nèi)元宇宙的發(fā)展形成了制約。
3)數(shù)據(jù)安全問題突出。國內(nèi)的很多基礎工業(yè)軟件,都依賴國外供應商,但工業(yè)生產(chǎn)領域,會涉及大量工業(yè)企業(yè)的關鍵核心數(shù)據(jù),在當前的國際競爭環(huán)境下,數(shù)據(jù)安全問題顯得尤為突出。
4)應用場景的廣度及深度相對有限。無論是橫向的價值鏈維度還是面向不同行業(yè),國內(nèi)的工業(yè)元宇宙應用還相對初級,雖然在產(chǎn)品的數(shù)字化設計、重大設備及產(chǎn)線管理、城市管理等方面已有不同程度的應用,但還是需要在政策、產(chǎn)業(yè)界的持續(xù)推動下,往工業(yè)制造、冶金、港口、航空航天、能源、交通等領域縱深發(fā)展,同時往研發(fā)制造、生產(chǎn)、銷售、培訓等環(huán)節(jié)不斷拓展,加深仿真測試、設備及產(chǎn)線運維、自動駕駛等更豐富場景的應用。
2.3工業(yè)元宇宙當前的主要解決方案
從業(yè)界實踐來看,目前工業(yè)元宇宙領域主要有以下幾類應用方向:
1)工業(yè)現(xiàn)場的數(shù)據(jù)采集清洗與分析、展現(xiàn):由于工業(yè)生產(chǎn)現(xiàn)場設備類型和種類繁多,不同設備的型號及通信協(xié)議存在差異,通過打通協(xié)議、安裝傳感器等方式,將各類物理設備數(shù)據(jù)的基礎數(shù)據(jù)進行采集,然后通過大數(shù)據(jù)技術進行數(shù)據(jù)清洗,最后以二維圖表的形式進行實時展現(xiàn),便于企業(yè)管理者對工業(yè)生產(chǎn)的各方面、各部門數(shù)據(jù)進行分析挖掘、有效決策。
2)XR設備及配套系統(tǒng)進行虛實互動:利用XR設備作為交互平臺,借助通信網(wǎng)絡,讓后臺工程師團隊、后臺知識庫能夠與前端XR設備進行信息的實時交互,以遠程協(xié)助方式,提升現(xiàn)場作業(yè)人員的作業(yè)效率。
3)數(shù)字孿生實現(xiàn)虛實融合:通過數(shù)字孿生、圖形圖像顯示與交互技術,對建筑、廠房、產(chǎn)線、設備進行高精度的復刻,形成數(shù)字鏡像,實現(xiàn)物理世界與虛擬世界之間的映射、重構(gòu);同時通過IoT平臺等方式,實時接入物理世界的真實數(shù)據(jù),通過虛實交互融合,進行分析、模擬、推演,從而實現(xiàn)更好的感知、試錯、預測以及反控,實現(xiàn)“數(shù)”與“實”深度融合。隨著部分廠商在圖形圖像顯示與交互技術領域的技術國產(chǎn)化突破,將有助于我國在工業(yè)元宇宙領域的技術儲備的提升,加速行業(yè)應用,逐步應對數(shù)據(jù)安全問題。
案例1: 數(shù)字孿生驅(qū)動,艾迪普助力工業(yè)設備制造行業(yè)服務蛻變
終端客戶數(shù)字化轉(zhuǎn)型升級加速,用友網(wǎng)絡協(xié)助設備制造商提供賦能方案
用友網(wǎng)絡,是全球領先的企業(yè)服務提供商,為企業(yè)及公共組織提供數(shù)字化、智能化服務,推動產(chǎn)業(yè)轉(zhuǎn)型升級。用友網(wǎng)絡為工業(yè)、醫(yī)療、建筑、能源、金融等多個行業(yè)提供軟件產(chǎn)品及云服務,內(nèi)容覆蓋營銷、采購、制造、供應鏈、財務、人力、協(xié)同等組織全價值鏈環(huán)節(jié),不僅為客戶提供本土化的業(yè)務管理系統(tǒng),還提供專業(yè)的工業(yè)控制系統(tǒng),擁有龐大的客戶基數(shù)。多年來,用友網(wǎng)絡持續(xù)發(fā)揮自身優(yōu)勢,結(jié)合眾多戰(zhàn)略合作伙伴的資源能力,加速我國傳統(tǒng)產(chǎn)業(yè)數(shù)智化轉(zhuǎn)型升級。
近年來,隨著數(shù)字技術的發(fā)展,尤其是數(shù)字孿生、數(shù)據(jù)可視化、大數(shù)據(jù)和人工智能等新興技術在工業(yè)領域的創(chuàng)新應用,眾多工業(yè)企業(yè)都希望通過數(shù)字技術提升自身的數(shù)字化轉(zhuǎn)型效率。用友網(wǎng)絡的設備制造商客戶(以下簡稱“合作伙伴”)也需要順應終端工業(yè)企業(yè)客戶的業(yè)務數(shù)字化轉(zhuǎn)型發(fā)展趨勢,提供相應產(chǎn)品與服務。合作伙伴在順應趨勢發(fā)展升級自身服務能力的時候,面臨以下主要需求痛點:
1. 傳統(tǒng)產(chǎn)品無法適應終端工業(yè)企業(yè)需求升級。工業(yè)企業(yè)的作業(yè)現(xiàn)場,傳統(tǒng)模式下,產(chǎn)線、設備的管控效率相對較低,存在時滯性和信息盲區(qū),管理者無法掌控全局,不能實時做出最優(yōu)決策,潛在風險大,因此終端工業(yè)企業(yè)客戶希望在實體設備交付之時,在設備之外,設備制造商能夠提供一個該設備相應的數(shù)字孿生體,以便利用該設備的數(shù)字原生體在虛擬空間快速的搭建生產(chǎn)環(huán)境,或基于實時數(shù)據(jù)去監(jiān)控物理設備的實時運轉(zhuǎn)狀態(tài)。
2. 實際業(yè)務應用對數(shù)字孿生的技術、產(chǎn)品、成本提出高要求。首先,終端客戶需要將設備及其數(shù)字孿生體應用于實際生產(chǎn)環(huán)節(jié),且涉及大量核心生產(chǎn)數(shù)據(jù),需要數(shù)字孿生技術足夠先進、成熟且技術自主可控;其次,設備制造商通常會有多條產(chǎn)品線及大量設備需要交付,傳統(tǒng)高度依賴人工的項目式交付,無法保證交付效率,且性價比低;最后,在全生命周期視角下,設備制造商需要數(shù)字孿生服務商的產(chǎn)品快速交付、快速部署、靈活拓展,使得給到最終客戶端的增加的邊際成本相對可控,且支持終端客戶的業(yè)務創(chuàng)新。
3. 終端客戶培訓模式亟待變革。很多大型工業(yè)設備,都屬于高凈值設備,基于實體設備進行培訓,有一定的操作風險,并且設備損耗較高,培訓規(guī)模受限,整體培訓成本高昂;而傳統(tǒng)的錄播方式,無法基于設備的實時狀態(tài)進行交互和設備狀態(tài)反饋,培訓效果大打折扣。
針對以上業(yè)務需求痛點,用友網(wǎng)絡決定順應需求升級演化趨勢,啟動工業(yè)3D數(shù)字孿生無人產(chǎn)線項目,通過將數(shù)字孿生技術及產(chǎn)品整合進自身的制造云產(chǎn)品,通過應用方式的升級進階,賦能其合作伙伴,進而為終端工業(yè)企業(yè)提供一體化解決方案,實現(xiàn)降本增效。
艾迪普科技股份有限公司(以下簡稱“艾迪普”),專注實時三維圖形圖像引擎技術研發(fā)與應用,面向工業(yè)、傳媒、教育、醫(yī)療等眾多行業(yè),為客戶提供數(shù)字孿生、元宇宙、虛擬/增強現(xiàn)實、虛擬仿真等產(chǎn)業(yè)創(chuàng)新應用的數(shù)字內(nèi)容生產(chǎn)及信息三維可視化的平臺與工具組件、解決方案。
鑒于此,用友網(wǎng)絡在對數(shù)字孿生技術服務商進行招投標選型工作時,在充分考慮技術自主與先進性、產(chǎn)品成熟度與易用性等多種因素后,最終選擇艾迪普作為合作伙伴。主要考慮到艾迪普的三維圖形圖像引擎擁有100%完全自主知識產(chǎn)權(quán),核心技術獲得了國際專利,產(chǎn)品通過國家級+省級項目及超萬家重點客戶的應用及迭代,成熟度高,通過可視化與無代碼化的建模與可視化工具,可快速、低成本地進行模型開發(fā)。
經(jīng)過與用友網(wǎng)絡智能制造事業(yè)部決策層、交付團隊的多次研討以及前期的業(yè)務調(diào)研與溝通,艾迪普進一步明確了用友網(wǎng)絡對于數(shù)字孿生產(chǎn)品部署及集成效率、全周期應用維護成本的綜合需求,為用友網(wǎng)絡提供了集成了艾迪普自研三維圖形圖像引擎底層核心能力的、無代碼、易學易用的工具化產(chǎn)品,并集成設備運行、產(chǎn)線生產(chǎn)等業(yè)務系統(tǒng)數(shù)據(jù),支持用友網(wǎng)絡快速、低成本地構(gòu)建3D數(shù)字孿生無人產(chǎn)線,升級自身工業(yè)控制軟件應用方式,提升終端用戶體驗,幫助客戶降本增效。
圖2:用友網(wǎng)絡工業(yè)3D數(shù)字孿生無人產(chǎn)線項目參與方關系示意
可視化無代碼化開發(fā)工具,助力高精度數(shù)字孿生產(chǎn)線構(gòu)建
根據(jù)過往服務經(jīng)驗,結(jié)合用友網(wǎng)絡的核心訴求,在艾迪普的建議下,雙方按照“需求刻畫-場景構(gòu)建-虛實匹配-數(shù)據(jù)接入-部署調(diào)試-系統(tǒng)培訓”的“六步走”的具體流程展開項目合作,為用友網(wǎng)絡提供了基于艾迪普自研實時三維圖形圖像引擎核心能力的iArtist(實時三維可視化建模工具)+iVis(信息三維可視化工具)開發(fā)的數(shù)字孿生產(chǎn)線,最終通過與用友網(wǎng)絡IOT平臺進行打通,實現(xiàn)了虛實聯(lián)動,取得了出色的項目成效。
圖3:用友網(wǎng)絡工業(yè)3D數(shù)字孿生無人產(chǎn)線項目合作步驟示意
具體過程如下:
1. 需求刻畫
艾迪普項目團隊與用友網(wǎng)絡項目團隊進行詳細需求對接。一方面,結(jié)合用友網(wǎng)絡及其合作伙伴所反饋信息,明確作為工業(yè)企業(yè)的最終用戶希望以何種形態(tài)來使用設備的數(shù)字孿生體、當前有哪些業(yè)務系統(tǒng)和工業(yè)控制軟件、平時在實際生產(chǎn)當中產(chǎn)生哪些數(shù)據(jù)、對于數(shù)字孿生體有何種展示和交互需求。另一方面,基于需求畫像,艾迪普向用友網(wǎng)絡推薦了SaaS化的工具軟件,即iArtist(實時三維可視化建模工具)+iVis(信息三維可視化工具)。
其中,iArtist支持制作和處理文字、圖片、2D/3D視頻、聲音、VR視頻、模型、數(shù)據(jù)、場景、事件等全類型內(nèi)容,可一站式滿足三維內(nèi)容設計制作需求;iVis信息三維可視化工具軟件可無代碼實現(xiàn)數(shù)字孿生、虛擬仿真、信息可視化等應用開發(fā)。二者結(jié)合,可使得三維數(shù)字內(nèi)容的創(chuàng)建與可視化開發(fā)門檻大幅降低,一次制作后即可規(guī)?;瘡陀谩?/p>
2. 場景構(gòu)建
在客戶需求的基礎上,艾迪普協(xié)助用友網(wǎng)絡針對某個產(chǎn)線,構(gòu)建產(chǎn)線的數(shù)字原生場景。以機械臂生產(chǎn)線為例:
1)若用友網(wǎng)絡能夠提供客戶物理設備的產(chǎn)線三維模型,如設備制造商的機械臂生產(chǎn)線基礎模型,因其還原度較高,則通常艾迪普不用進行明顯的拆解和優(yōu)化,僅需將源文件導入后進行運用iArtist、iVis工具進行微調(diào)即可完成針對該客戶三維產(chǎn)線場景的初步構(gòu)建。
2)若用友網(wǎng)絡提供不了產(chǎn)線三維模型,艾迪普項目團隊將安排團隊赴用友網(wǎng)絡的合作伙伴現(xiàn)場進行現(xiàn)場采集,如通過現(xiàn)場查勘,用CAD、掃描儀、紅外等方式,進行設備各方面數(shù)據(jù)的采集。同時,艾迪普團隊基于設備的模型,運用iArtist、iVis中的一些行業(yè)組件,以可視化方式快速為該設備配套 AGV 小車、運輸流水線等周邊設備,幫助用友網(wǎng)絡快速構(gòu)建針對某個客戶某類型設備的完整生產(chǎn)線初步數(shù)字場景。
3)此外,在上述基礎上,艾迪普的技術團隊還會結(jié)合現(xiàn)場所采集數(shù)據(jù),進行產(chǎn)線模型的拆解、重構(gòu)、清洗等進一步的輕量化優(yōu)化操作,保證模型的精準度和還原度。
3. 虛實匹配
對用友網(wǎng)絡的客戶而言,靜態(tài)的模型固然重要,但對于終端工業(yè)企業(yè)客戶而言,與現(xiàn)實世界能夠進行實時、同步的活體數(shù)字模型,才是數(shù)字孿生的意義所在。為此,艾迪普先利用部分數(shù)據(jù)進行動態(tài)測驗。
1)在靜態(tài)產(chǎn)線模型的基礎上,艾迪普將所建產(chǎn)線當中的所有設備的運動狀態(tài)、運動邏輯與現(xiàn)實產(chǎn)線當中對應設備在產(chǎn)線當中實際運營的狀態(tài)、運動邏輯進行校驗和匹配,確保完全一致,同時核查不同設備所需要的數(shù)據(jù)類型是否完整、準確。
2)對于核查后有運動狀態(tài)缺失的部分,如六軸的機械臂若測驗時給出的數(shù)據(jù)類型是四軸的,會導致機械臂動作還原不夠精準。艾迪普技術團隊通過與用友網(wǎng)絡機器合作伙伴進行溝通,將另外兩軸的數(shù)據(jù)接口開放出來,達到最大化的還原效果,實現(xiàn)了真“孿生”。
4. 數(shù)據(jù)接入
在經(jīng)過建模、數(shù)據(jù)初步測試,確保模型運動狀態(tài)與真實產(chǎn)線不同設備的運動狀態(tài)保持完全一致的前提下,艾迪普團隊進行了生產(chǎn)現(xiàn)場正式的數(shù)據(jù)接入和模型驅(qū)動。
1)艾迪普的底層引擎具備數(shù)據(jù)接入能力,對于IOT平臺接入的之前已經(jīng)識別過的常規(guī)數(shù)據(jù)類型, 可通過引擎的API 接口接入,直接驅(qū)動對應設備進行運轉(zhuǎn)。
2)對于一些之前未識別的數(shù)據(jù)類型,艾迪普則利用引擎的拓展能力,快速進行接口開發(fā)。期間,艾迪普會根據(jù)接口的形態(tài),評估相應接口的時間,通常情況下,幾天之內(nèi)都可順利完成,極大保障了集成效率。
5. 部署調(diào)試
經(jīng)過生產(chǎn)現(xiàn)場實際數(shù)據(jù)的檢測后,艾迪普協(xié)助用友網(wǎng)絡進行3D數(shù)字孿生無人產(chǎn)線的正式部署,并再次校驗實際跟物理設備與數(shù)字孿生體的映射關系,實時數(shù)據(jù)驅(qū)動模型響應速度可達到毫秒級。該3D數(shù)字孿生無人產(chǎn)線可實現(xiàn)本地部署,也可部署在云端,部署十分便捷。
圖4:用友網(wǎng)絡3D數(shù)字孿生無人產(chǎn)線效果圖示意
6. 系統(tǒng)培訓
在艾迪普的協(xié)助下,用友網(wǎng)絡構(gòu)建的3D數(shù)字孿生無人產(chǎn)線打破了客戶原來需要現(xiàn)場啟動大型、高凈值設備對業(yè)務、銷售人員、終端客戶進行現(xiàn)場模擬和培訓的制約,讓受訓人員在自己的終端,實時和產(chǎn)線、設備的數(shù)字孿生體進行交互并觀察產(chǎn)線、設備的實時反饋效果,提升了培訓體驗,大幅降低了設備耗損成本,規(guī)避了培訓風險,提升了培訓效率。
技術可控+過程可視化,用友網(wǎng)絡助推生產(chǎn)范式的優(yōu)化和制造革新
艾迪普幫助用友網(wǎng)絡3D數(shù)字孿生無人產(chǎn)線,實現(xiàn)物理世界實時數(shù)據(jù)與數(shù)字孿生體的無縫連接。待設備制造商的某條設備產(chǎn)線出新產(chǎn)品時,原有的模型可由設備制造商的業(yè)務人員通過可視化的、無代碼工具進行快速的調(diào)整、優(yōu)化,而不必再重新進行建模。并且,由于艾迪普的技術全部為國產(chǎn)化,有效避免了終端工業(yè)企業(yè)客戶大量生產(chǎn)數(shù)據(jù)在開源模型之下的潛在泄露風險。
艾迪普的數(shù)字孿生方案使用門檻低、制作成本低、制作周期短,免去底層技術安全風險,幫助用友網(wǎng)絡實現(xiàn)了無人產(chǎn)線的全要素數(shù)字化、生產(chǎn)過程全實時可視化和運行狀態(tài)監(jiān)測智能化,推動了生產(chǎn)范式的優(yōu)化和制造革新,實現(xiàn)了智慧工廠全域可視化的運營管理新模式,提高了工廠管理效率,加速了產(chǎn)業(yè)數(shù)智化升級。
圖5:用友網(wǎng)絡3D數(shù)字孿生無人產(chǎn)線項目收益示意
3.數(shù)字人
3.1數(shù)字人當前的應用現(xiàn)狀及面臨的主要挑戰(zhàn)——技術、成本、場景成主要制約因素
數(shù)字人,是融合人的外形、思維、行為三要素的數(shù)字化載體,是技術與場景深度融合的綜合產(chǎn)物。伴隨著元宇宙、Web3時代的迎面而來,數(shù)字人不僅有望成為下一代互聯(lián)網(wǎng)人機交互的重要入口,承擔信息傳遞、實時交互的重要職責,還將隨著應用的持續(xù)深入,成為人類在虛擬世界中的重要的數(shù)字資產(chǎn)甚至是情感連接紐帶,其價值勢必會伴隨技術的持續(xù)成熟、應用的持續(xù)深化而加速演化升級。
AI新聞主播、智能陪護、智能助理、直播帶貨等,數(shù)字人如今已服務于諸多行業(yè)應用領域,在大幅降低人力成本的同時,也一定程度上提升了服務的人性化程度、智能化程度以及時間跨度。然而當前數(shù)字人的應用發(fā)展也面臨著一些問題和挑戰(zhàn),主要有以下幾方面:
圖6:數(shù)字人當前發(fā)展面臨的主要問題與挑戰(zhàn)
1)產(chǎn)業(yè)發(fā)展還相對處于早期,技術發(fā)展仍不成熟。從數(shù)字人的技術構(gòu)成來看,除了底層的計算、通信、顯示技術外,關鍵還需要建模、渲染等數(shù)字人開發(fā)技術,以及由AI賦能的智能生成、驅(qū)動、交互技術,分別為數(shù)字人提供外形、“靈魂與大腦”。尤其是在智能化方面,需要NLP、知識圖譜、語音\視覺識別等眾多AI技術共同聚合創(chuàng)新,并做到口型適配。從結(jié)果來看,數(shù)字人的形象與早期相比并未出現(xiàn)明顯進步,智能化驅(qū)動與交互效果也差強人意,存在動作僵硬、肢體和語音不協(xié)調(diào)等問題,無法像真人一樣實時獲取交互內(nèi)容并進行智能化實時反饋,整體的使用和交互體驗還有待改善。
2)數(shù)字人的制作周期長、成本高。數(shù)字人按照角色的類型風格可以分為寫實/超寫實、二次元、卡通角色三大類。目前應用趨勢在往寫實/超寫實風格的數(shù)字人加速演進,但這類數(shù)字人從形象構(gòu)思與設計、建模、骨骼綁定、貼圖、動作捕捉、驅(qū)動、渲染等完整流程,通常需要以月為單位進行各細分環(huán)節(jié)的創(chuàng)作實施,并且構(gòu)建成本至少都在百萬量級,制作成本高昂且周期較長,制約了其在終端的快速迭代發(fā)力。據(jù)英偉達官方消息,其黃仁勛虛擬人在發(fā)布會上出鏡僅14秒視頻,卻共有34位3D美術師和15位軟件工程師協(xié)同參與,總計近千工時,成本可見一斑。
3)數(shù)字人的后期運營成本高昂,同質(zhì)化嚴重,商業(yè)化情況普遍不佳。數(shù)字人主要分為to C的偶像型、to B\G的服務型數(shù)字人兩大類。To C數(shù)字人,主要集中在游戲主播泛娛樂、電商及游戲直播等場景,但在場景內(nèi)缺乏有效交互,更強調(diào)單向、標準化內(nèi)容輸出,沒有差異化特點,效果無法保證,而且to C端的數(shù)字人,完成數(shù)字人制作只是“萬里長征的第一步”,后期IP的持續(xù)打造和粉絲運營才是關鍵,與制作階段成本相比,數(shù)字人運營階段的成本則更高;而to B\G的服務型數(shù)字人,應用場景相對簡單,但需要對行業(yè)知識庫進行持續(xù)更新。整體而言,目前數(shù)字人的前端應用效果并不理想,商業(yè)化空間并未打開。
3.2數(shù)字人行業(yè)的破局實踐思路——AI技術或成破局關鍵
面對數(shù)字人領域當前由于技術、成本所限,致使應用端無法大規(guī)模有效落地進而使得行業(yè)陷入發(fā)展瓶頸的情況:圖7:業(yè)界對于數(shù)字人應用的路徑探索思路
一方面,業(yè)界也在尋求在建模、動作捕捉、驅(qū)動、渲染等環(huán)節(jié)的單環(huán)節(jié)優(yōu)化方案。比如在建模環(huán)節(jié),相較于傳統(tǒng)的CG建模,靜態(tài)掃描、動態(tài)光場重建技術也被引入,不僅效率大幅提升,也克服了傳統(tǒng)CG依賴人工導致的成本高、產(chǎn)能低、品質(zhì)精度不夠的弊端,借助相機陣列和三維掃描儀,制作時間與成本已大幅降低,且效果更好。同時,業(yè)界也在嘗試利用人工智能進行建模,相較于相機陣列、三維掃描儀的數(shù)字人制作成本,AI建??蛇M一步大幅降低制作成本,但仍舊限于關鍵技術的制約,尤其對超寫實級的數(shù)字人,AI建模仍舊有較大提升空間。在驅(qū)動環(huán)節(jié),AI驅(qū)動也在逐步成為主流,隨著ChatGPT的火爆,很多數(shù)字人廠商也紛紛宣布正在研發(fā)將虛擬人接入ChatGPT的相關技術,使AIGC技術以更加形象的數(shù)字人的形式進行輸出,讓數(shù)字人互動更具靈性。
另一方面,以百度、華為、商湯科技等為代表的業(yè)界大廠也在不斷嘗試將數(shù)字人的整個創(chuàng)建、智能交互甚至運營環(huán)節(jié)打通,形成一站式數(shù)字人解決方案平臺。一體化的解決方案,可以有效避免在建模、動捕、驅(qū)動、渲染等數(shù)字人的制作工序當中由于對接溝通產(chǎn)生的溝通協(xié)調(diào)及摩擦成本。在建模方面,憑借強大的AI能力,數(shù)字人解決方案平臺通??梢宰層脩艚?jīng)過圖片上傳,在分鐘甚至秒級時間內(nèi),即可生成2D、3D數(shù)字人形象;在驅(qū)動及交互方面,通過AI語音、AI視頻驅(qū)動,提升語音識別、口型合成等方面的準確率,交互識別和輸出的等待時長、交互人性化方面更加趨向于“真人化”??傊?,通過AI技術,可降低數(shù)字人創(chuàng)作門檻,讓更多機構(gòu)擁有低成本、高效率、高品質(zhì)的數(shù)字人生成能力,同時提升用戶交互體驗,讓數(shù)字人更快更扎實地與場景緊密相連,進而推動行業(yè)健康發(fā)展。
案例2:商湯科技AI數(shù)字人,助力寧波銀行金融網(wǎng)點打開“新窗口”
科技化大勢所趨,寧波銀行以數(shù)字人提升網(wǎng)點服務智能化水平
寧波銀行是一家區(qū)域性上市銀行,是國內(nèi)19家系統(tǒng)重要性銀行之一。目前,寧波銀行在北京、上海、深圳、杭州、南京、蘇州、無錫、溫州等地設有16家分行,開設永贏基金、永贏金租、寧銀理財、寧銀消金4家子公司,全行員工2.5萬人。在英國《銀行家》雜志“2022年度全球銀行1000強”最新榜單中,寧波銀行排名第87位,首次邁入全球銀行百強行列。
當前,銀行業(yè)經(jīng)營環(huán)境發(fā)生了顯著變化,科技化、市場化、國際化趨勢明顯。雖然金融行業(yè)客戶線上化已是大勢所趨,但線下服務網(wǎng)點仍是重要的客戶服務平臺和觸點。在數(shù)字化轉(zhuǎn)型的浪潮下,金融網(wǎng)點正朝著“智能化、無人化”方向發(fā)展。全新的科技理念,將有助于優(yōu)化網(wǎng)點服務標準、質(zhì)量和效率。
寧波銀行始終牢固樹立科技就是第一生產(chǎn)力的發(fā)展理念,持續(xù)加大科技系統(tǒng)建設投入力度,已在同類銀行中建立起一定的比較優(yōu)勢。考慮到數(shù)字人可通過語音交互方式代替銀行員工與客戶進行互動,提供業(yè)務咨詢、產(chǎn)品介紹、掃碼取號等眾多服務,還可協(xié)助客戶在自助機上辦理轉(zhuǎn)賬匯款等業(yè)務,有助于提升自身銀行網(wǎng)點服務的智能化、科技化水平,寧波銀行決定引入數(shù)字人來推動智能服務體系的升級,增添更多金融服務的人文關懷。
針對上述業(yè)務訴求,寧波銀行上海分行攜手商湯科技,打造了超寫實型 AI 數(shù)字人大堂經(jīng)理“小寧”,以栩栩如生的客服形象為客戶提供各類業(yè)務咨詢和服務。該數(shù)字人客服由商湯科技基于三大智能引擎為寧波銀行專屬打造,可提供從前端客戶接待到后端運營管理的全鏈條服務支持。
圖8:寧波銀行-數(shù)字員工-小寧
(圖片來源:新浪科技:寧波銀行上海分行入職001號數(shù)字人員工,商湯科技助力打通智能服務系統(tǒng))
三大智能引擎支撐,寧波銀行數(shù)字人員工高效 “上崗”
根據(jù)與寧波銀行上海分行金融科技部的需求交流,商湯科技結(jié)合自身能力優(yōu)勢,圍繞“擬人化”和“自動化”兩大維度,調(diào)用自身的“智能化生成引擎”、“智能化驅(qū)動引擎”及“智能化交互引擎”三大引擎,并通過三大引擎間的流程打通和標準化處理,打造“一站式”AI 數(shù)字人生產(chǎn)流水線,快速高效地完成“小寧”的建模、驅(qū)動。
圖9:商湯科技 “一站式”數(shù)字人生產(chǎn)能力布局示意
1. 擬人化方面
1)商湯科技的“智慧化生成引擎”將人工智能技術與 CG 建模環(huán)節(jié)融合,支持 3D 超寫實、3D 擬真、3D 卡通等多種類型數(shù)字人的快速生成。該生成引擎可通過少量照片的面部掃描,依托算法自動生成高精度 3D 面部模型,或基于照片快速生成 3D 卡通的風格化形象。此外,該生成引擎還支持調(diào)用相應的算法模塊,自動美化、臉部 / 頭發(fā)等人物形象細節(jié),幫助開發(fā)者在 CG 建模環(huán)節(jié)降低所需投入的成本和時間。基于寧波銀行的需求,商湯科技依托智慧化生成引擎為寧波銀行打造了3D超寫實風格的數(shù)字人形象。
2)同時,為提升“小寧”的動作協(xié)調(diào)性,讓小寧的視覺效果、用戶感知更真實,商湯科技將人工智能技術與動畫設計和制作環(huán)節(jié)相融合,利用“智能化驅(qū)動引擎”分兩個階段進行處理。第一階段,在AI 驅(qū)動準備環(huán)節(jié),通過算法代替人工來加速蒙皮和 BS 制作;其次,在動作 AI 驅(qū)動環(huán)節(jié),通過真人大數(shù)據(jù)的深度神經(jīng)網(wǎng)絡訓練,基于 STA 算法模擬真人說話的口型、表情和肢體動作,使得AI 數(shù)字人的動作表現(xiàn)更加協(xié)調(diào),也大幅減輕了動畫師的工作強度和人工成本。
2. 自動化方面
商湯科技主要依托“智能化交互引擎”從交流對象識別分析、語音語義理解和知識庫運用等三大功能來展開,為“小寧”提供智慧大腦。
1)在交流對象識別分析功能下,商湯科技依賴視覺和語音識別等算法組合,幫助“小寧”在實際應用場景下與用戶快速、高效建立對話關系。當視覺算法識別到人臉注視時,“小寧”可自動開啟語音交互并進行主動式問候及觸發(fā)后續(xù)服務,無需通過傳統(tǒng)語音喚醒;在服務過程中,也可以識別用戶口型,判定當前用戶是否說了話,進而過濾掉背景雜音。
2)在語音語義理解和知識庫方面,基于語音識別(ASR)、語音合成(TTS)、自然語言理解(NLP)等技術組合,結(jié)合商湯所積累的海量金融知識領域的知識問答庫、金融行業(yè)語料自動獲取和 NLP模型訓練能力,快速定制出了“小寧”的智能語音對話和問答系統(tǒng),并通過接入后臺運營管理平臺,實現(xiàn)“小寧”知識庫的在線更新和維護,幫助“小寧”進行持續(xù)迭代升級。
3. 業(yè)務應用方面
1)在業(yè)務前端,“小寧”代替大堂經(jīng)理,可自動識別前來辦理業(yè)務的客戶,并主動接待問好,其后通過專業(yè)、自然的溝通互動,針對客戶的個性化需求進行自動化引導和智能分流,彰顯了作為寧波銀行001號數(shù)字員工的機智與專業(yè)。
2)在管理后端,“小寧”連接了寧波銀行的運營管理平臺,可實現(xiàn)知識庫的持續(xù)更新和業(yè)務數(shù)據(jù)分析。依托知識庫體系,“小寧”可回答各類復雜業(yè)務問題。當遇到超出知識庫范圍的問題時,還可由管理人員遠程接管,以便及時回復。同時,平臺還會自動將該問題進行收集和記錄,在完善答案后,及時更新到知識庫中,以持續(xù)擴大“小寧”的“知識面”。目前,“小寧”已經(jīng)可以回答超過550個常見業(yè)務問題以及由此衍生的超3000個相關業(yè)務問題,通過運營管理平臺的持續(xù)運營優(yōu)化,每天還可新增超過50個業(yè)務相關衍生問題。
3)不僅如此,寧波銀行的運營管理平臺還可匯聚“小寧”作為前端觸點所搜集的與客戶每日互動所產(chǎn)生的大量業(yè)務信息,通過對互動信息進行分析,可對各網(wǎng)點關注問題方向、高頻問題、業(yè)務需求進行后臺統(tǒng)計,進而為寧波銀行內(nèi)部產(chǎn)品迭代、業(yè)務方向預測等提供大數(shù)據(jù)支持,便于寧波銀行對各網(wǎng)點的業(yè)務進行有效的統(tǒng)籌規(guī)劃,進一步實現(xiàn)科技賦能業(yè)務創(chuàng)新。
創(chuàng)新交互體驗,數(shù)字人助力寧波銀行探索服務新模式
生動的形象和近似真人的交互體驗,001號數(shù)字員工“小寧”讓寧波銀行的客戶倍感新鮮,不僅有效提升了客戶關注時間,還能通過新觸點為銀行創(chuàng)造更多業(yè)務推廣機會。在網(wǎng)點“智能化、無人化”的大趨勢下,AI數(shù)字人“小寧”成為銀行服務線下客群的“新窗口”,也成為寧波銀行提升服務效率、提高服務質(zhì)量和標準的重要載體。
此外,商湯科技為寧波銀行上海分行打造的智慧化的知識運營體系,以AI數(shù)字人為入口,為銀行網(wǎng)點建立了有效的運營數(shù)據(jù)管理機制,以智能技術全面提高銀行業(yè)服務效率、持續(xù)提升客戶體驗。
案例資料來源:
a)商湯科技&增強現(xiàn)實核心技術產(chǎn)業(yè)聯(lián)盟《企業(yè)級AI數(shù)字人:數(shù)字經(jīng)濟發(fā)展“新動能”》白皮書
b)寧波銀行官網(wǎng)
c)新浪科技:寧波銀行上海分行入職001號數(shù)字人員工,商湯科技助力打通智能服務系統(tǒng)
d)公開資料整理
4.結(jié)語
愛分析認為,作為技術集大成者的元宇宙,其發(fā)展過程不可能一蹴而就,需要技術革新、產(chǎn)品形態(tài)突破,最終在應用端產(chǎn)生深刻客戶價值,進而實現(xiàn)產(chǎn)業(yè)供需的良性循環(huán)。
具體來看:
1. AIGC不會“吞噬”元宇宙,反而會成為元宇宙發(fā)展的“加速器”。由ChatGPT引爆的AIGC,雖然從資本、社會關注度角度給元宇宙帶來了一定的短期沖擊,但AIGC作為元宇宙引擎層的一項重要工具,可極大促進元宇宙高質(zhì)量內(nèi)容的生成。尤其是作為交互入口的數(shù)字人若接入ChatGPT、百度文心一言等,將還有助于大幅提升數(shù)字人的智能化程度,推動數(shù)字人行業(yè)跨越發(fā)展平臺期;同時,AI繪畫、AI生成策略等,AIGC將發(fā)揮所長,大幅提升數(shù)字內(nèi)容的生成和創(chuàng)作效率,改變數(shù)字內(nèi)容生成范式,為元宇宙的加速發(fā)展提供可能。
2. 輕量元宇宙可能成為元宇宙發(fā)展的突破口。傳統(tǒng)發(fā)展思路下,元宇宙的形態(tài)表現(xiàn)得更為“重度”,并且交互終端多集中于XR設備之上,與普通用戶距離相對較遠。為解決流量問題,在終極元宇宙到來之前,如何利用好現(xiàn)有設備,讓更多人參與其中,逐步向更高級、更深度的元宇宙過渡,是當前元宇宙發(fā)展的重要議題。借助手機等現(xiàn)有終端進行隨時隨地接入的輕量元宇宙,將有望能夠通過撬動需求端,聚集充分的流量,基本解決用戶來源問題,反向拉動生產(chǎn)端,進而促進整體生態(tài)的逐步正向循環(huán)。
3. 工業(yè)元宇宙、數(shù)字文旅、混合辦公、數(shù)字展廳等產(chǎn)業(yè)應用將引領元宇宙應用由點及面。元宇宙當前正在經(jīng)歷自消費級向產(chǎn)業(yè)級過渡的發(fā)展階段,從應用的直觀效果、應用粘性等角度,以工業(yè)元宇宙為代表的領域,將產(chǎn)生更為直觀、可持續(xù)的應用價值,因此有望持續(xù)發(fā)展。隨著技術的進一步突破,元宇宙勢必將慢慢滲透到消費端、產(chǎn)業(yè)端的各個方面。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )