推進(jìn)工業(yè)新質(zhì)生產(chǎn)力,機(jī)器人有望成為AI下一個(gè)“新引擎”?

科技云報(bào)道原創(chuàng)。

推進(jìn)工業(yè)新質(zhì)生產(chǎn)力,機(jī)器人有望成為AI下一個(gè)“新引擎”?

“人工智能的下一波浪潮是機(jī)器人技術(shù),這是一個(gè)‘0億美元市場’,但未來將價(jià)值數(shù)十億美元,就像Nvidia剛起步時(shí)的GPU加速計(jì)算一樣……”這是英偉達(dá)CEO黃仁勛對(duì)加州理工2024屆畢業(yè)生的勸勉。

這不免讓人想起初創(chuàng)公司Figure的人形機(jī)器人,其外表和動(dòng)作都與人類十分相似。它可以與人流暢對(duì)話,理解人的意圖。當(dāng)聽到工程師“想吃點(diǎn)東西”的口令后,它遲疑了一下,準(zhǔn)確地拿起了蘋果。它甚至可以解釋自己為什么要這樣做。

這一人形機(jī)器人背后,是OpenAI公司為其配置的大語言模型。多模態(tài)技術(shù)加持下,它具備高級(jí)視覺和語言智能。

隨著大模型、機(jī)器人制造等技術(shù)發(fā)展,賦予人工智能“形體”的具身智能(Embodied AI)正逐步走入人工智能舞臺(tái)中央。

AI技術(shù)的集大成者

“具身智能”,字面意思是“具有身體的人工智能”。簡言之,具身智能就是讓機(jī)器人或智能系統(tǒng)像生物一樣,通過自己的身體去感知世界、理解世界,并在世界中行動(dòng)和完成任務(wù)的智能技術(shù)。一年多來,隨著政策、資本、產(chǎn)業(yè)、學(xué)術(shù)界的共同推動(dòng),具身智能成為廣為人知的熱門詞匯。

如今,具身智能是人工智能產(chǎn)業(yè)發(fā)展的重要方向之一。英偉達(dá)近期發(fā)布人形機(jī)器人通用基礎(chǔ)模型Project GR00T,希望能讓機(jī)器人擁有更聰明的“大腦”。由Project GR00T驅(qū)動(dòng)的機(jī)器人能夠理解自然語言,并通過觀察人類行為來模仿人類動(dòng)作。在特斯拉2023股東大會(huì)上,馬斯克也向大眾展示了人形機(jī)器人Optimus的全新型號(hào)。這些都是具身智能駛?cè)氚l(fā)展快車道的縮影。

值得一提的是,在大眾語境中,具身智能常常會(huì)被認(rèn)知為人形機(jī)器人,以此作為其通俗意義的指代稱呼。但具身智能不能完全等同于人形機(jī)器人,它代表的是一種智能技術(shù),當(dāng)具身智能走進(jìn)物理世界、與不同硬件結(jié)合時(shí),形成的硬件有可能是機(jī)械手臂、四足或六足機(jī)器人、輪式機(jī)器人,或者人形機(jī)器人,因此二者的范疇是不同的,人形機(jī)器人只是可能承載具身智能的一個(gè)本體。

具身智能強(qiáng)調(diào)的是機(jī)器能夠像人類一樣感知和交互的能力,不僅僅局限于思維和計(jì)算能力。它涉及多個(gè)學(xué)科和技術(shù),包括機(jī)器人學(xué)、計(jì)算機(jī)視覺、計(jì)算機(jī)圖形學(xué)、語音與自然語言處理技術(shù)等,這些技術(shù)共同作用,使機(jī)器能夠理解、推理并與物理世界進(jìn)行有效的互動(dòng)。換句話說,具身智能的獨(dú)特意義在于為實(shí)體機(jī)器人安上“大腦”,讓“機(jī)器”真正變成“機(jī)器人”。

隨著AI技術(shù)的不斷突破,機(jī)器人產(chǎn)業(yè)或?qū)⒊蔀橄乱粋€(gè)萬億市場。人形機(jī)器人是AI最有前景的落地方向之一,未來不僅能將人類從低級(jí)和高危行業(yè)中解放出來,提升人類生產(chǎn)力水平和工作效率,還可以在工業(yè)、商業(yè)、家庭、外太空探索等領(lǐng)域具有廣闊應(yīng)用場景。

根據(jù)Precedence Research數(shù)據(jù),2022年全球人形機(jī)器人市場規(guī)模約為16.2億美元,預(yù)計(jì)到2032年,全球人形機(jī)器人的市場規(guī)模將增至286.6億美元,2022-2032年的CAGR高達(dá)33.28%市場空間廣闊。

當(dāng)前,阻礙人形機(jī)器人商業(yè)化量產(chǎn)的原因包括大規(guī)模應(yīng)用場景不足以及存在諸多技術(shù)問題亟待解決。

一方面,應(yīng)用場景直接影響機(jī)器人需求的剛性程度,目前人形機(jī)器人應(yīng)用場景仍有待挖掘。

另一方面,人形機(jī)器人尚處于功能相對(duì)簡單、初步智能的形態(tài)。其解決路徑核心仍是機(jī)器人功能和智能化水平提升,支撐機(jī)器人從封閉場景走向開放場景,從單一場景進(jìn)入復(fù)雜場景。提升通用化水平是未來人形機(jī)器人行業(yè)發(fā)展的必由之路,必須依靠AI技術(shù)的進(jìn)步和發(fā)展,AI技術(shù)與機(jī)器人的結(jié)合,將彌補(bǔ)當(dāng)前機(jī)器人在智能性、易用性、經(jīng)濟(jì)性上的短板,有效提升機(jī)器人在各個(gè)行業(yè)的滲透率。

傳統(tǒng)的深度學(xué)習(xí)模型中,機(jī)器智能往往局限于特定場景,而在ChatGPT、PaLM為代表的AI多模態(tài)大模型的賦能下,機(jī)器人可以與真實(shí)世界進(jìn)行多模態(tài)交互,從而實(shí)現(xiàn)具身智能,并擁有不斷進(jìn)化、跨場景應(yīng)用的能力。

技術(shù)進(jìn)步與挑戰(zhàn)并存

依托大規(guī)模數(shù)據(jù)和強(qiáng)大算力的大模型,為機(jī)器理解世界提供了前所未有的能力。它與具身智能的結(jié)合,預(yù)示著機(jī)器人的未來將更加智能化、互動(dòng)化。

在制造業(yè)領(lǐng)域,機(jī)器人集成了人工智能、高端制造、新材料等先進(jìn)技術(shù),被譽(yù)為“制造業(yè)皇冠頂端的明珠”。而結(jié)合大模型的人形機(jī)器人,更是新質(zhì)生產(chǎn)力發(fā)展的重要代表。

去年11月,工業(yè)和信息化部印發(fā)《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見》,提出人形機(jī)器人集成人工智能、高端制造、新材料等先進(jìn)技術(shù),發(fā)展?jié)摿Υ蟆?yīng)用前景廣,是未來產(chǎn)業(yè)的新賽道。

發(fā)展具身智能,主要可從三方面發(fā)力。

一是仿生機(jī)制。具身智能的一個(gè)關(guān)鍵目標(biāo)是使機(jī)器能像生物體一樣具備感知、決策和運(yùn)動(dòng)能力。因此,更深入地研究和模仿復(fù)雜的生物機(jī)制,如神經(jīng)系統(tǒng)的運(yùn)行方式、生物體的自我修復(fù)能力等,是實(shí)現(xiàn)這一目標(biāo)的重要途徑。

二是基于物理的智能決策能力。智能系統(tǒng)需要更緊密地與其所處的物理形態(tài)融合,以便在各種環(huán)境中自然、高效地執(zhí)行任務(wù)。這意味著需要發(fā)展出更先進(jìn)的機(jī)器人硬件和軟件技術(shù),支持智能系統(tǒng)在復(fù)雜環(huán)境中的運(yùn)動(dòng)和操作。

三是自主學(xué)習(xí)和適應(yīng)環(huán)境。具身智能系統(tǒng)需要具備自主學(xué)習(xí)和適應(yīng)環(huán)境能力,以便能在復(fù)雜多變的環(huán)境中執(zhí)行任務(wù)和解決問題。這可以通過強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)等機(jī)器學(xué)習(xí)技術(shù)實(shí)現(xiàn)。

然而,難題和挑戰(zhàn)也如影隨形。

首當(dāng)其沖的是算力。具身智能需要進(jìn)行大量計(jì)算來支持感知、決策和運(yùn)動(dòng)過程。隨著任務(wù)和環(huán)境復(fù)雜性的升級(jí),其對(duì)算力的需求會(huì)不斷增加。目前,大模型的參數(shù)已經(jīng)達(dá)到萬億級(jí)別。這類大模型存在過度消耗數(shù)據(jù)和算力的問題。沒有深度學(xué)習(xí)時(shí),算力對(duì)電力的依賴每20個(gè)月翻一番;大模型時(shí)代,算力對(duì)電力的依賴,每年都要翻10到100倍??梢姡懔?duì)電力的消耗呈幾何指數(shù)增長。

數(shù)據(jù)安全也不可忽視。具身智能系統(tǒng)需要收集和處理大量數(shù)據(jù)進(jìn)行學(xué)習(xí)優(yōu)化,這些數(shù)據(jù)可能包含用戶個(gè)人隱私信息。除了隱私泄露,具身智能在實(shí)踐應(yīng)用中,還可能帶來模型中毒、數(shù)據(jù)竄改、內(nèi)部威脅、蓄意攻擊等數(shù)據(jù)安全威脅。

隨著具身智能技術(shù)不斷發(fā)展,也需要關(guān)注其可能帶來的倫理和道德問題。例如,如何確保機(jī)器人在執(zhí)行任務(wù)時(shí)不傷害人類或造成不必要的損失,如何保證機(jī)器人行為符合人類道德和價(jià)值觀等。

具身智能的萬里長征

在2024北京智源大會(huì)上,針對(duì)當(dāng)下人形機(jī)器人賽道參與者眾多、創(chuàng)業(yè)項(xiàng)目層出不窮的現(xiàn)象,零一萬物CEO、創(chuàng)新工場董事長李開復(fù)“潑”了一盆冷水,他透露,目前創(chuàng)新工場投資了約6家無人駕駛公司,卻并沒有投資任何一家具身智能、人形機(jī)器人公司。李開復(fù)指出,具身智能是物理世界跟AI的結(jié)合,一旦大模型接入物理世界,就需要面臨包括安全問題、機(jī)器問題、機(jī)械問題、故障問題在內(nèi)的各種問題,難度會(huì)增加很多倍。

具身智能是重要的,它可以很好地結(jié)合大模型多模態(tài)能力,而且一旦實(shí)現(xiàn)之后就可以產(chǎn)生數(shù)據(jù),形成數(shù)據(jù)飛輪閉環(huán),有很大的想象空間。但具身智能要在短期做好,難度很大,必然要走漫長的道路。

張亞勤從AI安全方面發(fā)出了提醒,隨著AI能力的不斷擴(kuò)大,AI的安全風(fēng)險(xiǎn)也在擴(kuò)大,因此現(xiàn)在考慮未來的風(fēng)險(xiǎn)是很重要的。當(dāng)AGI達(dá)到一定能力并被大規(guī)模部署,那么可能會(huì)有失控的風(fēng)險(xiǎn)。目前AI仍存在可解釋性問題,未來機(jī)器人數(shù)量可能會(huì)比人要多,當(dāng)大模型被用到基礎(chǔ)物理設(shè)施、金融系統(tǒng),包括國家安全、軍事系統(tǒng)等方面,就可能會(huì)有失控的風(fēng)險(xiǎn)。

人工智能的未來就像“薛定諤的貓”,充滿不確定性。但可以確定的是,人類不會(huì)在各種陷阱面前望而卻步、畏首畏尾。面對(duì)人工智能帶來的陷阱,堅(jiān)持開放而審慎、包容而敬畏、大膽而自信的心態(tài),我們就能與新技術(shù)的更迭保持同頻,站在人工智能的肩膀之上抓住機(jī)遇,確保AI技術(shù)朝著有益于人類福祉的方向發(fā)展。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-06-20
推進(jìn)工業(yè)新質(zhì)生產(chǎn)力,機(jī)器人有望成為AI下一個(gè)“新引擎”?
科技云報(bào)道原創(chuàng)。推進(jìn)工業(yè)新質(zhì)生產(chǎn)力,機(jī)器人有望成為AI下一個(gè)“新引擎”?“人工智能的下一波浪潮是機(jī)器人技術(shù),這是一個(gè)‘0億美元市場’...

長按掃碼 閱讀全文