中國(guó)首個(gè)通用泛化機(jī)器人,千尋智能連續(xù)泛化絲滑處理多任務(wù)

中國(guó)首個(gè)擁有真正意義多任務(wù)連續(xù)泛化具身模型的機(jī)器人,誕生了!這個(gè)機(jī)器人,是真正由模型訓(xùn)練出來(lái)的,據(jù)了解,截止目前除了Figure 01,國(guó)內(nèi)似乎還沒(méi)有第二家能做到這種級(jí)別的泛化能力,即使被百般刁難,都能完成任務(wù)。清華校友下場(chǎng)創(chuàng)業(yè),才4個(gè)月就已融資近2億。

剛結(jié)束的世界機(jī)器人大會(huì),余熱未消。

各家機(jī)器人展示的花活,令人眼花繚亂。

然而大概所有逛展的人都有這樣一個(gè)感觸:目前全世界范圍內(nèi),真正擁有強(qiáng)大泛化能力、能應(yīng)對(duì)各個(gè)場(chǎng)景的機(jī)器人,依然寥寥無(wú)幾。

中國(guó)廠商中是否有哪家機(jī)器人,能夠?qū)崿F(xiàn)真正的多任務(wù)連續(xù)泛化能力?

還真有!消息靈通的我們打聽到,一家名為「千尋智能 Spirit AI」的具身智能公司,已經(jīng)首次展示出了強(qiáng)大的多任務(wù)連續(xù)泛化能力。

據(jù)說(shuō)這家神秘的公司成立時(shí)間并不長(zhǎng),卻展示出了如此級(jí)別的技術(shù)進(jìn)步,他們究竟是怎么做到的?

最近,我們?nèi)ヌ搅藗€(gè)廠,詳細(xì)記錄下了那些驚掉我們下巴的瞬間。

所有動(dòng)作均由神經(jīng)網(wǎng)絡(luò)自動(dòng)生成

怎么刁難都不怕,動(dòng)作無(wú)比絲滑

在研究人員的配合下,我們現(xiàn)場(chǎng)錄制了一番demo。

拿著白色紙杯的小哥走近機(jī)器人,并發(fā)出請(qǐng)求「一杯意式濃縮」,忙于看手機(jī)信息的同時(shí),他卻不小心把杯子弄翻了。

來(lái)看看,千尋的機(jī)器人會(huì)怎么做?

只見,它自如地用一只手將紙杯擺正。

所有動(dòng)作均由神經(jīng)網(wǎng)絡(luò)自動(dòng)生成

然后用另一只手將其放在咖啡機(jī)上,按下功能鍵。

所有動(dòng)作均由神經(jīng)網(wǎng)絡(luò)自動(dòng)生成

等咖啡做好之后,再將盛滿咖啡的杯子放到桌子中間,任務(wù)就大功告成了。

所有動(dòng)作均由神經(jīng)網(wǎng)絡(luò)自動(dòng)生成

接下來(lái)過(guò)來(lái)的這位小哥,想要一杯卡布奇諾。

不過(guò)這次,換的是一個(gè)透明的玻璃杯。

而就在機(jī)器人快要夠到杯子時(shí),小哥還有意「刁難」它,快速把杯子移走了。

所有動(dòng)作均由神經(jīng)網(wǎng)絡(luò)自動(dòng)生成

面對(duì)這種刁難,機(jī)器人表示完全沒(méi)問(wèn)題!

端到端神經(jīng)網(wǎng)絡(luò)強(qiáng)大的泛化能力,讓機(jī)器人能精準(zhǔn)識(shí)別透明反光物體,無(wú)論杯子放到哪里,它的「夾子」手都能輕松hold住。

接下來(lái),我們出場(chǎng)了,決定給它來(lái)個(gè)高難度的任務(wù)。

先隨手在機(jī)器人一只手旁擺放一個(gè)紙巾盒,再將紙杯子緊挨紙巾盒放置,并要求「來(lái)一杯美式」。

沒(méi)想到,它一眼識(shí)別出身旁的障礙物,并將其移到一旁,成功取到了杯子。

所有動(dòng)作均由神經(jīng)網(wǎng)絡(luò)自動(dòng)生成

最后,我們喝到了機(jī)器人制作的美式。

更驚喜的是,我們還在現(xiàn)場(chǎng)意外地發(fā)現(xiàn):千尋機(jī)器人的「夾子」手也可以更換成靈巧手!

它不僅精準(zhǔn)拿起蘋果,還可以將其顛起,精準(zhǔn)拿住。

而且,據(jù)稱無(wú)論是什么樣的手——兩指、三指、五指,都可以實(shí)現(xiàn)連續(xù)多任務(wù)泛化。

看到這兒之后,我們瞬感驚艷,可以暢想出千尋機(jī)器人走進(jìn)家庭的未來(lái),憑借強(qiáng)大的泛化能力,幫助人們完成各種各樣的任務(wù)。

所有動(dòng)作均由神經(jīng)網(wǎng)絡(luò)自動(dòng)生成

緊接著,我們紛紛涌向會(huì)議室,好奇地問(wèn)道,「千尋機(jī)器人究竟是如何實(shí)現(xiàn)如此完美地連續(xù)泛化能力」?

豪華創(chuàng)業(yè)團(tuán)隊(duì),全棧AI配齊

這家堪稱「中國(guó)Figure」的具身智能公司,智囊團(tuán)在世界范圍內(nèi)也算是極其稀缺的。

幕后技術(shù)團(tuán)隊(duì)紛紛出自UC Berkeley、CMU、NTU、清華、北大、浙大、華為、騰訊、大疆、小米等國(guó)內(nèi)外頂尖高校、企業(yè)。

在具身大模型、機(jī)器人研發(fā),以及實(shí)際落地上,這支融合學(xué)術(shù)精英與業(yè)界翹楚的團(tuán)隊(duì),展現(xiàn)出了卓越的實(shí)力。

他們不僅有著基座模型預(yù)訓(xùn)練、RL、IL等核心技術(shù)力,還在機(jī)械臂系統(tǒng)設(shè)計(jì)、機(jī)器人安全、控制架構(gòu)等方面身處行業(yè)前沿。

正因如此,千尋智能才得以具備全棧的AI工程化能力。

一起來(lái)認(rèn)識(shí)下,這支星光熠熠的領(lǐng)軍團(tuán)隊(duì),都有哪些關(guān)鍵人物。

創(chuàng)始人兼CEO韓峰濤

創(chuàng)始人兼CEO韓峰濤,師從機(jī)器人學(xué)術(shù)泰斗丁漢院士,在機(jī)器人領(lǐng)域中深耕十余年。

他曾任珞石機(jī)器人聯(lián)合創(chuàng)始人&CTO,是國(guó)內(nèi)高性能輕型工業(yè)機(jī)器人領(lǐng)軍者和國(guó)內(nèi)力控協(xié)作量產(chǎn)交付第一人,帶隊(duì)成功交付數(shù)十款型號(hào)的產(chǎn)品超20000臺(tái)。

值得一提的是,這些產(chǎn)品還獲得了43項(xiàng)國(guó)內(nèi)外認(rèn)證,其中包括全球僅有兩家、國(guó)內(nèi)唯一的醫(yī)療方向IEC60601安全認(rèn)證。

而且,整機(jī)的自主化率達(dá)到了90%以上。

在產(chǎn)品應(yīng)用方面,韓峰濤博士帶領(lǐng)團(tuán)隊(duì)落地20+行業(yè)、100+場(chǎng)景,1000+客戶的商業(yè)化成果轉(zhuǎn)化。

除了豐富的實(shí)踐經(jīng)驗(yàn),他還積極參加許多國(guó)家級(jí)科研項(xiàng)目。

今年2月,韓峰濤博士創(chuàng)辦了千尋智能Spirit AI,致力于打造行業(yè)領(lǐng)先的通用機(jī)器人AI系統(tǒng)與人形機(jī)器人。

首席科學(xué)家高陽(yáng)

而在AI能力方面,就不得不提另一位核心人物——首席科學(xué)家高陽(yáng),也是千尋智能的聯(lián)合創(chuàng)始人。

他本科就讀于清華計(jì)算機(jī)系,師從國(guó)內(nèi)ML領(lǐng)域享有盛譽(yù)的著名學(xué)者朱軍教授。

憑借出色的表現(xiàn),他獲得了UC Berkeley計(jì)算機(jī)系的全額獎(jiǎng)學(xué)金,攻讀計(jì)算機(jī)視覺博士學(xué)位。

這期間,高陽(yáng)師從國(guó)際計(jì)算機(jī)視覺大師Trevor Darrell教授(曾培養(yǎng)了包括賈揚(yáng)清在內(nèi)的多位視覺領(lǐng)域知名學(xué)者)。

此外,在讀博士、博士后期間,他曾與機(jī)器人學(xué)習(xí)領(lǐng)域的頂尖學(xué)者Sergey Levine和Pieter Abbeel教授有深入合作。

Pieter Abbeel是擴(kuò)散模型(Sora、SD背后核心技術(shù))的提出者之一。

爆火AI搜索初創(chuàng)Perplexity AI的創(chuàng)始人Aravind Srinivas,以及前OpenAI聯(lián)創(chuàng)John Schulman,皆是他的學(xué)生。

論文地址:https://arxiv.org/pdf/2006.11239

此外,Sergey Levine教授是美國(guó)Physical Intelligence (Pi)的創(chuàng)始人。Pi是美國(guó)具身智能領(lǐng)域的頭部公司,獲得OpenAI等公司共計(jì)7000萬(wàn)美元的天使投資。

就讀博士期間,高陽(yáng)在AI頂會(huì)CVPR上,曾發(fā)表了一篇大規(guī)模現(xiàn)實(shí)世界數(shù)據(jù)的端到端自動(dòng)駕駛論文。

這為后來(lái)的端到端自動(dòng)駕駛,如FSD等,奠定了學(xué)術(shù)基礎(chǔ)。

論文地址:https://www2.eecs.berkeley.edu/Pubs/TechRpts/2020/EECS-2020-5.pdf

在個(gè)人貢獻(xiàn)方面,如上介紹的所有機(jī)器人背后核心技術(shù),皆有首席科學(xué)家高陽(yáng)的貢獻(xiàn)。

他在具身智能的三層模型中,取得了豐碩的研究成果。

在強(qiáng)化學(xué)習(xí)方面,高陽(yáng)提出了世界上迄今為止,樣本效率最高的強(qiáng)化學(xué)習(xí)算法EfficientZero、EfficientZero v2。

EfficientZero曾被前OpenAI聯(lián)創(chuàng)、強(qiáng)化學(xué)習(xí)帶頭人John Schulman,賦予了高度評(píng)價(jià)。

在模仿學(xué)習(xí)方面,他提出了EfficientImitate高性能模仿學(xué)習(xí)算法,相比斯坦福的VMAIL提升了600%性能。

此外,高陽(yáng)從利用互聯(lián)網(wǎng)視頻以及預(yù)訓(xùn)練VLM角度,提出了ViLa和CoPa模型。

在硬件方面,千尋智能也是這一賽道中的佼佼者。

團(tuán)隊(duì)不僅具備了世界一流的機(jī)器人運(yùn)動(dòng)控制系統(tǒng)開發(fā)能力,還具備了一流的系統(tǒng)級(jí)機(jī)電系統(tǒng)設(shè)計(jì)能力。

最重要的是,他們已經(jīng)在工業(yè)機(jī)器人、醫(yī)療機(jī)器人方面,有著豐富的經(jīng)驗(yàn),在技術(shù)上實(shí)現(xiàn)「降維打擊」。

總言之,千尋智能在軟硬件方面所具備的領(lǐng)先優(yōu)勢(shì),也成為持續(xù)吸引、贏得資本青睞與押注的關(guān)鍵因素。

所有動(dòng)作均由神經(jīng)網(wǎng)絡(luò)自動(dòng)生成

4個(gè)月,融資2億

這次千尋智能Spirit AI的天使輪融資,由弘暉基金領(lǐng)投,達(dá)晨財(cái)智、千乘資本跟投,同時(shí),順為資本和綠洲資本作為種子輪老股東也在持續(xù)加碼。

現(xiàn)在,具身智能的下一個(gè)爆發(fā)點(diǎn)就在眼前。在商用服務(wù)和家用服務(wù)上,可能批量落地就在3到5年內(nèi)了。

從工業(yè)到服務(wù),再到家庭應(yīng)用,一個(gè)亟待開拓的萬(wàn)億級(jí)市場(chǎng),正在所有人眼前展開。

憑借業(yè)界領(lǐng)先的具身大模型技術(shù),和卓越的機(jī)器人研發(fā)能力,千尋智能將以最高效率完成從技術(shù)研發(fā)到產(chǎn)品市場(chǎng)化的商業(yè)閉環(huán)。

通用機(jī)器人成為人類的親密伙伴,即將從科幻走入現(xiàn)實(shí),整個(gè)世界已經(jīng)開始走進(jìn)智能機(jī)器人時(shí)代。機(jī)器人像iPhone手機(jī)一樣人人可用的時(shí)刻,或許就在眼前了!

而看完了機(jī)器人自主做咖啡,我們對(duì)千尋智能打動(dòng)投資人的理由,也就有了更多具象化的理解。

在弘暉基金投資團(tuán)隊(duì)看來(lái),具身智能是AGI的重要應(yīng)用場(chǎng)景,市場(chǎng)空間極為廣闊。

在過(guò)去,機(jī)器人的操控依賴大量人工編程流程,對(duì)場(chǎng)景有諸多限制。而具身大模型算法與硬件結(jié)合而成的智能體,相對(duì)傳統(tǒng)機(jī)器人會(huì)在任務(wù)泛化性上有極大的提升。

這類智能體,會(huì)是通往空間智能的最佳路徑。而中國(guó)在機(jī)器人硬件產(chǎn)業(yè)鏈上,具備領(lǐng)先優(yōu)勢(shì)。

團(tuán)隊(duì)非常期待,新一代智能機(jī)器人的量產(chǎn)指日可待,掀起一場(chǎng)新的工業(yè)革命。

順為投資團(tuán)隊(duì)非常看好千尋智能創(chuàng)始團(tuán)隊(duì)的復(fù)合背景和行業(yè)經(jīng)驗(yàn)。同樣,綠洲資本投資負(fù)責(zé)人也表示,千尋智能的隊(duì)伍既結(jié)合了產(chǎn)業(yè)理解,還積累了前沿技術(shù)。也是因此,才讓我們見證到了公司在短期內(nèi)的高效成長(zhǎng)和迭代。

達(dá)晨財(cái)智投資團(tuán)隊(duì)則肯定了千尋智能在行業(yè)內(nèi)的稀缺性——這樣一個(gè)團(tuán)隊(duì),是同時(shí)具備機(jī)器人硬件、具身AI算法能力以及商業(yè)化經(jīng)驗(yàn)的老炮團(tuán)隊(duì),緊密結(jié)合了過(guò)往的機(jī)器人工程化理解和前沿學(xué)術(shù)積累。

才短短半年,公司表現(xiàn)出的具身大模型以及快速的軟硬件迭代能力,無(wú)不令人印象深刻。

而千乘資本投資團(tuán)隊(duì)對(duì)千尋智能表示出了強(qiáng)烈的信心。

在他們看來(lái),AI大模型的革命性突破,賦予了機(jī)器人更多的智能性和敏捷性,展現(xiàn)出通用和泛化能力。

在人形機(jī)器人這個(gè)下一個(gè)萬(wàn)億級(jí)別的大賽道,千尋智能無(wú)疑站在了行業(yè)的前沿。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )