2025年值得關(guān)注的十大AI技術(shù)趨勢:除了具身智能 還有這些熱門領(lǐng)域

AI“復(fù)活”親人、大模型幫寫年度總結(jié)、無人駕駛汽車接送上下班、豆包月活躍用戶數(shù)超7000萬……隨著AI企業(yè)在大模型端的持續(xù)發(fā)力和成熟,2024年AI更多向應(yīng)用側(cè)嘗試落地。

進入2025年,全球AI產(chǎn)業(yè)會呈現(xiàn)哪些新的變化?有哪些突破值得期待?AI超級應(yīng)用是否會出現(xiàn)?從基礎(chǔ)設(shè)施到產(chǎn)品應(yīng)用,北京智源人工智能研究院給出了2025年度AI趨勢預(yù)測,或可提供一些參考。

1.AI將改變未來科研范式

2024年,諾貝爾物理學(xué)獎和化學(xué)獎均頒給了AI相關(guān)領(lǐng)域,被簡化為“AI4S”的AI for Science(AI用于科研)理念也受到了國內(nèi)外科學(xué)家們的重點關(guān)注。

當(dāng)前,AI已經(jīng)在許多不同的科研領(lǐng)域取得成就。除了與諾獎相關(guān)的AlphaFold外,還包括諸如DeepMind利用AI技術(shù)在核聚變-托克馬克裝置中控制等離子體形狀等。

此外,AI還加速了實驗研究的進程。中國科學(xué)院院士張錦此前在出席活動時表示,讓一名同學(xué)一天重復(fù)3組一樣的實驗基本不可能,但通過自動化平臺做自動化實驗一天可以做150組,極大提高了實驗的重復(fù)性,而高質(zhì)量的實驗數(shù)據(jù)是模擬訓(xùn)練的基礎(chǔ)。

智源人工智能研究院報告指出,大模型引領(lǐng)下的AI4S已成為推動科學(xué)研究范式變革的關(guān)鍵力量。2024年,科研人員使用AI的比例快速增加,AI對科學(xué)研究方法和流程的變革效應(yīng)也開始顯現(xiàn)。

2025年,多模態(tài)大模型將進一步融入科學(xué)研究,賦能多維數(shù)據(jù)的復(fù)雜結(jié)構(gòu)挖掘,輔助科研問題的綜合理解與全局分析,為生物醫(yī)學(xué)、氣象、材料發(fā)現(xiàn)、生命模擬、能源等基礎(chǔ)與應(yīng)用科學(xué)的研究開辟新方向。

2.具身智能元年:小腦大模型的嘗試或有突破

在剛剛過去的2024年,具身智能成為最吸金的科技賽道之一,從北美到中國均掀起了空前的融資熱潮。

北美市場,F(xiàn)igure AI籌集6.75億美元,機器人基礎(chǔ)模型公司Skild AI獲得3億美元,Collaborative Robotics籌集了1億美元,OpenAI則獲得66億美元融資。彰顯出資本市場對具身智能領(lǐng)域的看好。

在中國市場,有媒體統(tǒng)計,僅2024年前三季度,中國人形機器人領(lǐng)域就完成了55起融資,同比增加21起。其中不乏科技大廠的身影,比如美團戰(zhàn)略投資宇樹科技、銀河通用,阿里巴巴參與星動紀元融資,華為正式啟動具身智能產(chǎn)業(yè)創(chuàng)新中心。

此外,比亞迪、長安、廣汽、奇瑞、小鵬、小米、蔚來、理想等近10家國內(nèi)車企也已明確表示未來將進入具身智能賽道。特斯拉預(yù)計2025年年底將有數(shù)千臺人形機器人Optimus在特斯拉工廠執(zhí)行任務(wù),2026年將開始交付給外部客戶。

智源人工智能研究院預(yù)測,2025年的具身智能,將繼續(xù)從本體擴展到具身腦的敘事主線,我們可以從三方面有更多期待:

在行業(yè)格局上,近百家的具身初創(chuàng)或?qū)⒂瓉硐磁?,廠商數(shù)量開始收斂;在技術(shù)路線上,端到端模型繼續(xù)迭代,小腦大模型的嘗試或有突破;在商業(yè)變現(xiàn)上,我們也必將看到更多的工業(yè)場景下的具身智能應(yīng)用,部分人形機器人迎來量產(chǎn)。

3.統(tǒng)一的多模態(tài)大模型實現(xiàn)更高效AI

2024年,各家大模型廠商不再簡單競爭參數(shù)規(guī)模,而是將兼具文字、圖片、視頻等不同能力的多模態(tài)作為重要發(fā)力點。

2024年2月,OpenAI的文生視頻大模型Sora一經(jīng)面世即驚艷世界。隨后,快手、字節(jié)跳動、騰訊、阿里等國內(nèi)大廠也紛紛推出了文生視頻大模型。目前,快手可靈AI、字節(jié)即夢AI均已上線獨立APP。

值得注意的是,當(dāng)前的語言大模型、拼接式的多模態(tài)大模型對人類思維過程的模擬仍存在天然的局限性。智源人工智能研究院認為,從訓(xùn)練之初就打通多模態(tài)數(shù)據(jù),實現(xiàn)端到端輸入和輸出的原生多模態(tài)技術(shù)路線給出了多模態(tài)發(fā)展的新可能。

基于此,訓(xùn)練階段即對齊視覺、音頻、3D等模態(tài)的數(shù)據(jù),實現(xiàn)多模態(tài)的統(tǒng)一,構(gòu)建原生多模態(tài)大模型成為多模態(tài)大模型進化的重要方向。

4.Scaling Law擴展,模型泛化從預(yù)訓(xùn)練向后訓(xùn)練、推理遷移

2024年12月中旬,OpenAI 聯(lián)合創(chuàng)始人Ilya Sutskever拋出了一個非常犀利的觀點:預(yù)訓(xùn)練時代即將結(jié)束。

Ilya 認為,當(dāng)前提升計算能力的速度已經(jīng)超過了可用于AI模型訓(xùn)練的總量,數(shù)據(jù)增長已接近瓶頸,“當(dāng)前仍然可以使用現(xiàn)有數(shù)據(jù)進行訓(xùn)練,但趨勢終將放緩,預(yù)訓(xùn)練時代也會逐步結(jié)束”。
值得注意的是,Ilya的觀點并非孤言。據(jù)外媒報道,越來越多的從業(yè)者正在重新評估“Scaling law”的有效性和局限性。

對于Scaling Law放緩一說,北京智源人工智能研究院創(chuàng)始董事長、美國國家工程院外籍院士張宏江日前在出席活動時表示,對此并不擔(dān)心,“即使在pre-training(預(yù)訓(xùn)練)有放緩趨勢,但GPT-o1的發(fā)布,讓我們看到另外一個天地,就是相對于預(yù)訓(xùn)練模型的‘快思考’模式,推理模型o1可以給更多的思考時間,Scaling Law的推理性能已出現(xiàn)’拐點’,有一個指數(shù)級增長?!?/p>

智源人工智能研究院認為,基于Scaling Law推動基礎(chǔ)模型性能提升的訓(xùn)練模式“性價比”持續(xù)下降,后訓(xùn)練與特定場景的Scaling law不斷被探索。強化學(xué)習(xí)作為發(fā)現(xiàn)后訓(xùn)練、推理階段的Scaling Law的關(guān)鍵技術(shù),也將會得到更多的應(yīng)用和創(chuàng)新使用。

5.世界模型加速發(fā)布,有望成為多模態(tài)大模型的下一階段

近年來,人工智能領(lǐng)域涌現(xiàn)出一種被稱為“世界模型”的新概念,被一些業(yè)內(nèi)人士視為AI的下一個重大前沿。

所謂世界模型,是一種高度先進的模擬技術(shù),能夠創(chuàng)造出虛擬的3D環(huán)境,這些環(huán)境不僅逼真,還能夠模擬出動作及其后果。簡言之,就是一種讓AI或人類用戶能夠在其中進行交互、探索和游戲的虛擬世界生成器。

“AI教母”李飛飛的World Labs已籌集2.3億美元用于構(gòu)建“大世界模型”,該公司計劃生成虛擬的三維空間,用戶可以控制其中的物理等變量,并允許人們創(chuàng)建自己的三維“世界”。李飛飛表示,這項技術(shù)對藝術(shù)家、設(shè)計師、開發(fā)者和工程師等職業(yè)群體都有重要意義。

2024年12月,谷歌DeepMind最新基礎(chǔ)世界模型Genie 2登場,能生成各種可控制動作、可玩的3D環(huán)境。今年1月,英偉達發(fā)布首個生成式世界基礎(chǔ)模型Cosmos。此外,初創(chuàng)公司Decart、 Odyssey也均在布局世界模型。

智源人工智能研究院認為,更注重“因果”推理的世界模型賦予AI更高級別的認知和更符合邏輯的推理與決策能力,這種能力不僅能推動AI在自動駕駛、機器人控制及智能制造等前沿領(lǐng)域的深度應(yīng)用,更有望突破傳統(tǒng)的任務(wù)邊界,探索人機交互的新可能。

值得注意的是,盡管前景誘人,世界模型的發(fā)展仍面臨諸多技術(shù)挑戰(zhàn)。比如,與目前用于生成式模型的計算量相比,訓(xùn)練和運行世界模型需要龐大的算力。而且世界模型也存在幻覺問題。

6.合成數(shù)據(jù)將成為大模型迭代與應(yīng)用落地的重要催化劑

大模型訓(xùn)練和開發(fā)對數(shù)據(jù)尤其是高質(zhì)量數(shù)據(jù)的需求量日益增長,但現(xiàn)實世界中大模型訓(xùn)練所需數(shù)據(jù)量卻日漸緊張。智源人工智能研究院認為,高質(zhì)量數(shù)據(jù)將成為大模型進一步Scaling up的發(fā)展阻礙,合成數(shù)據(jù)已經(jīng)成為基礎(chǔ)模型廠商補充數(shù)據(jù)的首選。

這與OpenAI聯(lián)合創(chuàng)始人Ilya Sutskever的觀點一致。他曾表示,“預(yù)訓(xùn)練毫無疑問將會終結(jié),與此同時我們也不會再有更多數(shù)據(jù)了。原因在于,我們只有一個互聯(lián)網(wǎng),訓(xùn)練模型需要的海量數(shù)據(jù)即將枯竭,唯有從現(xiàn)有數(shù)據(jù)中尋找新的突破,AI才會繼續(xù)發(fā)展。以后的突破點,就在于智能體、合成數(shù)據(jù)和推理時計算。”

據(jù)了解,合成數(shù)據(jù)可以降低人工治理和標注的成本,緩解對真實數(shù)據(jù)的依賴,不再涉及數(shù)據(jù)隱私問題;提升數(shù)據(jù)的多樣性,有助于提高模型處理長文本和復(fù)雜問題的能力。此外,合成數(shù)據(jù)可以緩解通用數(shù)據(jù)被大廠壟斷,專有數(shù)據(jù)存在獲取成本等問題,促進大模型的應(yīng)用落地。

目前,市面上有許多工具可生成合成數(shù)據(jù)。比如英偉達發(fā)布的3D仿真數(shù)據(jù)生成引擎Omniverse Replicator,能夠生成物理模擬的合成數(shù)據(jù),用于自動駕駛汽車和機器人的訓(xùn)練。微軟旗下有開源合成數(shù)據(jù)工具Synthetic Data Showcase,蘋果自研人工智能系統(tǒng)Apple Intelligence,在預(yù)訓(xùn)練階段也大量使用了合成數(shù)據(jù)。

7.推理優(yōu)化迭代加速,成為AI Native應(yīng)用落地的必要條件

業(yè)內(nèi)認為,AI Native賽道正在實現(xiàn)從概念到規(guī)?;⑸虡I(yè)化的跨越。截至2024年10月,該領(lǐng)域已吸引85億美元融資,其中不乏大額融資案例,比如生成式AI搜索平臺Perplexity、GitHub對手Poolside在去年分別獲得5億美元融資。

所謂AI Native,是指將人工智能技術(shù)深度集成到產(chǎn)品和服務(wù)中,使其成為核心功能的一部分,而不是簡單的附加功能。其應(yīng)用場景包括智能助手(如Siri、Google Assistant)、推薦系統(tǒng)(如Netflix和Spotify)以及可穿戴AI設(shè)備、智能眼鏡等原生硬件。

智源人工智能研究院指出,大模型硬件載體從云端向手機、PC等端側(cè)硬件滲透。在這些資源受限(AI算力、內(nèi)存等)的設(shè)備上,大模型的落地應(yīng)用會面臨較大的推理側(cè)的開銷限制,對部署資源、用戶體驗、經(jīng)濟成本等均帶來巨大挑戰(zhàn)。算法加速和硬件優(yōu)化技術(shù)持續(xù)迭代,雙輪驅(qū)動加速AI Native應(yīng)用落地。

8.Agentic AI成為產(chǎn)品落地的重要模式

2024年12月31日,OpenAI CEO奧特曼在社交平臺公布2025年OpenAI即將發(fā)布的技術(shù)產(chǎn)品,通用人工智能(AGI)排在第一位,緊隨其后的就是智能體。他直言,“我們會擁有越來越好的模型,但我認為下一個巨大突破來自智能體?!?/p>

AI智能體,就是由AI驅(qū)動的軟件工具,只需要給出最小的監(jiān)督,它就可以執(zhí)行多步驟任務(wù)。比爾?蓋茨將智能體稱為計算領(lǐng)域的又一次重大變革,預(yù)示著它將改變?nèi)藗兣c計算機之間的交互方式,甚至顛覆整個軟件行業(yè)。

在去年,智能體已經(jīng)開始被各大科技公司重視起來。國內(nèi)大廠和AI創(chuàng)業(yè)公司已紛紛推出自家的智能體平臺或應(yīng)用,比如阿里云ModelScopeGPT、騰訊元器、字節(jié)跳動旗下飛書智能伙伴、百度文心智能體、百川旗下百小應(yīng)、科大訊飛旗下訊飛友伴、昆侖萬維天工skyAgents等。

信息技術(shù)服務(wù)和咨詢公司凱捷(Capgemini)發(fā)布的報告稱,雖然目前只有約10%的企業(yè)已經(jīng)開始使用AI智能體,但82%的企業(yè)計劃在未來三年內(nèi)將智能體整合到工作流中。

從Chatbot、Copilot到AI Agent、Agentic AI,2023年以來行業(yè)對于AI應(yīng)用形態(tài)的理解越發(fā)深入。智源人工智能研究院認為,2025年,更通用、更自主的智能體將重塑產(chǎn)品應(yīng)用形態(tài),進一步深入工作與生活場景,成為大模型產(chǎn)品落地的重要應(yīng)用形態(tài)。

9. AI應(yīng)用熱度持續(xù)攀升,已來到超級應(yīng)用爆發(fā)的黎明前夕

近一年時間,生成式模型在圖像、視頻側(cè)的處理能力得到大幅提升,疊加推理優(yōu)化帶來的降本,Agent/RAG框架、應(yīng)用編排工具等技術(shù)的持續(xù)發(fā)展,為AI超級應(yīng)用的落地積基樹本。

截至2024年12月,豆包月活躍用戶數(shù)達到7116萬,成為國內(nèi)第一、全球第二的AI原生應(yīng)用。在服務(wù)類智能體賽道,螞蟻集團旗下支小寶、螞小財?shù)认盗蠥I管家產(chǎn)品,重塑了AI產(chǎn)品形態(tài)。

然而,與移動互聯(lián)網(wǎng)時代用戶量達數(shù)億甚至十億的超級應(yīng)用相比,AI時代的的超級應(yīng)用尚未出現(xiàn)。無論是在美國、歐洲還是中國,都在積極探索能夠發(fā)揮生成式AI能力、且能夠吸引數(shù)十億人使用的應(yīng)用形態(tài)。

智源研究院行業(yè)研究組負責(zé)人倪賢豪表示,“雖然Super APP花落誰家尚未塵埃落定,但從用戶規(guī)模、交互頻次、停留時長等維度來看,AI應(yīng)用熱度持續(xù)攀升,已到應(yīng)用爆發(fā)的黎明前夕?!?/p>

他進一步指出,大廠更有機會出現(xiàn)AI超級應(yīng)用,因為它們的渠道建設(shè)能力更強,創(chuàng)業(yè)公司的難度相對比較大。

10.模型能力提升與風(fēng)險預(yù)防并重,AI安全治理體系持續(xù)完善

在信息傳播速度日益加快的當(dāng)下,由AI系統(tǒng)引發(fā)的偏見、深度偽造、隱私泄漏、版權(quán)爭議等問題叢生,社會對AI安全的關(guān)注度急劇上升。

與此相對應(yīng)的,各個國家、組織在AI安全上持續(xù)投入,并進行了技術(shù)研究、治理框架、國際合作等多種形式的探索。2024年4月,聯(lián)合國科技大會發(fā)布了兩項大模型安全標準:《生成式人工智能應(yīng)用安全測試標準》《大語言模型安全測試方法》,這兩項國際標準由 OpenAI、螞蟻集團、科大訊飛、谷歌、微軟、英偉達、百度、騰訊等數(shù)十家單位的多名專家學(xué)者共同編制而成。

此外,螞蟻集團自研的大模型安全一體化解決方案“蟻天鑒”已經(jīng)開放給20家外部機構(gòu)和企業(yè)使用。智源研究院發(fā)起并承辦我國首個AI安全國際對話高端閉門論壇,與全球AI領(lǐng)袖學(xué)者及產(chǎn)業(yè)專家聯(lián)合簽署《北京AI安全國際共識》。

總的來說,基礎(chǔ)模型在自主決策上的持續(xù)進步帶來了潛在的失控風(fēng)險,如何引入新的技術(shù)監(jiān)管方法,如何在人工監(jiān)管上平衡行業(yè)發(fā)展和風(fēng)險管控?這對參與AI的各方來說,都是一個值得持續(xù)探討的議題。(周小白)

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2025-01-09
2025年值得關(guān)注的十大AI技術(shù)趨勢:除了具身智能 還有這些熱門領(lǐng)域
AI“復(fù)活”親人、大模型幫寫年度總結(jié)、無人駕駛汽車接送上下班、豆包月活躍用戶數(shù)超7000萬……隨著AI企業(yè)在大模型端的持續(xù)發(fā)力和成熟,2024年AI更多向應(yīng)用側(cè)

長按掃碼 閱讀全文