2025年值得關注的十大AI技術趨勢:除了具身智能 還有這些熱門領域

AI“復活”親人、大模型幫寫年度總結、無人駕駛汽車接送上下班、豆包月活躍用戶數(shù)超7000萬……隨著AI企業(yè)在大模型端的持續(xù)發(fā)力和成熟,2024年AI更多向應用側嘗試落地。

進入2025年,全球AI產(chǎn)業(yè)會呈現(xiàn)哪些新的變化?有哪些突破值得期待?AI超級應用是否會出現(xiàn)?從基礎設施到產(chǎn)品應用,北京智源人工智能研究院給出了2025年度AI趨勢預測,或可提供一些參考。

1.AI將改變未來科研范式

2024年,諾貝爾物理學獎和化學獎均頒給了AI相關領域,被簡化為“AI4S”的AI for Science(AI用于科研)理念也受到了國內外科學家們的重點關注。

當前,AI已經(jīng)在許多不同的科研領域取得成就。除了與諾獎相關的AlphaFold外,還包括諸如DeepMind利用AI技術在核聚變-托克馬克裝置中控制等離子體形狀等。

此外,AI還加速了實驗研究的進程。中國科學院院士張錦此前在出席活動時表示,讓一名同學一天重復3組一樣的實驗基本不可能,但通過自動化平臺做自動化實驗一天可以做150組,極大提高了實驗的重復性,而高質量的實驗數(shù)據(jù)是模擬訓練的基礎。

智源人工智能研究院報告指出,大模型引領下的AI4S已成為推動科學研究范式變革的關鍵力量。2024年,科研人員使用AI的比例快速增加,AI對科學研究方法和流程的變革效應也開始顯現(xiàn)。

2025年,多模態(tài)大模型將進一步融入科學研究,賦能多維數(shù)據(jù)的復雜結構挖掘,輔助科研問題的綜合理解與全局分析,為生物醫(yī)學、氣象、材料發(fā)現(xiàn)、生命模擬、能源等基礎與應用科學的研究開辟新方向。

2.具身智能元年:小腦大模型的嘗試或有突破

在剛剛過去的2024年,具身智能成為最吸金的科技賽道之一,從北美到中國均掀起了空前的融資熱潮。

北美市場,F(xiàn)igure AI籌集6.75億美元,機器人基礎模型公司Skild AI獲得3億美元,Collaborative Robotics籌集了1億美元,OpenAI則獲得66億美元融資。彰顯出資本市場對具身智能領域的看好。

在中國市場,有媒體統(tǒng)計,僅2024年前三季度,中國人形機器人領域就完成了55起融資,同比增加21起。其中不乏科技大廠的身影,比如美團戰(zhàn)略投資宇樹科技、銀河通用,阿里巴巴參與星動紀元融資,華為正式啟動具身智能產(chǎn)業(yè)創(chuàng)新中心。

此外,比亞迪、長安、廣汽、奇瑞、小鵬、小米、蔚來、理想等近10家國內車企也已明確表示未來將進入具身智能賽道。特斯拉預計2025年年底將有數(shù)千臺人形機器人Optimus在特斯拉工廠執(zhí)行任務,2026年將開始交付給外部客戶。

智源人工智能研究院預測,2025年的具身智能,將繼續(xù)從本體擴展到具身腦的敘事主線,我們可以從三方面有更多期待:

在行業(yè)格局上,近百家的具身初創(chuàng)或將迎來洗牌,廠商數(shù)量開始收斂;在技術路線上,端到端模型繼續(xù)迭代,小腦大模型的嘗試或有突破;在商業(yè)變現(xiàn)上,我們也必將看到更多的工業(yè)場景下的具身智能應用,部分人形機器人迎來量產(chǎn)。

3.統(tǒng)一的多模態(tài)大模型實現(xiàn)更高效AI

2024年,各家大模型廠商不再簡單競爭參數(shù)規(guī)模,而是將兼具文字、圖片、視頻等不同能力的多模態(tài)作為重要發(fā)力點。

2024年2月,OpenAI的文生視頻大模型Sora一經(jīng)面世即驚艷世界。隨后,快手、字節(jié)跳動、騰訊、阿里等國內大廠也紛紛推出了文生視頻大模型。目前,快手可靈AI、字節(jié)即夢AI均已上線獨立APP。

值得注意的是,當前的語言大模型、拼接式的多模態(tài)大模型對人類思維過程的模擬仍存在天然的局限性。智源人工智能研究院認為,從訓練之初就打通多模態(tài)數(shù)據(jù),實現(xiàn)端到端輸入和輸出的原生多模態(tài)技術路線給出了多模態(tài)發(fā)展的新可能。

基于此,訓練階段即對齊視覺、音頻、3D等模態(tài)的數(shù)據(jù),實現(xiàn)多模態(tài)的統(tǒng)一,構建原生多模態(tài)大模型成為多模態(tài)大模型進化的重要方向。

4.Scaling Law擴展,模型泛化從預訓練向后訓練、推理遷移

2024年12月中旬,OpenAI 聯(lián)合創(chuàng)始人Ilya Sutskever拋出了一個非常犀利的觀點:預訓練時代即將結束。

Ilya 認為,當前提升計算能力的速度已經(jīng)超過了可用于AI模型訓練的總量,數(shù)據(jù)增長已接近瓶頸,“當前仍然可以使用現(xiàn)有數(shù)據(jù)進行訓練,但趨勢終將放緩,預訓練時代也會逐步結束”。
值得注意的是,Ilya的觀點并非孤言。據(jù)外媒報道,越來越多的從業(yè)者正在重新評估“Scaling law”的有效性和局限性。

對于Scaling Law放緩一說,北京智源人工智能研究院創(chuàng)始董事長、美國國家工程院外籍院士張宏江日前在出席活動時表示,對此并不擔心,“即使在pre-training(預訓練)有放緩趨勢,但GPT-o1的發(fā)布,讓我們看到另外一個天地,就是相對于預訓練模型的‘快思考’模式,推理模型o1可以給更多的思考時間,Scaling Law的推理性能已出現(xiàn)’拐點’,有一個指數(shù)級增長。”

智源人工智能研究院認為,基于Scaling Law推動基礎模型性能提升的訓練模式“性價比”持續(xù)下降,后訓練與特定場景的Scaling law不斷被探索。強化學習作為發(fā)現(xiàn)后訓練、推理階段的Scaling Law的關鍵技術,也將會得到更多的應用和創(chuàng)新使用。

5.世界模型加速發(fā)布,有望成為多模態(tài)大模型的下一階段

近年來,人工智能領域涌現(xiàn)出一種被稱為“世界模型”的新概念,被一些業(yè)內人士視為AI的下一個重大前沿。

所謂世界模型,是一種高度先進的模擬技術,能夠創(chuàng)造出虛擬的3D環(huán)境,這些環(huán)境不僅逼真,還能夠模擬出動作及其后果。簡言之,就是一種讓AI或人類用戶能夠在其中進行交互、探索和游戲的虛擬世界生成器。

“AI教母”李飛飛的World Labs已籌集2.3億美元用于構建“大世界模型”,該公司計劃生成虛擬的三維空間,用戶可以控制其中的物理等變量,并允許人們創(chuàng)建自己的三維“世界”。李飛飛表示,這項技術對藝術家、設計師、開發(fā)者和工程師等職業(yè)群體都有重要意義。

2024年12月,谷歌DeepMind最新基礎世界模型Genie 2登場,能生成各種可控制動作、可玩的3D環(huán)境。今年1月,英偉達發(fā)布首個生成式世界基礎模型Cosmos。此外,初創(chuàng)公司Decart、 Odyssey也均在布局世界模型。

智源人工智能研究院認為,更注重“因果”推理的世界模型賦予AI更高級別的認知和更符合邏輯的推理與決策能力,這種能力不僅能推動AI在自動駕駛、機器人控制及智能制造等前沿領域的深度應用,更有望突破傳統(tǒng)的任務邊界,探索人機交互的新可能。

值得注意的是,盡管前景誘人,世界模型的發(fā)展仍面臨諸多技術挑戰(zhàn)。比如,與目前用于生成式模型的計算量相比,訓練和運行世界模型需要龐大的算力。而且世界模型也存在幻覺問題。

6.合成數(shù)據(jù)將成為大模型迭代與應用落地的重要催化劑

大模型訓練和開發(fā)對數(shù)據(jù)尤其是高質量數(shù)據(jù)的需求量日益增長,但現(xiàn)實世界中大模型訓練所需數(shù)據(jù)量卻日漸緊張。智源人工智能研究院認為,高質量數(shù)據(jù)將成為大模型進一步Scaling up的發(fā)展阻礙,合成數(shù)據(jù)已經(jīng)成為基礎模型廠商補充數(shù)據(jù)的首選。

這與OpenAI聯(lián)合創(chuàng)始人Ilya Sutskever的觀點一致。他曾表示,“預訓練毫無疑問將會終結,與此同時我們也不會再有更多數(shù)據(jù)了。原因在于,我們只有一個互聯(lián)網(wǎng),訓練模型需要的海量數(shù)據(jù)即將枯竭,唯有從現(xiàn)有數(shù)據(jù)中尋找新的突破,AI才會繼續(xù)發(fā)展。以后的突破點,就在于智能體、合成數(shù)據(jù)和推理時計算。”

據(jù)了解,合成數(shù)據(jù)可以降低人工治理和標注的成本,緩解對真實數(shù)據(jù)的依賴,不再涉及數(shù)據(jù)隱私問題;提升數(shù)據(jù)的多樣性,有助于提高模型處理長文本和復雜問題的能力。此外,合成數(shù)據(jù)可以緩解通用數(shù)據(jù)被大廠壟斷,專有數(shù)據(jù)存在獲取成本等問題,促進大模型的應用落地。

目前,市面上有許多工具可生成合成數(shù)據(jù)。比如英偉達發(fā)布的3D仿真數(shù)據(jù)生成引擎Omniverse Replicator,能夠生成物理模擬的合成數(shù)據(jù),用于自動駕駛汽車和機器人的訓練。微軟旗下有開源合成數(shù)據(jù)工具Synthetic Data Showcase,蘋果自研人工智能系統(tǒng)Apple Intelligence,在預訓練階段也大量使用了合成數(shù)據(jù)。

7.推理優(yōu)化迭代加速,成為AI Native應用落地的必要條件

業(yè)內認為,AI Native賽道正在實現(xiàn)從概念到規(guī)模化、商業(yè)化的跨越。截至2024年10月,該領域已吸引85億美元融資,其中不乏大額融資案例,比如生成式AI搜索平臺Perplexity、GitHub對手Poolside在去年分別獲得5億美元融資。

所謂AI Native,是指將人工智能技術深度集成到產(chǎn)品和服務中,使其成為核心功能的一部分,而不是簡單的附加功能。其應用場景包括智能助手(如Siri、Google Assistant)、推薦系統(tǒng)(如Netflix和Spotify)以及可穿戴AI設備、智能眼鏡等原生硬件。

智源人工智能研究院指出,大模型硬件載體從云端向手機、PC等端側硬件滲透。在這些資源受限(AI算力、內存等)的設備上,大模型的落地應用會面臨較大的推理側的開銷限制,對部署資源、用戶體驗、經(jīng)濟成本等均帶來巨大挑戰(zhàn)。算法加速和硬件優(yōu)化技術持續(xù)迭代,雙輪驅動加速AI Native應用落地。

8.Agentic AI成為產(chǎn)品落地的重要模式

2024年12月31日,OpenAI CEO奧特曼在社交平臺公布2025年OpenAI即將發(fā)布的技術產(chǎn)品,通用人工智能(AGI)排在第一位,緊隨其后的就是智能體。他直言,“我們會擁有越來越好的模型,但我認為下一個巨大突破來自智能體。”

AI智能體,就是由AI驅動的軟件工具,只需要給出最小的監(jiān)督,它就可以執(zhí)行多步驟任務。比爾?蓋茨將智能體稱為計算領域的又一次重大變革,預示著它將改變人們與計算機之間的交互方式,甚至顛覆整個軟件行業(yè)。

在去年,智能體已經(jīng)開始被各大科技公司重視起來。國內大廠和AI創(chuàng)業(yè)公司已紛紛推出自家的智能體平臺或應用,比如阿里云ModelScopeGPT、騰訊元器、字節(jié)跳動旗下飛書智能伙伴、百度文心智能體、百川旗下百小應、科大訊飛旗下訊飛友伴、昆侖萬維天工skyAgents等。

信息技術服務和咨詢公司凱捷(Capgemini)發(fā)布的報告稱,雖然目前只有約10%的企業(yè)已經(jīng)開始使用AI智能體,但82%的企業(yè)計劃在未來三年內將智能體整合到工作流中。

從Chatbot、Copilot到AI Agent、Agentic AI,2023年以來行業(yè)對于AI應用形態(tài)的理解越發(fā)深入。智源人工智能研究院認為,2025年,更通用、更自主的智能體將重塑產(chǎn)品應用形態(tài),進一步深入工作與生活場景,成為大模型產(chǎn)品落地的重要應用形態(tài)。

9. AI應用熱度持續(xù)攀升,已來到超級應用爆發(fā)的黎明前夕

近一年時間,生成式模型在圖像、視頻側的處理能力得到大幅提升,疊加推理優(yōu)化帶來的降本,Agent/RAG框架、應用編排工具等技術的持續(xù)發(fā)展,為AI超級應用的落地積基樹本。

截至2024年12月,豆包月活躍用戶數(shù)達到7116萬,成為國內第一、全球第二的AI原生應用。在服務類智能體賽道,螞蟻集團旗下支小寶、螞小財?shù)认盗蠥I管家產(chǎn)品,重塑了AI產(chǎn)品形態(tài)。

然而,與移動互聯(lián)網(wǎng)時代用戶量達數(shù)億甚至十億的超級應用相比,AI時代的的超級應用尚未出現(xiàn)。無論是在美國、歐洲還是中國,都在積極探索能夠發(fā)揮生成式AI能力、且能夠吸引數(shù)十億人使用的應用形態(tài)。

智源研究院行業(yè)研究組負責人倪賢豪表示,“雖然Super APP花落誰家尚未塵埃落定,但從用戶規(guī)模、交互頻次、停留時長等維度來看,AI應用熱度持續(xù)攀升,已到應用爆發(fā)的黎明前夕?!?/p>

他進一步指出,大廠更有機會出現(xiàn)AI超級應用,因為它們的渠道建設能力更強,創(chuàng)業(yè)公司的難度相對比較大。

10.模型能力提升與風險預防并重,AI安全治理體系持續(xù)完善

在信息傳播速度日益加快的當下,由AI系統(tǒng)引發(fā)的偏見、深度偽造、隱私泄漏、版權爭議等問題叢生,社會對AI安全的關注度急劇上升。

與此相對應的,各個國家、組織在AI安全上持續(xù)投入,并進行了技術研究、治理框架、國際合作等多種形式的探索。2024年4月,聯(lián)合國科技大會發(fā)布了兩項大模型安全標準:《生成式人工智能應用安全測試標準》《大語言模型安全測試方法》,這兩項國際標準由 OpenAI、螞蟻集團、科大訊飛、谷歌、微軟、英偉達、百度、騰訊等數(shù)十家單位的多名專家學者共同編制而成。

此外,螞蟻集團自研的大模型安全一體化解決方案“蟻天鑒”已經(jīng)開放給20家外部機構和企業(yè)使用。智源研究院發(fā)起并承辦我國首個AI安全國際對話高端閉門論壇,與全球AI領袖學者及產(chǎn)業(yè)專家聯(lián)合簽署《北京AI安全國際共識》。

總的來說,基礎模型在自主決策上的持續(xù)進步帶來了潛在的失控風險,如何引入新的技術監(jiān)管方法,如何在人工監(jiān)管上平衡行業(yè)發(fā)展和風險管控?這對參與AI的各方來說,都是一個值得持續(xù)探討的議題。(周小白)

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2025-01-09
2025年值得關注的十大AI技術趨勢:除了具身智能 還有這些熱門領域
AI“復活”親人、大模型幫寫年度總結、無人駕駛汽車接送上下班、豆包月活躍用戶數(shù)超7000萬……隨著AI企業(yè)在大模型端的持續(xù)發(fā)力和成熟,2024年AI更多向應用側嘗試落地。

長按掃碼 閱讀全文