2023年,人工智能發(fā)展風(fēng)起云涌,步入快車道,通用人工智能強(qiáng)勢(shì)突圍,在全球掀起大模型颶風(fēng)。2023年,有哪些AI關(guān)鍵詞值得銘記?不久前,中國(guó)信通院人工智能創(chuàng)新中心發(fā)布的“2023人工智能十大關(guān)鍵詞”給出了答案。
AI基礎(chǔ)設(shè)施
大模型的飛速發(fā)展正在推動(dòng)AI基礎(chǔ)設(shè)施的加速升級(jí)。在需求層面,AI基礎(chǔ)設(shè)施需要支撐萬(wàn)億級(jí)參數(shù)的模型訓(xùn)練、TB/PB級(jí)別的數(shù)據(jù)處理與計(jì)算,提供萬(wàn)卡級(jí)別的算力支撐。在供給層面,AI基礎(chǔ)設(shè)施要更快、更穩(wěn)、更易用。
目前針對(duì)AI基礎(chǔ)設(shè)施,百度、阿里、騰訊等企業(yè)已開(kāi)展實(shí)踐。
而作為亞太地區(qū)知名的人工智能公司,同時(shí)也是人工智能國(guó)家隊(duì)的科大訊飛,早在2009年就開(kāi)始布局算力基礎(chǔ)設(shè)施建設(shè),在總部自建有業(yè)界一流的數(shù)據(jù)中心,截至目前,已建成4城7中心深度學(xué)習(xí)計(jì)算平臺(tái)。同時(shí)還與華為、曙光等國(guó)產(chǎn)平臺(tái)合作,在算力和操作系統(tǒng)方面都有系統(tǒng)性地對(duì)接。
2023年10月24日,科大訊飛星火認(rèn)知大模型V3.0發(fā)布,董事長(zhǎng)劉慶峰在發(fā)布會(huì)上表示,為確保數(shù)據(jù)安全及相關(guān)研究不被外國(guó)卡脖子,星火大模型V3.0所有訓(xùn)練都是在國(guó)產(chǎn)平臺(tái)完成的,所有應(yīng)用底層代碼都是國(guó)產(chǎn)的。
同時(shí)他還透露,2024年上半年,科大訊飛將發(fā)布星火4.0版,性能方面全面對(duì)標(biāo)GPT-4,而星火大模型4.0的訓(xùn)練工作,也將由科大訊飛與華為攜手打造的“飛星一號(hào)”平臺(tái)完成。
高質(zhì)量數(shù)據(jù)集
以數(shù)據(jù)為中心的人工智能時(shí)代,呼喚高質(zhì)量數(shù)據(jù)集。尤其是伴隨著大模型在技術(shù)創(chuàng)新和工程落地的齊頭并進(jìn),高質(zhì)量數(shù)據(jù)集供給成為大模型發(fā)展的主要矛盾。
從發(fā)展需求看,大模型需要高質(zhì)量的數(shù)據(jù),以提高模型精度和可解釋性,減少訓(xùn)練時(shí)間;需要大規(guī)模的數(shù)據(jù),以提升模型訓(xùn)練效果;需要全維度的數(shù)據(jù),以提高模型的泛化能力。
從供給困境看,目前中文數(shù)據(jù)集依然存在四個(gè)方面的問(wèn)題,包括在數(shù)量方面,中文語(yǔ)料供給不足、開(kāi)源生態(tài)不完善;在質(zhì)量方面,缺少代碼和文獻(xiàn)類等高質(zhì)量開(kāi)放數(shù)據(jù)、已公開(kāi)數(shù)據(jù)集與模型訓(xùn)練需求不匹配;在供需對(duì)接方面,數(shù)據(jù)資源流通規(guī)則不健全、對(duì)接生態(tài)鏈缺位;在生態(tài)建設(shè)方面,缺乏共性關(guān)鍵技術(shù)、工具和保障機(jī)制等。
從破局思路看,一方面要從加強(qiáng)內(nèi)部數(shù)據(jù)治理、用好合成數(shù)據(jù)等角度,提升企業(yè)自身數(shù)據(jù)供給能力;另一方面,要從搭建數(shù)據(jù)聯(lián)盟、繪制數(shù)據(jù)資源地圖、推動(dòng)共性關(guān)鍵技術(shù)聯(lián)合攻關(guān)和推動(dòng)數(shù)據(jù)流通模式創(chuàng)新等角度,完善數(shù)據(jù)供給的行業(yè)生態(tài)。
大模型能力增強(qiáng)
隨著思維鏈(CoT)、向量數(shù)據(jù)庫(kù)(Vector Database)、基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)、提示工程(Prompt Engineering)等前沿技術(shù)的應(yīng)用,大模型的能力愈發(fā)強(qiáng)大,智能技術(shù)已初步呈現(xiàn)涌現(xiàn)現(xiàn)象。
4.AI基準(zhǔn)測(cè)試
隨著大模型等人工智能技術(shù)的快速發(fā)展,傳統(tǒng)的“圖靈”測(cè)試和針對(duì)深度學(xué)習(xí)的測(cè)試很難覆蓋所有的智能應(yīng)用場(chǎng)景和邊界樣例,因此很難全面衡量新型人工智能系統(tǒng)的能力。
同時(shí),大模型在知識(shí)涌現(xiàn)、思維鏈、提示工程、多模態(tài)信息處理等方面展現(xiàn)出強(qiáng)大的能力,也給AI基準(zhǔn)測(cè)試帶來(lái)新的挑戰(zhàn),例如如何測(cè)試大模型生成的可靠等。AI基準(zhǔn)測(cè)試已逐漸成為影響AI技術(shù)發(fā)展的關(guān)鍵問(wèn)題。
2023年6月份,中科院人工智能產(chǎn)學(xué)研創(chuàng)新聯(lián)盟和長(zhǎng)三角人工智能產(chǎn)業(yè)聯(lián)盟為大模型制定了7大方向481個(gè)維度的科學(xué)評(píng)測(cè)體系,截至目前,國(guó)內(nèi)已井噴式出現(xiàn)近百種大模型基準(zhǔn)測(cè)試,但基準(zhǔn)測(cè)試仍缺乏統(tǒng)一的體系和方法論,缺乏針對(duì)行業(yè)和場(chǎng)景實(shí)際應(yīng)用效果進(jìn)行測(cè)試的數(shù)據(jù)集。
5.生成式AI應(yīng)用
自去年以來(lái),生成式AI呈現(xiàn)出高效能工具持續(xù)出現(xiàn)、應(yīng)用生態(tài)繁榮的新格局。在技術(shù)方面,大模型、生成算法與多模態(tài)等底層技術(shù)的突破成為生成式AI質(zhì)變的關(guān)鍵。生成式AI更易調(diào)用、部署更輕量、成本更低。
今年國(guó)內(nèi)科技公司發(fā)布的大模型,如訊飛星火、百度文心一言、華為云盤(pán)古等,性能表現(xiàn)持續(xù)向好。
特別是訊飛星火,據(jù)國(guó)務(wù)院發(fā)展研究中心國(guó)研經(jīng)濟(jì)研究院發(fā)布的測(cè)試結(jié)果表明,綜合能力已達(dá)到國(guó)際一流水平,所有7個(gè)測(cè)評(píng)行業(yè)中表現(xiàn)均大幅超越ChatGPT,并在醫(yī)療、法律、教育等行業(yè)超過(guò)GPT-4。
從9月5日開(kāi)放注冊(cè)截至10月末,科大訊飛星火大模型已擁有1200萬(wàn)用戶,為千萬(wàn)用戶持續(xù)創(chuàng)造剛需場(chǎng)景價(jià)值。
目前,生成式AI應(yīng)用已廣泛展開(kāi)。截至2023年末,訊飛星火的應(yīng)用范圍已覆蓋辦公、汽車,金融、醫(yī)療、工業(yè)、法律、科研等各領(lǐng)域。
6.AI安全
大模型在快速發(fā)展的同時(shí),也將安全可信性問(wèn)題拋到了每個(gè)人面前。大模型技術(shù)突破可能放大AI安全風(fēng)險(xiǎn)。
針對(duì)安全問(wèn)題,7月13日,國(guó)家網(wǎng)信辦聯(lián)合多部門(mén)發(fā)布了《生成式人工智能服務(wù)管理暫行辦法》?!掇k法》中反復(fù)強(qiáng)調(diào),中國(guó)的大模型,無(wú)論是芯片、軟件、工具、算力和數(shù)據(jù)資源,都應(yīng)該做到安全可信。
7.MaaS
在大模型火熱發(fā)展的進(jìn)程中,產(chǎn)業(yè)界衍生出多種智能應(yīng)用需求,但是模型的使用門(mén)檻較高,海量的算力、高質(zhì)量的數(shù)據(jù)集、復(fù)雜的技術(shù)棧等問(wèn)題使得很多企業(yè)望而卻步,大模型的高門(mén)檻阻礙了企業(yè)應(yīng)用落地。
MaaS通過(guò)將模型生產(chǎn)過(guò)程分層打造智算基礎(chǔ)設(shè)施、大小模型庫(kù)、一站式開(kāi)發(fā)平臺(tái)以及上層應(yīng)用服務(wù)全套體系,為各類用戶提供多層次一站式服務(wù)。
近年來(lái)產(chǎn)業(yè)界對(duì)MaaS的探索在逐步深入,頭部云廠商相繼發(fā)布自家MaaS產(chǎn)品,實(shí)現(xiàn)和加速M(fèi)aaS生態(tài)賦能各行各業(yè)。
比如在教育場(chǎng)景,科大訊飛推出“教育數(shù)字基座”協(xié)助教育工作者完成學(xué)校個(gè)性化應(yīng)用搭建,縮短開(kāi)發(fā)周期,降低投資成本。
在醫(yī)療場(chǎng)景,發(fā)布星火醫(yī)療大模型應(yīng)對(duì)民生健康的各項(xiàng)需求。
在汽車和辦公場(chǎng)景,“星火大模型+智能座艙”,可讓智能座艙實(shí)現(xiàn)車內(nèi)跨業(yè)務(wù)、跨場(chǎng)景人車自由交流;“星火大模型+數(shù)字員工”,基于自然語(yǔ)言生成業(yè)務(wù)流程和 RPA,可幫助企業(yè)員工完成諸如數(shù)據(jù)分析、產(chǎn)品推薦等大量重復(fù)性工作。
科大訊飛在“數(shù)字員工”行業(yè),實(shí)現(xiàn)了基于自然語(yǔ)言的生成業(yè)務(wù)流程和 RPA(機(jī)器人流程自動(dòng)化),可幫助員工快速完成大量重復(fù)性工作。
8.AI4SE
大模型對(duì)代碼生成和理解性能的突出表現(xiàn),使整個(gè)軟件工程開(kāi)啟了一個(gè)全新階段。
大模型推動(dòng)軟件工程向智能化演進(jìn)。以訊飛星火等為代表的大模型在代碼方面表現(xiàn)出來(lái)的巨大能力,很好地解決了傳統(tǒng)的AI技術(shù)存在的對(duì)代碼的理解能力不足、無(wú)法學(xué)習(xí)不同的編碼規(guī)范和編碼習(xí)慣、重復(fù)性勞動(dòng)多的問(wèn)題。
借助基于訊飛星火大模型的“智能編程助手iFlyCode”,只需輸入簡(jiǎn)單的指令,便能完成復(fù)雜代碼的編寫(xiě),較高的理解和生成能力為軟件工程向全棧智能化方向演進(jìn)提供了基礎(chǔ)支撐。
9.AI Agent
大模型推動(dòng)了AI Agent的快速出現(xiàn)和發(fā)展。從基本概念來(lái)看,AI Agent是以大語(yǔ)言模型為大腦,可以實(shí)現(xiàn)自主理解、長(zhǎng)期記憶、規(guī)劃決策、執(zhí)行復(fù)雜任務(wù)的智能體。
從產(chǎn)生必要性來(lái)看,AI Agent充分結(jié)合大模型“腦”與數(shù)字員工“手”二者的優(yōu)勢(shì),一方面破除了大模型“有腦無(wú)手”的困局,另一方面賦予數(shù)字員工多重能力,帶來(lái)更高級(jí)的自動(dòng)化解決方案。
從目前產(chǎn)品來(lái)看,有自主代理和生成代理兩大類,自主代理根據(jù)需求自動(dòng)規(guī)劃并執(zhí)行任務(wù),成為高效的服務(wù)工具,如上面提到的基于訊飛星火大模型的“數(shù)字員工”和國(guó)外的BabyGPT等,而生成代理?yè)碛凶约旱挠洃浤繕?biāo)和社交關(guān)系,是獨(dú)立的機(jī)器個(gè)體,如斯坦福西部世界小鎮(zhèn)等。
未來(lái),AI Agent作為大模型的核心應(yīng)用模式之一,可能會(huì)掀起新一輪應(yīng)用創(chuàng)新的熱潮。
10.AI原生
大模型技術(shù)的發(fā)展加速了AI原生時(shí)代的到來(lái),其應(yīng)用生態(tài)有望引來(lái)智能化革命。從基本要素來(lái)看,AI原生概念日益明確,它以AI為核心,對(duì)軟件構(gòu)建、用戶交互方式、智能應(yīng)用生成等環(huán)節(jié)進(jìn)行重構(gòu),相關(guān)應(yīng)用完全由AI打造,并具備“原生”的AI能力。
其次AI原生應(yīng)用的核心特點(diǎn)也隨之凸顯,高效、精準(zhǔn)、便捷、自動(dòng)化的特性使其能實(shí)現(xiàn)更智能的服務(wù)。
從目前產(chǎn)品來(lái)看,國(guó)內(nèi)外AI原生應(yīng)用已涉及法律、教育、文學(xué)創(chuàng)作等眾多領(lǐng)域,覆蓋服務(wù)營(yíng)銷、辦公提效、生產(chǎn)優(yōu)化等不同場(chǎng)景。
其中較知名的例子,有國(guó)外的營(yíng)銷文案助手Jasper和國(guó)內(nèi)的包括訊飛星火,百度文一言等在內(nèi)的一眾大模型,借助它們,諸如營(yíng)銷方案、PPT,甚至詩(shī)歌、散文、小說(shuō)等的撰寫(xiě)工作可以事半功倍,高效完成。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )