訊飛星火與昇騰AI雙向奔赴:本土化技術(shù)創(chuàng)新應(yīng)對全球化挑戰(zhàn)的一次成功驗證

文 | 智能相對論

作者 | 陳泊丞

2019年,彼時的AI賽道還不像今天這么熱。

這一年,人工智能連續(xù)第三年出現(xiàn)在政府工作報告中,政策關(guān)鍵詞從“加快”“加強(qiáng)”轉(zhuǎn)變?yōu)椤吧罨保_始進(jìn)入行業(yè)需求快速增長的應(yīng)用探索期。而華為也在這個階段完成了初步的戰(zhàn)略布局和自主技術(shù)儲備,向更深層次邁進(jìn)??拼笥嶏w也前瞻性地聯(lián)合多家國內(nèi)廠商圍繞根技術(shù)進(jìn)行科研攻關(guān),并希望通過一系列自主創(chuàng)新,提升AI領(lǐng)域的自主化水平,從而真正與國際科技巨頭們能在同一起跑線上進(jìn)行競爭。相似的經(jīng)歷、一致的目標(biāo),讓科大訊飛和華為意識到對根技術(shù)的探索任重道遠(yuǎn),并開始尋求深度的合作。

本土科技廠商的雙向奔赴:“敢用-真用-會用-用好”步步深入

回顧訊飛星火大模型和華為昇騰的合作之路,科大訊飛副總裁、AI工程院院長潘青華梳理出了四個關(guān)鍵階段,即“敢用-真用-會用-用好”,雙方在每一個階段都遇到了大量的問題、顧慮,最終攜手克服困難,才把原生創(chuàng)新的路徑走通。在與昇騰合作之前,科大訊飛就已經(jīng)做了很多技術(shù)上的行動,比如自研深度學(xué)習(xí)并行訓(xùn)練框架和訓(xùn)推工具鏈,基于國內(nèi)優(yōu)秀軟硬件基礎(chǔ)設(shè)施打造穩(wěn)定高效的大規(guī)模深度學(xué)習(xí)訓(xùn)練平臺等等,但是在核心算力層面上始終沒有很好的國產(chǎn)化解決方案,算力資源成了本土科技廠商發(fā)展AI大模型的一個關(guān)鍵限制。在這種情況下,科大訊飛走出了“敢用”的第一步。

隨著對根技術(shù)需求的認(rèn)識加深以及對昇騰AI平臺性能的了解,科大訊飛開始嘗試基于昇騰AI進(jìn)行模型訓(xùn)練和推理工作。昇騰以其高度專業(yè)的服務(wù)態(tài)度和服務(wù)能力,全力支持訊飛AI訓(xùn)練移植優(yōu)化,包含語音識別、語音理解、機(jī)器翻譯等模型在昇騰算力資源上的移植適配。這讓科大訊飛與昇騰AI的合作繼續(xù)進(jìn)入了“真用”階段,開始尋求發(fā)展中解決大模型訓(xùn)練推理的核心難題。

以國內(nèi)首個支持萬億參數(shù)大模型訓(xùn)練的智算集群“飛星一號”正式上線為標(biāo)志性節(jié)點,科大訊飛不僅在業(yè)界首創(chuàng)基于RoCE的大規(guī)模無損組網(wǎng),還與昇騰AI聯(lián)合解決500余次軟硬件問題,首次實現(xiàn)千億參數(shù)大模型訓(xùn)練效率達(dá)到業(yè)界水平。在這個過程中,科大訊飛與昇騰AI共同攻堅克難,解決大規(guī)模集群訓(xùn)練中保存斷點后性能“抖動”、性能“爬坡”等疑難雜癥。有了這些成功的探索與驗證,科大訊飛與昇騰AI的合作進(jìn)入了以原生創(chuàng)新為主導(dǎo)的“會用”階段,雙方在根技術(shù)上的攻關(guān)取得顯著回饋。

基于昇騰硬件親和特性,科大訊飛對星火大模型的模型結(jié)構(gòu)進(jìn)行重新設(shè)計,不僅讓星火大模型訓(xùn)練性能較之前提升10%,還創(chuàng)新實現(xiàn)了混合長序列并行算法,促使星火大模型在昇騰上的長序列性能提升了15%。今年6月,科大訊飛正式發(fā)布完全基于昇騰算力訓(xùn)練的星火大模型V4.0,其中星火V4.0在國內(nèi)外中英文12項主流測試集的8項中,實現(xiàn)了對GPT-4Turbo的超越,成功晉升為業(yè)界領(lǐng)先的通用大模型底座。

未來,科大訊飛將繼續(xù)思考如何進(jìn)一步“用好”昇騰AI,面向更大規(guī)模集群和更大規(guī)模訓(xùn)練任務(wù),共同探索如何持續(xù)挖潛集群性能、大模型推理性能如何進(jìn)一步提升等等一系列問題。

一路走來,步步深入,科大訊飛與昇騰AI從最初的接觸探索到后來的深入?yún)f(xié)同,再到原生創(chuàng)新的成功實踐,雙方以深度合作的姿態(tài),在AI原生創(chuàng)新之路上越走越堅定。

本土化技術(shù)創(chuàng)新完成了一次很好的驗證

本土化技術(shù)創(chuàng)新難在兩大方面,一是技術(shù)難做,沒有解題思路,二是項目難堅持,沒有持續(xù)解決問題的理念,往往就會無疾而終。這是一段長期的探索歷程,技術(shù)決定了起步,而理念決定了起步后的發(fā)展是否能長期。

一、技術(shù)與理念的雙向奔赴。

科大訊飛與昇騰AI的這場合作之所以能成功,不僅是技術(shù)層面的深入?yún)f(xié)同,還有理念層面的雙向奔赴。比如針對大規(guī)模集群訓(xùn)練兩個月后“越訓(xùn)越慢”的問題,科大訊飛與昇騰AI通過集合通信-驅(qū)動-內(nèi)核的層層分析,最終發(fā)現(xiàn)操作系統(tǒng)內(nèi)核問題,導(dǎo)致算子下發(fā)時間變長、訓(xùn)練性能下降,才有了后續(xù)的解決方案。

二、互為反哺的價值共生。

此次合作中,業(yè)界看到的更多是科大訊飛基于昇騰AI完成了一系列成就,但與此同時,昇騰AI也在接受反哺。科大訊飛深入?yún)⑴c并助力昇騰持續(xù)完善面向大模型的軟件生態(tài),共同開發(fā)和優(yōu)化了基礎(chǔ)算子和通信算子共120多個,基于底層開放API接口也開發(fā)了自定義融合算子30多個。同時,雙方共同組建的聯(lián)合項目組還推動了昇騰工具50多項關(guān)鍵特性的開發(fā),促使Mindstudio工具不斷完善,也持續(xù)豐富了昇騰的大模型工具集。

好的合作關(guān)系一定是互相成就的,雙方在本次合作中收獲的巨大成果便是具象化呈現(xiàn),若要實現(xiàn)本土化技術(shù)創(chuàng)新,就應(yīng)該在互為反哺的價值共生關(guān)系中去尋求答案。

三、惠及產(chǎn)業(yè)發(fā)展的生態(tài)成果。

科大訊飛和昇騰AI的這場合作,在惠及企業(yè)自身的同時,也在推動著中國AI產(chǎn)業(yè)的跨越發(fā)展。比如,雙方聯(lián)合打造的國內(nèi)首個支持萬億參數(shù)規(guī)模大模型訓(xùn)練的智算集群“飛星一號”,大幅提升我國在人工智能領(lǐng)域的行業(yè)競爭力。接下來雙方將繼續(xù)深入探索未來中國人工智能產(chǎn)業(yè)發(fā)展的關(guān)鍵問題,相信將有更多技術(shù)創(chuàng)新與生態(tài)成果,更廣泛地惠及千行萬業(yè)。

大模型原生創(chuàng)新時代開了個好頭

科大訊飛和昇騰AI的雙向奔赴為中國AI產(chǎn)業(yè)發(fā)展開了一個好頭。正如潘青華院長在演講中強(qiáng)調(diào),“只有持續(xù)跑得快才能最終跑得贏?!敝袊鳤I產(chǎn)業(yè)發(fā)展需要持續(xù)跑得快。

現(xiàn)階段,“原生創(chuàng)新”概念經(jīng)常被行業(yè)所提及。但大部分的討論只停留在了應(yīng)用原生創(chuàng)新之上,認(rèn)為只要把AI應(yīng)用孵化在技術(shù)平臺上,就是做到了原生創(chuàng)新,往往卻忽視了根技術(shù)的原生創(chuàng)新。

如果孵化到國外的技術(shù)平臺,做到了應(yīng)用的原生創(chuàng)新,那確實是“跑得快”,但是能“持續(xù)”嗎?其中客觀存在的不穩(wěn)定性和高風(fēng)險,或許會在未來的某天突然“暴雷”,給企業(yè)經(jīng)營和產(chǎn)業(yè)發(fā)展帶來不可挽回的損失。

而只有基于根技術(shù)的自主創(chuàng)新,放在自家的技術(shù)平臺上孵化、培育,那才有“持續(xù)跑得快、跑得穩(wěn)”,最終“跑得贏”,跑向一個真正的大模型原生創(chuàng)新時代??拼笥嶏w和昇騰AI就一直在為這樣的時代而努力。

基于訊飛星火醫(yī)療大模型平臺和昇騰AI基礎(chǔ)軟硬件,科大訊飛與華為聯(lián)合打造了一體化醫(yī)療健康私有化解決方案。同時,訊飛醫(yī)療還攜手華為,與四川大學(xué)華西醫(yī)院達(dá)成了三方戰(zhàn)略合作伙伴關(guān)系,共同圍繞創(chuàng)新醫(yī)療服務(wù)模式、改善就醫(yī)體驗、醫(yī)療大模型技術(shù)應(yīng)用等重點領(lǐng)域展開深入合作。

這將是醫(yī)療大模型應(yīng)用落地的一個里程碑,未來一個“AI為每個醫(yī)生打造診療助理,為每個居民打造健康助手的世界”或許很快就會到來。那么,站在社會民生的角度來看,大模型原生創(chuàng)新時代的到來,不僅僅是對產(chǎn)業(yè)發(fā)展有助益,更將是AI普惠社會民眾的開端。

據(jù)多家媒體統(tǒng)計,2024年上半年,在已公開的行業(yè)大模型中標(biāo)信息中,科大訊飛的合同數(shù)量、合同金額均保持行業(yè)領(lǐng)先,行業(yè)場景逐步拓寬。今天,隨著AI賽道越來越熱,千行萬業(yè)都在向AI領(lǐng)域發(fā)起沖鋒,而產(chǎn)業(yè)經(jīng)濟(jì)的高質(zhì)量發(fā)展需要持續(xù)跑得快、跑得穩(wěn),最終才能跑得贏。這一目標(biāo)離不開本土企業(yè)對根技術(shù)的攻關(guān)以及對原生創(chuàng)新的堅持。

在訊飛星火與昇騰AI的雙向奔赴中,業(yè)界看到了一條從技術(shù)攻關(guān)到應(yīng)用探索的完整路徑。以此為標(biāo)桿,中國的AI產(chǎn)業(yè)又完成了一次探索驗證,將跨入一個更穩(wěn)定、堅實的發(fā)展新階段。

*本文圖片均來源于網(wǎng)絡(luò)

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-10-11
訊飛星火與昇騰AI雙向奔赴:本土化技術(shù)創(chuàng)新應(yīng)對全球化挑戰(zhàn)的一次成功驗證
訊飛星火與昇騰AI雙向奔赴:本土化技術(shù)創(chuàng)新應(yīng)對全球化挑戰(zhàn)的一次成功驗證

長按掃碼 閱讀全文