2024年8月19日,北京人工智能生態(tài)大會(huì)在中關(guān)村國(guó)家自主創(chuàng)新示范區(qū)會(huì)議中心頤和廳成功召開(kāi)。智譜CEO張鵬作專(zhuān)題分享,簡(jiǎn)要介紹了昇騰對(duì)自主創(chuàng)新的智譜大模型的助力,以及正在打造的基于昇騰的第四代代碼模型CodeGeeX4和多模態(tài)模型CogVLM2-video,華為昇騰計(jì)算業(yè)務(wù)副總裁劉鑫介紹昇騰原生進(jìn)展。
智譜代碼生成大模型CodeGeeX4的新版本基于昇騰AI與昇思AI框架訓(xùn)練,依托昇騰與昇思的多維混合分布式并行技術(shù)等軟硬件能力等,將大幅提升模型開(kāi)發(fā)、訓(xùn)練的效率及模型精度。
智譜CEO 張鵬
華為昇騰計(jì)算業(yè)務(wù)副總裁 劉鑫
模型能力
1.代碼生成大模型CodeGeeX4
第四代代碼模型CodeGeeX4堪稱(chēng)代碼生成大模型的“六邊形戰(zhàn)士”,已經(jīng)發(fā)布的CodeGeeX4-ALL-9B 僅用百億級(jí)參數(shù)實(shí)現(xiàn)模型精度超越業(yè)界主流產(chǎn)品。在NaturalCodebench等測(cè)試基準(zhǔn)上,相對(duì)于更大的模型實(shí)現(xiàn)了性能反超。
CodeGeeX4單一模型實(shí)現(xiàn)編程開(kāi)發(fā)全流程覆蓋,包括需求設(shè)計(jì)、前端開(kāi)發(fā)、后端開(kāi)發(fā)、數(shù)據(jù)處理等場(chǎng)景,支持代碼補(bǔ)全和生成、代碼問(wèn)答、代碼解釋器、工具調(diào)用、聯(lián)網(wǎng)搜索、項(xiàng)目級(jí)代碼問(wèn)答等全面能力。模型長(zhǎng)序列達(dá)128K,支持中文、英文、俄語(yǔ)、法語(yǔ)、西班牙語(yǔ)等20+自然語(yǔ)言和300+編程語(yǔ)言。同時(shí),在模型推理可實(shí)現(xiàn)單卡部署,最低24GB顯存即可進(jìn)行量化推理,用戶(hù)可在本地私有化部署,保護(hù)企業(yè)代碼安全。
2.多模態(tài)大模型CogVLM2-video(視頻生成文本)
多模態(tài)大模型CogVLM2-video實(shí)現(xiàn)視頻生成文本能力,支持2K序列長(zhǎng)度、224×224分辨率的視頻理解以及中英文回答等功能。測(cè)試實(shí)踐顯示,CogVLM2-video在多個(gè)視頻問(wèn)答任務(wù)上達(dá)到了state-of-the-art SOTA模型)的性能,并能夠?qū)崿F(xiàn)一分鐘內(nèi)的視頻理解,在幾個(gè)主流性能測(cè)試數(shù)據(jù)集(MVBench, VideoChatGPT-Bench and Zero-shot VideoQA datasets)中,CogVLM2-video也表現(xiàn)不俗,展現(xiàn)出全面競(jìng)爭(zhēng)力,同時(shí)在多類(lèi)主要指標(biāo)上完成對(duì)其他模型的領(lǐng)先。
基于昇騰與昇思的新版本CodeGeeX4
CodeGeeX4在訓(xùn)練過(guò)程中,調(diào)用昇騰原生的融合算子,利用昇思MindSpore AI框架的提供的多維混合分布式并行能力,通過(guò)對(duì)流水交織并行、tensor模型并行的優(yōu)化,解決內(nèi)存瓶頸、降低計(jì)算空泡、提升通信效率,實(shí)現(xiàn)“計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)”協(xié)同優(yōu)化,對(duì)比同等規(guī)模參數(shù)的模型,訓(xùn)練效率20%提升,加速模型的迭代創(chuàng)新。
另外,該模型也采用MindSpore 2.3版本原創(chuàng)的多級(jí)編譯技術(shù),開(kāi)啟O1編譯選項(xiàng)增加自動(dòng)算子融合優(yōu)化,以接近動(dòng)態(tài)圖的啟動(dòng)時(shí)間獲取了圖模式下接近理論值的內(nèi)存復(fù)用率,進(jìn)而降低重計(jì)算比例,相對(duì)動(dòng)態(tài)圖獲得15%的性能收益。
未來(lái),智譜將與昇騰AI持續(xù)攜手,打造更多領(lǐng)先的自主創(chuàng)新大模型,加速人工智能產(chǎn)業(yè)發(fā)展,助力中國(guó)千行百業(yè)的智能化轉(zhuǎn)型,共同邁向智能新世界。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )