中國(guó)電信星辰語(yǔ)義大模型正式開源,攜手昇騰共建開源大模型生態(tài)

1月10日,中國(guó)電信星辰語(yǔ)義大模型TeleChat-7B版本宣布開源,并開放1T高質(zhì)量清洗數(shù)據(jù)集。星辰語(yǔ)義大模型已與昇騰AI基礎(chǔ)軟硬件完成適配,并開源了適配后的代碼。此外,中國(guó)電信還將在1月20日開源12B版本模型,擁抱更多開發(fā)者共建開源大模型生態(tài)。

星辰語(yǔ)義大模型是由中電信人工智能科技有限公司研發(fā)訓(xùn)練的大語(yǔ)言模型,采用1.5萬億 Tokens中英文高質(zhì)量語(yǔ)料進(jìn)行訓(xùn)練。星辰語(yǔ)義大模型在業(yè)界首次提出緩解多輪幻覺的解決方案,通過關(guān)鍵信息注意力增強(qiáng)、知識(shí)圖譜強(qiáng)化、多輪知識(shí)強(qiáng)化、知識(shí)溯源能力四大技術(shù),將AI大模型的幻覺率降低了40%,這有助于大模型變得更有“人味”,真正理解問題語(yǔ)境,告別風(fēng)馬牛不相及的答案。

目前,星辰語(yǔ)義大模型正在與千行百業(yè)的信息化解決方案進(jìn)行融合,滿足多樣場(chǎng)景需求。在中國(guó)電信內(nèi)部,星辰語(yǔ)義大模型賦能行文寫作、代碼編程、網(wǎng)絡(luò)故障分析以及經(jīng)營(yíng)分析等場(chǎng)景,以行文寫作為例,其平均生成字?jǐn)?shù)超過1500字,有效采納率達(dá)到85.7%;在對(duì)外企事業(yè)單位客戶的業(yè)務(wù)中,星辰語(yǔ)義大模型賦能企業(yè)經(jīng)營(yíng)分析、政務(wù)公開咨詢、民生訴求接待等場(chǎng)景,其業(yè)務(wù)覆蓋率達(dá)到95%,多輪理解準(zhǔn)確率達(dá)到90%。

早在2023年11月,中國(guó)電信就在2023數(shù)字科技生態(tài)大會(huì)上發(fā)布了千億參數(shù)“星辰語(yǔ)義大模型”,并公布了后續(xù)的開源開放的時(shí)間表。本次TeleChat-7B版本開源了對(duì)話模型TeleChat-7B-bot,以及其huggingface格式的權(quán)重文件。此外,還開源了7B模型的int8和int4量化版本。

可訪問開源倉(cāng)了解詳情:

Gitee地址:https://gitee.com/Tele-AI/tele-chat

Github地址:https://github.com/Tele-AI/Telechat

在模型開發(fā)上,星辰語(yǔ)義大模型已與昇騰AI基礎(chǔ)軟硬件完成適配:支持Atlas 300I pro推理卡,具備int8量化能力,精度與性能表現(xiàn)均與業(yè)界第一梯隊(duì)持平;支持Atlas訓(xùn)練服務(wù)器,用戶可使用昇思MindSpore和PyTorch框架進(jìn)行模型訓(xùn)練和推理,兩個(gè)框架下模型精度與性能均有不俗表現(xiàn)。

除了星辰語(yǔ)義大模型,目前已有50+業(yè)界主流大模型基于昇騰訓(xùn)練迭代,9家伙伴攜手昇騰發(fā)布了大模型訓(xùn)推一體機(jī),昇騰以開放易用的平臺(tái)使能千模百態(tài),為大模型創(chuàng)新注入動(dòng)能。

本次星辰語(yǔ)義大模型TeleChat-7B版本開源,夯實(shí)了中國(guó)電信構(gòu)建開放生態(tài)的重要一環(huán),降低了大模型開發(fā)門檻,未來,中國(guó)電信將進(jìn)一步攜手昇騰AI等合作伙伴推動(dòng)中國(guó)大模型在千行百業(yè)落地,加速人工智能產(chǎn)業(yè)發(fā)展。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2024-01-12
中國(guó)電信星辰語(yǔ)義大模型正式開源,攜手昇騰共建開源大模型生態(tài)
星辰語(yǔ)義大模型已與昇騰AI基礎(chǔ)軟硬件完成適配,并開源了適配后的代碼。此外,中國(guó)電信還將在1月20日開源12B版本模型,擁抱更多開發(fā)者共建開源大模型生態(tài)。

長(zhǎng)按掃碼 閱讀全文