在技術(shù)迸發(fā)、智慧涌現(xiàn)的AI時(shí)代,中國(guó)企業(yè)從不會(huì)缺席!如果說(shuō)ChatGPT是生成式AI爆發(fā)的“導(dǎo)火索”,那么接連而來(lái)的國(guó)產(chǎn)大模型就像裝滿(mǎn)火藥的戰(zhàn)船,在奮勇沖鋒中炸開(kāi)了一道又一道關(guān)口,整體縮短甚至局部超越了與ChatGPT的航距。目前為止,業(yè)界比較認(rèn)可的國(guó)產(chǎn)大模型分別有訊飛星火、文心一言、通義千問(wèn)和360智腦等,而令大家好奇的是,這些國(guó)產(chǎn)大模型之間孰強(qiáng)孰弱?近期,老牌知名科技媒體IT之家重磅推出了四款主流大模型的橫向測(cè)評(píng),其中諸多測(cè)試結(jié)果令人意想不到。
此次IT之家對(duì)國(guó)產(chǎn)大模型進(jìn)行了10個(gè)維度的評(píng)測(cè),每個(gè)維度單項(xiàng)得分10分,累計(jì)總分100分。這樣的打分機(jī)制非常公平,10個(gè)維度也依次體現(xiàn)了大模型的場(chǎng)景應(yīng)用。根據(jù)測(cè)試結(jié)果,訊飛星火以總分93分的成績(jī)一騎絕塵,并且在“終端支持”、“語(yǔ)言理解能力”、“代碼編寫(xiě)能力”、“多輪對(duì)話(huà)能力”“AI助手功能”等單項(xiàng)獲滿(mǎn)分。百度的文心一言則以84分的總成績(jī)緊隨其后,360智腦和通義千問(wèn)總分與訊飛星火有較大的差距。
具體到測(cè)試單項(xiàng),在終端支持能力上,訊飛星火是目前唯一“五端全覆蓋”的國(guó)產(chǎn)大模型,五端分別指安卓、iOS、小程序、PC和H5,幾乎涵蓋了移動(dòng)端和桌面端的所有設(shè)備。用戶(hù)既可以在上班的時(shí)候,將訊飛星火當(dāng)成AI輔助工具,又可以在移動(dòng)辦公或出差的時(shí)候,隨時(shí)打開(kāi)訊飛星火尋求“支援”,隨時(shí)隨地獲得大模型能力的加持。
在語(yǔ)言理解能力測(cè)試上,這向來(lái)就是訊飛星火的“主戰(zhàn)場(chǎng)”,自AI語(yǔ)音起家,訊飛背靠認(rèn)知智能全國(guó)重點(diǎn)實(shí)驗(yàn)室與五大聲學(xué)實(shí)驗(yàn)室,在自然語(yǔ)言理解技術(shù)上擁有深厚沉淀。在IT之家的測(cè)試中,多次采用“一語(yǔ)雙關(guān)”或“一語(yǔ)多意”的詞匯來(lái)檢測(cè)理解能力,結(jié)果訊飛星火都深度理解了語(yǔ)言背后的深層意圖,并給出了很有邏輯性且精煉的回答。
在多輪對(duì)話(huà)能力測(cè)試中,IT之家采用唐詩(shī)宋詞來(lái)“考”大模型,結(jié)果360智腦把白居易描寫(xiě)草原的詩(shī)強(qiáng)行說(shuō)成描寫(xiě)月亮,犯了“張冠李戴”的錯(cuò)誤。而訊飛星火不僅能識(shí)別描寫(xiě)月亮的詩(shī)詞,還自行創(chuàng)作了兩首描寫(xiě)月亮的詩(shī),創(chuàng)作水平真不賴(lài)。而在代碼編寫(xiě)能力上,訊飛星火更展現(xiàn)了極高的“天賦”,生成的代碼不僅規(guī)范簡(jiǎn)潔,還直接通過(guò)了程序運(yùn)行工具的檢測(cè),可以完美執(zhí)行。訊飛星火也成為了IT之家在測(cè)試中四款大模型中唯一一款生成代碼“可用”的大模型,表現(xiàn)突出。
據(jù)了解,訊飛星火自5月首發(fā)以來(lái),歷經(jīng)6月9日的V1.5迭代,又將要在8月15日迎來(lái)新一輪迭代,其官方宣布8月15日將升級(jí)代碼能力、開(kāi)放多模態(tài)能力,并在知識(shí)問(wèn)答能力等方面持續(xù)提升。即便目前訊飛星火在代碼能力上已經(jīng)非常出色,但依然有巨大的向上空間,未來(lái)或許人人都可以借助AI之力化身“碼農(nóng)”,這不禁讓人們充滿(mǎn)了期待。
通過(guò)IT之家對(duì)四大國(guó)產(chǎn)AI模型的橫評(píng),幾乎可以肯定地說(shuō),訊飛星火是目前最好用、最聰明的國(guó)產(chǎn)大模型之一,并且未來(lái)還有巨大的提升空間,最終要跟ChatGPT“掰一掰”手腕。
如今,國(guó)內(nèi)大模型發(fā)展局面已經(jīng)逐漸明朗,國(guó)產(chǎn)大模型梯隊(duì)也漸漸形成,很高興看到企業(yè)在大模型賽道呈現(xiàn)你追我趕的態(tài)勢(shì),因?yàn)檫@也成為了實(shí)現(xiàn)中國(guó)“智慧涌現(xiàn)”的強(qiáng)大引擎。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )