極客網(wǎng)·人工智能 3月14日,零一萬(wàn)物宣布正式發(fā)布 Yi 大模型 API 開放平臺(tái),并即日起為開發(fā)者提供通用 Chat、200k 超長(zhǎng)上下文、多模態(tài)交互等模型。目前,Yi 大模型 API 名額限量開放中,新用戶注冊(cè)即贈(zèng)60元。
亮點(diǎn)功能方面,Yi-34B-Chat-0205支持通用聊天、問答、對(duì)話、寫作、翻譯等功能;Yi-34B-Chat-200K提供200K 上下文,多文檔閱讀理解、超長(zhǎng)知識(shí)庫(kù)構(gòu)建小能手;Yi-VL-Plus提供多模態(tài)模型,支持文本、視覺多模態(tài)輸入,中文圖表體驗(yàn)超過 GPT-4V。
其中,零一萬(wàn)物重點(diǎn)介紹了Yi-34B-Chat-200K和Yi-VL-Plus 多模態(tài)模型的亮點(diǎn)功能,并放出兩者結(jié)合的實(shí)際案例。
200K 模型,支持輸入 30 萬(wàn)漢字
· 加速大模型應(yīng)用進(jìn)入“長(zhǎng)文本時(shí)代”。200K 模型支持處理約 30 萬(wàn)個(gè)中英文字符,(例如,可以輕松處理整本《哈利?波特與魔法石》小說),適合用于多篇文檔內(nèi)容理解、海量數(shù)據(jù)分析挖掘和跨領(lǐng)域知識(shí)融合等,為各行各業(yè)提供了極大的便利。例如,金融分析師可以用它快速閱讀報(bào)告并預(yù)測(cè)市場(chǎng)趨勢(shì)、律師可以用它精準(zhǔn)解讀法律條文、科研人員可以用它高效提取論文要點(diǎn)、文學(xué)愛好者可以用它快速掌握作品精髓等,應(yīng)用場(chǎng)景非常廣泛。
· 大海撈針評(píng)測(cè)升至99.8%。“大海撈針”測(cè)試的設(shè)計(jì)是:將一個(gè)目標(biāo)句子(針)放進(jìn)一個(gè)隨機(jī)文檔語(yǔ)料庫(kù)(大海),然后提出一個(gè)只能使用“針”(目標(biāo)句子)中的信息才能回答的問題來測(cè)試模型的回憶能力。在“大海撈針”測(cè)試中,Yi-34B-Chat-200K的性能提高了10.5%,從89.3%提升到99.8%。
Yi-VL-Plus 多模態(tài)模型,中文圖表體驗(yàn)超過GPT4V
零一萬(wàn)物開發(fā)的多模態(tài)模型 Yi-VL-Plus,可支持文本、視覺多模態(tài)輸入,面向?qū)嶋H應(yīng)用場(chǎng)景大幅增強(qiáng):
· 增強(qiáng)Charts, Table, Inforgraphics, Screenshot 識(shí)別能力,支持復(fù)雜圖表理解、信息提取、問答以及推理。中文圖表體驗(yàn)超過GPT4V。
· 在 Yi-VL 基礎(chǔ)上進(jìn)一步提高了圖片分辨率,模型支持 1024*1024 分辨率輸入,顯著提高生產(chǎn)力場(chǎng)景中的文字、數(shù)字 OCR 的準(zhǔn)確性。
· 保持了 LLM 通用語(yǔ)言、知識(shí)、推理、指令跟隨等能力。
在中文圖表識(shí)別功能評(píng)測(cè)中,Yi-VL-Plus模型能準(zhǔn)確識(shí)別圖表對(duì)應(yīng)數(shù)據(jù),而 GPT-4V則識(shí)別錯(cuò)3處數(shù)據(jù)
Yi-VL-Plus模型在一些中文圖表理解場(chǎng)景,比GPT-4V準(zhǔn)確率更高
與此同時(shí),零一萬(wàn)物還是放出了Yi-34B-Chat-200K和Yi-VL-Plus 多模態(tài)模型的實(shí)際應(yīng)用案例,展示了強(qiáng)大的能力。
· Yi-34B-Chat 200K + 多模態(tài)模型解讀 Yi-tech-report 論文
· Yi-34B-Chat-200K 對(duì)經(jīng)典文學(xué)作品《呼嘯山莊》進(jìn)行復(fù)雜角色和角色關(guān)系的歸納總結(jié)
該小說篇幅龐大(中文字?jǐn)?shù)約 30 萬(wàn)字),且人物關(guān)系錯(cuò)綜復(fù)雜,但它仍能精準(zhǔn)地梳理和總結(jié)出人物之間的關(guān)系,展示了它在處理超長(zhǎng)上下文時(shí)出色的復(fù)雜內(nèi)容理解和分析能力。
此外,零一萬(wàn)物還表示,近期將為開發(fā)者提供更多更強(qiáng)模型和 AI 開發(fā)框架,預(yù)期亮點(diǎn)功能包括:
· 推出一系列的模型 API,覆蓋更大的參數(shù)量、更強(qiáng)的多模態(tài),更專業(yè)的代碼/數(shù)學(xué)推理模型等;
· 突破更長(zhǎng)的上下文,目標(biāo) 100萬(wàn) tokens;支持更快的推理速度,顯著降低推理成本;
· 基于超長(zhǎng)上下文能力,構(gòu)建向量數(shù)據(jù)庫(kù)、RAG、Agent 架構(gòu)在內(nèi)的全新開發(fā)者 AI 框架。旨在提供更加豐富和靈活的開發(fā)工具,以適應(yīng)多樣化的應(yīng)用場(chǎng)景。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )