谷歌發(fā)布能力最強(qiáng)AI模型Gemini:性能碾壓GPT4 語(yǔ)言理解超人類(lèi)

12月7日消息,北京時(shí)間7日凌晨,Google公司突然放出了自己“迄今為止最強(qiáng)大、最通用的模型”Gemini。

Gemini是一款多模態(tài)模型,可以歸納并流暢地理解、操作以及組合不同類(lèi)型的信息,包括文本、代碼、音頻、圖像和視頻。第一個(gè)版本 Gemini 1.0 推出3款不同尺寸模型:Ultra、Pro 和 Nano。

Gemini能理解“文本、代碼、音頻、圖像和視頻”五種信息

其中,Gemini Ultra是規(guī)模最大且功能最強(qiáng)大的模型,適用于高度復(fù)雜的任務(wù);Gemini Pro是適用于各種任務(wù)的最佳模型;Gemini Nano是端側(cè)設(shè)備上最高效的模型。

三種尺寸

目前,Gemini 1.0 現(xiàn)已在多種Google產(chǎn)品和平臺(tái)上推出,包括接入聊天機(jī)器人Bard和智能手機(jī)Pixel 8 Pro 上。未來(lái)幾個(gè)月,Gemini 將應(yīng)用于Google更多的產(chǎn)品和服務(wù),如Search、Ads、Chrome 和 Duet AI

從12月13日開(kāi)始,開(kāi)發(fā)者和企業(yè)客戶可以通過(guò) Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 獲取 Gemini Pro。

谷歌CEO桑達(dá)爾?皮查伊(Sundar Pichai)表示:“我們正與 Gemini 一起邁入下一段旅程。Gemini 是我們迄今為止最強(qiáng)大、最通用的模型,它在許多領(lǐng)先的基準(zhǔn)測(cè)試中都展現(xiàn)出了最先進(jìn)的性能?!?/p>

Gemini Ultra性能超越GPT4

DeepMind CEO戴密斯?哈薩比斯(Demis Hassabis)對(duì)Gemini進(jìn)行了詳細(xì)介紹。

據(jù)介紹,從自然圖像、音頻和視頻理解到數(shù)學(xué)推理,在被大型語(yǔ)言模型(LLM)研究和開(kāi)發(fā)中廣泛使用的 32 項(xiàng)學(xué)術(shù)基準(zhǔn)中,Gemini Ultra 的性能有 30 項(xiàng)都超過(guò)了目前最先進(jìn)的水平。

在 MMLU(大規(guī)模多任務(wù)語(yǔ)言理解)測(cè)試中Gemini Ultra 的得分率為 90.0%,是第一個(gè)超過(guò)人類(lèi)專(zhuān)家的模型,GPT-4的得分率為86.4%。

圖像理解方面,在新的 MMMU 基準(zhǔn)測(cè)試中,Gemini Ultra的表現(xiàn)也更優(yōu),其得分率達(dá)59.4%,GPT-4V的得分率為56.8%。

Gemini Ultra目前正在完成大規(guī)模的信任和安全檢查,在模型的完善過(guò)程中Google將向部分客戶、開(kāi)發(fā)者、合作伙伴以及安全和責(zé)任專(zhuān)家提供 Gemini Ultra,以供其進(jìn)行早期試驗(yàn)和提供反饋。并將在明年初向開(kāi)發(fā)者和企業(yè)客戶提供該模型。

最強(qiáng)AI模型Gemini性能展示

Gemini 1.0具有復(fù)雜推理能力,通過(guò)閱讀、過(guò)濾以及理解信息,從數(shù)十萬(wàn)份文件中提取見(jiàn)解。

Google工程師演示了一個(gè)Gemini提取“20萬(wàn)份科學(xué)研究文獻(xiàn)”關(guān)鍵信息的例子。
自2021年以來(lái),該研究領(lǐng)域新增了20多萬(wàn)份研究論文,需要更新到原有(截止于202年)的研究中。

以往,科學(xué)研究人員只能手動(dòng)來(lái)處理,現(xiàn)在Gemini能夠自動(dòng)區(qū)分和過(guò)濾與研究領(lǐng)域相關(guān)的文獻(xiàn)信息,只需要一頓午飯的時(shí)間,Gemini幫科學(xué)家讀完20萬(wàn)篇論文,并畫(huà)出了更新數(shù)據(jù)信息后的新圖片。

右邊為更新數(shù)據(jù)后的新圖

Google表示,Gemini 1.0這種從海量的數(shù)據(jù)中發(fā)掘難以辨別的知識(shí)內(nèi)容的能力將有助于在從科學(xué)到金融等多個(gè)領(lǐng)域以數(shù)字化速度實(shí)現(xiàn)新的突破。

Gemini 1.0可以同時(shí)識(shí)別并理解文本、圖像、音頻等,因此它能更好地理解具有細(xì)微差別的信息,回答與復(fù)雜主題相關(guān)的問(wèn)題。Gemini 1.0擅長(zhǎng)解釋數(shù)學(xué)和物理等復(fù)雜科目中的推理。

Google演示的例子展示了Gemini 1.0解復(fù)雜數(shù)學(xué)題的能力,和歸納整理同類(lèi)題型的能力。

另外,Gemini 1.0 還可以理解、解釋和生成Python、Java、C++、Go編程語(yǔ)言的高質(zhì)量代碼。

Google在兩年前發(fā)布了編碼工具AlphaCode,它是第一個(gè)在編程競(jìng)賽中性能達(dá)到競(jìng)賽水平的 AI 代碼生成系統(tǒng)。

現(xiàn)在,利用Gemini,Google團(tuán)隊(duì)創(chuàng)建了更先進(jìn)的代碼生成系統(tǒng) AlphaCode 2,它解決的問(wèn)題的數(shù)量是AlphaCode 的2倍,編程能力超過(guò)85%的人類(lèi)程序員。

另外,Google還發(fā)布了迄今為止功能最強(qiáng)大、效率最高且可擴(kuò)展性最強(qiáng)的 TPU 系統(tǒng) Cloud TPU v5p,旨在為訓(xùn)練前沿 AI 模型提供支持。新一代 TPU 將加速 Gemini 的開(kāi)發(fā),幫助開(kāi)發(fā)者和企業(yè)客戶更快地訓(xùn)練大規(guī)模生成式 AI 模型,從而更快推出新產(chǎn)品和新功能。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2023-12-07
谷歌發(fā)布能力最強(qiáng)AI模型Gemini:性能碾壓GPT4 語(yǔ)言理解超人類(lèi)
12月7日消息,北京時(shí)間7日凌晨,Google公司突然放出了自己“迄今為止最強(qiáng)大、最通用的模型”Gemini。

長(zhǎng)按掃碼 閱讀全文