谷歌發(fā)布能力最強AI模型Gemini:性能碾壓GPT4 語言理解超人類

12月7日消息,北京時間7日凌晨,Google公司突然放出了自己“迄今為止最強大、最通用的模型”Gemini。

Gemini是一款多模態(tài)模型,可以歸納并流暢地理解、操作以及組合不同類型的信息,包括文本、代碼、音頻、圖像和視頻。第一個版本 Gemini 1.0 推出3款不同尺寸模型:Ultra、Pro 和 Nano。

Gemini能理解“文本、代碼、音頻、圖像和視頻”五種信息

其中,Gemini Ultra是規(guī)模最大且功能最強大的模型,適用于高度復雜的任務;Gemini Pro是適用于各種任務的最佳模型;Gemini Nano是端側設備上最高效的模型。

三種尺寸

目前,Gemini 1.0 現已在多種Google產品和平臺上推出,包括接入聊天機器人Bard和智能手機Pixel 8 Pro 上。未來幾個月,Gemini 將應用于Google更多的產品和服務,如Search、Ads、Chrome 和 Duet AI。

從12月13日開始,開發(fā)者和企業(yè)客戶可以通過 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 獲取 Gemini Pro。

谷歌CEO桑達爾?皮查伊(Sundar Pichai)表示:“我們正與 Gemini 一起邁入下一段旅程。Gemini 是我們迄今為止最強大、最通用的模型,它在許多領先的基準測試中都展現出了最先進的性能?!?/p>

Gemini Ultra性能超越GPT4

DeepMind CEO戴密斯?哈薩比斯(Demis Hassabis)對Gemini進行了詳細介紹。

據介紹,從自然圖像、音頻和視頻理解到數學推理,在被大型語言模型(LLM)研究和開發(fā)中廣泛使用的 32 項學術基準中,Gemini Ultra 的性能有 30 項都超過了目前最先進的水平。

在 MMLU(大規(guī)模多任務語言理解)測試中Gemini Ultra 的得分率為 90.0%,是第一個超過人類專家的模型,GPT-4的得分率為86.4%。

圖像理解方面,在新的 MMMU 基準測試中,Gemini Ultra的表現也更優(yōu),其得分率達59.4%,GPT-4V的得分率為56.8%。

Gemini Ultra目前正在完成大規(guī)模的信任和安全檢查,在模型的完善過程中Google將向部分客戶、開發(fā)者、合作伙伴以及安全和責任專家提供 Gemini Ultra,以供其進行早期試驗和提供反饋。并將在明年初向開發(fā)者和企業(yè)客戶提供該模型。

最強AI模型Gemini性能展示

Gemini 1.0具有復雜推理能力,通過閱讀、過濾以及理解信息,從數十萬份文件中提取見解。

Google工程師演示了一個Gemini提取“20萬份科學研究文獻”關鍵信息的例子。
自2021年以來,該研究領域新增了20多萬份研究論文,需要更新到原有(截止于202年)的研究中。

以往,科學研究人員只能手動來處理,現在Gemini能夠自動區(qū)分和過濾與研究領域相關的文獻信息,只需要一頓午飯的時間,Gemini幫科學家讀完20萬篇論文,并畫出了更新數據信息后的新圖片。

右邊為更新數據后的新圖

Google表示,Gemini 1.0這種從海量的數據中發(fā)掘難以辨別的知識內容的能力將有助于在從科學到金融等多個領域以數字化速度實現新的突破。

Gemini 1.0可以同時識別并理解文本、圖像、音頻等,因此它能更好地理解具有細微差別的信息,回答與復雜主題相關的問題。Gemini 1.0擅長解釋數學和物理等復雜科目中的推理。

Google演示的例子展示了Gemini 1.0解復雜數學題的能力,和歸納整理同類題型的能力。

另外,Gemini 1.0 還可以理解、解釋和生成Python、Java、C++、Go編程語言的高質量代碼。

Google在兩年前發(fā)布了編碼工具AlphaCode,它是第一個在編程競賽中性能達到競賽水平的 AI 代碼生成系統(tǒng)。

現在,利用Gemini,Google團隊創(chuàng)建了更先進的代碼生成系統(tǒng) AlphaCode 2,它解決的問題的數量是AlphaCode 的2倍,編程能力超過85%的人類程序員。

另外,Google還發(fā)布了迄今為止功能最強大、效率最高且可擴展性最強的 TPU 系統(tǒng) Cloud TPU v5p,旨在為訓練前沿 AI 模型提供支持。新一代 TPU 將加速 Gemini 的開發(fā),幫助開發(fā)者和企業(yè)客戶更快地訓練大規(guī)模生成式 AI 模型,從而更快推出新產品和新功能。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )

贊助商
2023-12-07
谷歌發(fā)布能力最強AI模型Gemini:性能碾壓GPT4 語言理解超人類
12月7日消息,北京時間7日凌晨,Google公司突然放出了自己“迄今為止最強大、最通用的模型”Gemini。

長按掃碼 閱讀全文