成人一级毛片黄片,每日在线观看亚洲最新AV

OpenAI正在開發(fā)名為“草莓”的AI項目，以提升其模型的高級推理能力，力求實現(xiàn)自主互聯(lián)網(wǎng)導航與深度研究。

OpenAI正在開發(fā)一個名為“草莓”(Strawberry)的新項目，這一消息來自知情人士和路透社審查的內(nèi)部文件。

這個項目的細節(jié)此前從未被報道。微軟支持的這家初創(chuàng)公司正在加緊展示其模型能夠提供先進推理能力。

根據(jù)路透社5月看到的一份OpenAI內(nèi)部文件，OpenAI內(nèi)部團隊正在進行“草莓”項目。路透社無法確定文件的具體日期，但文件詳細說明了OpenAI計劃如何利用“草莓”進行研究。消息人士將該計劃描述為一個正在進行中的項目。路透社無法確定“草莓”距離公開發(fā)布有多近。

消息人士稱，“草莓”的工作原理在OpenAI內(nèi)部也是一個高度保密的秘密。

該文件描述了一個使用“草莓”模型的項目，旨在讓公司的AI不僅能夠生成答案，還能提前計劃，足夠可靠地自主導航互聯(lián)網(wǎng)，執(zhí)行OpenAI稱之為“深度研究”的任務。

根據(jù)與十多位AI研究人員的采訪，這種能力目前尚未被AI模型實現(xiàn)。

當被問及“草莓”和這篇報道中提到的細節(jié)時，OpenAI的一位發(fā)言人在一份聲明中表示：“我們希望我們的AI模型能像我們一樣看到和理解世界。持續(xù)研究新的AI能力是行業(yè)中的常見做法，大家普遍認為這些系統(tǒng)的推理能力會隨著時間的推移而改進?！?/p>

這位發(fā)言人沒有直接回應有關(guān)“草莓”的問題。

“草莓”項目曾被稱為Q*，路透社去年報道，這個項目在公司內(nèi)部已經(jīng)被視為一次突破。

兩位消息人士描述了今年早些時候看到的Q*演示，OpenAI工作人員告訴他們這些演示能夠回答目前市面上模型無法回答的復雜科學和數(shù)學問題。

據(jù)彭博社報道，周二在一次內(nèi)部全體會議上，OpenAI展示了一個研究項目的演示，聲稱該項目具有新的類似人類的推理能力。OpenAI的一位發(fā)言人確認了這次會議，但拒絕提供內(nèi)容的詳細信息。路透社無法確定展示的項目是否為“草莓”。

熟悉此事的人士表示，OpenAI希望這一創(chuàng)新能顯著提升其AI模型的推理能力，補充說“草莓”涉及一種特殊的方式來處理AI模型，該模型在預訓練了大量數(shù)據(jù)集后進行。

接受路透社采訪的研究人員表示，推理是AI實現(xiàn)人類或超人類智能的關(guān)鍵。

雖然大型語言模型已經(jīng)能夠快速總結(jié)密集文本和創(chuàng)作優(yōu)美的文章，但在解決一些對人類來說直覺性的常識問題時，這項技術(shù)常常表現(xiàn)不佳，比如識別邏輯謬誤和玩井字棋。當模型遇到這些問題時，往往會產(chǎn)生虛假的信息。

路透社采訪的AI研究人員普遍認為，在AI中，推理涉及到形成一個模型，使得AI能夠提前計劃，反映物理世界的運作方式，并可靠地解決復雜的多步驟問題。

提升AI模型的推理能力被視為實現(xiàn)從重大科學發(fā)現(xiàn)到規(guī)劃和構(gòu)建新軟件應用程序等一切能力的關(guān)鍵。

OpenAI的CEO Sam Altman今年早些時候表示，在AI領(lǐng)域，“最重要的進展領(lǐng)域?qū)⑹峭评砟芰Α薄?/p>

Google、Meta和Microsoft等公司也在嘗試不同的技術(shù)以改進AI模型的推理能力，幾乎所有進行AI研究的學術(shù)實驗室也是如此。然而，研究人員對大型語言模型(LLM)是否能夠?qū)⑾敕ê烷L期規(guī)劃融入其預測方式存在分歧。例如，現(xiàn)代AI的先驅(qū)之一、在Meta工作的Yann LeCun，經(jīng)常表示LLM無法實現(xiàn)類似人類的推理。

AI挑戰(zhàn)

熟悉此事的消息人士稱，“草莓”是OpenAI計劃克服這些挑戰(zhàn)的關(guān)鍵組成部分。路透社看到的文件描述了“草莓”旨在實現(xiàn)的目標，但沒有說明具體實現(xiàn)方式。

據(jù)四位了解公司情況的人士透露，最近幾個月，OpenAI私下向開發(fā)者和其他外部人士暗示，他們即將推出具有顯著更先進推理能力的技術(shù)。這些人拒絕透露身份，因為他們沒有被授權(quán)談論私人事務。

據(jù)其中一位消息人士稱，“草莓”包括一種專門的“后訓練”O(jiān)penAI生成AI模型的方法，即在模型已經(jīng)“訓練”了大量通用數(shù)據(jù)后，調(diào)整基本模型以特定方式提升其性能。

開發(fā)模型的后訓練階段涉及“微調(diào)”等方法，這是幾乎所有語言模型今天都在使用的過程，有多種形式，例如讓人類根據(jù)模型的響應提供反饋，并向其提供好的和壞的答案示例。

據(jù)知情人士透露，“草莓”與斯坦福大學2022年開發(fā)的一種方法“自我教學推理者”(Self-Taught Reasoner, 簡稱“STaR”)有相似之處。STaR使AI模型能夠通過反復創(chuàng)建自己的訓練數(shù)據(jù)來自我提升智能水平，理論上可用于讓語言模型超越人類智能水平，其創(chuàng)造者之一、斯坦福大學教授Noah Goodman告訴路透社。

Goodman說：“我認為這既令人興奮又可怕……如果事情朝這個方向發(fā)展，我們作為人類有一些嚴肅的事情需要考慮?！?Goodman不隸屬于OpenAI，對“草莓”也不了解。

據(jù)文件顯示，OpenAI希望“草莓”能夠完成長周期任務(LHT)，即需要模型提前計劃并在較長時間內(nèi)執(zhí)行一系列動作的復雜任務。

為了實現(xiàn)這一目標，OpenAI正在創(chuàng)建、訓練和評估一種“深度研究”數(shù)據(jù)集。據(jù)OpenAI內(nèi)部文件稱，路透社無法確定該數(shù)據(jù)集的具體內(nèi)容或所需的長時間范圍。

根據(jù)文件和其中一位消息人士，OpenAI特別希望其模型使用這些能力通過“CUA”(計算機使用代理)自主瀏覽互聯(lián)網(wǎng)，進行研究，并根據(jù)發(fā)現(xiàn)采取行動。OpenAI還計劃測試其在軟件和機器學習工程師工作中的能力。

本文譯自 Reuters，由 BALI 編輯發(fā)布。

（免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）