學而思曝自研數(shù)學大模型MathGPT 擬年內(nèi)推出

5月5日消息,學而思正在進行自研數(shù)學大模型的研發(fā),命名為MathGPT,面向全球數(shù)學愛好者和科研機構(gòu),以數(shù)學領域的解題和講題算法為核心,目前已經(jīng)取得階段性成果,并將于年內(nèi)推出基于該自研大模型的產(chǎn)品級應用。

據(jù)知情人透露,學而思已將MathGPT作為公司核心項目,由CTO田密負責,今年春節(jié)前,該項目已經(jīng)啟動相應的團隊建設、數(shù)據(jù)、算力準備和技術研發(fā)。此外,學而思已經(jīng)啟動在美國硅谷的團隊建設,將成立一支海外算法和工程團隊,在全球范圍內(nèi)招募優(yōu)秀的人工智能專家加入。

美國OpenAI公司在今年三月份發(fā)布了大語言模型GPT-4,國內(nèi)百度、阿里也發(fā)布了各自的大模型產(chǎn)品,學而思認為,通用語言模型更像一個“文科生”,在語言翻譯、摘要、理解和生成等任務上有出色表現(xiàn),在數(shù)學問題的解決、講解、問答和推薦方面則存在明顯不足:解答數(shù)學問題經(jīng)常出錯,有些數(shù)學問題雖然能夠解決,但方法更偏成年人,無法針對適齡孩子的知識結(jié)構(gòu)和認知水平做適配。

“這種不足是由LLM模型(大語言模型)的自身特點決定的?!睂W而思AI團隊負責人介紹,LLM大模型來自對海量語言文本的訓練,因此最擅長語言處理。行業(yè)內(nèi)偏向基于LLM大模型做閱讀、寫作類應用,但如果想要在數(shù)學能力上有突破,就需要研發(fā)新的大模型。

因此,學而思決心組建團隊專研MathGPT——數(shù)學領域大模型,用自己在數(shù)學和AI上的多年積累,面向全球范圍內(nèi)的數(shù)學愛好者和科研機構(gòu),做好AI大模型時代的數(shù)學基礎工作。

據(jù)悉,學而思希望通過MathGPT彌補和攻克大語言模型的三個問題:第一,題目要解對,現(xiàn)在GPT結(jié)果經(jīng)常出現(xiàn)錯誤;第二,解題步驟要穩(wěn)定、清晰,現(xiàn)在GPT的解題步驟每次都不一樣,而且生成內(nèi)容經(jīng)常很冗余;第三,解題要講的有趣、個性化,現(xiàn)在GPT的解釋過于“學術”和機械,對孩子的學習體驗很不友好。

學而思在人工智能領域早有深耕,2017年,學而思便成立了AI lab 人工智能實驗室。

學而思AI團隊負責人認為,“以數(shù)學起家”的學而思至今已有20年的數(shù)學教學經(jīng)驗,積累了龐大的數(shù)學相關數(shù)據(jù),這些數(shù)據(jù)是進行MathGPT訓練的必備物料。另外,學而思的海外業(yè)務Think Academy在全球若干國家和地區(qū)深受數(shù)學愛好者喜歡,學而思的學生在每年的IMO和AMC等國際數(shù)學競賽中表現(xiàn)優(yōu)異,每年都有多位學生在國際奧林匹克數(shù)學競賽中拿到金牌。所以,學而思選擇在MathGPT方向發(fā)力也順理成章。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )

贊助商
2023-05-05
學而思曝自研數(shù)學大模型MathGPT 擬年內(nèi)推出
5月5日消息,學而思正在進行自研數(shù)學大模型的研發(fā),命名為MathGPT5月5日消息。

長按掃碼 閱讀全文