請(qǐng)外援、蹭熱度、偷工減料,這些公司的大模型就是個(gè)笑話?

進(jìn)入5月,國(guó)產(chǎn)大模型的風(fēng)口非但沒有熄火,反倒越燒越旺。過去一個(gè)星期,就有多家企業(yè)發(fā)布AI大模型相關(guān)產(chǎn)品:

5月5日,網(wǎng)易有道發(fā)布了基于“子曰”大模型開發(fā)的AI口語(yǔ)老師劇透視頻,介紹其基于教育場(chǎng)景的類ChatGPT產(chǎn)品布局;5月6日,科大訊飛發(fā)布認(rèn)知大模型“訊飛星火”,董事長(zhǎng)劉慶峰表示有信心超越ChatGPT;同日,淘云科技發(fā)布“國(guó)內(nèi)首個(gè)”兒童認(rèn)知大模型“阿爾法蛋”……

在上述公司之外,還有很多企業(yè)宣布進(jìn)軍大模型,類ChatGPT產(chǎn)品正在密鑼緊鼓研發(fā)中,預(yù)計(jì)不久便會(huì)正式上線。企業(yè)的熱情毋庸置疑,AI大模型似乎已經(jīng)不是一條選擇題,而是必做題。

然而,狂熱背后不乏擔(dān)憂。大模型技術(shù)應(yīng)用范圍雖廣,目前落地的場(chǎng)景畢竟有限。而這群入局大模型的企業(yè),分別來自游戲、教育、動(dòng)漫等諸多行業(yè),和大模型的應(yīng)用場(chǎng)景離得很遠(yuǎn)。

當(dāng)國(guó)產(chǎn)大模型變得泛濫,我們?cè)撊绾畏直鎯?yōu)劣?

(圖片來自UNsplash)

沒技術(shù)不要緊,有公司靠“外援”搗鼓大模型

要評(píng)判一個(gè)大模型的優(yōu)劣,首先看技術(shù),其中最核心的是算法和算力,即訓(xùn)練參數(shù)量。因?yàn)閰?shù)量越大,系統(tǒng)的知識(shí)面就會(huì)越廣,表現(xiàn)也會(huì)越穩(wěn)定。資料顯示,openAI在2020年推出的ChatGPT-3參數(shù)量已經(jīng)達(dá)到1750億,谷歌在一年后發(fā)布的PaLM則達(dá)到5400億,更不用說最新的ChatGPT-4了。

參照此技術(shù)標(biāo)準(zhǔn),我們可以精準(zhǔn)識(shí)別一批蹭熱點(diǎn)的企業(yè):它們要么確實(shí)拿出了產(chǎn)品,但參數(shù)量和ChatGPT等有較大差距,功能也較單一;更有甚者,套用別家公司的硬件、數(shù)據(jù)庫(kù)來預(yù)訓(xùn)練參數(shù),本身缺乏核心技術(shù)。

當(dāng)中的代表,有昆侖萬(wàn)維。

4月10日,昆侖萬(wàn)維宣布聯(lián)合奇點(diǎn)智源研發(fā)“天工3.5”國(guó)產(chǎn)大語(yǔ)言模型。根據(jù)發(fā)布會(huì)上的介紹,“天工3.5”定位為“中國(guó)第一個(gè)真正實(shí)現(xiàn)智能涌現(xiàn)”的大模型產(chǎn)品,具備智能問答、聊天互動(dòng)、文本生成等多種應(yīng)用功能以及豐富的科學(xué)、技術(shù)、文化、藝術(shù)和歷史知識(shí)儲(chǔ)備。

根據(jù)官方資料,昆侖萬(wàn)維最早在2020年布局AIGC業(yè)務(wù),投入數(shù)億元組建研發(fā)團(tuán)隊(duì)。去年12月,“昆侖天工”首次亮相,初代產(chǎn)品提供圖像、音樂、文本及代碼AI生成功能。作為對(duì)比,大模型領(lǐng)頭羊 openAI在2019年發(fā)布ChatGPT-1,每一代產(chǎn)品的研發(fā)周期都在一年左右。

乍一看,昆侖萬(wàn)維的“天工3.5”功能全面對(duì)標(biāo)ChatGPT,比起百度“文心一言”、阿里“通義千問”等國(guó)產(chǎn)大模型毫不遜色。在研發(fā)速度上,昆侖萬(wàn)維也領(lǐng)先于大多數(shù)國(guó)內(nèi)同行。不過昆侖萬(wàn)維的缺點(diǎn)也很突出——“天工3.5”是和阿里云合作的產(chǎn)物,后者的參數(shù)、硬件設(shè)備幫了昆侖萬(wàn)維很大忙。

事實(shí)上,昆侖萬(wàn)維一直抱緊阿里云的大腿。資料顯示,過去幾年昆侖萬(wàn)維的海外數(shù)據(jù)基本都在使用阿里云公有云儲(chǔ)存服務(wù),2020年布局AIGC時(shí)也是在阿里云的協(xié)助下建立算力集群。在“天工3.5”發(fā)布后,還有媒體爆出昆侖萬(wàn)維缺乏文本生成、數(shù)據(jù)處理專利的消息,和百度、阿里形成鮮明對(duì)比。

同樣遭遇技術(shù)質(zhì)疑的,還有“AI四小龍”之一的商湯科技。

商湯科技在4月10日發(fā)布了自研大模型系統(tǒng)“日日新SenseNova”,內(nèi)含AI數(shù)字人視頻生成平臺(tái)“如影”,3D內(nèi)容生成平臺(tái)“瓊宇”和“格物”,類ChatGPT產(chǎn)品“SenseChat”等產(chǎn)品。別人都是發(fā)布單個(gè)產(chǎn)品,商湯科技一次過拿出一套“全家桶”,可見其野心之大。

然而,商湯的大模型全家桶在發(fā)布那天就有翻車跡象。演示視頻公布后,就有媒體和網(wǎng)友發(fā)現(xiàn)商湯“妙畫”生成的圖片和AI網(wǎng)站Civitai的圖片撞車,甚至還有來自Civitai的文字注釋。SenseChat則在一些基礎(chǔ)問題上表達(dá)含糊不清,其訓(xùn)練參數(shù)量也遭到質(zhì)疑。

在價(jià)值研究所(ID:jiazhiyanjiusuo)看來,缺乏數(shù)據(jù)源,是昆侖萬(wàn)維和商湯科技共同的命門。

“文心一言”背后有百度的海量搜索數(shù)據(jù)和語(yǔ)料庫(kù),阿里的“通義千問”則有來自電商、云計(jì)算等領(lǐng)域的語(yǔ)料庫(kù),流量大、用戶覆蓋面廣,能提供足夠的參數(shù)。缺乏面向C端用戶的通用產(chǎn)品、沒有參數(shù)積累,強(qiáng)行上馬大模型,昆侖萬(wàn)維和商湯科技的尷尬處境完全可以預(yù)料。

沒應(yīng)用場(chǎng)景又如何?這些企業(yè)硬要和AI攀關(guān)系

除了缺乏核心技術(shù)、產(chǎn)品缺陷明顯的昆侖萬(wàn)維等企業(yè),另一類企業(yè)的行為更讓人迷惑:在缺乏應(yīng)用場(chǎng)景的情況下,硬要給自身產(chǎn)品貼上大模型標(biāo)簽、 “硬蹭”熱點(diǎn)。

這一類企業(yè),以專注C端服務(wù)的互聯(lián)網(wǎng)公司為主,尤其是近年來處境不佳的教育、科技金融、游戲公司。

比如專注于智能教育硬件研發(fā)的淘云科技,在5月6日發(fā)布了首個(gè)兒童認(rèn)知大模型“阿爾法兒童認(rèn)知大模型”和GPT機(jī)器人,并宣布把平臺(tái)的兒童原始語(yǔ)料加入科大訊飛的“訊飛星火”大模型中。同樣來自教育領(lǐng)域的學(xué)而思,也在近日宣布研發(fā)數(shù)學(xué)大模型MathGPT,目前已取得階段性成果,預(yù)計(jì)年內(nèi)推出。

這類企業(yè)最大的問題在于,大模型的應(yīng)用場(chǎng)景、目標(biāo)用戶和它們的業(yè)務(wù)有巨大差異。強(qiáng)推大模型,根本無(wú)法為它們的用戶帶來多少幫助。

根據(jù)淘云科技董事長(zhǎng)劉慶升的說法,“阿爾法兒童認(rèn)知大模型”基于兒童場(chǎng)景提供更貼近幼兒理解力的生成式內(nèi)容,讓兒童用戶在輕松的氛圍下積累新知識(shí)。問題在于,類ChatGPT應(yīng)用仍無(wú)法保證100%準(zhǔn)確率,常識(shí)性的錯(cuò)誤屢見不鮮。對(duì)于認(rèn)知能力有限的兒童來說,并不穩(wěn)定的大模型反倒可以帶來反作用。

當(dāng)然,上面這些公司蹭熱點(diǎn)的目的雖然很明確,但好歹拿出了實(shí)打?qū)嵉漠a(chǎn)品或規(guī)劃。還有一些企業(yè),不僅業(yè)務(wù)場(chǎng)景和大模型相去甚遠(yuǎn),甚至還沒有拿出實(shí)際產(chǎn)品就開始往自己臉上貼金。

比如定位于“國(guó)漫IP孵化平臺(tái)和漫畫分享社區(qū)”的快看漫畫,就在4月27日宣布成立AIGC事業(yè)部。創(chuàng)始人兼CEO陳安妮更是在內(nèi)部信中表示,AI將會(huì)給內(nèi)容產(chǎn)業(yè)帶來“顛覆式”生態(tài)變革。

再比如最近一邊搗鼓直播電商、一邊忙著進(jìn)軍本地生活的小紅書,也沒忘記籌備大模型團(tuán)隊(duì)。根據(jù)36氪報(bào)道,小紅書在今年3月開始組建研發(fā)團(tuán)隊(duì),主要成員來自廣告NLP技術(shù)部門。4月,小紅書悄悄上線了一款名為“Trik”的AI創(chuàng)作應(yīng)用,主打AI繪畫,但沒有大規(guī)模宣傳,至今沒有引發(fā)多少關(guān)注。

總的來說,這兩類企業(yè)的大模型布局都經(jīng)不起推敲。但蹭上大模型風(fēng)口,確實(shí)為其帶來了可觀的流量,也掀起資本市場(chǎng)的狂歡。前面提到昆侖萬(wàn)維,在發(fā)布“天工3.5”次日股價(jià)暴漲16%?;蛟S正因?yàn)槭袌?chǎng)過于狂熱,才會(huì)反過來迫使這些企業(yè)主動(dòng)迎合熱點(diǎn)。

可惜這種熱度是無(wú)法持續(xù)的,而且還會(huì)遭到監(jiān)管機(jī)構(gòu)的重點(diǎn)關(guān)照。在“天工3.5”發(fā)布次日,昆侖萬(wàn)維就收到了深交所的關(guān)注函,要求前者結(jié)合項(xiàng)目研發(fā)進(jìn)度、行業(yè)政策風(fēng)險(xiǎn)、對(duì)公司財(cái)務(wù)的影響等情況,說明該業(yè)務(wù)可能面臨的風(fēng)險(xiǎn)。

雖然深交所沒有把話挑明,但明眼人都看得出這封關(guān)注函寫滿對(duì)昆侖萬(wàn)維蹭熱點(diǎn)的懷疑。在價(jià)值研究所(ID:jiazhiyanjiusuo)看來,蹭熱點(diǎn)的行為正在損壞行業(yè)生態(tài)。給大模型降降火、讓市場(chǎng)回歸理性,對(duì)踏實(shí)搞研發(fā)的企業(yè)來說非常重要。

追趕ChatGPT,一場(chǎng)艱苦的馬拉松競(jìng)賽

不可否認(rèn),除了上面這些蹭熱點(diǎn)的公司外,國(guó)內(nèi)有不少企業(yè)在認(rèn)真打磨大模型產(chǎn)品,也有一定的技術(shù)積累和豐富的應(yīng)用場(chǎng)景。不過從百度、阿里,再到360,幾乎所有頭部企業(yè)都承認(rèn)自己的技術(shù)不如openAI的ChatGPT。

5月7日,周鴻祎應(yīng)邀來到東方甄選直播間,和俞敏洪、董宇輝大談國(guó)內(nèi)的大模型創(chuàng)業(yè)熱潮。周鴻祎直言,openAI比國(guó)內(nèi)企業(yè)領(lǐng)先至少兩年,國(guó)產(chǎn)大模型有機(jī)會(huì)在一年內(nèi)追上ChatGPT-3.5,但openAI已經(jīng)開始訓(xùn)練ChatGPT-5了。

“上來就說能超越ChatGPT,那叫吹牛。”

周鴻祎最后這番話,不少媒體認(rèn)為是在影射5月6日發(fā)布“訊飛星火”認(rèn)知大模型的科大訊飛??拼笥嶏w董事長(zhǎng)劉慶峰在發(fā)布會(huì)上表示,“訊飛星火”在文本生成、知識(shí)問答、數(shù)學(xué)能力上已經(jīng)超過ChatGPT,目標(biāo)是到今年10月,通用認(rèn)知能力對(duì)標(biāo)ChatGPT,并在中文上超越ChatGPT。

周鴻祎是否意有所指不得而知,可以肯定的是,投資者、用戶對(duì)國(guó)產(chǎn)大模型的耐心正在流失,要求變得更加苛刻,外部的競(jìng)爭(zhēng)也更加激烈——留給國(guó)產(chǎn)大模型的時(shí)間已經(jīng)不多了。

5月4日,微軟宣布Bing預(yù)覽版全面開放,該系統(tǒng)此前已接入openAI的ChatGPT-4;一天后,谷歌也宣布向所有擁有Wordspace賬號(hào)的用戶開放Bard AI工具訪問權(quán)限。

微軟和谷歌先后走向開放,意味著新一輪用戶爭(zhēng)奪戰(zhàn)正式打響。一旦它們滲透進(jìn)國(guó)內(nèi)市場(chǎng),面對(duì)技術(shù)上的差距,國(guó)產(chǎn)大模型并沒有太多應(yīng)對(duì)方法。比起那群蹭熱點(diǎn)的企業(yè),追趕openAI的骨干力量更值得我們關(guān)注——特別是百度、阿里、騰訊三巨頭,周鴻祎治下的360,疑似被其揶揄的科大訊飛實(shí)力也不容小覷。

這幾家公司的優(yōu)勢(shì)是相似的:雄厚的資金儲(chǔ)備;擁有諸多面向用戶的產(chǎn)品/服務(wù),語(yǔ)料庫(kù)十分豐富;主營(yíng)業(yè)務(wù)貼近大模型應(yīng)用場(chǎng)景,如百度和360的搜索,騰訊的社交媒體,阿里的云計(jì)算和電商,科大訊飛的智慧辦公等。現(xiàn)階段,這些企業(yè)的產(chǎn)品距離ChatGPT當(dāng)然還有一定差距,但并非沒有追趕的機(jī)會(huì)。

要知道,即便是技術(shù)領(lǐng)跑全行的openAI,也有自己的苦惱。過去一年,隨著ChatGPT走紅openAI的估值也是一路走高,成為全球范圍內(nèi)升值最快的獨(dú)角獸——可惜隨之飆升的,還有虧損額。

據(jù)外媒報(bào)道,openAI上一財(cái)年凈虧損達(dá)到5.4億美元,同比幾乎放大一倍。每一次預(yù)訓(xùn)練參數(shù)都要耗費(fèi)巨資,要提升系統(tǒng)穩(wěn)定性又必須不斷加大參數(shù)量和預(yù)訓(xùn)練頻次,虧損自然成為無(wú)解難題。國(guó)盛證券的研報(bào)指出,通過測(cè)算,2800億參數(shù)量的大模型預(yù)訓(xùn)練成本約為200萬(wàn)美元/次,谷歌的PaLM號(hào)稱擁有5400億參數(shù),單次預(yù)訓(xùn)練成本將高達(dá)1200萬(wàn)美元。

今年2月推出的付費(fèi)版ChatGPT和其他商業(yè)化嘗試收效甚微,短時(shí)間內(nèi)不可能覆蓋預(yù)訓(xùn)練所需成本。CEO Sam Altman曾暗示,公司未來幾年可能需要籌集約1000億美元的資金,才能進(jìn)一步提升技術(shù),打磨下一代產(chǎn)品。

openAI的經(jīng)歷表明,AI大模型研發(fā)如同一場(chǎng)漫長(zhǎng)且艱難的馬拉松——不要總是奢望彎道超車,踏踏實(shí)實(shí)和參數(shù)打交道是成功的基礎(chǔ)。

寫在最后

水能載舟亦能覆舟,狂熱的市場(chǎng)氛圍既給企業(yè)帶來了資金和關(guān)注度,也帶來了難以預(yù)估的風(fēng)險(xiǎn)。近段時(shí)間,證監(jiān)會(huì)等監(jiān)管機(jī)構(gòu)已經(jīng)加大管控力度,不少公司也主動(dòng)出面自證清白:據(jù)不完全統(tǒng)計(jì),4月底至今已有世紀(jì)天鴻、萬(wàn)興科技、中科信息、唐德影視等多家上市企業(yè)發(fā)布股票交易異常波動(dòng)公告,澄清自身業(yè)務(wù)和AI、大模型的關(guān)系。

經(jīng)過移動(dòng)互聯(lián)時(shí)代的洗禮,蹭熱點(diǎn)、追風(fēng)口的情況太過常見了。似乎任何一個(gè)風(fēng)口都逃不過從萌芽到爆發(fā),再走向混亂、重塑秩序的過程。但在亂戰(zhàn)過后,有的風(fēng)口出清泡沫、置之死地而后生;有的賽道卻徹底沉淪,如一顆流星般結(jié)束自己絢爛卻短暫的一生。

走在時(shí)代前沿的AI大模型,似乎更有可能成為前者,不過需要所有從業(yè)者、監(jiān)管機(jī)構(gòu)的共同努力才能保證健康發(fā)展。大模型是一條技術(shù)門檻、資金門檻都很高的賽道,蹭熱點(diǎn)的企業(yè)注定無(wú)法長(zhǎng)久。加強(qiáng)監(jiān)管、凈化行業(yè)環(huán)境、驅(qū)逐不良玩家可能會(huì)帶來短期混亂,但對(duì)行業(yè)的長(zhǎng)期發(fā)展肯定是有益的。

風(fēng)險(xiǎn)提示及免責(zé)聲明:

本文不構(gòu)成任何投資建議,市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-05-09
請(qǐng)外援、蹭熱度、偷工減料,這些公司的大模型就是個(gè)笑話?
進(jìn)入5月,國(guó)產(chǎn)大模型的風(fēng)口非但沒有熄火,反倒越燒越旺。過去一個(gè)星期,就有多家企業(yè)發(fā)布AI大模型相關(guān)產(chǎn)品:5月5日,網(wǎng)易有道發(fā)布了基于“...

長(zhǎng)按掃碼 閱讀全文