外灘掀起了“AI熱”

撰文 | 李信馬

題圖 |?螞蟻集團(tuán)

熱鬧了3天的上海外灘大會(huì)終于落下了帷幕,但余音還在回蕩。作為金融科技頂會(huì),上一屆的外灘大會(huì)時(shí),金融科技中金融的“濃度”很高,而這一屆大會(huì),科技成為了主旋律。人工智能,尤其是大模型,成了本屆大會(huì)的熱詞。

這也不奇怪,根據(jù)最新的統(tǒng)計(jì),國(guó)內(nèi)“百模大戰(zhàn)”的參戰(zhàn)方已經(jīng)增加到了至少130家公司,其中做通用大模型的有78家。從投資的角度來看,今年上半年生成式人工智能領(lǐng)域的投資額,已經(jīng)超過了去年全年,美國(guó)頭部的前25家AI公司總?cè)谫Y額超過了170億美元。

麥肯錫中國(guó)區(qū)主席、全球資深董事合伙人倪以理在外灘現(xiàn)場(chǎng)預(yù)測(cè):“AI 對(duì)全球經(jīng)濟(jì)的潛在收益將達(dá)到 25 萬億美元,是當(dāng)前所有企業(yè)最重要的賽道之一,但這個(gè)時(shí)代剛剛開始?!?/p>

大模型的魅力為什么這么大?螞蟻集團(tuán)(以下簡(jiǎn)稱“螞蟻”)董事長(zhǎng)兼CEO井賢棟引用電影《奧本海默》的一句臺(tái)詞:“this is not a new weapon. this is a new world.”在他看來,大模型是一項(xiàng)新技術(shù),但又不只是新技術(shù),而是足以引發(fā)世界級(jí)的變革。

自然而然地,螞蟻也發(fā)布了他們的金融大模型。據(jù)了解,這款大模型是基于螞蟻的自研基礎(chǔ)大模型,然后針對(duì)金融產(chǎn)業(yè)深度定制的。此外,螞蟻還發(fā)布了基于金融大模型能力的兩款產(chǎn)品:智能金融助理“支小寶2.0”,服務(wù)金融產(chǎn)業(yè)專家的智能業(yè)務(wù)助手“支小助”。

其中,“支小寶2.0”已內(nèi)測(cè)近半年,將在完成相關(guān)備案工作后上線。“支小助”正在與螞蟻平臺(tái)合作機(jī)構(gòu)內(nèi)測(cè)共建,為理財(cái)顧問、保險(xiǎn)代理、投研、金融營(yíng)銷、保險(xiǎn)理賠等金融從業(yè)者打造全鏈條的AI業(yè)務(wù)助手。?

可以說,在金融科技領(lǐng)域,以后大模型也是頂流了。

對(duì)到場(chǎng)的專家和學(xué)者們來說,他們又是怎么看待大模型的呢?以及,大模型又該如何落地行業(yè),真正改變世界呢?

01.大模型時(shí)代

人工智能70年的發(fā)展中,經(jīng)歷了多次的高峰和低谷,但“讓機(jī)器掌握完成復(fù)雜任務(wù)的知識(shí)和能力”這一終極目標(biāo)卻基本沒有改變。

當(dāng)前,我們可以說已經(jīng)進(jìn)入了“大模型時(shí)代”,大模型的特點(diǎn)就是可以實(shí)現(xiàn)大規(guī)模無標(biāo)注數(shù)據(jù)的深度學(xué)習(xí),由于無標(biāo)注數(shù)據(jù)廉價(jià)且易得,模型學(xué)習(xí)的范圍和水平都迎來了極大的提升,大模型的參數(shù)量也在不斷攀升,從1億左右增長(zhǎng)到了現(xiàn)在GPT的31750億,可以說是科技領(lǐng)域的暴力美學(xué)。而且從ChatGPT的經(jīng)驗(yàn)來看,更多的數(shù)據(jù)、更大的模型還可以帶來更多的智能。(以下部分內(nèi)容和圖片來自清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系副教授劉知遠(yuǎn)的演講,文中不再另做說明)

圖片來源:外灘大會(huì)

可以說,大模型是邁向通用人工智能的技術(shù)。劉知遠(yuǎn)總結(jié)了大模型在兩方面的優(yōu)勢(shì),首先,是通用框架,能有效降低開發(fā)成本。自上世紀(jì)五十年代以來,成千上萬個(gè)不同的神經(jīng)網(wǎng)絡(luò)解決方案被提出過,但在2017年Transformer被提出來后,這些神經(jīng)網(wǎng)絡(luò)架構(gòu)日益混凝在Transformer架構(gòu)下,2020年后大模型的發(fā)展,讓大語言模型架構(gòu)更加統(tǒng)一。

其次是大模型的通用能力,能有效降低適配成本。以前深度學(xué)習(xí)模型總是用于專用的任務(wù),標(biāo)注專門的數(shù)據(jù),訓(xùn)練專用的模型,而沒有辦法拓展到其他任務(wù)。比如場(chǎng)景像客服、營(yíng)銷、售前,行業(yè)像房地產(chǎn)、金融,最后結(jié)果是每一個(gè)行業(yè)的每一個(gè)場(chǎng)景都要做一個(gè)小模型,總的成本就很高,但通用大模型微調(diào)后可以完成不同的任務(wù),在每一個(gè)任務(wù)都可以有非常好的表現(xiàn)。

圖片來源:外灘大會(huì)

也因?yàn)檫@兩方面的突出優(yōu)勢(shì),大模型有潛力成為智能時(shí)代基礎(chǔ)設(shè)施。劉知遠(yuǎn)認(rèn)為,邁向通用人工智能的路徑會(huì)是語言智能、多模態(tài)智能、工具智能、具身智能、群體智能,目前人類語言的智能已經(jīng)基本被實(shí)現(xiàn)了,接下來會(huì)是其他智能相關(guān)探索。

圖片來源:外灘大會(huì)

以上是技術(shù)層面的分析,從商業(yè)的角度來看,大模型能掙到上一代AI掙不到的錢。小冰公司CEO李笛認(rèn)為,以前行業(yè)靠粗放式的API調(diào)用和Traffic的模式,賺到的錢基本就是成本。比如為媒體生成稿件,撰稿人原來每篇是1500元,但API調(diào)用,一家媒體可能每月只支付幾百塊,最后整個(gè)市場(chǎng)不過大幾十萬。

還有最近很火的游戲公司用生成式AI做美術(shù)資源,可以為游戲公司節(jié)省幾百萬上千萬的成本,但他們?cè)敢鉃閷iT私有化部署的模型支付價(jià)格大概也就10萬人民幣左右。李笛甚至現(xiàn)身說法,目前在汽車智能座艙領(lǐng)域,小冰的市占率很高,但按調(diào)用次數(shù)付費(fèi),卻連研發(fā)成本都收不回來。

而大模型的創(chuàng)造力,可能帶來AI商業(yè)模式上的改變,比如去年年底開始,小冰公司和網(wǎng)飛聯(lián)合打造了幫助動(dòng)漫工作室端到端生成視頻作品的平臺(tái)。如果按照傳統(tǒng)的商業(yè)模式,一次性技術(shù)開發(fā)的收費(fèi)大概不到30萬人民幣,但一部《人和狗》的3分鐘短片,就為小冰公司獲得了15萬美元的回報(bào)。

目前大模型在移動(dòng)互聯(lián)網(wǎng)領(lǐng)域,不斷有應(yīng)用落地,在企業(yè)級(jí)應(yīng)用,也有新的探索,未來在傳統(tǒng)產(chǎn)業(yè)呢?大模型還有近乎無限的應(yīng)用可能,比如,科學(xué)家們認(rèn)為,大模型已經(jīng)類似于人腦,那如果我們給它外接上攝像頭,它是不是就有眼睛了?如果再加上手臂甚至翅膀呢?隨著深層次人工智能不斷落地和普及,新的改變還將會(huì)不斷發(fā)生。

02.螞蟻大模型

回到文章開頭,螞蟻投入到人工智能的研發(fā)差不多有10年的時(shí)間,本身就有非常豐富的AI業(yè)務(wù)場(chǎng)景,投入方向主要是降本增效和提升用戶體驗(yàn)。目前,大模型應(yīng)用的一個(gè)難題是喜歡“胡說八道”,因此,在應(yīng)用到行業(yè)上時(shí),尤其是金融這樣追求嚴(yán)謹(jǐn)?shù)男袠I(yè),廠商會(huì)格外慎重。

“通用大模型無法在專業(yè)嚴(yán)謹(jǐn)?shù)念I(lǐng)域直接商用,特別是金融服務(wù)對(duì)錯(cuò)誤的容忍度很低,金融大模型要確保領(lǐng)域知識(shí)和專業(yè)邏輯的嚴(yán)謹(jǐn)性,才能真正落地帶來產(chǎn)業(yè)價(jià)值。知識(shí)力、專業(yè)力、語言力以及安全力,保障四大能力是前提條件,也是金融大模型要解的產(chǎn)業(yè)真命題?!蔽浵伡瘓F(tuán)副總裁、金融大模型負(fù)責(zé)人王曉航在活動(dòng)中介紹道。

不過,這并不意味著就忽視基礎(chǔ)大模型。螞蟻集團(tuán)副總裁徐鵬在演講中介紹,螞蟻的大模型體系里,最核心的依舊是基礎(chǔ)大模型,而且包括語言大模型和多模態(tài)大模型。螞蟻的基礎(chǔ)大語言模型也是基于Transformer架構(gòu),但采取了跟ChatGPT不一樣的Prefix模型結(jié)構(gòu)?;A(chǔ)多模態(tài)大模型主要的特色是大語言模型和圖文模型進(jìn)行橋接,原生支持中文、融合文本圖像形態(tài),對(duì)齊其語義信息,支持多媒體內(nèi)容理解和搜索推介,對(duì)于圖像的編輯和生成等。

在此之上,再在不同的領(lǐng)域,包括安全、金融、服務(wù)等,建設(shè)行業(yè)模型,通過行業(yè)模型實(shí)現(xiàn)產(chǎn)品的落地。

螞蟻建設(shè)了模型數(shù)據(jù)體系,包括在互聯(lián)網(wǎng)上通過機(jī)器進(jìn)行大量數(shù)據(jù)的采集加工,通過高效用工管理和內(nèi)容標(biāo)注平臺(tái)產(chǎn)生高質(zhì)量的數(shù)據(jù),來給模型進(jìn)行精調(diào),進(jìn)一步人工強(qiáng)化學(xué)習(xí)等。螞蟻?zhàn)匝辛司{(diào)框架和強(qiáng)化學(xué)習(xí)框架,還有智能分布式訓(xùn)練引擎和高效分布式的推理引擎,再之上有開放的研發(fā)范式,支持螞蟻內(nèi)部各業(yè)務(wù)對(duì)于大模型的需求。

從長(zhǎng)遠(yuǎn)上來看,螞蟻希望推動(dòng)大模型規(guī)?;漠a(chǎn)業(yè)落地,為此,初步的目標(biāo)是提升AIGC模型研發(fā)的效能和技術(shù)的先進(jìn)性,建設(shè)一個(gè)可持續(xù)發(fā)展的AIGC模型的研發(fā)范式,一個(gè)開發(fā)共贏的應(yīng)用生態(tài),包括建設(shè)一流的基礎(chǔ)模型、行業(yè)模型,實(shí)現(xiàn)To C、To B的產(chǎn)品落地。

總結(jié)一下,就是從基礎(chǔ)大模型到行業(yè)大模型、再到產(chǎn)業(yè)應(yīng)用的全棧布局。

圖片來源:外灘大會(huì)

以金融大模型為例,螞蟻金融大模型就是基于螞蟻基礎(chǔ)大模型,針對(duì)金融產(chǎn)業(yè)深度定制。螞蟻基礎(chǔ)大模型平臺(tái)具備萬卡異構(gòu)集群,其中千卡規(guī)模訓(xùn)練MFU可達(dá)到40%,集群有效訓(xùn)練時(shí)長(zhǎng)占比90%以上,RLHF訓(xùn)練在同等模型效果下訓(xùn)練吞吐性能相較于業(yè)界方案提升3.59倍,推理性能相較于業(yè)界方案提升約2倍。

目前“大模型+知識(shí)+服務(wù)”的架構(gòu)已經(jīng)在螞蟻內(nèi)部金融智能化場(chǎng)景上內(nèi)測(cè),理財(cái)側(cè)的專業(yè)服務(wù)包括理財(cái)選品、產(chǎn)品評(píng)測(cè)、行情解讀、資產(chǎn)配置等6大類服務(wù),保險(xiǎn)側(cè)的專業(yè)服務(wù)包括產(chǎn)品解讀、家庭配置、智能核保、智能理賠等10多個(gè)智能服務(wù)?;诮鹑诖竽P?,還有更貼近個(gè)人用戶的“支小寶2.0”和“支小助1.0”,提供便捷且豐富的服務(wù) 。

大模型的迅速崛起和繁榮,不僅是AI發(fā)展前沿?zé)狳c(diǎn),也加速了人工智能與各行業(yè)深度融合,更強(qiáng)大、更通用、更開放的大模型,還有新算法、新應(yīng)用、新場(chǎng)景不斷涌現(xiàn),正成為產(chǎn)業(yè)增長(zhǎng)的新引擎和投資創(chuàng)業(yè)的新風(fēng)口。不過,大模型也遇到了一系列的問題和挑戰(zhàn),比如算力能耗、中文公開數(shù)據(jù)集語料不足、大模型應(yīng)用安全等,這條路不只是雪厚坡陡,也是道阻且長(zhǎng)。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-09-10
外灘掀起了“AI熱”
螞蟻入局大模型

長(zhǎng)按掃碼 閱讀全文