從“奇點(diǎn)”到“大爆炸”,生成式AI開(kāi)啟“十年周期”

科技云報(bào)道原創(chuàng)。

世界是復(fù)雜的,沒(méi)有人知道未來(lái)會(huì)怎樣,但如果單純從技術(shù)的角度,我們總是能夠沿著技術(shù)發(fā)展的路徑,找到一些主導(dǎo)未來(lái)趨勢(shì)的脈絡(luò)。

從Sora到Suno,從OpenAI到Copilot、Blackwell,這些熱詞在大眾眼里或許還分不清楚,但很多人已經(jīng)用上各種“ChatGPT”,或聊天或創(chuàng)作。不知不覺(jué)間,我們已經(jīng)卷入新一輪AI浪潮中。

這輪人工智能浪潮,自ChatGPT這類生成式AI工具問(wèn)世,被迅速引爆。AI大模型從研究走向應(yīng)用,復(fù)用成本大幅降低,各種應(yīng)用得以更快滲透進(jìn)各行各業(yè)。

IDC發(fā)布報(bào)告稱,2027年全球人工智能IT總投資規(guī)模有望從2022年的1324.9億美元增至2027年的5124.2億美元,年復(fù)合增長(zhǎng)率(CAGR)為31.1%。

聚焦生成式AI,IDC預(yù)測(cè),全球生成式AI市場(chǎng)年復(fù)合增長(zhǎng)率將達(dá)85.7%,到2027年全球生成式AI市場(chǎng)規(guī)模將接近1500億美元。

英偉達(dá)CEO黃仁勛表示,生成式AI已經(jīng)開(kāi)啟了全新的投資周期,已經(jīng)進(jìn)入了“十年周期”(技術(shù)從出現(xiàn)、傳播到大規(guī)模應(yīng)用所需的時(shí)間)的第一年。

當(dāng)生成式AI從一個(gè)“奇點(diǎn)”到迎來(lái)“大爆炸”時(shí)刻,其將在現(xiàn)實(shí)世界發(fā)生哪些改變?又將激發(fā)怎樣的潛力?

生成式AI迎來(lái)“三個(gè)轉(zhuǎn)變”

生成式AI技術(shù)可分為四個(gè)層次,即面向消費(fèi)者應(yīng)用;大語(yǔ)言模型(LLM)等基礎(chǔ)技術(shù);支持服務(wù)的云基礎(chǔ)設(shè)施;以及對(duì)于開(kāi)發(fā)和運(yùn)營(yíng)至關(guān)重要的半導(dǎo)體。

從技術(shù)發(fā)展看,今年生成式AI將從純理論探討階段,全面進(jìn)入到業(yè)務(wù)應(yīng)用階段。過(guò)去一年,大部分企業(yè)和機(jī)構(gòu)并沒(méi)有真正打造出生成式AI系統(tǒng);而今年,生成式AI系統(tǒng)將全面進(jìn)入到生產(chǎn)當(dāng)中,企業(yè)將真正地開(kāi)始使用生成式AI工具。

對(duì)于生成式AI本身,即將迎來(lái)三個(gè)方面的轉(zhuǎn)變。

首先,要把生成式AI投入到企業(yè)以及業(yè)務(wù)用例的過(guò)程中,就要從構(gòu)建訓(xùn)練基礎(chǔ)架構(gòu)轉(zhuǎn)向構(gòu)建推理基礎(chǔ)架構(gòu)。

到目前為止,大部分企業(yè)往往是通過(guò)對(duì)開(kāi)源基礎(chǔ)模型進(jìn)行調(diào)優(yōu)、優(yōu)化或者是互聯(lián),來(lái)實(shí)現(xiàn)自己的某些功能和需求。

對(duì)于各個(gè)企業(yè)、各個(gè)垂直行業(yè)領(lǐng)域的企業(yè)來(lái)說(shuō),無(wú)論是GenAI還是GPT4,大語(yǔ)言模型的訓(xùn)練成本是高昂的。特別是對(duì)于垂直行業(yè)的企業(yè)用戶,不會(huì)在業(yè)務(wù)推進(jìn)過(guò)程中直接采用這些模型。

如果未來(lái)需要將AI能力賦予企業(yè)的業(yè)務(wù),那么企業(yè)就需要進(jìn)一步開(kāi)發(fā)已有的模型,從而讓這些模型在部署到垂直行業(yè)的生產(chǎn)中時(shí),可以真正地轉(zhuǎn)化為生產(chǎn)力。

而這種轉(zhuǎn)變也對(duì)企業(yè)提出了更加明確的要求:如何更好地設(shè)計(jì)出這種推理基礎(chǔ)架構(gòu)?該把它們放在哪里?如何確保其安全?

其次,是企業(yè)的關(guān)注點(diǎn)將越來(lái)越多地將從寬泛的實(shí)驗(yàn)轉(zhuǎn)向自上而下的戰(zhàn)略推進(jìn),即挑選出少數(shù)幾個(gè)真正具有變革意義的生成式AI應(yīng)用項(xiàng)目。

去年,很多企業(yè)都在考慮采用生成式AI技術(shù)。但如今,企業(yè)已經(jīng)認(rèn)識(shí)到,要應(yīng)用生成式AI技術(shù),每個(gè)項(xiàng)目都非常龐大,需要占用大量人力、物力、財(cái)力,才能構(gòu)建和實(shí)施一個(gè)能夠投入生產(chǎn)的生成式AI系統(tǒng)。

到了今年,一方面,生成式AI領(lǐng)域?qū)?huì)有成百上千乃至上萬(wàn)的潛在用例,但另一方面,由于每一個(gè)企業(yè)的資源有限,因此只能選擇其中幾個(gè)重點(diǎn)實(shí)施。

對(duì)于企業(yè)的CIO和領(lǐng)導(dǎo)者,必然會(huì)面臨一個(gè)問(wèn)題:就是從幾百個(gè)AI項(xiàng)目中,優(yōu)先選擇幾個(gè)進(jìn)行實(shí)施。這其中的風(fēng)險(xiǎn)在于:一旦選對(duì)了,這些項(xiàng)目將對(duì)業(yè)務(wù)產(chǎn)生正向影響;而萬(wàn)一選錯(cuò),可能就會(huì)造成大量的資源浪費(fèi)。

要想做出一個(gè)正確的選擇,各個(gè)企業(yè)必須要充分理解GenAI價(jià)值,以及生成式AI最有可能從哪些方面能夠?yàn)槠髽I(yè)提升生產(chǎn)力而賦能。

第三,是用戶對(duì)于AI投入的成本考量,從對(duì)“訓(xùn)練成本”的計(jì)算轉(zhuǎn)向?qū)Α斑\(yùn)營(yíng)成本”的衡量。

在理論研究和訓(xùn)練階段,生成式AI的成本取決于構(gòu)建模型的復(fù)雜程度,以及架構(gòu)開(kāi)發(fā)和維護(hù)人員的規(guī)模,除此之外再無(wú)其他成本可言。

但當(dāng)企業(yè)用戶開(kāi)始實(shí)施部署和應(yīng)用生成式AI工具時(shí),現(xiàn)實(shí)的運(yùn)營(yíng)成本就會(huì)成為企業(yè)用戶面臨的最大經(jīng)濟(jì)考量。

以戴爾科技為例,其最初開(kāi)始建立自己的生成式AI系統(tǒng)時(shí),基本上會(huì)在三個(gè)月的時(shí)間里用到20臺(tái)服務(wù)器,此刻其整體運(yùn)營(yíng)成本是未知的。

但當(dāng)這套系統(tǒng)開(kāi)始被戴爾科技內(nèi)部的工程師應(yīng)用時(shí),6000名工程師每個(gè)月就需要大約5000萬(wàn)次處理量,因此該系統(tǒng)最大的成本不是建立一個(gè)模型的成本,而是基于大規(guī)模處理而產(chǎn)生的巨額運(yùn)營(yíng)成本。

這對(duì)企業(yè)用戶而言,從訓(xùn)練成本到運(yùn)營(yíng)成本的考慮,將是未來(lái)必將面對(duì)的一個(gè)相當(dāng)現(xiàn)實(shí)的問(wèn)題。

從本質(zhì)上說(shuō),生成式AI的轉(zhuǎn)變其實(shí)是技術(shù)從研發(fā)到應(yīng)用的商用化過(guò)程中必然要經(jīng)歷的過(guò)程。

只是由于AI自身業(yè)務(wù)形態(tài)的改變,也將帶來(lái)更多行業(yè)的改變,其中的一個(gè)影響就是會(huì)帶動(dòng)一批相關(guān)技術(shù)和應(yīng)用,成為未來(lái)的熱點(diǎn)和趨勢(shì)。

如何激發(fā)生成式AI更大潛力

僅僅一年,隨著各大資本和巨頭入場(chǎng),AI從底層大模型,到基礎(chǔ)設(shè)施,到機(jī)器學(xué)習(xí)操作(MLOps),再到消費(fèi)端應(yīng)用,生成式AI的生態(tài)已經(jīng)初步建立。

隨著今年生成式AI的進(jìn)一步訓(xùn)練和穩(wěn)定,行業(yè)發(fā)展將加速向下游移動(dòng),生成式AI將進(jìn)一步改變?nèi)藗兊纳?,乃至改變整個(gè)世界,其為企業(yè)提供了無(wú)限的想象空間,使產(chǎn)品和服務(wù)的研發(fā)過(guò)程更加高效、有趣。

面對(duì)生成式AI市場(chǎng)的巨大潛力,亞馬遜、谷歌、微軟、Meta等科技巨頭不甘示弱。去年12月,谷歌多模態(tài)大模型Gemini發(fā)布,包含三個(gè)版本:Nano、Pro和Ultra。

Pro對(duì)標(biāo)GPT-3.5,Ultra對(duì)標(biāo)GPT-4,可以處理文本之外的信息,包括圖像、視頻和音頻。同時(shí),谷歌上線文生圖模型Imagen 2、視頻生成模型VideoPoet,推出醫(yī)療人工智能大模型MedLM,將大模型與醫(yī)療保健行業(yè)緊密結(jié)合。

去年11月,微軟將集成了GPT的Bing Chat更名為Copilot,可以免費(fèi)使用GPT-4、DALL·E 3功能,并且擁有了獨(dú)立網(wǎng)站,Copilot將嵌入所有微軟旗下應(yīng)用中。微軟還推出Copilot Studio,使用者可以自定義GPT、創(chuàng)建新插件、自定義工作流。

Meta則接連發(fā)布了650億參數(shù)的開(kāi)源大模型 LLaMA和700億參數(shù)的LLaMA2。近日,Meta推出全新開(kāi)源大模型Code Llama 70B,其準(zhǔn)確率達(dá)到了53%,超過(guò)了GPT-3.5的48.1%,是目前評(píng)分最高的開(kāi)源大模型。

2023年以來(lái),看似默默無(wú)聞的亞馬遜頻頻出擊。去年9月,亞馬遜宣布將向人工智能初創(chuàng)公司Anthropic投資40億美元,近日,其再次宣布追加投資27.5億美元,完成了對(duì)Anthropic40億美元的投資,決心可見(jiàn)一斑。

更為重要的是,亞馬遜云科技提出了基于生成式AI的三層技術(shù)棧。

第一層是高性能基礎(chǔ)設(shè)施,過(guò)去五年,亞馬遜云科技持續(xù)加大在自研芯片方面的投入,比如Amazon Trainium和Amazon Inferentia芯片,可以提供在云上訓(xùn)練模型和運(yùn)行推理的最低成本。

除此之外,在GPU方面,NVIDIA多款先進(jìn)算力均率先在亞馬遜云科技落地。

第二層是最廣泛的基礎(chǔ)模型選擇。亞馬遜云科技認(rèn)為“沒(méi)有一個(gè)模型可以適用于所有業(yè)務(wù)場(chǎng)景”,因此推出Amazon Bedrock,企業(yè)可以靈活選擇適合自己的模型,更容易地構(gòu)建應(yīng)用,并在保證數(shù)據(jù)安全和隱私基礎(chǔ)上,進(jìn)行定制化模型的開(kāi)發(fā),還無(wú)需大量的標(biāo)注數(shù)據(jù)。

Amazon Bedrock提供各種領(lǐng)先的基礎(chǔ)模型供客戶選擇:既有知名的開(kāi)源模型,如Stable Diffusion XL、Llama、Mistral 7B和Mixtral 8*7B,也有如Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan等非開(kāi)源模型。

基于Amazon Bedrock云托管服務(wù),企業(yè)可以通過(guò)API訪問(wèn)從文本到圖像的一系列強(qiáng)大的基礎(chǔ)模型。

值得一提的是,亞馬遜和Anthropic在生成式AI領(lǐng)域有著廣泛的合作,Anthropic在Amazon Bedrock上提供的Claude 3系列模型是全球最領(lǐng)先的大模型之一,共包含三個(gè)模型:Haiku、Sonnet、Opus,從模型尺寸來(lái)看,可以理解為模型的中杯、大杯、超大杯。

客戶可以根據(jù)自己的商業(yè)需求,從中選擇最合適的智能、速度和價(jià)格組合。

· Haiku:是響應(yīng)速度最快的模型,也是成本最低的選項(xiàng),在大多數(shù)純文本任務(wù)上的表現(xiàn)仍然相當(dāng)出色,也同時(shí)包含多模態(tài)能力(比如視覺(jué))。

· Sonnet:適用于需要平衡性能和成本的場(chǎng)景,它在純文本任務(wù)上的表現(xiàn)與后面的Opus相當(dāng),但在成本上更為經(jīng)濟(jì),適合于那些需要性能稍微好點(diǎn),但預(yù)算有限的企業(yè)和個(gè)人用戶。

· Opus:具有強(qiáng)大的推理、數(shù)學(xué)和編碼能力,接近人類的理解能力,適用于需要高度智能和復(fù)雜任務(wù)處理的場(chǎng)景,如企業(yè)自動(dòng)化、復(fù)雜金融預(yù)測(cè)、研究和開(kāi)發(fā)等。

對(duì)于Claude 3,更有行業(yè)人士認(rèn)為其終結(jié)了GPT-4時(shí)代。Claude 3有兩大亮點(diǎn),一個(gè)是長(zhǎng)文本,二是多模態(tài)能力。

長(zhǎng)文本是Claude 3的一個(gè)顯著優(yōu)勢(shì),體現(xiàn)為在讀論文、小說(shuō)等字?jǐn)?shù)更多的文本時(shí),Claude 3更擅長(zhǎng)理解和回答用戶的相關(guān)問(wèn)題。

此次Claude 3大大提升了上下文對(duì)話窗口,達(dá)到200k,可以理解為單次和模型對(duì)話能夠輸入的文本。

具體而言,Claude 3 200k的對(duì)話長(zhǎng)度,相當(dāng)于能夠單次處理超過(guò)15萬(wàn)英文單詞,而GPT-4 Turbo的上下文窗口為128k,大約是9.6萬(wàn)個(gè)英文單詞。同時(shí),Claude 3也第一次允許圖像和文檔上傳。

ChatGPT一樣,Claude 3能夠“認(rèn)”出來(lái)圖里的是什么東西,直接描述,回答用戶的問(wèn)題。更令人印象深刻的是,Claude 3在分析一些復(fù)雜問(wèn)題時(shí),已經(jīng)能夠和人一樣,先拆解問(wèn)題,并且交由子模型來(lái)進(jìn)行調(diào)度。

第三層就是應(yīng)用生成式AI技術(shù)的開(kāi)箱即用的云服務(wù),進(jìn)一步降低使用門(mén)檻。目前已經(jīng)推出Amazon Q這一AI助手,可以根據(jù)客戶業(yè)務(wù)進(jìn)行定制,專用于辦公場(chǎng)景需要。

還與像Amazon QuickSight,包括智能客服的產(chǎn)品Amazon Connect,面向編程開(kāi)發(fā)人員的平臺(tái)Amazon CodeWhisperer,都實(shí)現(xiàn)了非常有效的結(jié)合。

可以看到,從底層基礎(chǔ)設(shè)施到上層應(yīng)用拓展,今年亞馬遜云科技在生成式AI領(lǐng)域不斷發(fā)力。不同的客戶可以根據(jù)需求選擇不同層級(jí)的產(chǎn)品,通過(guò)這三層來(lái)支持他們的業(yè)務(wù)創(chuàng)新。

此外,對(duì)于如何幫助企業(yè)快速具備生成式AI能力,亞馬遜云科技擁有豐富的專業(yè)技術(shù)支持資源,包括SA、產(chǎn)品專家、人工智能實(shí)驗(yàn)室、數(shù)據(jù)實(shí)驗(yàn)室、快速原型團(tuán)隊(duì)、專業(yè)服務(wù)團(tuán)隊(duì),幫客戶打通應(yīng)用生成式AI的“最后三公里”工程化挑戰(zhàn)。

對(duì)于作為扮演“底層架構(gòu)師”角色的亞馬遜云科技而言,大模型固然重要,但關(guān)鍵技術(shù)能力的集合才是提升企業(yè)生產(chǎn)力的根本動(dòng)力。

亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建表示,“盡管大模型非常重要,但僅靠大模型對(duì)企業(yè)的生產(chǎn)是遠(yuǎn)遠(yuǎn)不夠的。從模型能力到真正的運(yùn)營(yíng)生產(chǎn)之間,企業(yè)還需要增加很多輔助能力。企業(yè)需要一系列周邊的能力來(lái)正確、合理、安全、高效地使用大模型,這就是亞馬遜云科技一系列產(chǎn)品所提供的價(jià)值所在?!?/p>

生成式AI領(lǐng)域接下來(lái)發(fā)展的最關(guān)鍵一步是什么?陳曉建表示,首先,從最底層來(lái)看,芯片性能仍然落后于需求。雖然半導(dǎo)體芯片的發(fā)展已經(jīng)非???,但模型本身參數(shù)規(guī)模的擴(kuò)大實(shí)際上遠(yuǎn)超芯片的能力。

“以前一個(gè)幾百萬(wàn)參數(shù)的模型,就覺(jué)得已經(jīng)很大了,但現(xiàn)在動(dòng)輒達(dá)到數(shù)百億的規(guī)模?;A(chǔ)服務(wù)商仍需關(guān)注如何將底層能力、業(yè)務(wù)復(fù)雜度和大模型復(fù)雜度相匹配,使硬件發(fā)展趕上軟件發(fā)展規(guī)模?!?/p>

其次,他認(rèn)為大模型能力本身還有很多發(fā)展空間,今天看到的模型可能代表了一個(gè)博士生水平,但是能不能做得更好?比如達(dá)到教授或者院士水平?

包括亞馬遜云科技在內(nèi)的諸多生成式AI供應(yīng)商需要在未來(lái)持之以恒地去做模型能力方面的工作。

在最上層與各行各業(yè)務(wù)相結(jié)合方面,陳曉建表示,相關(guān)的SaaS解決方案非常多。

從這點(diǎn)上看,將生成式AI能力與垂直場(chǎng)景的解決方案結(jié)合需要做巨大的工作。“我們需要思考大模型如何為人類社會(huì)各行各業(yè)中的應(yīng)用提供更好的模型能力、更易用的方式和更低的成本?!?/p>

無(wú)論如何,人們對(duì)未來(lái)的期許總是充滿希望。對(duì)于科技未來(lái)的走向,以AI為代表的技術(shù)進(jìn)化,正在成為一場(chǎng)考驗(yàn)人類想象力的比賽。

科技企業(yè)能做的,就是通過(guò)技術(shù)普惠,降低AI參與門(mén)檻,先把大模型打造成像電、水一樣隨取隨用的公共資源,再將生成式AI技術(shù)應(yīng)用于各行各業(yè),變成真正能夠推動(dòng)人類發(fā)展的生產(chǎn)力。

【關(guān)于科技云報(bào)道】

專注于原創(chuàng)的企業(yè)級(jí)內(nèi)容行家——科技云報(bào)道。成立于2015年,是前沿企業(yè)級(jí)IT領(lǐng)域Top10媒體。獲工信部權(quán)威認(rèn)可,可信云、全球云計(jì)算大會(huì)官方指定傳播媒體之一。深入原創(chuàng)報(bào)道云計(jì)算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領(lǐng)域。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2024-04-15
從“奇點(diǎn)”到“大爆炸”,生成式AI開(kāi)啟“十年周期”
科技云報(bào)道原創(chuàng)。世界是復(fù)雜的,沒(méi)有人知道未來(lái)會(huì)怎樣,但如果單純從技術(shù)的角度,我們總是能夠沿著技術(shù)發(fā)展的路徑,找到一些主導(dǎo)未來(lái)趨勢(shì)的...

長(zhǎng)按掃碼 閱讀全文