16家頭部大模型公司上海神秘碰頭,現(xiàn)場人擠人人人

擠爆了,簡直要被大模型公司們給擠爆了。

來感受一下這個(gè)feel:

毫不夸張地說,國內(nèi)外叫得上來的大模型公司基本上都來了——

Anthropic、Meta、Mistral.AI、Stability.ai、月之暗面、智譜AI、百川、MiniMax……

到底是什么樣的事情能讓它們紛紛聚集到了一起?

不賣關(guān)子,這正是“云計(jì)算一哥”亞馬遜云科技所舉辦的中國峰會(huì),整場活動(dòng)的關(guān)鍵詞就是大熱的生成式AI。

不過有一說一,自打AIGC大戰(zhàn)開局以來,全球科技巨頭如谷歌、微軟、OpenAI等一直呈現(xiàn)出你追我趕的態(tài)勢。

而亞馬遜云科技的“出鏡率”似乎并沒有它們那么高,但這場活動(dòng)又為何會(huì)引來如此多的廠商和圍觀群眾?

其實(shí)在深入了解和體驗(yàn)一番之后,我們不難發(fā)現(xiàn),亞馬遜云科技在AIGC這件事上已然是“全棧+全能”的狀態(tài)了。

已經(jīng)可以上崗的AIGC應(yīng)用

之所以說是全棧,是因?yàn)閬嗰R遜云科技的能力已經(jīng)覆蓋到了生成式AI最為關(guān)鍵的三大層面,即:

算力層:用于基礎(chǔ)模型訓(xùn)練和推理的基礎(chǔ)設(shè)施

模型層:使用基礎(chǔ)模型加速生成式AI應(yīng)用構(gòu)建

應(yīng)用層:開箱即用的生成式AI應(yīng)用

至于能力如何,我們直接來看下最為直觀的效果。

在生成式AI應(yīng)用方面,亞馬遜云科技面向企業(yè)和開發(fā)人員所推出的是生成式AI助手——Amazon Q。

它相當(dāng)于給企業(yè)配備了一個(gè)量身定制的AI專家,可以根據(jù)企業(yè)既有的人員、角色和權(quán)限對每個(gè)用戶交互進(jìn)行個(gè)性化的定制。

例如用上Amazon Q Developer(開發(fā)者版),編程這件事就只需簡單的“點(diǎn)點(diǎn)點(diǎn)”和“提要求”。

以功能開發(fā)和代碼轉(zhuǎn)換為例,開發(fā)者只需要向Amazon Q描述想要的新功能即可,然后它就能自己進(jìn)行規(guī)劃、執(zhí)行和迭代:

而且Amazon Q還會(huì)根據(jù)任務(wù)的內(nèi)容,動(dòng)態(tài)地分配最合適的大模型,讓性能做到Pro Max。

再如Amazon Q Business(企業(yè)版),同樣也是只需要簡單的語言輸入,就能幫助員工簡化任務(wù)、加速?zèng)Q策。

例如員工可以根據(jù)公司已有但分散的數(shù)據(jù)信息,讓Amazon Q來做整理和分析的工作,從而給員工答疑解惑、增加工作效率:

諸如整合分析、撰寫報(bào)告和制作PPT文稿等工作也是不在話下:

除此之外,亞馬遜云科技為了讓提高效率這事更上一層樓,還推出了Amazon Q Apps,它是Amazon Q Business中的一項(xiàng)功能,可以讓員工能夠迅速且安全的基于企業(yè)信息創(chuàng)建、分享應(yīng)用程序。

而且Amazon Q Apps是無需任何編程經(jīng)驗(yàn)、可以基于歷史對話、自動(dòng)化的那種。

例如一個(gè)HR如果要?jiǎng)?chuàng)建一個(gè)新人的入職30天計(jì)劃,就只需要向Amazon Q Apps“喂”員工姓名和工號即可。

而整個(gè)過程,也只需要短短幾秒鐘的時(shí)間!

數(shù)據(jù)分析處理方面,亞馬遜云科技則是將Amazon Q集成到了QuickSight中。

以往生成一個(gè)商業(yè)智能儀表盤可能需要數(shù)個(gè)小時(shí)的時(shí)間,但現(xiàn)在,幾分鐘就可以搞定了。

而且所有員工都可以根據(jù)這樣可視化的數(shù)據(jù)內(nèi)容,向Amazon Q提出自己的問題,讓復(fù)雜的數(shù)據(jù)分析任務(wù)變得簡單且高效。

總而言之,縱觀Amazon Q的效果和能力,亞馬遜云科技主打的就是用生成式AI的力量把繁瑣復(fù)雜的工作任務(wù)變得簡單,簡單,再簡單。

但Amazon Q之所以能在企業(yè)場景做到如此方方面面且絲滑,離不開背后大模型的能力。

不會(huì)有一個(gè)大模型一統(tǒng)天下

亞馬遜云科技的大模型能力對外輸出,主要依靠處于模型層的Amazon Bedrock

它是亞馬遜云科技正式加入大模型浪潮競爭的標(biāo)志,也是亞馬遜云科技和微軟OpenAI正面硬剛的關(guān)鍵。

基于Bedrock打造的生成式AI應(yīng)用,已經(jīng)多達(dá)數(shù)十種,讓人看得眼花繚亂。

簡單理解,Bedrock是一個(gè)集成了多種先進(jìn)AI大模型的平臺,只需單個(gè)API,就可以提供包括Claude、Mistral、Llama、Stable Diffusion、自研Titan系列在內(nèi)30個(gè)模型的能力。通過提供預(yù)訓(xùn)練、微調(diào)、知識庫、RAG、模型評估等功能,能夠靈活定制大模型或應(yīng)用。

亞馬遜全球副總裁、亞馬遜云科技大中華區(qū)總裁儲瑞松在峰會(huì)上表示,亞馬遜云科技一直認(rèn)為“不會(huì)有一個(gè)模型一統(tǒng)天下”,企業(yè)有從多個(gè)大模型中做選擇的權(quán)力。

因此,在Bedrock上被放置了數(shù)十個(gè)業(yè)界領(lǐng)先的大模型供企業(yè)選擇。包括和GPT-4并駕齊驅(qū)的Claude 3、主打開源的Llama系列Mistral AI、以及圖像生成方面的Stable Diffusion。

同時(shí)還包括亞馬遜云科技自研的Titan系列,目前已陸續(xù)推出7個(gè)模型,能力范圍包括文本摘要檢索生成、圖像生成、RAG、思維鏈、問答、搜索、個(gè)性化、推薦等。

具體能力上,Bedrock重點(diǎn)關(guān)注4個(gè)方面:

豐富靈活的模型選擇

輕松定制模型

簡化AI應(yīng)用集成

保障隱私安全

最首要的,構(gòu)建生成式AI應(yīng)用關(guān)鍵的一步是找到合適的模型。

Bedrock提供了業(yè)內(nèi)最廣泛的模型選擇,并推出Model Evaluation功能,支持企業(yè)快速分析和比較不同模型。

一般需要企業(yè)先給出評估標(biāo)準(zhǔn),比如對準(zhǔn)確性、魯棒性的要求,并上傳自有數(shù)據(jù)集/提示詞庫,或者從Bedrock內(nèi)置的、公開可用的資源中選擇。一些主觀或需要細(xì)致判斷的的評判內(nèi)容,平臺會(huì)引入人工審核,根據(jù)特定應(yīng)用場景的指標(biāo)進(jìn)行評估。

完成設(shè)置后,Bedrock便可開始評估并生成報(bào)告,最短僅需幾個(gè)小時(shí),企業(yè)就能找到適合自己的模型。

在選擇好模型后,企業(yè)可利用專有數(shù)據(jù),通過RAG、提示詞工程或微調(diào)來定制對應(yīng)大模型功能,以創(chuàng)建私有模型。

比如針對Command R、Llama 3、Titan Text Lite等模型,只需簡單幾步即可進(jìn)行微調(diào)。如果選擇了Titan Text模型,還能對未標(biāo)記的數(shù)據(jù)持續(xù)預(yù)訓(xùn)練,以更適應(yīng)對應(yīng)行業(yè)和領(lǐng)域。

Bedrock知識庫可自動(dòng)執(zhí)行完整的RAG工作流程,包括攝取、檢索、提示詞增強(qiáng)和引用。

同時(shí),Bedrock還推出了自定義模型導(dǎo)入(Custom Model Import)功能。企業(yè)現(xiàn)在能將自己定制模型導(dǎo)入到Bedrock中,以完全托管的API形式進(jìn)行訪問。由此,自定義模型可以方便地被集成到現(xiàn)有應(yīng)用程序和工作流中,并同樣得到隱私安全保護(hù)。

目前Bedrock專有模型導(dǎo)入功能已推出預(yù)覽版并支持Flan-T5、Llama和Mistral三種開放模型架構(gòu)。

模型推理方面,Bedrock Batch支持有效執(zhí)行大量數(shù)據(jù)的模型推理任務(wù),可在大規(guī)模推理任務(wù)中避免限流問題,無需編寫代碼即可處理故障并重啟,適用于基礎(chǔ)模型及用戶自定義模型。

AI應(yīng)用層面,Bedrock Agents功能支持構(gòu)建基于企業(yè)系統(tǒng)和數(shù)據(jù)來執(zhí)行任務(wù)的Agent。使生成式AI應(yīng)用能夠使用自然語言來執(zhí)行多步驟的業(yè)務(wù)任務(wù)。

包括利用LLM使用自然語言進(jìn)行交互和相應(yīng);任務(wù)拆分和編排;通過動(dòng)態(tài)調(diào)用API完成任務(wù)執(zhí)行;追蹤基礎(chǔ)大模型思維鏈流程并優(yōu)化底層Agent的提示工程。

比如使用Bedrock構(gòu)建一個(gè)AI造型師,效果大概會(huì)是醬嬸兒的。

最后在安全隱私保障方面。Bedrock的Guardrails功能在基礎(chǔ)模型的原生能力之上提供了安全保護(hù),可阻擋85%有害內(nèi)容。

企業(yè)只需通過自然語言來定義不予顯示的內(nèi)容,就能快速創(chuàng)建一個(gè)Guardrail。同時(shí)還可設(shè)置閾值以過濾帶有仇恨羞辱、暴力、攻擊性等內(nèi)容,并移除任何個(gè)人信息和敏感信息。

這一功能可用于Bedrock上的所有大模型,并且能與微調(diào)、Agent功能結(jié)合使用。

總結(jié)來看,Bedrock以企業(yè)定制大模型為出發(fā)點(diǎn),提供模型選擇、定制、應(yīng)用開發(fā)、安全保障等一系列功能,使各行各業(yè)能更加簡單方便用上大模型。

在正式推出1年之后,Bedrock為亞馬遜云科技帶來的增長和影響已經(jīng)在具體數(shù)據(jù)直觀體現(xiàn):

亞馬遜2024年第一季度財(cái)報(bào)顯示,亞馬遜云科技收入連續(xù)兩季度加速增長,運(yùn)營利潤率創(chuàng)下歷史新高,達(dá)到37.6%。

為啥能增長如此迅速?亞馬遜云科技的最強(qiáng)基本盤——算力基礎(chǔ)設(shè)施,為其提供了最關(guān)鍵的保障。

還有“云計(jì)算一哥”的看家本領(lǐng)

基礎(chǔ)設(shè)施一直都是亞馬遜云科技的強(qiáng)項(xiàng)。

2023年第四季度數(shù)據(jù)顯示,亞馬遜云科技依舊是“云市場一哥”,擁有全球31%市場份額

全球1000家獨(dú)角獸中,超過80%都使用亞馬遜云。目前亞馬遜云科技的年化收入已經(jīng)超過1000億美元,并且還在以17%的增長率增長。

在前大模型時(shí)代,亞馬遜云科技構(gòu)建了服務(wù)全球245個(gè)國家和地區(qū)的基礎(chǔ)設(shè)施建設(shè)、超過200大類的云服務(wù),過去十余年中已服務(wù)全球數(shù)百萬客戶。

其底層算力構(gòu)成主要由兩部分構(gòu)成,可以為企業(yè)提供高性能、高性價(jià)比、低功耗的算力選擇:

和英偉達(dá)密切合作

持續(xù)投入自研芯片

一方面,亞馬遜云科技和英偉達(dá)的合作已經(jīng)長達(dá)13年,二者保持長期的戰(zhàn)略合作關(guān)系,曾共同推出了世界上第一個(gè)GPU Cloud實(shí)例。

在披露的最新進(jìn)展中,亞馬遜云科技將推出基于英偉達(dá)最新一代Blackwell架構(gòu)GPU的Amazon EC2(Amazon Elastic Compute Cloud),以加速構(gòu)建及運(yùn)行數(shù)萬億參數(shù)大模型的性能。

同時(shí)將提供首款搭載英偉達(dá)Grace Hopper超級芯片的云AI超級計(jì)算機(jī),以及首款采用英偉達(dá)GH200 NVL32的NVIDIA DGX Cloud。

另一方面,在算力瓶頸愈加明顯的環(huán)境下,亞馬遜在很早期便開始自研芯片。

2019年亞馬遜云科技推出了高性能機(jī)器學(xué)習(xí)推理芯片Inferentia,2020年底又推出了定制機(jī)器學(xué)習(xí)訓(xùn)練芯片Trainium。

目前最新一代用于AI訓(xùn)練的Trainium 2可支持千億、萬億級參數(shù)大模型訓(xùn)練。與上一代相比,其訓(xùn)練性能提高4倍,能效功耗比提高2倍,內(nèi)存增加3倍。

一個(gè)Amazon EC2可部署多達(dá)16個(gè)Trainium 2,相較于部署同類芯片的EC2,部署Trainium 2的可節(jié)省50%訓(xùn)練成本。

用于AI推理的Inferentia 2專門針對千億參數(shù)大模型進(jìn)行優(yōu)化,與上一代相比,計(jì)算性能提高3倍,內(nèi)存擴(kuò)大4倍,吞吐量提高了4倍,延遲降低至1/10,并可支持大模型分布推理。

Inferentia 2是Amazon EC2中首個(gè)推理優(yōu)化實(shí)例,可通過加速器之間的超高速鏈接支持橫向擴(kuò)展分布式推理。

搭配SageMaker HyperpodSageMaker Jumpstart, 可進(jìn)一步加速基礎(chǔ)模型推理與訓(xùn)練。

前者可簡化大模型基礎(chǔ)訓(xùn)練的過程,后者則提供了一個(gè)機(jī)器學(xué)習(xí)中心,通過提供一系列基礎(chǔ)模型,讓用戶無需自己從頭構(gòu)建和訓(xùn)練模型,進(jìn)行快速訓(xùn)練和部署。

現(xiàn)在亞馬遜云科技還在不斷拓展中國區(qū)域SageMaker Jumpstart中的基礎(chǔ)模型種類,引入領(lǐng)先的中文基礎(chǔ)模型。亞馬遜云科技在中國峰會(huì)2024上宣布,由百川智能提供的基礎(chǔ)模型Baichuan2-7B即將登陸中國區(qū)域SageMaker JumpStart,由零一萬物提供的基礎(chǔ)模型Yi-1.5 6B/9B/34B正式登陸中國區(qū)域SageMaker JumpStart,在為中國企業(yè)提供豐富模型選擇的同時(shí)滿足了企業(yè)對安全合規(guī)、快速擴(kuò)展、免運(yùn)維的需求。

作為首批登陸中國區(qū)域SageMaker JumpStart的中文基礎(chǔ)模型,Baichuan2和Yi-1.5與亞馬遜云科技托管服務(wù)深度集成,助力中國企業(yè)應(yīng)用一流的生成式AI技術(shù)實(shí)現(xiàn)本土創(chuàng)新與業(yè)務(wù)轉(zhuǎn)型。

如上多個(gè)方面,共同構(gòu)成了亞馬遜云科技的底層算力建設(shè),更為其生成式AI全棧架構(gòu)提供扎實(shí)底座。

在生成式AI大潮下,亞馬遜云科技提出,未來真正能創(chuàng)造最大價(jià)值的將是生成式 AI 的行業(yè)應(yīng)用。如金山辦公、沐瞳科技、涂鴉智能、禮來科技等擁抱大模型的廠商都選擇與亞馬遜云科技合作。

其中,禮來制藥是一家全球跨國藥企。去年開始,他們重點(diǎn)布局打造以生成式AI為核心的AI基礎(chǔ)能力?;趤嗰R遜云科技提供的生成式AI云服務(wù),他們快速打造了員工聊天問答機(jī)器人、醫(yī)學(xué)文獻(xiàn)引用驗(yàn)證、競品及市場推廣分析、基于醫(yī)學(xué)內(nèi)容的FAQ生成。

實(shí)際上,這也是亞馬遜云科技一直以來強(qiáng)調(diào)的路線與理念。

他們提出,企業(yè)應(yīng)用是行業(yè)應(yīng)用未被泛化的一個(gè)個(gè)實(shí)例。

而亞馬遜云科技當(dāng)下要做的,就是成為企業(yè)構(gòu)建和應(yīng)用生成式AI的首選,以推動(dòng)各個(gè)行業(yè)真正意義上擁抱生成式AI大潮。

從宏大遠(yuǎn)景到具體行動(dòng),亞馬遜云科技的生成式AI戰(zhàn)略已然全盤托出。

那么當(dāng)下,也就到了重新審視亞馬遜云科技的時(shí)刻。

AIGC時(shí)代,如何評價(jià)亞馬遜云科技?

首先,不論是大模型時(shí)代的當(dāng)下還是此前的傳統(tǒng)AI時(shí)代,一切的一切都繞不開算力這個(gè)核心關(guān)鍵點(diǎn)。

而亞馬遜云科技早早發(fā)力于云計(jì)算領(lǐng)域,已然在全球范圍內(nèi)處于公認(rèn)的“云計(jì)算一哥”的位置。

加之與英偉達(dá)的密切合作,亞馬遜云科技無疑是在Scaling Law為主旋律的當(dāng)下妥妥的算力大玩家。

其次,在模型層面上的戰(zhàn)略,亞馬遜云科技走的是一條“集大成者”的路線——當(dāng)下每個(gè)大模型都各自擅長的能力,將它們集成到一起,方便客戶選用。

也正如儲瑞松在這次Keynote中所述:

大模型已不再是企業(yè)生成式AI創(chuàng)新的唯一要素;企業(yè)在確定生成式AI場景之后,需要根據(jù)自身的要求選擇合適的大模型。

不同的模型在應(yīng)用過程中所擅長的領(lǐng)域是不同的,要最大發(fā)揮生成式AI的能力,需要將它們結(jié)合起來產(chǎn)生復(fù)合效應(yīng),從而提高系統(tǒng)整體的智力水平。

正是基于這樣的一個(gè)思路,在更上層的應(yīng)用方面,諸如Amazon Q這樣的應(yīng)用才能做到“多、快、好、省”地上崗諸多領(lǐng)域。

而這也是符合當(dāng)下“應(yīng)用為王”的大趨勢。

總而言之,有算力、有模型、有應(yīng)用、有市場,亞馬遜云科技絕對是AIGC時(shí)代不容小覷的巨頭之一。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-05-30
16家頭部大模型公司上海神秘碰頭,現(xiàn)場人擠人人人
16家頭部大模型公司上海神秘碰頭,現(xiàn)場人擠人人人

長按掃碼 閱讀全文