12月27日消息,亞馬遜云科技2024 re:Invent全球大會于12月初在美國舉辦,期間推出一系列技術(shù)發(fā)布,聚集生成式AI、數(shù)據(jù)戰(zhàn)略和云服務(wù)三大領(lǐng)域,覆蓋基礎(chǔ)設(shè)施、模型和應(yīng)用的全棧聯(lián)動創(chuàng)新,可謂為企業(yè)應(yīng)用生成式AI鋪平了道路。
近日,在亞馬遜云科技2024 re:Invent中國行活動上,亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建就表示:“在非常受關(guān)注的生成式AI應(yīng)用領(lǐng)域,2024年許多客戶從思考階段進(jìn)入實踐階段,進(jìn)行了大量場景試驗。2025年肯定會發(fā)生一個變化,很多客戶將從原型驗證階段轉(zhuǎn)化為生產(chǎn)階段?!?/p>
幫助客戶將生成式AI技術(shù)從小范圍試驗探索到落地至真正投入生產(chǎn)應(yīng)用,亞馬遜云科技到底是如何進(jìn)行全棧聯(lián)動來達(dá)成這一能力的呢?我們從其最新的技術(shù)發(fā)布中可以窺見一斑。
整體來看,2024 re:Invent全球大會上,亞馬遜云科技在生成式AI領(lǐng)域,推出Amazon Nova系列基礎(chǔ)模型并強化Amazon SageMaker、Amazon Bedrock和Amazon Q等核心服務(wù),通過更低的訓(xùn)練和推理成本、更多的模型選擇、更深入場景的應(yīng)用全面加速企業(yè)應(yīng)用生成式AI創(chuàng)新;在數(shù)據(jù)戰(zhàn)略方面,發(fā)布新一代Amazon SageMaker為數(shù)據(jù)、分析和AI提供統(tǒng)一平臺;Amazon S3新增Tables存儲類型和元數(shù)據(jù)功能,以及無服務(wù)器分布式SQL數(shù)據(jù)庫Amazon Aurora DSQL將進(jìn)一步提升用戶的數(shù)據(jù)管理能力;在云服務(wù)方面,推出搭載Trainium2芯片的新型計算實例和為萬億參數(shù)模型提供實時推理性能的超級服務(wù)器。
陳曉建強調(diào):“這些新發(fā)布展現(xiàn)出亞馬遜云科技不僅在云的核心服務(wù)層面持續(xù)創(chuàng)新,更在從芯片到模型,再到應(yīng)用的每一個技術(shù)堆棧取得突破,讓不同層級的創(chuàng)新相互賦能、協(xié)同進(jìn)化。只有這樣全棧聯(lián)動的大規(guī)模創(chuàng)新才能真正滿足當(dāng)今客戶的發(fā)展需求,助力各行各業(yè)重塑未來。”
生成式AI從原型驗證到生產(chǎn)應(yīng)用,有效改善大模型幻覺是基礎(chǔ)
將生成式AI應(yīng)用于企業(yè)實際的業(yè)務(wù)時,很多企業(yè)的第一個顧慮就是“幻覺”問題——大模型一本正經(jīng)的胡說八道。想象一下,如果企業(yè)想將生成式AI用來做一個非常重要的業(yè)務(wù)應(yīng)用場景,比如法律咨詢、金融交易或者健康咨詢等,這里如果出現(xiàn)幻覺的話,結(jié)果是無法接受的。
“亞馬遜云科技團隊一直在思考如何解決幻覺的問題,也探索了多種不同的技術(shù)方案。最后我們發(fā)現(xiàn)自動推理技術(shù)(Automatic Reasoning)能夠很有效的解決幻覺問題?!标悤越ǚQ。
陳曉建介紹,自動推理技術(shù)(Automatic Reasoning)是一項特殊的 AI 技術(shù),它能夠從數(shù)學(xué)層面證明這個推理的結(jié)果是不是正確的。它通常用于驗證這個系統(tǒng)是不是按照設(shè)計的規(guī)范來正常的運行。自動推理在很多領(lǐng)域下都已經(jīng)有了實踐的應(yīng)用,比如金融交易、健康咨詢、法律咨詢等領(lǐng)域。亞馬遜云科技擁有自動推理方面的多位世界級專家。例如,可以通過自動推理來證明在Amazon IAM(Identity and Access Management)之中設(shè)計的權(quán)限和策略是不是按照企業(yè)所預(yù)想的方式來進(jìn)行,這種方式的證明叫做“可證明的安全性”。這些技術(shù)同樣能夠幫助提升模型的準(zhǔn)確性、降低模型的幻覺。
本次2024 re:Invent上,亞馬遜云科技推出了Amazon Bedrock 自動化推理檢查的功能,它能夠有效的預(yù)防由于模型幻覺帶來的事實性錯誤。
生成式AI三層架構(gòu)同頻更新:更強訓(xùn)練推理、更多模型、更優(yōu)應(yīng)用
在解決大模型幻覺問題后,陳曉建表示,2025年,很多客戶將從生成式AI原型驗證階段轉(zhuǎn)化為生產(chǎn)階段,屆時客戶需求將更加復(fù)雜,不僅是選擇模型,還需要各種技術(shù)支持。因此,在生成式AI領(lǐng)域,亞馬遜云科技全面強化基礎(chǔ)設(shè)施、模型和應(yīng)用三層技術(shù)棧能力。
更強訓(xùn)練推理方面,此次2024 re:Invent上,亞馬遜云科技推出新?代Amazon SageMaker,為客戶提供一個單一的數(shù)據(jù)和AI開發(fā)環(huán)境,用戶可以在其中查找和訪問其組織中的所有數(shù)據(jù),為各種常見的數(shù)據(jù)用例選擇最佳工具,并將數(shù)據(jù)和AI項目擴展至團隊內(nèi)不同分工角色以實現(xiàn)協(xié)作。此外,Amazon SageMaker AI的四項創(chuàng)新包括Amazon SageMaker HyperPod的新訓(xùn)練配方功能、靈活訓(xùn)練計劃和任務(wù)治理功能,以及在Amazon SageMaker中使用亞馬遜云科技合作伙伴的熱門AI應(yīng)用。這些功能將幫助客戶更快開始訓(xùn)練流行模型,通過靈活訓(xùn)練計劃節(jié)省數(shù)周時間,并將成本降低高達(dá)40%。
陳曉建表示,新的Amazon SageMaker涵蓋了分析、數(shù)據(jù)處理、搜索、數(shù)據(jù)準(zhǔn)備、AI模型開發(fā)和訓(xùn)練、?成式AI等所有必需功能。
更多模型方面,亞馬遜云科技一方面新推出了自研的Amazon Nova六款基礎(chǔ)模型,包括Nova Micro、Nova Lite、Nova Pro和Nova Premier基礎(chǔ)模型,以及用于生成高質(zhì)量圖像的Nova Canvas和生成高質(zhì)量視頻的Nova Reel,這些模型成本更低速度更快。另一方面,Amazon Bedrock通過推出的Amazon Bedrock Marketplace新功能新接入Luma AI和poolside等100多款熱門、新興及專業(yè)模型。這些給企業(yè)客戶提供了豐富的模型選擇。
同時,Amazon Bedrock推出了低延遲優(yōu)化推理、模型蒸餾、提示詞緩存等功能,大幅提升推理效率;支持GraphRAG等知識庫功能增強數(shù)據(jù)利用能力;通過自動推理檢查功能和多智能體協(xié)作等創(chuàng)新,進(jìn)一步增強AI安全性并推動智能體發(fā)展。
陳曉建總結(jié)道:“更新能力后的Amazon Bedrock 提供的功能不只是提供多種多樣的功能和模型,還能幫客戶在不同的場景下選擇最適合的場景功能,它同時提供了大模型真正用于生產(chǎn)的時候所需要的各種各樣的工具。”
更優(yōu)應(yīng)用方面,Amazon Q更加深入軟件開發(fā)和商業(yè)應(yīng)用場景。Amazon Q Developer增加三款新的智能體,能自動執(zhí)行單元測試、文檔編制和代碼審查流程,并通過與GitLab深度集成,擴展應(yīng)用場景;推出轉(zhuǎn)型功能以加速Windows.NET、VMware和大型機工作負(fù)載的遷移和現(xiàn)代化,縮短轉(zhuǎn)型時間并降低成本。強化了Amazon Q Business和Amazon Q in QuickSight洞察能力,并簡化了復(fù)雜工作流程的自動化實現(xiàn)方式。
至此,對生成式AI應(yīng)用于生產(chǎn)時所需的各類模型、技術(shù)、工具等都已具備。
夯實底層,升級計算、網(wǎng)絡(luò)、存儲和數(shù)據(jù)庫等云服務(wù)
事實上,生成式AI應(yīng)用是天然的“云原生”應(yīng)用。如何讓企業(yè)客戶在使用生成式AI應(yīng)用時更快、更省、更穩(wěn),還有很多云基礎(chǔ)服務(wù)方面的工作可以優(yōu)化和提升。
2024 re:Invent上,亞馬遜云科技在計算、網(wǎng)絡(luò)、存儲和數(shù)據(jù)庫等云計算服務(wù)核心領(lǐng)域也進(jìn)行了創(chuàng)新,為包括生成式AI應(yīng)用在內(nèi)的各類工作負(fù)載提供更強大的底層支持。
在自研芯片領(lǐng)域,基于Amazon Trainium2的EC2 Trn2實例正式可用,較當(dāng)前GPU實例性價比提升30-40%;推出配備64個Trainium2芯片的EC2 Trn2 UltraServers服務(wù)器,提供高達(dá)83.2 Petaflops浮點算力,計算能力是單一實例的四倍。采用3納米工藝的下一代Trainium3芯片預(yù)計將在2025年末上線,預(yù)計將使集群性能提升4倍,并在性能、能效和密度上樹立新標(biāo)桿。
在網(wǎng)絡(luò)基礎(chǔ)設(shè)施領(lǐng)域,推出第二代UltraCluster網(wǎng)絡(luò)架構(gòu),支持超過20,000個GPU協(xié)同工作,帶寬達(dá)10Pb/s,延遲低于10ms,這一突破性升級將模型訓(xùn)練時間縮短至少15%。
在存儲服務(wù)領(lǐng)域,Amazon S3新增Metadata元數(shù)據(jù)功能實現(xiàn)自動獲取和實時更新;推出專為Iceberg表優(yōu)化的S3 Tables存儲類型,將查詢性能提升3倍,事務(wù)處理能力提升10倍。
在數(shù)據(jù)庫服務(wù)領(lǐng)域,推出Amazon Aurora DSQL全新的無服務(wù)器分布式SQL數(shù)據(jù)庫,采用active-active架構(gòu)并具備自動故障恢復(fù)功能,支持應(yīng)用程序在任意端點進(jìn)行讀寫,能實現(xiàn)近乎無限的可擴展性。Amazon DynamoDB global tables增加了多區(qū)域強一致性支持,進(jìn)一步增強了其分布式數(shù)據(jù)庫服務(wù)能力。
陳曉建表示,亞馬遜云科技是全球云計算的開創(chuàng)者和引領(lǐng)者,更是企業(yè)構(gòu)建和應(yīng)用生成式AI的首選,今年re:Invent全球大會的這一系列重磅發(fā)布再次印證了這一點。
沙利文大中華區(qū)總監(jiān)李慶表示:”本屆re:Invent大會上的新發(fā)布更加側(cè)重于產(chǎn)品的實際應(yīng)用和工具優(yōu)化。本次更新有兩個方面讓人印象深刻:一是隨著全球企業(yè)對生成式AI的深入應(yīng)用,數(shù)據(jù)不僅實現(xiàn)跨區(qū)域的傳輸與協(xié)同,更實現(xiàn)跨地域、跨區(qū)域的深度連接;二是亞馬遜云科技進(jìn)一步優(yōu)化生成式AI的應(yīng)用,從數(shù)據(jù)存儲、治理到管理的全流程提升,旨在簡化AI對數(shù)據(jù)的使用,同時強化模型功能、增加AI agent管理和應(yīng)對模型幻覺的功能。此外,新發(fā)布的Amazon Nova大模型家族備受期待,這一系列的模型和亞馬遜云科技的開放選擇理念將為用戶帶來更多創(chuàng)新機會,進(jìn)一步推動AI的發(fā)展?!保ü啵?/p>
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 《全職高手》登陸上海北外灘 成二次元愛好者熱門打卡地
- 新勢力2025年將迎決戰(zhàn)?銷量翻番才能活下去?
- 馬蜂窩大數(shù)據(jù):“元旦一日游”熱度上漲166%,不少人選擇“請四休九”
- 亞馬遜云科技陳曉建:2025年很多客戶將從生成式AI原型驗證轉(zhuǎn)為生產(chǎn)應(yīng)用
- 林肯中國回應(yīng)“并入福特中國”傳聞:簡化財務(wù)體系 各項業(yè)務(wù)保持不變
- 要做中國的OpenAI?字節(jié)跳動2024年研發(fā)開支接近BAT之和
- 螞蟻旗下跨境匯款平臺為開發(fā)者提供收款服務(wù) 每日限額10萬美元
- 要買車還能再等等!2025年新能源車,這些關(guān)鍵技術(shù)將有重大升級
- AAAA,三七互娛發(fā)起的游心公益基金會社會組織評估等級再提升
- 網(wǎng)易云音樂2024年度聽歌報告刷屏 你最喜歡的歌手是誰?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。