亞馬遜云科技CEO:用全棧技術加速推動Generative AI普及

今年,Generative AI(生成式AI)席卷全球,各種熱點層出不窮,讓全球感受到生成式AI的熱度。

臨近年底,一年一度的云計算盛會--亞馬遜云科技 re:Invent大會上,從各種產品的發(fā)布,到重磅級的合作,再到激烈的討論,生成式AI理所當然的成為主角。只不過,亞馬遜云科技對于生成式AI的視角更加令人值得期待。

在現場,亞馬遜云科技CEO Adam Selipsky面向五萬現場觀眾全面展示了亞馬遜云科技生成式AI三層技術棧:底層基礎設施層、中間AI大模型服務以及上層應用,旨在幫助用戶提供加速模型訓練和推理的先進基礎設施、用于構建大型語言模型的完善工具以及提供利用人工智能的豐富應用,不斷降低生成式AI的門檻,從而真正推動生成式AI在企業(yè)中的落地。

讓模型訓練與推理更加高效

生成式AI的興起,伴隨的是動輒幾千上萬GPU芯片組成的集群、處理龐大規(guī)模的數據量以及高效的數據傳輸網絡等,讓人們意識到基礎設施的重要性。

毫無疑問,云是生成式AI首選的基礎設施理想之地。從今年 re:Invent大會來看,亞馬遜云科技正在構建最為先進且可以充分給予用戶選擇權的基礎設施。

在大會上,亞馬遜云科技CEO Adam Selipsky表示,生成式AI正在重塑基礎設施,并與英偉達創(chuàng)始人黃仁勛共同討論了生成式AI的發(fā)展趨勢,同時宣布亞馬遜云科技是全球第一家在云端配備具有多節(jié)點NVLink技術的NVIDIA GH200 Grace Hopper Superchips的云服務商。

另外,英偉達DGX Cloud也將登陸亞馬遜云科技。黃仁勛介紹道,DGX Cloud是Nvidia的人工智能工廠。此前,DGX Cloud已經與微軟Azure、谷歌OCP、Oracle等云廠商達成DGX Cloud的托管云服務合作。對于與亞馬遜云科技的DGX Cloud合作,黃仁勛表示非常期待。

據悉,DGX Cloud將部署在亞馬遜云科技的UltraCluster集群中,利用,Nitro System先進虛擬化與安全平臺、Elastic Fabric Adapter(EFA)互連技術和UltraCluster(超大規(guī)模集群)擴展能力,為訓練基礎模型和構建生成式AI應用提供先進的大模型訓練與推理服務。

除了與英偉達合作之外,亞馬遜云科技還宣布了推出第二代推理芯片Trainium2,專為以高性能訓練具有數萬億個參數或變量的基礎模型和大語言模型而構建。相比于上一代芯片,Trainium2訓練速度提升多達4倍、內存提升3倍、能效比提升2倍,并能在EC2 UltraClusters中部署多達100000個芯片,可以在極短的時間訓練基礎模型(FMs)和大語言模型(LLMs),同時能效提升多達2倍。

據悉,Databricks、Helixon、Money Forward以及 Amazon Search團隊等眾多客戶都在使用Trainium訓練大規(guī)模深度學習模型,隨著Trainium2芯片,以更低成本和更佳能效來更快地訓練機器學習模型成為可能。Trainium2在新一代EC2 UltraClusters中可擴展多達100,000個Trainium2加速芯片,并與Amazon Elastic Fabric Adapter(EFA)PB級網絡互聯,提供的算力高達65 exaflops,客戶可按需獲得超級計算級別的性能。

此外,亞馬遜云科技還發(fā)布了Graviton4自研通用芯片,性能提升高達30%,獨立核心增加50%以上,內存帶寬提升75%以上,為在Amazon EC2上運行的工作負載提供更優(yōu)的性能和能效。

從本次大會的發(fā)布來看,亞馬遜云科技的確是站在用戶視角去考慮基礎設施在生成式AI時代的發(fā)展。首先,尊重用戶的選擇性,構建起多種基礎設施服務,以滿足用戶對于基礎設施的不同需求;其次,充分利用在基礎設施集群、網絡、虛擬化等方面的深厚積累,以云服務的方式來降低生成式AI的復雜性,來保證大模型的高效輸出。

讓生成式AI應用構建更容易

如果說強大的基礎設施在幫助用戶們完成模型的訓練、推理等基礎工作,那么生成式AI應用的構建則離不開強大的工具。對于絕大部分企業(yè)而言,面對市場中如此多的模型如何選,如何利用快速、高效的工具來基于大模型開發(fā)應用,這是當前普遍遇到的需求痛點。

亞馬遜云科技CEO Adam Selipsky在大會上也強調,生成式AI還處于早期發(fā)展階段,存在著非常多的變化,不存在一個模型就適應所有場景,而是不同模型通常會在不同的適用場景中表現更好,模型對于場景的適應能力很重要。

因此,亞馬遜云科技在今年帶來了Amazon Bedrock服務。在本次大會上,Amazon Bedrock進行了更新:模型的微調(Fine-tuning)、檢索增強生成(RAG)以及基于Amazon Titan大模型的持續(xù)預訓練,為用戶帶來持續(xù)更多的模型選擇,包括新推出的Anthropic Claude 2.1和Meta Llama 2 70B以及最近推出的Stability AI Stable Diffusion XL 1.0、Meta Llama 2 Chat 13B、Cohere Command Light、Cohere Embed English和Cohere Embed等語言模型。

這其中,亞馬遜云科技是首個集成 Meta Llama 2 模型的云廠商。另外,與Anthropic的合作也值得關注。作為對比OpenAI的公司,Anthropic今年在市場收獲多筆融資,亞馬遜投資40億美元給Anthropic,雙方合作明顯提速,Anthropic利用亞馬遜云科技的專用機器學習芯片Trainium來訓練他們的下一代復雜Claude模型,Amazon Bedrock的客戶將享有獨家早期使用權,體驗其他地方都無法使用的先進Claude定制和微調模型功能。

據悉,Amazon Bedrock服務自推出以來,已經擁有超過一萬名顧客在使用,包括阿迪達斯、納斯達克等企業(yè)。亞馬遜云科技大中華區(qū)戰(zhàn)略生態(tài)部總經理顧凡直言,Amazon Bedrock更新的諸多功能都是源自于客戶需求的迭代,核心能夠幫助用戶三點:一、增加模型評估,告訴客戶哪個模型適合自身業(yè)務;二、保障大模型的高效輸出;三、降低模型幻覺帶來的影響。

從中間層Amazon Bedrock今年迅猛的發(fā)展態(tài)勢來看,亞馬遜云科技的確是切中了當前市場用戶們的需求痛點,Amazon Bedrock對于大模型應用構建門檻的大幅降低,有利于生成式AI應用的快速落地。

Amazon Q:不可小覷的生成式AI助手

對于企業(yè)而言,生成式AI并不是寫詩作畫,而且渴望通過生成式AI來實現效率提升和成本降低。

今年以來,OpenAI ChatGPT、谷歌Bard智能聊天機器人等,生成式AI助手的賽道競爭十分激烈。不過,亞馬遜云科技聚焦依然是企業(yè)級領域。如何服務好亞馬遜云科技平臺上數以百萬計的企業(yè)用戶群體,是亞馬遜云科技切入生成式AI助手賽道的核心目標。

為此,亞馬遜云科技推出了Amazon Q。Amazon Q由亞馬遜云科技17年來積累的知識和經驗訓練而成,它能幫助用戶快速上手亞馬遜云科技的新服務、功能,輕松學習不熟悉的技術、構建解決方案、發(fā)現問題、升級應用程序等,真正改變了開發(fā)者和IT人員在亞馬遜云科技上構建、部署和運維應用程序和工作負載的方式。

例如,亞馬遜云科技CEO Adam Selipsky在大會上介紹了,亞馬遜云科技內部團隊使用Amazon Q將上千款應用程序從Java8升級到了Java17,甚至還完成了對應的測試,大幅提升了工作效率。

亞馬遜云科技大中華區(qū)戰(zhàn)略發(fā)展部總經理顧凡直言,亞馬遜云科技平臺上的智能助手一定不能是一個通用型的助手,而且需要圍繞企業(yè)業(yè)務場景來回答問題,AmazonQ就是一個最懂亞馬遜云科技的智能助手,滿足在亞馬遜云科技平臺上各類人群的使用需求。

以BI可視化分析為例,Amazon QuickSight內置Amazon Q之后,業(yè)務分析師只需簡單告知Amazon Q即可創(chuàng)建儀表板和報告。此外,亞馬遜呼叫中心服務Amazon Connect也接入Amazon Q,現在Amazon Connect通過機器學習、轉錄和分析使這變得更加容易,可以直接充當使用者的客服代表,,解決下游用戶提出的問題。

總體來看,亞馬遜云科技在本次re:Invent大會上圍繞生成式AI進行了組合拳式的發(fā)布,涵蓋了從底層基礎設施到中間工具層,再到上層應用,覆蓋面和深度前所未有。自從生成式AI火爆以來,產業(yè)界都在關注生成式AI如何從消費端進入到企業(yè)級領域,幫助廣大企業(yè)用戶充分利用人工智能技術。毫無疑問,亞馬遜云科技為生成式AI的普及做出了極好的示范。

免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。

極客網企業(yè)會員

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2023-12-01
亞馬遜云科技CEO:用全棧技術加速推動Generative AI普及
亞馬遜云科技CEO:用全棧技術加速推動GenerativeAI普及

長按掃碼 閱讀全文