生成式AI浪潮,亞馬遜云科技下場會來帶哪些改變?

去年底,ChatGPT橫空出世,不僅吸引了全球各界的眼光,更是讓生成式AI的熱浪來襲。隨后,Google、百度、阿里巴巴、360等紛紛下場,發(fā)布各自大模型產(chǎn)品,使得整個市場熱度有增無減。

如今,亞馬遜云科技也正式下場。作為云計算領域的頭牌廠商,亞馬遜云科技此次帶來了Amazon Bedrock生成式AI托管服務、Amazon Titan大語言模型、Amazon EC2 Trn1n、Amazon EC2 Inf2以及Amazon CodeWhisperer全家桶式的組合式服務。

眾所周知,越來越多企業(yè)意識到生成式AI所帶來顛覆性的變化,也渴望能夠利用生成式AI、大模型等強大的能力來改變自身。但強大的生成式AI后面是基礎設施、大模型和模型應用等一系列復雜的組合,絕非簡單搭建即可實現(xiàn)。

亞馬遜云科技全家桶式的生成式AI組合無疑瞄準了當下生成式AI應用的痛點,通過一系列產(chǎn)品與服務來降低了生成式AI應用的門檻和成本,助力普惠AI的加速實現(xiàn)。亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建直言:“亞馬遜云科技希望將生成式AI技術從研究和實驗領域釋放出來,不僅僅是大型科技公司的專屬,而是讓更多公司能夠從中受益?!?/p>

生成式AI的基石:云計算

什么是生成式AI的基石?

毫無疑問是云計算。本質(zhì)上,生成式AI涉及到前端應用、模型庫、大模型以及基礎設施。像ChatGPT這種生成式AI應用,背后起到支撐作用的正是強大的基礎設施。例如,公開信息顯示,OpenAI在訓練GPT-3大模型時用到了數(shù)十萬個CPU、上萬個GPU等大量基礎設施資源。

因為需要消耗大量的算力和數(shù)據(jù)資源,所以生成式AI應用所面臨的門檻極高。以基礎設施層為例,訓練大模型涉及到采取何種并行策略、如何進行高效數(shù)據(jù)存儲、如何選擇合適的數(shù)據(jù)精度以及如何實現(xiàn)動態(tài)負載均衡等等一系列問題。

因此,云計算平臺無疑是生成式AI最為理想的基礎平臺。像亞馬遜云科技這樣的大型云服務商,本身就擁有強大的基礎設施能力,能夠滿足生成式AI對于算力的強大需求,并且在并行計算、數(shù)據(jù)高效存儲甚至運維等方面均有著豐富的經(jīng)驗,通過屏蔽底層基礎設施的復雜性,為用戶帶來性價比更加出色的基礎設施服務。

以訓練為例,眾所周知,大模型訓練往往需要耗費大量的GPU,但GPU實際效果遠非人們想象中那么理想。為此,亞馬遜云科技針對生成式AI推出了兩款優(yōu)化的計算實例Amazon EC2 Trn1n 實例和Amazon EC2 Inf2 。訓練實例Amazonn EC2 Trn1 由其自研芯片Trainium支持,可節(jié)省高達50%的訓練成本。推理實例Amazon Inf2 基于其自研芯片Inferentia2 ,據(jù)稱吞吐量提高了4倍,延遲降低了10倍。

陳曉建介紹:“Trn1n是一個網(wǎng)絡增強型的新實例,網(wǎng)絡帶寬提升到1.6TB,旨在為大型網(wǎng)絡密集型的模型訓練來使用。Inf2則把云中推理成本降到了最低?!?/p>

除了基礎設施之外,生成式AI要想真正用起來,也離不開模型層的服務,而亞馬遜云科技有針對性的推出了Amazon BedRock,為大模型的應用打開了全新的思路。

Amazon Bedrock,降低大模型門檻

在近年來的人工智能發(fā)展中,經(jīng)歷了“大練模型”到“練大模型”的過程。OpenAI GPT模型的發(fā)展歷程也是如此,直到基于GPT-3.5的ChatGPT橫空出世,極大打破了人們對于AI的認知,原來生成式AI在大模型參數(shù)足夠多、訓練數(shù)據(jù)足夠出色的情況下,其“涌現(xiàn)”能力往往讓人驚奇。

正因為如此,很多行業(yè)用戶都在密切關注大模型的訓練。例如,彭博已經(jīng)在金融領域率先嘗鮮,推出了擁有500億參數(shù)的BloombergGPT,希望在日常業(yè)務中融入大模型的能力。

但要想真正把大模型用起來絕非易事,哪怕是一些行業(yè)龍頭面對大模型的構建時也會束手無策。亞馬遜云科技的思路是通過Amazon Bedrock,來降低大模型訓練的門檻,推動生成式AI的普惠。

據(jù)悉,Amazon Bedrock是完全托管式的云服務,通過API提供無服務器的托管體驗,客戶無需擔心實例類型、網(wǎng)絡拓撲和端點等基礎設施細節(jié),用戶可以通過API的方式來訪問亞馬遜云科技Titan大模型,以及AI21Labs、Anthropic和Stability AI等AI初創(chuàng)公司的預訓練基礎模型,可以為用戶提供多種模型的選擇。

“客戶只要在Amazon S3中提供少量(低至20個)帶標簽的示例,就可以輕松定制Amazon Bedrock的基礎模型,用于其特定用例。此外,客戶還能通過Amazon Bedrock獨家訪問亞馬遜云科技開發(fā)的最先進基礎模型?!标悤越ㄍ嘎兜?。

Amazon Titan大模型是基于亞馬遜云科技20多年機器學習經(jīng)驗訓練出來的,包括Titan Text和Titan Embeddings。Titan Text是基于總結文本生成、分類、開放式回答和信息提取等任務的生成式大語言模型。Titan Embeddings是一個文本嵌入式的大語言模型,能夠把文本的輸入翻譯成包含語義的數(shù)字表達。

此外,亞馬遜云科技還強調(diào)了數(shù)據(jù)隱私和數(shù)據(jù)安全的重要性。用戶在Amazon Bedrock平臺訓練時,所有的數(shù)據(jù)都經(jīng)過加密的,并且不會離開虛擬專用云(VPC)而且亞馬遜云科技不會那用戶數(shù)據(jù)再訓練Titan大模型。

當前,埃森哲、德勤、Infosys 和Slalom 等客戶已經(jīng)在使用亞馬遜云科技Amazon Bedrock服務。陳曉建介紹:“亞馬遜云科技希望形成一個開放性、多元的底層模型環(huán)境?!?/p>

全家桶式服務:普惠AI指日可待

亞馬遜云科技還針對開發(fā)者們發(fā)布了AI編碼助手Amazon CodeWhisperer,面向所有個人用戶免費開放,不設任何資質(zhì)或使用時長的限制!

眾所周知,生成式 AI 可以通過“編寫”大量無差異代碼來消除繁重、重復的編碼工作,有利于開發(fā)人員進行其他創(chuàng)新。以Amazon CodeWhisperer為例,其幫助開發(fā)者基于注釋生成代碼,追蹤開源參考,掃描查找漏洞。

此外,Amazon CodeWhisperer還可以幫助開發(fā)者創(chuàng)建代碼勝任如下場景,比如常規(guī)、耗時的無差別任務,或是在使用不熟悉的API或SDK時構建示例代碼,亦或要正確高效地使用亞馬遜云科技API操作,還有其他場景比如編寫讀寫文件、處理圖像、編寫單元測試等代碼。Amazon CodeWhisperer還能利用亞馬遜云科技在安全方面的積累來掃描各種安全問題,自動掃描代碼中的安全漏洞并幫用戶修復。

據(jù)悉,Amazon CodeWhisperer可以支持15 種編程語言,包括Python、Java 和 C++等,以及開發(fā)者最喜歡的集成開發(fā)環(huán)境 (IDE),包括 VS Code、IntelliJ IDEA 和 AWS Cloud9等。

亞馬遜云科技大中華區(qū)數(shù)據(jù)技術專家團隊總監(jiān)王曉野介紹:“Amazon CodeWhisperer更像是一款插件,可以直接安裝在開發(fā)者現(xiàn)有開發(fā)環(huán)境中,開發(fā)者可以通過注釋的方式與Amazon CodeWhisperer交互。它類似開發(fā)者的智能助手,最主要的優(yōu)勢在于提高生產(chǎn)力。例如,使用Amazon CodeWhisperer之后,開發(fā)者無需切換到其他頁面去查找文檔。”

毫無疑問,生成式AI和大語言模型是革命性的,將深刻影響到每一個行和和每一個人。有研究顯示,到2027年,全球生成式AI市場預計將增長7倍,將超過1000億美元,將廣泛應用到智能客服、內(nèi)容優(yōu)化與推廣、智能輔助內(nèi)容生產(chǎn)、對話系統(tǒng)、自動化產(chǎn)品設計等場景領域。普惠AI,讓AI民主化是整個社會的大勢所趨,而亞馬遜云科技生成式AI全家桶式的服務組合,無疑率先在市場中降低了生成式AI的門檻,打開了普惠AI的局面。

免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2023-04-25
生成式AI浪潮,亞馬遜云科技下場會來帶哪些改變?
去年底,ChatGPT橫空出世,不僅吸引了全球各界的眼光,更是讓生成式AI的熱浪來襲。隨后,Google、百度、阿里巴巴、360等紛紛下場,發(fā)布各自...

長按掃碼 閱讀全文