123,123,123

科技云報道原創(chuàng)。

世界是復(fù)雜的，沒有人知道未來會怎樣，但如果單純從技術(shù)的角度，我們總是能夠沿著技術(shù)發(fā)展的路徑，找到一些主導未來趨勢的脈絡(luò)。

從Sora到Suno，從OpenAI到Copilot、Blackwell，這些熱詞在大眾眼里或許還分不清楚，但很多人已經(jīng)用上各種“ChatGPT”，或聊天或創(chuàng)作。不知不覺間，我們已經(jīng)卷入新一輪AI浪潮中。

這輪人工智能浪潮，自ChatGPT這類生成式AI工具問世，被迅速引爆。AI大模型從研究走向應(yīng)用，復(fù)用成本大幅降低，各種應(yīng)用得以更快滲透進各行各業(yè)。

IDC發(fā)布報告稱，2027年全球人工智能IT總投資規(guī)模有望從2022年的1324.9億美元增至2027年的5124.2億美元，年復(fù)合增長率（CAGR）為31.1%。

聚焦生成式AI，IDC預(yù)測，全球生成式AI市場年復(fù)合增長率將達85.7%，到2027年全球生成式AI市場規(guī)模將接近1500億美元。

英偉達CEO黃仁勛表示，生成式AI已經(jīng)開啟了全新的投資周期，已經(jīng)進入了“十年周期”（技術(shù)從出現(xiàn)、傳播到大規(guī)模應(yīng)用所需的時間）的第一年。

當生成式AI從一個“奇點”到迎來“大爆炸”時刻，其將在現(xiàn)實世界發(fā)生哪些改變？又將激發(fā)怎樣的潛力？

生成式AI迎來“三個轉(zhuǎn)變”

生成式AI技術(shù)可分為四個層次，即面向消費者應(yīng)用；大語言模型（LLM）等基礎(chǔ)技術(shù)；支持服務(wù)的云基礎(chǔ)設(shè)施；以及對于開發(fā)和運營至關(guān)重要的半導體。

從技術(shù)發(fā)展看，今年生成式AI將從純理論探討階段，全面進入到業(yè)務(wù)應(yīng)用階段。過去一年，大部分企業(yè)和機構(gòu)并沒有真正打造出生成式AI系統(tǒng)；而今年，生成式AI系統(tǒng)將全面進入到生產(chǎn)當中，企業(yè)將真正地開始使用生成式AI工具。

對于生成式AI本身，即將迎來三個方面的轉(zhuǎn)變。

首先，要把生成式AI投入到企業(yè)以及業(yè)務(wù)用例的過程中，就要從構(gòu)建訓練基礎(chǔ)架構(gòu)轉(zhuǎn)向構(gòu)建推理基礎(chǔ)架構(gòu)。

到目前為止，大部分企業(yè)往往是通過對開源基礎(chǔ)模型進行調(diào)優(yōu)、優(yōu)化或者是互聯(lián)，來實現(xiàn)自己的某些功能和需求。

對于各個企業(yè)、各個垂直行業(yè)領(lǐng)域的企業(yè)來說，無論是GenAI還是GPT4，大語言模型的訓練成本是高昂的。特別是對于垂直行業(yè)的企業(yè)用戶，不會在業(yè)務(wù)推進過程中直接采用這些模型。

如果未來需要將AI能力賦予企業(yè)的業(yè)務(wù)，那么企業(yè)就需要進一步開發(fā)已有的模型，從而讓這些模型在部署到垂直行業(yè)的生產(chǎn)中時，可以真正地轉(zhuǎn)化為生產(chǎn)力。

而這種轉(zhuǎn)變也對企業(yè)提出了更加明確的要求：如何更好地設(shè)計出這種推理基礎(chǔ)架構(gòu)？該把它們放在哪里？如何確保其安全？

其次，是企業(yè)的關(guān)注點將越來越多地將從寬泛的實驗轉(zhuǎn)向自上而下的戰(zhàn)略推進，即挑選出少數(shù)幾個真正具有變革意義的生成式AI應(yīng)用項目。

去年，很多企業(yè)都在考慮采用生成式AI技術(shù)。但如今，企業(yè)已經(jīng)認識到，要應(yīng)用生成式AI技術(shù)，每個項目都非常龐大，需要占用大量人力、物力、財力，才能構(gòu)建和實施一個能夠投入生產(chǎn)的生成式AI系統(tǒng)。

到了今年，一方面，生成式AI領(lǐng)域?qū)谐砂偕锨酥辽先f的潛在用例，但另一方面，由于每一個企業(yè)的資源有限，因此只能選擇其中幾個重點實施。

對于企業(yè)的CIO和領(lǐng)導者，必然會面臨一個問題：就是從幾百個AI項目中，優(yōu)先選擇幾個進行實施。這其中的風險在于：一旦選對了，這些項目將對業(yè)務(wù)產(chǎn)生正向影響；而萬一選錯，可能就會造成大量的資源浪費。

要想做出一個正確的選擇，各個企業(yè)必須要充分理解GenAI價值，以及生成式AI最有可能從哪些方面能夠為企業(yè)提升生產(chǎn)力而賦能。

第三，是用戶對于AI投入的成本考量，從對“訓練成本”的計算轉(zhuǎn)向?qū)Α斑\營成本”的衡量。

在理論研究和訓練階段，生成式AI的成本取決于構(gòu)建模型的復(fù)雜程度，以及架構(gòu)開發(fā)和維護人員的規(guī)模，除此之外再無其他成本可言。

但當企業(yè)用戶開始實施部署和應(yīng)用生成式AI工具時，現(xiàn)實的運營成本就會成為企業(yè)用戶面臨的最大經(jīng)濟考量。

以戴爾科技為例，其最初開始建立自己的生成式AI系統(tǒng)時，基本上會在三個月的時間里用到20臺服務(wù)器，此刻其整體運營成本是未知的。

但當這套系統(tǒng)開始被戴爾科技內(nèi)部的工程師應(yīng)用時，6000名工程師每個月就需要大約5000萬次處理量，因此該系統(tǒng)最大的成本不是建立一個模型的成本，而是基于大規(guī)模處理而產(chǎn)生的巨額運營成本。

這對企業(yè)用戶而言，從訓練成本到運營成本的考慮，將是未來必將面對的一個相當現(xiàn)實的問題。

從本質(zhì)上說，生成式AI的轉(zhuǎn)變其實是技術(shù)從研發(fā)到應(yīng)用的商用化過程中必然要經(jīng)歷的過程。

只是由于AI自身業(yè)務(wù)形態(tài)的改變，也將帶來更多行業(yè)的改變，其中的一個影響就是會帶動一批相關(guān)技術(shù)和應(yīng)用，成為未來的熱點和趨勢。

如何激發(fā)生成式AI更大潛力

僅僅一年，隨著各大資本和巨頭入場，AI從底層大模型，到基礎(chǔ)設(shè)施，到機器學習操作（MLOps），再到消費端應(yīng)用，生成式AI的生態(tài)已經(jīng)初步建立。

隨著今年生成式AI的進一步訓練和穩(wěn)定，行業(yè)發(fā)展將加速向下游移動，生成式AI將進一步改變?nèi)藗兊纳睿酥粮淖冋麄€世界，其為企業(yè)提供了無限的想象空間，使產(chǎn)品和服務(wù)的研發(fā)過程更加高效、有趣。

面對生成式AI市場的巨大潛力，亞馬遜、谷歌、微軟、Meta等科技巨頭不甘示弱。去年12月，谷歌多模態(tài)大模型Gemini發(fā)布，包含三個版本：Nano、Pro和Ultra。

Pro對標GPT-3.5，Ultra對標GPT-4，可以處理文本之外的信息，包括圖像、視頻和音頻。同時，谷歌上線文生圖模型Imagen 2、視頻生成模型VideoPoet，推出醫(yī)療人工智能大模型MedLM，將大模型與醫(yī)療保健行業(yè)緊密結(jié)合。

去年11月，微軟將集成了GPT的Bing Chat更名為Copilot，可以免費使用GPT-4、DALL·E 3功能，并且擁有了獨立網(wǎng)站，Copilot將嵌入所有微軟旗下應(yīng)用中。微軟還推出Copilot Studio，使用者可以自定義GPT、創(chuàng)建新插件、自定義工作流。

Meta則接連發(fā)布了650億參數(shù)的開源大模型 LLaMA和700億參數(shù)的LLaMA2。近日，Meta推出全新開源大模型Code Llama 70B，其準確率達到了53%，超過了GPT-3.5的48.1%，是目前評分最高的開源大模型。

2023年以來，看似默默無聞的亞馬遜頻頻出擊。去年9月，亞馬遜宣布將向人工智能初創(chuàng)公司Anthropic投資40億美元，近日，其再次宣布追加投資27.5億美元，完成了對Anthropic40億美元的投資，決心可見一斑。

更為重要的是，亞馬遜云科技提出了基于生成式AI的三層技術(shù)棧。

第一層是高性能基礎(chǔ)設(shè)施，過去五年，亞馬遜云科技持續(xù)加大在自研芯片方面的投入，比如Amazon Trainium和Amazon Inferentia芯片，可以提供在云上訓練模型和運行推理的最低成本。

除此之外，在GPU方面，NVIDIA多款先進算力均率先在亞馬遜云科技落地。

第二層是最廣泛的基礎(chǔ)模型選擇。亞馬遜云科技認為“沒有一個模型可以適用于所有業(yè)務(wù)場景”，因此推出Amazon Bedrock，企業(yè)可以靈活選擇適合自己的模型，更容易地構(gòu)建應(yīng)用，并在保證數(shù)據(jù)安全和隱私基礎(chǔ)上，進行定制化模型的開發(fā)，還無需大量的標注數(shù)據(jù)。

Amazon Bedrock提供各種領(lǐng)先的基礎(chǔ)模型供客戶選擇：既有知名的開源模型，如Stable Diffusion XL、Llama、Mistral 7B和Mixtral 8*7B，也有如Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan等非開源模型。

基于Amazon Bedrock云托管服務(wù)，企業(yè)可以通過API訪問從文本到圖像的一系列強大的基礎(chǔ)模型。

值得一提的是，亞馬遜和Anthropic在生成式AI領(lǐng)域有著廣泛的合作，Anthropic在Amazon Bedrock上提供的Claude 3系列模型是全球最領(lǐng)先的大模型之一，共包含三個模型：Haiku、Sonnet、Opus，從模型尺寸來看，可以理解為模型的中杯、大杯、超大杯。

客戶可以根據(jù)自己的商業(yè)需求，從中選擇最合適的智能、速度和價格組合。

· Haiku：是響應(yīng)速度最快的模型，也是成本最低的選項，在大多數(shù)純文本任務(wù)上的表現(xiàn)仍然相當出色，也同時包含多模態(tài)能力（比如視覺）。

· Sonnet：適用于需要平衡性能和成本的場景，它在純文本任務(wù)上的表現(xiàn)與后面的Opus相當，但在成本上更為經(jīng)濟，適合于那些需要性能稍微好點，但預(yù)算有限的企業(yè)和個人用戶。

· Opus：具有強大的推理、數(shù)學和編碼能力，接近人類的理解能力，適用于需要高度智能和復(fù)雜任務(wù)處理的場景，如企業(yè)自動化、復(fù)雜金融預(yù)測、研究和開發(fā)等。

對于Claude 3，更有行業(yè)人士認為其終結(jié)了GPT-4時代。Claude 3有兩大亮點，一個是長文本，二是多模態(tài)能力。

長文本是Claude 3的一個顯著優(yōu)勢，體現(xiàn)為在讀論文、小說等字數(shù)更多的文本時，Claude 3更擅長理解和回答用戶的相關(guān)問題。

此次Claude 3大大提升了上下文對話窗口，達到200k，可以理解為單次和模型對話能夠輸入的文本。

具體而言，Claude 3 200k的對話長度，相當于能夠單次處理超過15萬英文單詞，而GPT-4 Turbo的上下文窗口為128k，大約是9.6萬個英文單詞。同時，Claude 3也第一次允許圖像和文檔上傳。

和ChatGPT一樣，Claude 3能夠“認”出來圖里的是什么東西，直接描述，回答用戶的問題。更令人印象深刻的是，Claude 3在分析一些復(fù)雜問題時，已經(jīng)能夠和人一樣，先拆解問題，并且交由子模型來進行調(diào)度。

第三層就是應(yīng)用生成式AI技術(shù)的開箱即用的云服務(wù)，進一步降低使用門檻。目前已經(jīng)推出Amazon Q這一AI助手，可以根據(jù)客戶業(yè)務(wù)進行定制，專用于辦公場景需要。

還與像Amazon QuickSight，包括智能客服的產(chǎn)品Amazon Connect，面向編程開發(fā)人員的平臺Amazon CodeWhisperer，都實現(xiàn)了非常有效的結(jié)合。

可以看到，從底層基礎(chǔ)設(shè)施到上層應(yīng)用拓展，今年亞馬遜云科技在生成式AI領(lǐng)域不斷發(fā)力。不同的客戶可以根據(jù)需求選擇不同層級的產(chǎn)品，通過這三層來支持他們的業(yè)務(wù)創(chuàng)新。

此外，對于如何幫助企業(yè)快速具備生成式AI能力，亞馬遜云科技擁有豐富的專業(yè)技術(shù)支持資源，包括SA、產(chǎn)品專家、人工智能實驗室、數(shù)據(jù)實驗室、快速原型團隊、專業(yè)服務(wù)團隊，幫客戶打通應(yīng)用生成式AI的“最后三公里”工程化挑戰(zhàn)。

對于作為扮演“底層架構(gòu)師”角色的亞馬遜云科技而言，大模型固然重要，但關(guān)鍵技術(shù)能力的集合才是提升企業(yè)生產(chǎn)力的根本動力。

亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建表示，“盡管大模型非常重要，但僅靠大模型對企業(yè)的生產(chǎn)是遠遠不夠的。從模型能力到真正的運營生產(chǎn)之間，企業(yè)還需要增加很多輔助能力。企業(yè)需要一系列周邊的能力來正確、合理、安全、高效地使用大模型，這就是亞馬遜云科技一系列產(chǎn)品所提供的價值所在?！?/p>

生成式AI領(lǐng)域接下來發(fā)展的最關(guān)鍵一步是什么？陳曉建表示，首先，從最底層來看，芯片性能仍然落后于需求。雖然半導體芯片的發(fā)展已經(jīng)非?？?，但模型本身參數(shù)規(guī)模的擴大實際上遠超芯片的能力。

“以前一個幾百萬參數(shù)的模型，就覺得已經(jīng)很大了，但現(xiàn)在動輒達到數(shù)百億的規(guī)模。基礎(chǔ)服務(wù)商仍需關(guān)注如何將底層能力、業(yè)務(wù)復(fù)雜度和大模型復(fù)雜度相匹配，使硬件發(fā)展趕上軟件發(fā)展規(guī)模。”

其次，他認為大模型能力本身還有很多發(fā)展空間，今天看到的模型可能代表了一個博士生水平，但是能不能做得更好？比如達到教授或者院士水平？

包括亞馬遜云科技在內(nèi)的諸多生成式AI供應(yīng)商需要在未來持之以恒地去做模型能力方面的工作。

在最上層與各行各業(yè)務(wù)相結(jié)合方面，陳曉建表示，相關(guān)的SaaS解決方案非常多。

從這點上看，將生成式AI能力與垂直場景的解決方案結(jié)合需要做巨大的工作?！拔覀冃枰伎即竽Ｐ腿绾螢槿祟惿鐣餍懈鳂I(yè)中的應(yīng)用提供更好的模型能力、更易用的方式和更低的成本?！?/p>

無論如何，人們對未來的期許總是充滿希望。對于科技未來的走向，以AI為代表的技術(shù)進化，正在成為一場考驗人類想象力的比賽。

科技企業(yè)能做的，就是通過技術(shù)普惠，降低AI參與門檻，先把大模型打造成像電、水一樣隨取隨用的公共資源，再將生成式AI技術(shù)應(yīng)用于各行各業(yè)，變成真正能夠推動人類發(fā)展的生產(chǎn)力。

【關(guān)于科技云報道】

專注于原創(chuàng)的企業(yè)級內(nèi)容行家——科技云報道。成立于2015年，是前沿企業(yè)級IT領(lǐng)域Top10媒體。獲工信部權(quán)威認可，可信云、全球云計算大會官方指定傳播媒體之一。深入原創(chuàng)報道云計算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領(lǐng)域。

免責聲明：此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章，所有文字和圖片版權(quán)歸作者所有，且僅代表作者個人觀點，與極客網(wǎng)無關(guān)。文章僅供讀者參考，并請自行核實相關(guān)內(nèi)容。投訴郵箱：editor@fromgeek.com。

免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

從“奇點”到“大爆炸”，生成式AI開啟“十年周期”

下一篇

從“奇點”到“大爆炸”，生成式AI開啟“十年周期”

下一篇

從“奇點”到“大爆炸”，生成式AI開啟“十年周期”