2月7日消息,新年伊始,AI領(lǐng)域又迎來了一位耀眼的新星——DeepSeek。這位初出茅廬卻勢不可擋的選手,以驚人的速度席卷全球,超越ChatGPT成為全球增速最快的AI應(yīng)用,也吸引了越來越多的企業(yè)使用DeepSeek系列模型。
事實上,類似的劇情在過去一年中已屢見不鮮,從GPT4到Claude 3.5再到o1……雖然這次的主角是DeepSeek,但AI領(lǐng)域還處于“模型爭霸”時代的本質(zhì)依然沒變。
每當一個更強模型出現(xiàn)時,對普通用戶而言,要使用最新AI很簡單,下載對應(yīng)的APP(比如這次是DeepSeek APP)直接用起來就行了。但是,對依賴大模型構(gòu)建的企業(yè)級AI應(yīng)用來說,要想每次都能快速、無縫使用上最新大模型的能力,就沒這么簡單了,需要解決一系列部署和使用模型中的工程化問題。
站在企業(yè)視角,“模型爭霸”時代可謂是“鐵打的應(yīng)用,流水的模型”。那么,自身鐵打的應(yīng)用,該如何每次都能無縫搭乘上流水般涌現(xiàn)的新模型的東風,無疑是企業(yè)最關(guān)心的事。
“不會有一個模型一統(tǒng)天下”,亞馬遜CEO Andy Jassy在2024 re:Invent上分享了亞馬遜自身部署人工智能的關(guān)鍵洞察時就強調(diào)過。
在此洞察下,亞馬遜云科技對幫助客戶構(gòu)建企業(yè)級AI應(yīng)用早已有了一套成熟的思維方式和工具箱。比如,在第一時間,亞馬遜云科技就已為企業(yè)提供了4種方式來部署DeepSeek-R1系列模型。
這里一起看看亞馬遜云科技構(gòu)建企業(yè)級AI應(yīng)用的思維和工具。
認識到模型多樣性的重要
如同Andy Jassy在此前的演講中所述:“就像數(shù)據(jù)庫領(lǐng)域,探討了10年,大家會使用各種各樣的關(guān)系型數(shù)據(jù)庫或者非關(guān)系型數(shù)據(jù)庫。在分析領(lǐng)域也是如此,曾經(jīng)大家覺得TensorFlow會成為唯一的AI框架,而一直強調(diào)會有很多不同框架出現(xiàn),最終PyTorch成為了最受歡迎的那個?!逼髽I(yè)在基于大模型構(gòu)建應(yīng)用時,不同的應(yīng)用場景需要的技術(shù)指標也各不相同,延遲、成本、微調(diào)能力、知識庫協(xié)調(diào)能力、多模態(tài)支持能力等等,都會因場景需求的不同而被取舍。
2024年12月亞馬遜CEO Andy Jassy在2024 re:Invent上演講
就以DeepSeek為例,其于2024年12月推出DeepSeek-V3模型后,于2025年1月20日相繼發(fā)布了參數(shù)規(guī)模達6710億的DeepSeek-R1、DeepSeek-R1-Zero以及參數(shù)范圍覆蓋15億至700億的DeepSeek-R1-Distill系列模型。2025年1月27日,DeepSeek又新增了基于視覺的Janus-Pro-7B模型。這些模型均已開源,公開資料顯示,DeepSeek系列模型通過強化學習等創(chuàng)新訓練方法,在推理能力方面具有顯著優(yōu)勢,并且成本效益比同類模型高出90%-95%。
但是,以快速響應(yīng)場景為例,DeepSeek R1的深層思考模式顯然不太合適,其生成首個token的用時超過30秒,而Amazon Nova模型則只需要數(shù)百毫秒即可生成響應(yīng)。另外,目前的DeepSeek-V3模型只是文生文模型,不支持圖形等多模態(tài)信息的輸入。
可見,強如DeepSeek模型也不是萬能的。
正是從最初就洞察到“不會有一個模型一統(tǒng)天下”,亞馬遜云科技在精進自身大模型的同時,一直致力于為企業(yè)用戶提供豐富的模型“選擇”。
目前,Amazon Bedrock已上架AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI、Luma AI、poolside等廠商的最新大模型,近期還上線了Luma AI Ray 2 模型。
同時,亞馬遜云科技還推出了Amazon Bedrock Marketplace功能,為客戶提供100多個熱門、新興及專業(yè)模型,這其中就包括DeepSeek-R1。
如Andy Jassy所言,亞馬遜云科技提供的豐富且有深度的模型,讓客戶能夠根據(jù)自身獨特需求,精確選擇最合適的解決方案。關(guān)注客戶需求與技術(shù)發(fā)展,亞馬遜云科技持續(xù)擴展模型選擇,既要有潛力的新興模型,也要有行業(yè)內(nèi)的經(jīng)典模型。
打造企業(yè)級AI工具全家桶
需要注意的是,基于場景選擇合適的模型只是企業(yè)構(gòu)建應(yīng)用旅程的第一步。隨著構(gòu)建的深入,解決工程化問題的能力成為能否成功構(gòu)建的關(guān)鍵。
模型成本、性能、能否針對私有數(shù)據(jù)進行定制優(yōu)化,夠不夠安全,不同尺寸的模型和日益增長的各種智能體的復(fù)雜調(diào)度等等,這些企業(yè)部署和使用模型中的工程化問題都需要得到完美解決。
以DeepSeek為例,其公開的模型有V3和R1等不同的型號,R1也有不同的尺寸規(guī)模,如DeepSeek-R1-Distill系列模型參數(shù)范圍是15億至700億,而R1和R1-Zero的參數(shù)規(guī)模則達到6710億。要完整部署R1實現(xiàn)完美推理和響應(yīng),還需要配套的便捷工具。
Amazon Bedrock聚焦企業(yè)應(yīng)用AI的實際需求,在提供豐富模型選擇的同時,增添了一系列工具和功能。如低延遲優(yōu)化推理、模型蒸餾、提示詞緩存等功能,大幅提升推理效率。以模型蒸餾功能為例,它能夠?qū)⑻囟ㄖR從功能強大的大模型轉(zhuǎn)移到更小、更高效的模型,運行速度最快可提高500%,成本降低75%。
Amazon Bedrock支持基于企業(yè)自有數(shù)據(jù)的定制優(yōu)化。如模型微調(diào)功能,支持GraphRAG等圖數(shù)據(jù),以及夠快速且經(jīng)濟高效地從文檔、圖像、音頻以及視頻中提取信息,并將其轉(zhuǎn)換為結(jié)構(gòu)化格式的Amazon Bedrock Data Automation功能等。
Amazon Bedrock負責任AI的安全和審查,通過不斷豐富Guardrails功能,以簡化企業(yè)實施負責任AI的投入,例入為其加入自動推理檢查功能,從而能夠輕松識別事實性錯誤,以提升生成回答的準確性。
Amazon Bedrock不但提供智能體功能,還針對智能體的快速發(fā)展,進一步推出了多智能體協(xié)作功能,使客戶能夠輕松地構(gòu)建和協(xié)調(diào)專業(yè)智能體來執(zhí)行復(fù)雜的工作流程。憑借多智能體協(xié)作功能,客戶可以通過為項目的特定步驟創(chuàng)建和分配專用智能體,從而獲得更準確的結(jié)果,并通過編排多個并行工作的智能體來加速任務(wù)。
目前,亞馬遜云科技現(xiàn)已推出針對DeepSeek-R1模型四種不同的部署方式,企業(yè)可以在熟悉的亞馬遜云科技環(huán)境中輕松部署該系列模型,例如在Amazon Bedrock Marketplace中部署,或在Amazon SageMaker Jumpstart中部署,也可以通過Amazon Bedrock自定義導(dǎo)入功能或Amazon EC2 Trn1實例中部署DeepSeek-R1-Distill系列模型。
圖注:在Amazon Bedrock Marketplace中調(diào)用DeepSeek-R1模型
圖注:在Amazon SageMaker Jumpstart中部署DeepSeek-R1模型
總結(jié)來看,亞馬遜云科技圍繞云和AI領(lǐng)域展開的全棧式創(chuàng)新,為企業(yè)運用全球領(lǐng)先模型提供三大支持:
首先是云端本身的優(yōu)勢,與本地部署相比,云端部署更靈活更易擴展,同時也能與云端豐富且成熟的分析、數(shù)據(jù)等基礎(chǔ)服務(wù)進行無縫集成;
其次是多樣化的模型選擇優(yōu)勢,不同的場景能夠靈活選擇不同成本、性能、響應(yīng)速度的模型,從而實現(xiàn)最優(yōu)的性價比組合;
最后是模型從原型走向企業(yè)化生產(chǎn)環(huán)境時必須要考慮的一系列重要功能,堪稱企業(yè)級AI全家桶,包括優(yōu)化成本、根據(jù)自有數(shù)據(jù)定制提升準確性、至關(guān)重要的安全性以及針對未來復(fù)雜的多智能體構(gòu)建和管理等。
亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建強調(diào):“亞馬遜云科技是全球云計算的開創(chuàng)者和引領(lǐng)者,更是企業(yè)構(gòu)建和應(yīng)用生成式AI的首選。我們不僅在云的核心服務(wù)層面持續(xù)創(chuàng)新,更在從芯片到模型,再到應(yīng)用的每一個技術(shù)堆棧取得突破,讓不同層級的創(chuàng)新相互賦能、協(xié)同進化。我相信,只有這樣全棧聯(lián)動的大規(guī)模創(chuàng)新才能真正滿足當今客戶的發(fā)展需求,加速前沿技術(shù)的價值釋放,助力各行各業(yè)重塑未來?!保ü啵?/p>
- AI預(yù)測《哪吒2》票房或達百億元,光線傳媒贏麻了
- “鐵打的應(yīng)用,流水的模型”形勢下,該如何構(gòu)建企業(yè)級AI應(yīng)用?
- 雷軍最新發(fā)文:正研究提升小米汽車產(chǎn)能
- 華為Pura 80全系相機規(guī)格曝光:超大杯將首發(fā)國產(chǎn)1英寸主攝
- 賽力斯發(fā)布1月產(chǎn)銷數(shù)據(jù) 新能源車銷量同比降51% 中金公司維持跑贏行業(yè)評級
- 消息稱蘋果最快下周發(fā)布新款iPhone SE 有望月內(nèi)發(fā)售
- 因服務(wù)器資源緊張 DeepSeek已暫停 API 服務(wù)充值
- 文遠知行發(fā)布全新無人物流車Robovan W5 支持L4級無人駕駛
- “小米眼鏡官博上線”引熱議 王化回應(yīng):抱歉要掃大家的興了
- 比爾·蓋茨評英特爾:迷失了方向,想恢復(fù)昔日榮光很難
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。