不卷自研大模型,金山辦公如何創(chuàng)新生成式AI?

科技云報(bào)道原創(chuàng)。

過(guò)去大半年里,很多人對(duì)大模型的前景寄予厚望。主流觀點(diǎn)認(rèn)為,每個(gè)行業(yè)、每款產(chǎn)品都可以通過(guò)大模型“重做一遍”。

“重做一遍”聽(tīng)起來(lái)想象空間很大,但實(shí)際上多數(shù)大模型產(chǎn)品需要漫長(zhǎng)的訓(xùn)練周期和海量資源投入,落地也就變得遙遙無(wú)期。

今年年初金山辦公宣布All in AI,將LLM能力全面引入產(chǎn)品,發(fā)布基于大語(yǔ)言模型的智能辦公助手WPS AI

相較于大模型玩家普遍把“重做一遍”視為創(chuàng)新路徑時(shí),WPS AI帶來(lái)了另一種大模型創(chuàng)新方法論——與其“重做一遍”,不如去“重新發(fā)現(xiàn)”。

據(jù)悉,金山辦公選擇在大模型應(yīng)用側(cè)下功夫,WPS國(guó)內(nèi)版與WPS海外版同時(shí)推進(jìn)WPS AI研發(fā)落地,讓每個(gè)模型都能充分發(fā)揮自身的優(yōu)勢(shì)。

正因如此,WPS AI甚至比微軟的Microsoft 365 Copilot還快了一步,成了國(guó)內(nèi)第一個(gè)將大語(yǔ)言模型(LLM)應(yīng)用在辦公軟件領(lǐng)域,并真正交付了可用產(chǎn)品的公司。

自今年4月18日首次亮相以來(lái),WPS AI在短短50天里對(duì)多個(gè)核心辦公場(chǎng)景進(jìn)行了賦能,用“金山速度”不斷刷新著生成式AI的應(yīng)用邊界。

如此驚人的進(jìn)化速度,WPS AI是如何實(shí)現(xiàn)的?

生成式AI的背后是大模型服務(wù)的支撐

如果你是WPS的用戶,最近可能會(huì)觀察到一些變化:金山文檔「智能文檔」的新功能已經(jīng)能夠幫你提供新聞稿、廣告文案、教學(xué)教案、工作周報(bào)等種種文件的起草、改寫(xiě)、總結(jié)、潤(rùn)色、翻譯、續(xù)寫(xiě)等功能。

除此之外,它還可以幫你一鍵生成幻燈片、一鍵分析Excel數(shù)據(jù)、翻譯總結(jié)文檔,自己寫(xiě)日?qǐng)?bào)等等。

通過(guò)AI大模型,WPS構(gòu)建出一個(gè)更高效、快捷釋放場(chǎng)景能力的智能交互系統(tǒng),去解決用戶多元且碎片化的辦公需求。

不可否認(rèn),生成式AI本身的能力非常驚艷,但是生成式AI遠(yuǎn)遠(yuǎn)不只是以模型和AI這么簡(jiǎn)單。

基礎(chǔ)模型只是在海面上的冰山一角,為了支持好這個(gè)冰山一角,冰川的底部有多個(gè)服務(wù)來(lái)支撐,比如說(shuō)加速芯片、存儲(chǔ)優(yōu)化、數(shù)據(jù)庫(kù)、大數(shù)據(jù)分析、安全服務(wù)等等。

不僅如此,支撐生成式AI的每一種技術(shù)和基礎(chǔ)設(shè)施環(huán)境,都在發(fā)生著快速變化。

以基礎(chǔ)模型為例,其發(fā)展是按照月甚至按照天的速度來(lái)迭的。2019年,最大的預(yù)訓(xùn)練模型是3.3億個(gè)參數(shù),但到了2023年,大模型最大的參數(shù)已經(jīng)超過(guò)了五千億個(gè),也就是說(shuō)短短四年,整個(gè)參數(shù)的迭代超過(guò)了1600倍。

同時(shí),國(guó)內(nèi)外都掀起了“百模大戰(zhàn)”,從最開(kāi)始出現(xiàn)的Transformer,到去年的GPT3.5、Stable Diffusion,再到今天GPT4、Llama2、Claude2等模型,還包括國(guó)內(nèi)正在自研的基礎(chǔ)模型如百川、ChatGLM等,每個(gè)模型都具備著他們自己獨(dú)有的場(chǎng)景和優(yōu)勢(shì)。

正如亞馬遜云科技的CEO Adam Selipsky所說(shuō),沒(méi)有一個(gè)基礎(chǔ)模型可以適用于所有的業(yè)務(wù)場(chǎng)景,用戶會(huì)根據(jù)自己的場(chǎng)景去選擇最適合自己的基礎(chǔ)模型。

這一點(diǎn)放在金山辦公身上同樣適用。

金山辦公AI研發(fā)總監(jiān)劉強(qiáng)在采訪中表示,幾乎很少有一個(gè)模型能涵蓋全部的能力,通常一個(gè)功能需要多個(gè)模型協(xié)作,需要考慮不同模型之間的調(diào)用方式不一樣。

但Amazon Bedrock的模型管理,能把不同大模型底層的API做成透明統(tǒng)一的,這減輕了很大的工作量。

金山辦公AI研發(fā)總監(jiān) 劉強(qiáng)

劉強(qiáng)提到的Amazon Bedrock,是亞馬遜云科技今年4月發(fā)布的一項(xiàng)生成式AI重要產(chǎn)品。

它支持來(lái)自AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和Amazon等領(lǐng)先人工智能公司的高性能基礎(chǔ)模型,并可以輕松安全地進(jìn)行自定義模型訓(xùn)練。

作為國(guó)內(nèi)第一批Amazon Bedrock的預(yù)覽版用戶,金山辦公可以在輕松使用這些高性能基礎(chǔ)模型的同時(shí),也能夠使用自己的數(shù)據(jù)構(gòu)建差異化的應(yīng)用程序。

與此同時(shí),金山辦公通過(guò)使用機(jī)器學(xué)習(xí)平臺(tái)Amazon SageMaker,正在幫助算法科學(xué)家快速進(jìn)行場(chǎng)景實(shí)驗(yàn)和算法迭代。

Amazon SageMaker不僅可以避免算法科學(xué)家從頭搭建模型,還可以通過(guò)Amazon SageMaker JumpStart功能幫助客戶快速構(gòu)建和部署模型,從而嘗試多種開(kāi)源模型。

可以說(shuō),有了這類(lèi)大模型管理作為基礎(chǔ)服務(wù)作為支撐,生成式AI的應(yīng)用創(chuàng)新事倍功半。

生成式AI要效率也要安全合規(guī)

隨著大模型的發(fā)展,數(shù)據(jù)的合規(guī)性和安全性成為亟待解決的問(wèn)題。

在生成式AI領(lǐng)域中,數(shù)據(jù)的獲取、加工及利用的方式?jīng)Q定了模型的性能和準(zhǔn)確性。數(shù)據(jù)的非法泄漏、被惡意篡改,可能導(dǎo)致訓(xùn)練出的模型有誤導(dǎo)性;非法獲取或使用未經(jīng)授權(quán)的數(shù)據(jù),不僅違法,還可能使得模型偏離了其原本的目的。

前段時(shí)間,OpenAI被指控訓(xùn)練ChatGPT時(shí)使用從互聯(lián)網(wǎng)上抓取的數(shù)據(jù),大規(guī)模侵犯了無(wú)數(shù)人的版權(quán)和隱私。目前全球各國(guó)對(duì)于企業(yè)使用大模型的數(shù)據(jù)安全要求已日益提升。

不少企業(yè)在構(gòu)建大模型時(shí)也普遍要求私有化部署,即在加密環(huán)境中使用私有數(shù)據(jù)訓(xùn)練模型,以控制相關(guān)數(shù)據(jù)和模型的安全風(fēng)險(xiǎn)。

金山辦公AI研發(fā)總監(jiān)劉強(qiáng)表示,WPS非常重視數(shù)據(jù)安全,有專(zhuān)業(yè)的團(tuán)隊(duì)及合作伙伴共同打造完善的數(shù)據(jù)安全體系,在各個(gè)國(guó)家和地區(qū)可以有效的保障用戶隱私。

正因?qū)Π踩弦?guī)的重視,金山辦公作為一家中國(guó)企業(yè)得以順利走向全球。截至2022年底,WPS在海外已擁有超過(guò)1億活躍用戶,WPS Office累計(jì)獲得近4億次安裝。

從與金山辦公合作的亞馬遜云科技大模型服務(wù)來(lái)看,Amazon Bedrock在安全合規(guī)方面也助力頗多。

據(jù)亞馬遜云科技解決方案架構(gòu)師介紹,在開(kāi)發(fā)之初就考慮到安全性和隱私保護(hù),幫助客戶保護(hù)敏感數(shù)據(jù):

首先,Amazon Bedrock從服務(wù)設(shè)計(jì)層面就確保了客戶的數(shù)據(jù)以及客戶相關(guān)的信息不會(huì)被用于進(jìn)一步訓(xùn)練模型。所有的客戶數(shù)據(jù)都是經(jīng)過(guò)加密的,且只有客戶能夠訪問(wèn)。

其次,客戶可以使用Amazon PrivateLink,在Amazon Bedrock與虛擬私有網(wǎng)絡(luò)(VPC)之間建立專(zhuān)門(mén)的安全連接,確保任何數(shù)據(jù)傳輸都不會(huì)暴露在公共網(wǎng)絡(luò)。

最后,對(duì)于存在高度監(jiān)管需求的客戶,Amazon Bedrock符合 HIPAA(《健康保險(xiǎn)流通與責(zé)任法案》)要求,并且可以在 GDPR(歐盟《通用數(shù)據(jù)保護(hù)條例》)合規(guī)標(biāo)準(zhǔn)下使用,讓更多的客戶從生成式AI中獲益。

不難發(fā)現(xiàn),金山辦公也可以利用它有效提升安全合規(guī)工作的效率,并確??蛻魯?shù)據(jù)的安全性,讓金山辦公的實(shí)力得以在海外充分釋放。

構(gòu)建生成式AI需要高性價(jià)比的基礎(chǔ)設(shè)施

正如前文所說(shuō),開(kāi)發(fā)生成式AI應(yīng)用是一個(gè)充滿挑戰(zhàn)的系統(tǒng)工程,并不是單純的產(chǎn)品和服務(wù)拼接,需要各種技術(shù)和工具來(lái)解決挑戰(zhàn),而高性價(jià)比的基礎(chǔ)設(shè)施正是其強(qiáng)有力的支撐。

早在生成式AI創(chuàng)新之前,金山辦公就在積極探尋如何利用AI/ML技術(shù)為業(yè)務(wù)賦能。在數(shù)據(jù)存儲(chǔ)、現(xiàn)代化應(yīng)用開(kāi)發(fā)、AI/ML、芯片等層面,金山辦公與亞馬遜云科技都有深度合作。

例如,WPS Office通過(guò)使用Amazon S3高效低成本地實(shí)現(xiàn)了PB級(jí)海量數(shù)據(jù)存儲(chǔ)。

通過(guò)Amazon S3的智能分層功能,在存儲(chǔ)方面獲得了40%以上的成本優(yōu)化效果;利用亞馬遜云科技在美國(guó)、日本和印度的節(jié)點(diǎn),將終端用戶的響應(yīng)延遲從日常大于1秒減少穩(wěn)定至500毫秒以下。

在構(gòu)建精細(xì)化運(yùn)營(yíng)方面,金山辦公基于機(jī)器學(xué)習(xí)平臺(tái)Amazon SageMaker服務(wù)構(gòu)建了從用戶識(shí)別、用戶轉(zhuǎn)換到流失用戶挽回的一整套用戶精細(xì)化運(yùn)營(yíng)路徑,通過(guò)人工智能預(yù)測(cè)用戶購(gòu)買(mǎi),增強(qiáng)用戶轉(zhuǎn)化率。

除此之外,金山辦公還在嘗試?yán)脕嗰R遜提供的GPU機(jī)型和為生成式AI而打造的專(zhuān)門(mén)構(gòu)建的加速芯片(Amazon Inferentia和Amazon Trainium),為海外業(yè)務(wù)部署開(kāi)源模型方案,并且嘗試?yán)眉铀傩酒瑏?lái)降低成本。

總的來(lái)說(shuō),避免重復(fù)開(kāi)發(fā)大模型,專(zhuān)注于模型的開(kāi)發(fā)效率、調(diào)優(yōu)以及對(duì)底層基礎(chǔ)設(shè)施的高效利用,金山辦公為AI應(yīng)用帶來(lái)了新的研發(fā)方式,也為AI應(yīng)用開(kāi)發(fā)者值得借鑒的思路。

未來(lái),金山辦公還將以AIGC(內(nèi)容創(chuàng)作)、Copilot(智慧助理)和Insight(知識(shí)洞察)三個(gè)戰(zhàn)略方向?yàn)楹诵?,掀起辦公交互方式的新一輪變革。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2023-11-06
不卷自研大模型,金山辦公如何創(chuàng)新生成式AI?
科技云報(bào)道原創(chuàng)。過(guò)去大半年里,很多人對(duì)大模型的前景寄予厚望。主流觀點(diǎn)認(rèn)為,每個(gè)行業(yè)、每款產(chǎn)品都可以通過(guò)大模型“重做一遍”。“重做一...

長(zhǎng)按掃碼 閱讀全文