給學(xué)習(xí)視頻加上字幕需要多久?1小時(shí)?很可能30秒就夠了。
想把視頻字幕導(dǎo)出文字,還要一幀一幀記?一句話就行了。
你能想象這些操作依靠什么完成的嗎?大多數(shù)人可能想不到,以往一些需要專業(yè)編輯軟件耗時(shí)耗力才能實(shí)現(xiàn)的操作,今后在百度網(wǎng)盤里可以一鍵搞定了。不止如此,未來(lái),通過百度網(wǎng)盤“云一朵”助理,找圖、摘要、翻譯,都能成為一句話的事。
維特斯根坦說,我語(yǔ)言的邊界就是我世界的邊界。如今,AI正在拓寬世界的邊界——借助人類的自然語(yǔ)言。
未來(lái)的個(gè)人智能助理
科幻電影《Her》中,描述了這樣一個(gè)場(chǎng)景:一位擁有迷人聲線的虛擬AI,接管了人們大部分的工作和娛樂,不僅解放了雙手,甚至連雙腳也解放了,真正實(shí)現(xiàn)了常態(tài)化居家辦公。
過去幾十年,科幻電影對(duì)AI的描述大多離不開一個(gè)詞匯——效率。其背后掩藏的是現(xiàn)實(shí)世界對(duì)未來(lái)生活的終極愿景:生產(chǎn)力工具解放人類。
幾乎可以確定,每一部科幻片虛擬出來(lái)的AI都是在替人類工作,《西部世界》里的服務(wù)機(jī)器人、《星際穿越》里的塔斯,比比皆是。它映射出現(xiàn)實(shí)世界對(duì)AI的想象,總是要圍繞它最基礎(chǔ)的功能——效率躍遷。
從蒸汽機(jī)到內(nèi)燃機(jī),從數(shù)據(jù)化到信息化,科技催生社會(huì)進(jìn)步總是圍繞效率躍遷,而效率的躍遷背后,隱藏著的往往是時(shí)代下人們龐大且沒被滿足的需求。
chatGPT引發(fā)的這一輪AI浪潮,之所以能在短時(shí)間內(nèi)就席卷全球,技術(shù)創(chuàng)新是一方面,更底層的原因其實(shí)是社會(huì)對(duì)生產(chǎn)力工具進(jìn)化的極度渴望。
正如文初我們展示的那樣,生產(chǎn)力工具如今在AI的加持下已經(jīng)開始表現(xiàn)的更科幻,而未來(lái)百度網(wǎng)盤結(jié)合大模型的升級(jí),也將滿足社會(huì)對(duì)生產(chǎn)力工具的很大渴望。
1 更復(fù)雜的文件理解
以往我們需要一份專業(yè)報(bào)告的總結(jié),只能一頁(yè)一頁(yè)看,如果是外文報(bào)告可能還要用到翻譯工具,再或者還需要轉(zhuǎn)換文檔格式,上述操作需要我們?cè)跒g覽器、閱讀器、word等多個(gè)軟件來(lái)回穿梭,不僅會(huì)頭暈眼花,可能還會(huì)忙中出錯(cuò)。
好消息是,以后這些繁雜的工作可以在百度網(wǎng)盤一鍵完成了。
基于文心大模型,百度網(wǎng)盤將要實(shí)現(xiàn)的一個(gè)大功能,即文檔從「閱讀」到「理解」。你可以讓它給你寫一個(gè)文檔總結(jié),無(wú)論外文還是中文,幫助你快速?gòu)碾s亂的信息中梳理知識(shí)。
你也可以挑選某一段讓它給你翻譯,又快又好。
甚至就連格式轉(zhuǎn)換也能一句話搞定。
簡(jiǎn)而言之,通過這個(gè)例子,我們可以感受到一些變化,過去存儲(chǔ)在網(wǎng)盤的文件就只是一個(gè)文件,而今天百度網(wǎng)盤能夠幫助用戶理解其中的知識(shí)。
2 更快的圖片&文檔搜索
升級(jí)后的百度網(wǎng)盤,帶來(lái)了更快的圖片和文件搜索。
相較于傳統(tǒng)的翻閱式查找,在新的百度網(wǎng)盤中可以一句話找到想要的照片或文件。比如“幫我找一下最近拍的美食照片”或者更復(fù)雜的“去年公司的團(tuán)建聚餐照片”就可以了。
借助大模型的能力,百度網(wǎng)盤能夠理解和分析更復(fù)雜的語(yǔ)義,并借助圖像識(shí)別技術(shù)快速找到目標(biāo)文件。
而且,這項(xiàng)技術(shù)還不止步于圖片和文件,視頻查找也是可以的。
比如在百度網(wǎng)盤里的視頻資料,上次學(xué)過的知識(shí)點(diǎn)想要復(fù)習(xí)一下,但又記不得是幾分幾秒?沒關(guān)系,可以直接提問某個(gè)知識(shí)點(diǎn),百度網(wǎng)盤就會(huì)基于視頻內(nèi)容提供相關(guān)的解答并給出視頻對(duì)應(yīng)內(nèi)容的位置,也可以直接定位跳轉(zhuǎn)到對(duì)應(yīng)位置。
目前,百度網(wǎng)盤云一朵正在內(nèi)測(cè)中,打開百度網(wǎng)盤PC客戶端(最新版)或網(wǎng)頁(yè)版,即刻預(yù)約體驗(yàn)。
我們之前說過,某種技術(shù)的出現(xiàn),背后往往是當(dāng)時(shí)人類需求的集中爆發(fā)。內(nèi)燃機(jī)的發(fā)明,讓我們能去到更遠(yuǎn)的地方,促進(jìn)了貿(mào)易和文化的交流;而數(shù)據(jù)化、信息化相當(dāng)于是輪子和發(fā)動(dòng)機(jī),讓知識(shí)跑的更遠(yuǎn)。
而當(dāng)數(shù)據(jù)膨脹到一定程度后,知識(shí)堆疊的冗余就讓獲取知識(shí)變得困難。真正想找到有價(jià)值的信息卻如大海撈針,這一問題在數(shù)字信息時(shí)代變得越來(lái)越嚴(yán)重。生產(chǎn)力工具的進(jìn)化,其目標(biāo)就是讓知識(shí)獲取變得更容易。
如何解決這個(gè)新時(shí)代的新問題,這是我們看到在AI時(shí)代可能帶來(lái)的變化。就好像在輪子和發(fā)動(dòng)機(jī)的基礎(chǔ)上加入一個(gè)導(dǎo)航儀,讓所有的內(nèi)容和數(shù)據(jù)為我所用,這就從信息化到知識(shí)化。
炸裂的B端智能化
這一次的AI浪潮不止惠及個(gè)人,也包含廣大的B端企業(yè)用戶,畢竟企業(yè)擁有更集中也更迫切的生產(chǎn)力需求。
chatGPT發(fā)布之后,諸如廣告行業(yè)已有多家公司宣布將裁撤一部分基礎(chǔ)的文案崗位,轉(zhuǎn)向AIGC;一些畫師也在使用Midjourney這類的軟件為其工作。
跳轉(zhuǎn)到網(wǎng)盤市場(chǎng)的企業(yè)用戶,實(shí)際上存在兩類剛需,一類是數(shù)據(jù)存儲(chǔ)和傳輸,一類是基于存儲(chǔ)和傳輸?shù)谋镜匾绘I化生成。
對(duì)于第一類,比較典型的就是很多企業(yè)會(huì)將文件、合同、發(fā)票、素材等放到網(wǎng)盤里,以作備份或者傳輸用。那么這一類需求的痛點(diǎn)就是,花在海量文件查找和歸類的時(shí)間,即辛苦又沒有價(jià)值。
基于文心大模型,未來(lái),百度網(wǎng)盤升級(jí)后將在企業(yè)版中加入更智能的圖片分類功能,定制了多達(dá)57個(gè)更契合辦公用途的分類,例如企業(yè)票證、商務(wù)合同、設(shè)計(jì)素材等,實(shí)現(xiàn)更好的管理和更快的查詢。
同個(gè)人版一樣,百度網(wǎng)盤企業(yè)版也將基于文心大模型,帶來(lái)企業(yè)知識(shí)官。通過對(duì)話式交互幫助企業(yè)版用戶對(duì)文件內(nèi)容進(jìn)行總結(jié)、提煉、問答和進(jìn)一步加工。
例如可以讓它頭腦風(fēng)暴想10個(gè)小清新的飲品名稱、根據(jù)提綱完成一篇報(bào)告,或者潤(rùn)色一下文字讓文章看起來(lái)更高級(jí),百度網(wǎng)盤都能搞定。
針對(duì)第二類需求,升級(jí)后的百度網(wǎng)盤某種意義上真正幫助特定行業(yè)實(shí)現(xiàn)了效率躍遷。
比如攝影行業(yè),從客戶追蹤到售后服務(wù)一套流程下來(lái),平均服務(wù)一個(gè)客戶需要15個(gè)員工花費(fèi)35天。
百度網(wǎng)盤推出的即拍即選服務(wù),為攝影行業(yè)實(shí)現(xiàn)了效率的極大改進(jìn)。
拍完即上傳,并且借助一鍵AI修圖、自動(dòng)套版、生成網(wǎng)盤鏈接等本地操作,將傳統(tǒng)攝影機(jī)構(gòu)一張照片涉及拍照、初修、調(diào)色、導(dǎo)卡選片等13個(gè)環(huán)節(jié),平均參與人員15人,縮減到整個(gè)環(huán)節(jié)從5天到15分鐘,單客服務(wù)成本降低75%,效率提升超過30倍。
同樣,在電商行業(yè),百度網(wǎng)盤的智能多模態(tài)加工不僅針對(duì)?像精修,還能通過AI為圖?更換所需要的背景,通過智能扣圖然后匹配相應(yīng)的場(chǎng)景制作新的商品圖。
類似這樣針對(duì)特定行業(yè)的AI技術(shù),其實(shí)不止百度一家在做,Adobe、Midjourney甚至還有專門的AI模特公司,但本質(zhì)上它們還是傳統(tǒng)的軟件,也就是原有鏈條的一個(gè)部分。
而百度網(wǎng)盤未來(lái)支持AI模特、營(yíng)銷海報(bào)制作,就是在一鍵本地生成的基礎(chǔ)上減少鍵條,讓生產(chǎn)力得到最大化的提升。
再比如生命科學(xué)行業(yè),例如基因公司要將測(cè)序文件交付給醫(yī)院、學(xué)?;蚩蒲袡C(jī)構(gòu),數(shù)據(jù)往往高達(dá)幾百GB甚至1TB,百度網(wǎng)盤提供的文件交付解決方案支持TB級(jí)別的數(shù)據(jù)傳輸,能夠幫助客戶將超大文件既便捷又安全的完成交付。
網(wǎng)盤,技術(shù)推動(dòng)信息化到知識(shí)化
過去十年,網(wǎng)盤行業(yè)經(jīng)歷了兩個(gè)階段。其一是數(shù)據(jù)化,人們習(xí)慣將本地文件上傳到云端,實(shí)現(xiàn)本地資源的釋放和分享;其二是信息化,沉淀在網(wǎng)盤的海量數(shù)據(jù),催生了個(gè)人、企業(yè)乃至行業(yè)高效利用數(shù)據(jù)的新需求。
比如用戶在需要它們的時(shí)候可以隨時(shí)調(diào)用,這個(gè)階段網(wǎng)盤的價(jià)值在于提供一個(gè)目錄或者索引,可以快捷高效的找到文件。
而未來(lái)十年,隨著信息化越來(lái)越高,用戶需求也會(huì)隨之轉(zhuǎn)向。
一方面,知識(shí)化是一個(gè)大方向的趨勢(shì),AI將有用的信息梳理成知識(shí),無(wú)論是即時(shí)的還是過往的,用戶都可以輕松快捷的找到它并知識(shí)化它。
什么是知識(shí)化?
信息化的特點(diǎn)是淺層理解與離散化,而知識(shí)是信息的集合,是從相關(guān)信息中過濾、提煉及加工而得到的有用資料。知識(shí)基于推理和分析,還可能產(chǎn)生新的知識(shí)。
而百度網(wǎng)盤的知識(shí)化,可以將其理解為提供了一種對(duì)信息的理解、記憶、推理和連接的能力。它的作用類似汞,能從金砂中提煉出黃金。
三年前,百度網(wǎng)盤曾對(duì)行業(yè)未來(lái)作出判斷。認(rèn)為網(wǎng)盤能力將活躍于包括手機(jī)、音箱、電視在內(nèi)的智能終端,用戶可以“隨時(shí)隨地上傳數(shù)據(jù)到云端,或在終端呈現(xiàn)內(nèi)容”。同時(shí),用戶會(huì)更愿意直接在網(wǎng)盤操作和處理數(shù)據(jù),而不是將其下載到本地。
今天百度網(wǎng)盤知識(shí)化的越級(jí),對(duì)應(yīng)的正是三年前的這個(gè)預(yù)判。
基于這些,未來(lái)百度網(wǎng)盤就能依托知識(shí)化構(gòu)建網(wǎng)盤第二大腦,成為每個(gè)人都擁有的個(gè)人數(shù)字助理。
而這背后,都離不開百度長(zhǎng)久以來(lái)對(duì)技術(shù)的長(zhǎng)久投入和創(chuàng)新。
比如文字理解,百度網(wǎng)盤采用圖像預(yù)訓(xùn)練大模型技術(shù),能夠利用更多的上下文信息,并通過自監(jiān)督的思路提高效率和準(zhǔn)確率。
再比如圖像理解,依托文心大模型,百度網(wǎng)盤將模型規(guī)模縮小,成本下降的同時(shí)效率上去了。依托文心大模型,百度網(wǎng)盤的的解決方案百度網(wǎng)盤的的解決方案,在16個(gè)場(chǎng)景中有10個(gè)領(lǐng)域處于領(lǐng)先地位,并已廣泛應(yīng)用于網(wǎng)盤的照片故事和圖片視頻搜索中,支持復(fù)雜語(yǔ)義和多模態(tài)的搜索能力。
還有人像美化,除了提供基本的人像美化效果與競(jìng)品一致外,在保持效果的前提下,百度網(wǎng)盤將部分核心模型大小壓縮到百KB,推理耗時(shí)降低到百毫秒。
最后是音視頻理解。百度網(wǎng)盤的自動(dòng)語(yǔ)音識(shí)別(ASR)涵蓋了中、英、韓等多個(gè)國(guó)家的語(yǔ)言,識(shí)別和翻譯準(zhǔn)確率也處于行業(yè)領(lǐng)先地位。
尾聲
讓我們回到開頭的例子:《西部世界》和《星際穿越》都是科幻電影,但它們對(duì)于AI的立意卻是截然相反:前者刻畫了AI覺醒,而后者則是描述了AI為人類貢獻(xiàn)。
今天我們能體驗(yàn)到的AI,包括百度網(wǎng)盤、chatGPT、Midjourney等等,它們現(xiàn)存的形態(tài)亦或者未來(lái)的進(jìn)化方向,基本都是一類的,智能協(xié)同、彼此優(yōu)勢(shì)互補(bǔ),實(shí)現(xiàn)更高效、更準(zhǔn)確的工作成果。
百度網(wǎng)盤結(jié)合AI實(shí)現(xiàn)過目不忘和出口成章,是拓寬了我們語(yǔ)言的邊界,但它背后是人類不斷通過創(chuàng)造工具來(lái)增強(qiáng)自我的進(jìn)化過程。
同時(shí),人不是AI,人有語(yǔ)言與知識(shí),也有體驗(yàn)與感知。這是屬于我們更大的世界。
如果把語(yǔ)言和知識(shí)比做“讀萬(wàn)卷書”,也許AI能比人做的更好。
但是體驗(yàn)與感知是“行萬(wàn)里路”,這里不是單純的指去旅游,而是用心去生活,去體會(huì),去感悟,這是AI所無(wú)法替代的。
最后和大家分享一句話:AI是工具,人生是體驗(yàn)。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無(wú)人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。