10月17日消息,10月17日,李彥宏在百度世界2023上表示,大模型帶來的智能涌現(xiàn),是百度開發(fā)AI原生應(yīng)用的基礎(chǔ)。當天,李彥宏以《手把手教你做AI原生應(yīng)用》為主題發(fā)表演講,發(fā)布文心大模型4.0版本,并帶來新搜索、新地圖等十余款AI原生應(yīng)用。
李彥宏演講全文如下:
各位來賓,大家好!歡迎來到2023百度世界大會!歡迎來到生成式人工智能的時代!
這次大會的主題是AI原生應(yīng)用。我會詳細跟大家分享,過去幾個月,百度在對旗下各個產(chǎn)品線,進行AI原生化重構(gòu)過程中的心得體會,希望對大家有幫助。
眾所周知,AI原生應(yīng)用是基于大模型來開發(fā)的。過去一年,科技領(lǐng)域最大的創(chuàng)新無疑是大模型帶來的智能涌現(xiàn),這是我們開發(fā)AI原生應(yīng)用的基礎(chǔ)。
所以,百度的AI原生應(yīng)用也都是基于我們的文心一言來開發(fā)的。文心一言自今年3月16日首發(fā),之后我們迅速迭代,8月31日又獲準向全世界開放,獲得了大量的用戶反饋,創(chuàng)新的速度在不斷加快。
今天,我很高興地宣布,文心大模型4.0正式發(fā)布。?
我們也同步開始邀請測試。各位現(xiàn)場的朋友,只需要掃描嘉賓證上的二維碼,領(lǐng)取體驗券,就可以登錄文心一言官網(wǎng)或者文心一言App,體驗文心大模型4.0了。
這是迄今為止最強大的文心大模型,它實現(xiàn)了基礎(chǔ)模型的全面升級,理解、生成、邏輯和記憶四大能力,相比文心一言現(xiàn)在的版本都有明顯提升,綜合水平與GPT4相比已經(jīng)毫不遜色!
所謂AI原生應(yīng)用,我的理解,就是基于大模型的理解、生成、邏輯和記憶能力開發(fā)出來的應(yīng)用。這些能力是過去的時代所不具備的,因而才能打開無限的創(chuàng)新空間。下面我就結(jié)合應(yīng)用場景,給大家介紹一下文心一言的這四大能力。有了這四個能力的應(yīng)用,才是AI時代的原生應(yīng)用。
首先是理解能力。這是我接觸大模型之后感受最神奇的地方。過去我們講AI是“人工智障”,就是AI經(jīng)常聽不懂人話,久而久之,你也就不敢跟它說太多人話了。
今天,你說的每一句話,它大概率都能聽懂,很多時候比你的朋友同事更懂你在說什么。
舉個例子,你是一位在北京工作的年輕人,想在河北購房,想知道能不能在北京申請公積金貸款。
我們來輸入一行Prompt。
【我想回承德買房,能用公積金貸款嗎,手續(xù)怎么辦?我在北京工作?!?/p>
我們來看一下結(jié)果。文心一言回答說,可以用公積金貸款。為什么說這段問答體現(xiàn)了大模型的理解能力?其實剛才我給的Prompt,看似簡單,有好幾個小陷阱需要理解:
首先,是一個前后亂序的表述。大部分人打電話提問的時候,都是想到哪兒說到哪兒,不會那么嚴謹,就像這個Prompt,我先說了買房和辦理公積金,最后才說“我在北京工作”,這就對理解能力提出了更高的要求。
第二,我這里特意用了兩個比較模糊的表述。一個是“在北京工作”,潛臺詞是“在北京繳存公積金”,另一個是“回承德購房”,僅僅一個“回”字,其實暗示了我大概率是承德戶口。
第三,文心一言結(jié)合上下文,把所有信息點組合在一起,準確理解了真正的問題,也就是“一名河北承德戶籍的用戶,能不能用北京的公積金,在承德貸款購房”,然后針對這個問題給出了回答和辦理步驟。
可以看到,文心一言已經(jīng)可以對“前后亂序的表述,比較模糊的表達意圖,話語中的潛臺詞”,都進行相當準確的理解。這種能力,在政務(wù)、營銷、客服等領(lǐng)域,都有非常廣泛的應(yīng)用前景。
大模型的第二個重要能力是“生成”,可以生成文字、圖片、視頻等多模態(tài)內(nèi)容。
那么生成能力怎么用?我讓文心一言生成一套廣告素材。
先給它輸入一張圖片,再輸入一段Prompt。
【這是長安新推出的新能源車。請幫我生成兩張圖片,背景是春天、富有生機的景色,同時呈現(xiàn)車的飛馳感?!?/p>
我們看到,這個生成結(jié)果確實用到了春天生機勃勃的戶外景色,還配上了飛馳的模糊感。
我讓它直接給我生成一個豎版海報。
【結(jié)合長安官網(wǎng)上的長安啟源這款車型的信息,做一張豎版廣告海報,寫上簡約優(yōu)雅的營銷文案,與車身樣式相呼應(yīng)?!?/p>
大家看到,我們生成了一個同時具備圖片和文字的豎版廣告海報。
我們現(xiàn)在擁有了一張廣告海報,還需要更豐富的廣告文案,可以請文心一言再來寫幾條:
【這款車強調(diào)數(shù)智座艙、扶光設(shè)計、品質(zhì)駕乘。請再寫5條廣告文案,每條文案都需要包含簡短標題和一段描述】
AI寫出來的文案,里面有科技之美、時代風潮這一類表述,還強調(diào)了人機交互,文案是比較專業(yè)和流暢的,已經(jīng)達到了品牌營銷的標準。
那如果我還想要個視頻呢?
【請結(jié)合官網(wǎng)信息和已有的視頻內(nèi)容,生成一個數(shù)字人的口播視頻,我想投放信息流廣告?!?/p>
已經(jīng)生成了,那我們打開視頻看看效果。
這確實是個比較有特色的數(shù)字人口播視頻,也體現(xiàn)出了這個車的特點。
現(xiàn)在,我們擁有了1條廣告片、5個廣告文案和1張海報,而我僅僅給了文心一言一張圖片素材和幾個像是“數(shù)智座駕”“品質(zhì)駕乘”的詞語作為Prompt,全程只用了不到3分鐘。
不久前,我們也利用這個功能推出了AIGC營銷創(chuàng)意平臺擎舵,讓一個人就成為一支AI營銷隊伍。今天現(xiàn)場可能也有一些做文案策劃的朋友,看到這些,你們會不會覺得,大模型可以帶來更多創(chuàng)意上的啟發(fā),幫助你們提高效率?
接下來,我們講一講大模型的第三個能力:邏輯。
很多人經(jīng)常要給孩子輔導作業(yè)。有人開玩笑說,“不寫作業(yè)母慈子孝,一寫作業(yè)雞飛狗跳”。那我們來看看,文心一言能不能幫家長解決輔導功課的問題?
我來編一道數(shù)學題,看看表現(xiàn)如何:
【錐形的沙堆,底面積是8平方米,高12分米,把這堆沙子鋪在寬2米的公路上,厚度5厘米,能鋪多少米路?】
這是一類我們可能小時候都做過的數(shù)學題,從文心一言的回答看,它的答題邏輯還是挺清晰的。每一個解題步驟都寫了出來。家長們可以看看,是不是比一些輔導教材上給出的還要詳細。
甚至,AI還能指出解題中用到的知識點,幫助孩子們鞏固學習,讓我們再問它一下:
【上述解題過程都涉及了哪些知識點?】
文心一言明確給出了這道題涉及到的圓錐體積公式、統(tǒng)一計量單位、體積保持不變、解方程等知識點。這對于學生、老師和家長都很實用。這些知識點都清晰的掌握后,將使孩子們具備舉一反三的能力。
大模型超強的邏輯能力,當然不僅僅可以用在解題上。智能地圖的路線規(guī)劃、智能助理處理復雜任務(wù)、智能交通系統(tǒng)中的紅綠燈控制等等,都需要利用邏輯能力。
接下來,我們再看第四點,也就是大模型的記憶能力。這里的記憶,主要指的是你前面說過的話,AI記不記得住,AI生成的內(nèi)容,前后會不會矛盾。這是區(qū)分大模型智能程度的一個重要指標,多輪對話就是記憶能力的體現(xiàn)。
我知道,很多創(chuàng)作者都在利用文心一言寫小說。而小說的內(nèi)容如果前后矛盾,那就沒有可讀性了。今天,我就讓它現(xiàn)場寫個小說,然后穿插一些干擾性問題,再看看它能不能記住自己寫過的內(nèi)容。
我先輸入一個Prompt:
【請幫我寫一篇武俠小說,主人公是個女俠,情節(jié)要跌宕起伏一些?!?/p>
好,我們看,小說的大綱已經(jīng)出來了:
首先是故事背景,在古代的武林世界,黑暗勢力正在崛起;女主角叫靈兒,擁有操縱內(nèi)力和飛行的力量。
我先輸入一個Prompt:
【請幫我寫一篇武俠小說,主人公是個女俠,情節(jié)要跌宕起伏一些?!?/p>
好,我們看,小說的大綱已經(jīng)出來了:
首先是故事背景,在古代的武林世界,黑暗勢力正在崛起;女主角叫靈兒,擁有操縱內(nèi)力和飛行的力量。
接下來,是故事開篇。靈兒要擊敗黑暗勢力,拯救武林。在小說的最高潮,她和反派進行了生死決戰(zhàn),擊敗了反派,拯救了武林和所有門派。
結(jié)尾,靈兒和盟友們還一起建立了內(nèi)力修行所。
現(xiàn)在故事基本成型了,但有點簡單,我想再增加一些角色需求:
【現(xiàn)在人物關(guān)系太簡單了,只有兩個角色,再增加4個角色】
文心一言又給出了四個角色,每個人都有不同的身份和性格,有著不同的人設(shè),這個慕容孤城是一代宗師,還有一位能預測未來的先知蕭寒雁。
但現(xiàn)在還缺一個小說中的必備要素,戲劇沖突。沒有沖突的故事不是好故事,剛剛女主角打敗黑暗勢力的過程太簡單了,我們看能不能加大點難度。
再來輸入一個Prompt:
【還要給故事增加主線的戲劇沖突,讓故事更有可看性】
我們看,它已經(jīng)寫好戲劇沖突了。這里設(shè)置了一個反轉(zhuǎn),黑暗勢力背后,真正的主導者是一位德高望重的宗師級人物,好幾次讓女主角陷入險境。直到?jīng)Q戰(zhàn),女主角才有了反殺的機會。
可以看到,它記住了故事主線是靈兒與黑暗勢力的對決,沖突也是圍繞這一主線展開。
那么,文心一言現(xiàn)在還記得剛寫過的故事,并且把這些角色和故事對應(yīng)上嗎?
我們再來提個需求:
【把這些角色帶入到你給我設(shè)計的故事大綱中吧,并且設(shè)計個標題。】
結(jié)果已經(jīng)顯示到大屏幕上,小說叫做《江湖風云之正義之戰(zhàn)》,它把補充的人物和戲劇沖突加入到了故事大綱里。這里的第四章和第五章,它還告訴我們,這個反派的大宗師,就是剛剛介紹過的慕容孤城。
整個過程中,我不斷加大難度、提出新的要求,去干擾它的記憶,文心一言依然記住了前面所有的需求和答案,能把故事情節(jié)和人物準確地對應(yīng)上,記憶力非常驚人。
那我現(xiàn)在考考現(xiàn)場的大家,你們還記得,主人公靈兒的特殊能力是什么嗎?
可能大部分人都不記得了,那我們看看文心一言還記得嗎?
【女主角擁有的能力是什么?】
好,答案出來了,是操縱內(nèi)力和飛行的力量。這就是在第一輪對話中,文心一言寫下的示例文字?,F(xiàn)在經(jīng)過五輪對話和幾千字的小說撰寫之后,它還是能記得之前寫過的內(nèi)容,這就是大模型的記憶能力。
我們剛剛體驗了大模型的四大能力,當然,大部分時候,這四項能力都不是單一出現(xiàn)的,是相輔相成的。比如,創(chuàng)作一個廣告文案,它需要理解創(chuàng)作主題、理清創(chuàng)作邏輯,通過記憶來保持前后一致。
在解題中,也需要綜合應(yīng)用理解、生成、邏輯、記憶能力。
我們再來看一個綜合應(yīng)用的案例:
首先,我們打開重構(gòu)后的百度App,用攝像頭掃一下患者拿出的藥盒,就不用再翻看小字說明書了,還有數(shù)字人醫(yī)生幫你講解。
剛才屏幕上出現(xiàn)的問題,比如“是飯前吃還是飯后吃”、“喝酒能不能吃”,“還有什么注意事項”,是很多患者在日常用藥中都會遇到的問題。
我們看到,大模型不僅可以幫患者做用藥說明書的解讀,還可以結(jié)合個性化的需求,提升用藥效率,確?;颊叻幍臏蚀_性、及時性。
不久前,我們將文心大模型和專業(yè)的醫(yī)療知識結(jié)合,發(fā)布了靈醫(yī)大模型,它的上層應(yīng)用靈醫(yī)Bot,就可以幫患者和醫(yī)生對話、生成病歷。這個例子不僅用到理解生成邏輯記憶能力,還用到了語音,視覺等多模態(tài)的能力。
前面的演示,主要體現(xiàn)出文心大模型在理解、生成、邏輯、記憶這四大能力上的進步,這些能力是一切AI原生應(yīng)用賴以生存的基礎(chǔ)。同樣,沒有構(gòu)建于基礎(chǔ)模型之上的、豐富的AI原生應(yīng)用生態(tài),大模型就一文不值。
正因為如此,我在五月份公開說,百度要做第一個把所有產(chǎn)品都進行重構(gòu)的公司,我們要用AI思維,做出AI原生應(yīng)用。
幾個月過去,我們的搜索、如流、地圖、網(wǎng)盤、文庫等,都將以一個全新的面目,與大家見面。期間踩過不少的坑,也愿意跟大家分享,希望你們開發(fā)過程中能夠少走歪路。
下面,我就給大家展示一下,這些用大模型重構(gòu)的產(chǎn)品,究竟長啥樣兒?這也是為了拓展大家的想象力,激發(fā)大家一起來做出更驚艷的AI原生應(yīng)用來。
我首先向大家展示的是搜索,這也是百度的起點。很多人對搜索的印象是,你輸入一個關(guān)鍵詞,百度給你一個個網(wǎng)頁鏈接。Not anymore!?
百度新搜索,打開界面時,除了還能看到一個搜索框,搜索結(jié)果將和過去完全不同。
重構(gòu)后的新搜索,有三個特點:極致滿足、推薦激發(fā)、多輪交互。
什么是極致滿足?當你在搜索框里輸入問題,比如“MBTI是什么?”“怎么側(cè)方停車”,新搜索不再是給你一堆鏈接,而是通過大模型去理解,生成一個最好的答案。
比如,詢問“過去20年各國工業(yè)增加值排名”,新搜索不僅會直接告訴你答案,還能用動態(tài)的圖表來展現(xiàn)答案。
從我身后的大屏幕可以看到,過去二十年,我們的工業(yè)制造業(yè)經(jīng)歷了飛速的發(fā)展,正從制造大國向著制造強國轉(zhuǎn)變。
這就是極致滿足:一步給你最極致的答案。
那么第二步,看到答案后,你還想看到哪些內(nèi)容?
這里就用到了推薦激發(fā)。比如在動態(tài)圖之后,推薦激發(fā)功能還給出了“工業(yè)增加值與GDP有什么關(guān)系” “工業(yè)對國民經(jīng)濟發(fā)展有何影響”這些你還可能關(guān)心的問題。點擊就能得到答案。
當然,并非所有需求都有一個唯一正確的答案。用戶的需求有時候會很復雜,一句兩句話說不清楚。用戶也很難把一個非常復雜的需求,一次性地通過大段大段的描述完整表述出來。
這時候,我們就需要用一個更新穎、更個性化的搜索模式來服務(wù)用戶,這就是:多輪交互。
我們來看一下這個例子:
比如,你詢問“北京周邊登山去哪兒比較推薦”,它給出了百花山、海坨山等多個答案,偏向徒步路線;
然后,它給出幾個提示,讓你補充選擇自己的情況,你可以選擇新手、親子和觀賞落葉幾種情況?,F(xiàn)在,它改為推薦西山和百望山,相對好爬,而且對親子活動比較友好。
那再繼續(xù)詢問,登山徒步需要什么裝備?回答有登山杖、登山鞋等,而且它還記得前面選擇了親子游,特別提示了怎么照顧小朋友。
可以說,生成式AI與搜索是天作之合。
搜索,雖然還是從那個簡單的框開始,但接下來的一步步,都已超越、重構(gòu)了原來的搜索模式,不僅提升了搜索質(zhì)量,而且突破了搜索的應(yīng)用范圍、擴大了產(chǎn)品邊界。這樣的
AI互動式搜索,將引領(lǐng)搜索行業(yè)的代際變革。
不久的將來,搜索會變成一個貼心助手,能夠隨時喚起、解決問題,甚至打破“端”的限制,做到隨時隨地響應(yīng)、滿足所需,全程陪伴。
下面,我們來看看第二個AI原生思維產(chǎn)品,百度GBI,Generative Business Intelligence,也就是生成式商業(yè)智能。這是一個從零開始的產(chǎn)品,不是對已有產(chǎn)品的重構(gòu)。
在我們的商業(yè)世界里,最離不開的就是商業(yè)分析,也就是BI,怎么做出最快的商業(yè)決策?先讓大家通過一個視頻,感受一下:
大家看到,在視頻里,總裁問了多方面的專業(yè)問題。有財務(wù)分析的、項目交付的,還有用戶分析的,運用了GBI的總裁助理,都能快速給出結(jié)果,讓總裁當場決策。
這就是基于大模型能力的決策利器,國內(nèi)首個生成式商業(yè)智能產(chǎn)品,百度GBI。用GBI,干啥都快!
掌握先進工具的人不僅不會被AI取代,而且“升職加薪不是夢”。不使用先進工具的人,才會有丟工作的風險。
那么,百度GBI是怎么做到快人一步的?它從三個方面顛覆了傳統(tǒng)的數(shù)據(jù)分析:
首先,傳統(tǒng)BI只有專業(yè)人士才能操作,而GBI能直接聽懂總裁問題,實時執(zhí)行;
其次,GBI提供了便捷的接入方式,企業(yè)可以接入數(shù)據(jù),對任意數(shù)據(jù)用自然語言進行提問、分析,而不再需要人工去跨數(shù)據(jù)庫、跨表格做各種專業(yè)操作;
第三,GBI還具備學習能力,企業(yè)可注入本行業(yè)專業(yè)知識,讓它成為行業(yè)專家。
這就是百度GBI,它可以把商業(yè)分析師十幾天才能完成的數(shù)據(jù)分析、撰寫報告工作,縮短到分鐘級。所謂天下武功,唯快不破;企業(yè)競爭,不是大魚吃小魚,而是快魚吃慢魚,比競爭對手更快決策,很可能你就贏了!
說到快速決策,在百度,我們依賴一個智能辦公平臺叫做如流,我們也利用AI重構(gòu)了這個應(yīng)用。
如今,它已經(jīng)成為百度人離不開的超級助理。
現(xiàn)在大家請看,這是如流在做實時記錄。我們來看看,它是不是能把剛剛講過的要點內(nèi)容都記?。?/p>
這就是如流的會議紀要一鍵生成功能。我們說,如何高效地開會,是個技術(shù)活兒。如流的這個功能,極大地減少了會議工作量,讓開會時長縮短了40%。
另外一個常見的場景是工作群。大部分職場人常常被各種群聊信息轟炸。那么快速總結(jié)群聊的重點,就成了一個極為實用的功能。
下面請大家看看,我們?nèi)缌鞯漠a(chǎn)品經(jīng)理是如何使用它的。
他有9個工作群,耽擱一段時間,可能就有一千多條未讀信息,而如流不僅可以“1000條消息,一秒get重點”,還可以智能地把需要閱讀的內(nèi)容分為:“待我確認”、“重點關(guān)注”、“話題討論”幾個類別,大大提高了工作效率。
那它究竟提煉得準不準,會不會理解有誤,或者漏掉關(guān)鍵信息?這考驗的就是大模型的理解和生成能力。理解越深刻,總結(jié)越精確。不要說1000條,1萬條信息,如流超級助理也一樣可以在幾秒鐘內(nèi),就給出智能分類、智能總結(jié)。
我們再看看工作中的另一個場景:差旅。
機票、酒店、談參等等,這些事務(wù)性的工作很繁瑣、也很耗時!如果人手一個AI助理,幫你解決瑣碎事兒,你會不會更愛工作?
比如,最近如流的產(chǎn)品經(jīng)理就計劃出差去上海,和人保的王總見面。我們知道,人保集團正在推動產(chǎn)品服務(wù)、商業(yè)模式、數(shù)字科技等方面的創(chuàng)新,我們百度的人工智能技術(shù)正好可以發(fā)揮作用。
這次出差行程安排,就可以交給如流這個超級助理,我們一起來看看它的表現(xiàn)。
超級助理可以根據(jù)他的日程信息來安排行程。
像最晚的會議是4點結(jié)束,所以預定7點半之后的飛機;以及,按照他的差旅標準,幫他找到可以住宿的酒店。最后,還發(fā)出了和客戶的會邀。
和客戶見面前,他可能需要一些合作背景,這點如流的超級助理也可以幫他完成。通過和CRM等公司系統(tǒng)數(shù)據(jù)打通,如流給出了合作項目、拜訪記錄等細節(jié)數(shù)據(jù)。
通過理解業(yè)務(wù)合作情況和外部信息,如流還能幫他生成一份談參,預設(shè)客戶可能提出的問題,還會給出一些合作建議。從這點看,如流是不是更像一個真實的助理了?
我們剛剛看到,只說三句話,如流就搞定了差旅單、機酒和日程的預訂,甚至還準備了洽談的參考資料,這就是如流的“一鍵差旅”。它是怎么做到的呢?
這是大模型的理解、生成、邏輯、記憶能力的綜合應(yīng)用,它自動地把復雜任務(wù),拆解成多個簡單任務(wù)分別執(zhí)行,再合并生成最終的結(jié)果。我們說,提升效率,就是提升競爭力,如流讓“智能工作”代替“勤奮工作”。
現(xiàn)在,我們再來看看新的百度文庫。這也是我認為目前重構(gòu)最徹底的一款產(chǎn)品。
百度文庫將會徹底顛覆我們的辦公、學習和創(chuàng)作的習慣。
過去,我們是怎樣創(chuàng)作的?舉個例子,假設(shè)你要做一場演講,主題是AI在心理學領(lǐng)域的應(yīng)用。查資料、整理素材、寫稿、寫PPT、美化PPT,得花上好幾天時間。
今天,在百度文庫上,你可以用一句話啟動工作,請看大屏幕:首先,你希望它能撰寫一篇演講稿,圍繞人工智能和心理學這個主題,它找到了幾十份資料。
還能識別出哪些是學術(shù)期刊、權(quán)威報告,哪些只是大眾材料。如果你想寫一篇生動活潑的文章,就去選一些大眾素材,比如散文、科普類的。
那如果你想要一篇嚴謹?shù)膶W術(shù)演講稿,就可以只勾選權(quán)威內(nèi)容,保證內(nèi)容的準確。然后,文庫通過理解這些文稿資料,再生成一篇結(jié)構(gòu)完整、段落清晰的文章,同時對內(nèi)容做出潤色和排版。
能做到這些,是因為百度文庫已經(jīng)擁有了10億優(yōu)質(zhì)文檔,基于對這些內(nèi)容的理解,寫出真正實用、清晰的文稿,而不是像很多大模型一樣一本正經(jīng)地胡說八道,也不會是泛泛的空談。
下一步,演講還需要PPT。文庫可以把剛剛這篇稿子和你收藏過的一些資料結(jié)合,自動生成PPT的框架,然后美化作圖,做出一個幾十頁的PPT。
這里還有一些多模態(tài)生成能力的玩法,比如風格選擇、風格一鍵切換。但還有一些更考驗文庫能力的地方,需要它對內(nèi)容有精準的理解。比如,它要知道觀點之間的關(guān)系,是并列,還是從屬,才能設(shè)計出正確的圖表。
因為有這樣的理解能力,所以文庫在生成PPT基礎(chǔ)上,還可以為這份PPT寫好對應(yīng)的演講稿。不僅如此,它還能根據(jù)這些內(nèi)容,推演出觀眾可能會提出的問題,為你準備好回答。
我們評測過,文庫這些生成能力,尤其是PPT的生成能力,已經(jīng)遠超市場上任何其他工具,不論國外還是國內(nèi)。過去,人們來文庫是為了找現(xiàn)成的內(nèi)容。今后,人們可以隨心所欲地來文庫生產(chǎn)內(nèi)容,效率高于任何其他生產(chǎn)力工具。
基于文心大模型的四大能力,不夸張地說,百度文庫是從根本上革了自己的命,完成了從“內(nèi)容工具”向“生產(chǎn)力工具”的進化。
不久前,百度文庫新版本開放首日,AI新功能就迎來超過200萬人次體驗?,F(xiàn)在,我們更加有信心說,大模型時代,百度文庫是生產(chǎn)內(nèi)容最好的起點。
和文庫一樣,百度網(wǎng)盤也是大家熟悉的老朋友了。過去11年,百度網(wǎng)盤為8億用戶服務(wù),文件量級已經(jīng)達到了4萬億,每一天用戶會上傳超過10億張圖片。所以,百度網(wǎng)盤在AI重構(gòu)的方向上,重點就是做好個人文件的智能服務(wù)。
大家現(xiàn)在看到的,就是百度網(wǎng)盤的新首頁。
重構(gòu)后的網(wǎng)盤,不但實現(xiàn)了從圖形界面交互到自然語言交互的轉(zhuǎn)變,還增強了多模態(tài)信息理解。
現(xiàn)在,只需要一句話,你就能對自己網(wǎng)盤內(nèi)的文件、圖片、視頻等進行操作。
這就是百度網(wǎng)盤“云一朵”,它是業(yè)界乃至全球首個個人云智能助理。下面就讓我們感受一下,“云一朵”能解決哪些痛點,帶來新體驗?
第一點就是找圖片或找視頻。有時候,我們想起來一個畫面,想在網(wǎng)盤中找到它,往往要經(jīng)過很多步操作,折騰半天也找不到?,F(xiàn)在,你對“云一朵”說一句話,它就能幫你精準定位:
好,它幫我快速找到了OpenAI首席科學家llya采訪中,關(guān)于transformer的內(nèi)容。
在這次看似簡單的搜索背后,是多個AI能力的作用,它要能理解視頻內(nèi)容、識別角色、還要形成上下文的記憶,才能精準定位到視頻的某一幀,這個技術(shù)在全球個人云領(lǐng)域都是非常領(lǐng)先的。
云一朵的第二個特點,是幫助用戶快速了解視頻的內(nèi)容,我們來看一下:
大家看到演示了兩個能力,一個是對內(nèi)容進行總結(jié)和摘要的能力,還有提取金句的能力。這是一段43分鐘的采訪,通過AI的理解和邏輯能力,云一朵對視頻做了總結(jié)和提煉,介紹了llya和他的主要觀點。
但是很多時候,我們會覺得原文很精彩,提煉出主要觀點或者摘要后,就沒有那么吸引人了,所以剛才的第二個功能,我覺得其實對我來說更有用,也就是說我們要找到原來視頻當中最精彩的部分,就是那些金句。比如llya說“學習統(tǒng)計規(guī)律比看到表象要重要得多”。能提煉出這個金句,這其中的關(guān)鍵突破是,實現(xiàn)了多模態(tài)信息的高效提取,這個技術(shù)在全球都是領(lǐng)先的。它能夠從很長的訪談內(nèi)容中找到最精華的部分,極大地提高了我們的學習和工作效率。
這就是AI重構(gòu)后的新網(wǎng)盤。截至昨天,云一朵用戶已經(jīng)達到2000萬。
它是基于個人云的AI智能助理。過去十年,百度定義了什么叫網(wǎng)盤;未來十年,百度將用AI重新定義新的網(wǎng)盤。
接下來,我們來看一個更為歷史悠久的產(chǎn)品,百度地圖。我們用AI原生的思維重構(gòu)了這個18年歷史的產(chǎn)品,這也是全球首個AI原生地圖產(chǎn)品。
在過去的18年中,百度地圖積累了非常豐富的功能,它可以導航、打車、找代駕,還能訂酒店、買機票,甚至滿足更為復雜條件下的POI查找需求。過去,這些操作復雜,往往需要六七步甚至更多才能完成;
現(xiàn)在,用戶只要說出需求,地圖就能調(diào)動幾千個服務(wù)的API接口,多級菜單變成一步直達,快速響應(yīng)。
我們接下來看看,百度地圖是怎么實現(xiàn)的?
視頻里,用戶考驗了百度地圖對泛需求的理解,中間聚會點的選取、多地點的信息對比,以及未來出行的推薦和預約,它都給出了合理方案。
這是因為文心一言的能力,已經(jīng)與地圖特有的億級POI知識和萬億級交通感知數(shù)據(jù)進行了融合,能隨時調(diào)用,給出推薦。重構(gòu)后的百度地圖,不只是導航,更是我們的出行向?qū)АT接迷铰斆?,越來越懂你?/p>
剛剛,我們展示了6個線上的AI原生應(yīng)用,但大模型帶來的改變不僅如此,它也在影響著我們線下的工作和生活。
比如,用大模型重構(gòu)的汽車車內(nèi)空間,是否會給我們帶來驚喜?來看一段本月底即將交付的集度極越的視頻。
當大模型與智能座艙相結(jié)合,你與它交互得越多,它就越能理解你的需求。不再需要復雜的按鍵操作,用語音就能操控車內(nèi)的一切,讓智能座艙擁有邏輯推理、策略規(guī)劃和內(nèi)容生成等各種能力。
即使在七嘴八舌、多人指令、聲音交織、連續(xù)對話的情況下,它也能理解每個人不同的需求,同時滿足。
這些能力已率先落地在由集度設(shè)計的極越01汽車機器人上,百度Apollo將在EQ、IQ兩方面全面賦能這款新車,極越01也將成為最聰明、最懂你的汽車機器人。
今天,相信大家已經(jīng)感受到了AI的巨大能量,我更相信,大模型將開啟一個繁榮的AI原生應(yīng)用生態(tài)。
談到生態(tài),不能不提插件,它非常重要,能讓開發(fā)者、創(chuàng)業(yè)者快速加入到生態(tài)中。
插件是一種特殊的AI原生應(yīng)用,也是門檻最低,最容易上手的AI原生應(yīng)用。不久前,百度上線了靈境插件平臺,無論是個人或者企業(yè)的數(shù)據(jù)、能力還是應(yīng)用,都能在靈境平臺上,快速變成插件。
舉個例子,你從網(wǎng)上買了個東西,賣家發(fā)貨與實物不符,咨詢怎么要求賠償?
這里,法律智能助手就可以給出建議,因為它接入了中國司法大數(shù)據(jù)研究院這種官方權(quán)威機構(gòu)提供的插件。
再比如,畢業(yè)求職季,簡歷很重要。你想做一名AI算法工程師。
沒問題,看一下,只要輸入包含背景信息的Prompt,大模型通過調(diào)用插件,就能幫你一鍵生成簡歷模板。
插件增強了大模型的能力,讓它更實用、更易用,也使得很多企業(yè)私有數(shù)據(jù)在沒有泄露風險的情況下,能方便快捷地利用到大模型的能力,更能降低開發(fā)者的門檻,促進AI生態(tài)的繁榮。
現(xiàn)在,靈境插件平臺,上線短短一個月,已經(jīng)有2.7萬開發(fā)者申請入駐,覆蓋20多個領(lǐng)域,除了法律咨詢、簡歷生成外,還有腦圖制作、口語練習等各種各樣的場景。
AI原生應(yīng)用調(diào)用基礎(chǔ)大模型的主要方式是API。在百度的千帆大模型平臺上,企業(yè)可以快速調(diào)取包括文心一言在內(nèi)的各種大模型的API,獲得大模型的能力。
現(xiàn)在,千帆大模型平臺已經(jīng)成為了中國最大、最開放的大模型開發(fā)平臺,不僅有42個主流大模型入駐,而且有17000家企業(yè)在這里開發(fā)產(chǎn)業(yè)模型和解決方案,覆蓋了各行各業(yè)的近500個場景。
從今天起,企業(yè)客戶可以通過千帆來申請測試文心4.0的API了。中國有豐富的應(yīng)用場景,中國用戶又天然愿意擁抱新技術(shù),有了先進的基礎(chǔ)大模型,我們就能構(gòu)建起一個繁榮的AI生態(tài),共同創(chuàng)造新一輪經(jīng)濟增長。
隨著這一波AI浪潮的到來,也有些人會擔心會不會被AI所取代。但我們首先看到的實際情況是——AI不僅不會替代人,AI還能救人。
10秒鐘完成預警,10分鐘完成救援,哪怕是在瞬息萬變的現(xiàn)實里,AI也能依據(jù)風險排查的邏輯,通過對復雜圖像、語言的理解,第一時間找到潛在風險點,發(fā)出預警,避免悲劇發(fā)生。
最后,我還想說,未來的AI原生應(yīng)用一定是多模態(tài)的,在信息世界之外,一定會重構(gòu)物理世界。自動駕駛就是視覺大模型重構(gòu)物理世界的一個典型應(yīng)用。
大模型會讓百度的自動駕駛能力超越經(jīng)驗系統(tǒng),更聰明地處理復雜場景,實現(xiàn)更廣泛的時空覆蓋。
下面就請我的同事震宇帶大家感受一下,請看大屏幕。
今天,百度自動駕駛出行服務(wù)平臺蘿卜快跑,已經(jīng)是全球最大的自動駕駛出行服務(wù)商,累計提供了超過400萬次載客服務(wù)。蘿卜快跑的全無人車,已經(jīng)跑在武漢、重慶、北京、上海、深圳等城市的很多個區(qū)域。
我相信,隨著運營規(guī)模的不斷擴大、技術(shù)水平的不斷提升,成本更低的自動駕駛車輛的規(guī)?;渴?,蘿卜快跑將越來越接近商業(yè)化盈利。
讓我們共同期待,AI原生出行時代的到來。
隨著大模型技術(shù)不斷提升,我堅信,從今往后,大量AI原生應(yīng)用將不斷涌現(xiàn),數(shù)字技術(shù)與實體經(jīng)濟將深度融合。
我們的大模型技術(shù)已應(yīng)用在制造、能源、電力、化工、交通等實體產(chǎn)業(yè)中。
用智能巡檢降低安全隱患、用智能調(diào)度縮短交付周期、用智能決策提升企業(yè)效率、用智能信控解決交通擁堵…大模型正成為新型工業(yè)化的重要推動力。
《時代》周刊在一期封面文章中寫道,“AI的獨特性…是它不僅能模仿人類的某些技能,還能執(zhí)行我們難以完成的任務(wù)。然而,推動機器學習和大語言模型每一次進步的背后,其實都是人類?!?對這句話,我非常贊同。
新的世界、新的未來,將在每個企業(yè)、每個開發(fā)者、每位用戶的一次次Prompt中生成。我們即將進入一個AI原生的時代,進入一個人機通過prompt來交互的時代,未來將由你生成!未來由我們一起生成!謝謝大家!
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 特斯拉CEO馬斯克身家暴漲,穩(wěn)居全球首富寶座
- 阿里巴巴擬發(fā)行 26.5 億美元和 170 億人民幣債券
- 騰訊音樂Q3持續(xù)穩(wěn)健增長:總收入70.2億元,付費用戶數(shù)1.19億
- 蘋果Q4營收949億美元同比增6%,在華營收微降
- 三星電子Q3營收79萬億韓元,營業(yè)利潤受一次性成本影響下滑
- 賽力斯已向華為支付23億,購買引望10%股權(quán)
- 格力電器三季度營收同比降超15%,凈利潤逆勢增長
- 合合信息2024年前三季度業(yè)績穩(wěn)健:營收增長超21%,凈利潤增長超11%
- 臺積電四季度營收有望再攀高峰,預計超260億美元刷新紀錄
- 韓國三星電子決定退出LED業(yè)務(wù),市值蒸發(fā)超4600億元
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。