在“百模大戰(zhàn)”重生,搜索引擎又行了?

文丨智能相對(duì)論

作者丨沈浪

“我想讓人們知道,是我們(微軟)讓他們(谷歌)‘跳舞’。”

當(dāng)加入ChatGPT功能的新一代Bing上線,微軟CEO納德拉就已經(jīng)按耐不住向谷歌發(fā)起了挑戰(zhàn)。他認(rèn)為加入新一代人工智能對(duì)搜索是一次重新思考的變革,從現(xiàn)在開(kāi)始,包括核心排名在內(nèi)的幾乎所有東西都可以重新想象。

微軟CEO納德拉與OpenAI創(chuàng)始人奧特曼

AI大模型的加持下,搜索的游戲規(guī)則正面臨顛覆性的改變,對(duì)應(yīng)的市場(chǎng)的格局也要重塑。很顯然,如果AI大模型能“上岸”,那么這第一劍大概率就先斬向傳統(tǒng)的搜索巨頭。

在AI大模型的推動(dòng)下,微軟和谷歌之間的戰(zhàn)爭(zhēng)已經(jīng)打響,而國(guó)內(nèi)的反應(yīng)也同樣激烈。

前不久,昆侖萬(wàn)維推出國(guó)內(nèi)第一款融入大模型的搜索引擎——天工AI搜索,并宣稱(chēng)“傳統(tǒng)搜索已到了奇點(diǎn)時(shí)刻,陳舊的體驗(yàn)需要被顛覆、被改變”。換句話來(lái)說(shuō),國(guó)內(nèi)的傳統(tǒng)搜索引擎同樣面臨著新技術(shù)的挑戰(zhàn),也迎來(lái)了第一位真正意義上的大模型+搜索產(chǎn)品。

天工AI搜索首頁(yè)截圖

事實(shí)上,在天工AI搜索之外,國(guó)內(nèi)大多數(shù)大模型產(chǎn)品只是沒(méi)有明確挑戰(zhàn)傳統(tǒng)搜索引擎,但實(shí)際上在做的事情基本都離不開(kāi)對(duì)用戶(hù)搜索模式的重塑。

「智能相對(duì)論」試用了目前市面上的大多數(shù)大模型產(chǎn)品,包括通義千問(wèn)、訊飛星火、Baichuan-53B,還有文心一言等等。從體驗(yàn)來(lái)看,比起生成式AI,這些大模型產(chǎn)品更成熟的體驗(yàn)在于對(duì)用戶(hù)獲取信息模式的優(yōu)化和升級(jí),也就是搜索引擎一直在做的事情。

然而,以天工AI搜索為代表,融入大模型技術(shù)的AI+搜索引擎想要突圍,取代傳統(tǒng)的搜索引擎并沒(méi)有那么容易,一方面且不說(shuō)做大模型產(chǎn)品的廠商就不少,“百模大戰(zhàn)”還在持續(xù),另一方面融入大模型的搜索引擎能否力敵傳統(tǒng)搜索引擎,還有待驗(yàn)證。天工AI搜索的征程才剛剛開(kāi)始。

01、搜索增強(qiáng)

搜索增強(qiáng),正在成為各家大模型廠商首要強(qiáng)化的目標(biāo),百度在做,百川智能也在做。

百度副總裁、搜索平臺(tái)負(fù)責(zé)人肖陽(yáng)認(rèn)為,“ChatGPT要解決的問(wèn)題很多就是搜索要解決的問(wèn)題,它們的目標(biāo)是一致的?!薄裁茨繕?biāo)?從目前趨勢(shì)來(lái)看,應(yīng)是搜索增強(qiáng)。

百川智能認(rèn)為,搜索增強(qiáng)是解決模型時(shí)效性和幻覺(jué)的有效手段,將搜索技術(shù)與大語(yǔ)言模型能力結(jié)合實(shí)現(xiàn)了創(chuàng)新的模型優(yōu)化,也提升了 AI 回答的可用性。

對(duì)此,百川大模型融合了多個(gè)模塊,包括指令意圖理解、智能搜索和結(jié)果增強(qiáng)等組件。該體系通過(guò)深入理解用戶(hù)指令,精確驅(qū)動(dòng)查詢(xún)?cè)~的搜索,并結(jié)合大語(yǔ)言模型技術(shù)來(lái)優(yōu)化模型結(jié)果生成的可靠性。

本應(yīng)用在搜索引擎升級(jí)上的技術(shù),比如動(dòng)態(tài)超參數(shù)調(diào)整技術(shù)、智能化搜索詞生成、高質(zhì)量搜索結(jié)果篩選、RLHF 搜索結(jié)果增強(qiáng)等等,如今用在了大模型預(yù)訓(xùn)練上,由此結(jié)合大模型的產(chǎn)品表現(xiàn),打造出了一個(gè)超越傳統(tǒng)搜索引擎的AI搜索應(yīng)用。

在「智能相對(duì)論」體驗(yàn)文心一言、天工AI搜索等大模型產(chǎn)品的過(guò)程中,發(fā)現(xiàn)其背后的搜索流程和結(jié)果輸出基本都得到了不同程度的強(qiáng)化,帶來(lái)不少令人驚艷的搜索體驗(yàn)。

比如,向文心一言提問(wèn)“我10月份想去長(zhǎng)沙旅游”,結(jié)果反饋給出了長(zhǎng)沙的知名景點(diǎn)推薦。而在天工AI搜索上,除了景點(diǎn)推薦外,甚至還會(huì)給出10月份長(zhǎng)沙的天氣情況介紹、美食推薦等其他更詳細(xì)的信息。

從這一結(jié)果來(lái)說(shuō),相比傳統(tǒng)搜索引擎,大模型技術(shù)加持的智能搜索在兩大方面實(shí)現(xiàn)了升級(jí),一是對(duì)用戶(hù)需求的理解,不再是關(guān)鍵詞匹配,更多是一種對(duì)話式的交互和理解,覺(jué)得說(shuō)得不夠詳細(xì)的,還可以進(jìn)一步的追問(wèn),目前文心一言、天工AI搜索等大模型產(chǎn)品都支持。

二是對(duì)結(jié)果反饋的優(yōu)化,省去用戶(hù)查找和篩選信息的一大段過(guò)程,在大多數(shù)情況下AI都能給出相對(duì)客觀且準(zhǔn)確的答案。同時(shí),文心一言、天工AI搜索等也都會(huì)標(biāo)注相關(guān)信息的來(lái)源,便于用戶(hù)二次確認(rèn)信息的權(quán)威性與準(zhǔn)確度。

盡管也會(huì)出現(xiàn)一些答非所問(wèn)或是東拼西湊的回答,但是就現(xiàn)階段的體驗(yàn)來(lái)說(shuō),搜索強(qiáng)化下的大模型產(chǎn)品相對(duì)傳統(tǒng)搜索引擎,是有著實(shí)際性的進(jìn)步的。

02、傳統(tǒng)的桎梏

進(jìn)步是有,不足也存在。

隨著體驗(yàn)越深度,問(wèn)的問(wèn)題越多,越會(huì)發(fā)現(xiàn)當(dāng)前的大模型產(chǎn)品在搜索上同樣存在著諸多傳統(tǒng)搜索引擎遇到的問(wèn)題,比如信息的來(lái)源、知識(shí)的準(zhǔn)確性等等。

在目前的搜索體驗(yàn)上,天工AI搜索會(huì)同步給出知識(shí)、信息的參考標(biāo)注,以便用戶(hù)進(jìn)一步確認(rèn)知識(shí)、信息的準(zhǔn)確度和權(quán)威性。但,「智能相對(duì)論」也發(fā)現(xiàn),給出的參考來(lái)源大多是知乎、搜狐、新浪財(cái)經(jīng)的,同時(shí)根據(jù)問(wèn)題的類(lèi)別也會(huì)出現(xiàn)其他的來(lái)源,比如旅游相關(guān)會(huì)有馬蜂窩、攜程、本地寶的參考標(biāo)注。

這些網(wǎng)站上的信息有問(wèn)題嗎?就體驗(yàn)來(lái)說(shuō)似乎并沒(méi)有問(wèn)題,哪怕我們用傳統(tǒng)搜索引擎,搜出來(lái)的結(jié)果也大抵如此。

但是,呈現(xiàn)在一個(gè)新的產(chǎn)品上,就有較大的問(wèn)題了。如果新的AI搜索所帶給用戶(hù)的信息、知識(shí)還和傳統(tǒng)搜索引擎呈現(xiàn)出來(lái)的結(jié)果差不多,都是些未經(jīng)驗(yàn)證的、網(wǎng)友口口相傳的泛泛之談,那么搜索的結(jié)果還是沒(méi)有得到改善,只是過(guò)程變了、形態(tài)變了。

百度搜索之所以能長(zhǎng)期占據(jù)中文互聯(lián)網(wǎng)搜索Top1,有著一個(gè)非常關(guān)鍵的產(chǎn)品在支撐著——百度百科,這個(gè)產(chǎn)品的上線很大程度上提高了百度搜索的權(quán)威性、準(zhǔn)確度。

對(duì)于天工AI搜索以及其他大模型產(chǎn)品而言,實(shí)際上要建立的同樣也是這種權(quán)威性、準(zhǔn)確度。作為用戶(hù)獲取信息、知識(shí)的重要渠道,任何一個(gè)產(chǎn)品都需要讓用戶(hù)覺(jué)得自己的知識(shí)、信息是對(duì)的、準(zhǔn)確的、權(quán)威的。

當(dāng)前,市場(chǎng)上的大模型產(chǎn)品要么只給用戶(hù)一個(gè)答案,要么像天工AI搜索那樣給出一大堆第三方的來(lái)源標(biāo)注。然而,這兩種模式似乎都不能鞏固用戶(hù)對(duì)搜索結(jié)果的權(quán)威感、信任度?;蛟S,在接下來(lái)的產(chǎn)品優(yōu)化上,大模型產(chǎn)品還需要繼續(xù)做用戶(hù)教育,向用戶(hù)證明自家AI給出的答案、知識(shí)、信息等是權(quán)威的,是科學(xué)的。

回過(guò)頭來(lái)看,正對(duì)應(yīng)肖陽(yáng)的觀點(diǎn),ChatGPT和傳統(tǒng)搜索引擎的目標(biāo)是一致的。

03、新的可能

如果用搜索的視角來(lái)看大模型產(chǎn)品,很容易就能看到當(dāng)前缺什么。那么反過(guò)來(lái),如果用大模型的視角來(lái)做搜索,或許也會(huì)有新的發(fā)現(xiàn)——大模型+搜索,應(yīng)該呈現(xiàn)給用戶(hù)什么樣的體驗(yàn)?

答案絕不會(huì)是傳統(tǒng)的搜索引擎。

目前,通用人工智能的一大演進(jìn)方向是多模態(tài),而在大模型產(chǎn)品上,多模態(tài)就重塑了搜索的價(jià)值。日前,阿里云推出大規(guī)模視覺(jué)語(yǔ)言模型Qwen-VL,以通義千問(wèn)70億參數(shù)模型Qwen-7B為基座語(yǔ)言模型研發(fā),支持圖文輸入,具備多模態(tài)信息理解能力。

基于Qwen-VL,用戶(hù)的搜索體驗(yàn)得到了升級(jí)。比如,一位不懂中文的外國(guó)游客到醫(yī)院看病,不知怎么去往對(duì)應(yīng)科室,他拍下樓層導(dǎo)覽圖問(wèn)Qwen-VL“骨科在哪層”“耳鼻喉科去哪層”,Qwen-VL會(huì)根據(jù)圖片信息給出文字回復(fù)。

這是用戶(hù)獲取準(zhǔn)確信息的一個(gè)重要方式,也是搜索,但很顯然,這不同于傳統(tǒng)的搜索引擎。

如同天工AI搜索想實(shí)現(xiàn)的跨代際搜索體驗(yàn),Qwen-VL正在呈現(xiàn)出新的搜索跨越。

可以想象,在未來(lái)的時(shí)間內(nèi),搜索不再是單一的,而是多模態(tài)的、多場(chǎng)景的,比如用戶(hù)可以在旅游的過(guò)程中隨手拍下一處景點(diǎn),大模型產(chǎn)品就能給予相關(guān)的游玩建議、購(gòu)票服務(wù)等,又或者是用戶(hù)在旅游的某個(gè)瞬間聽(tīng)到一首民謠,錄下來(lái)也能在大模型產(chǎn)品上搜到相應(yīng)的歌曲等等。

基于這一趨勢(shì),大模型+搜索所帶來(lái)的新體驗(yàn)將是顛覆的。那個(gè)時(shí)候,或許搜索的奇點(diǎn)才算是正式到來(lái)了。

傳統(tǒng)的搜索引擎將黯然失色,而用戶(hù)將在大模型產(chǎn)品的智能搜索下無(wú)時(shí)無(wú)刻不在獲取新的信息、服務(wù)和體驗(yàn)。

*本文圖片均來(lái)源于網(wǎng)絡(luò)

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2023-09-24
在“百模大戰(zhàn)”重生,搜索引擎又行了?
在“百模大戰(zhàn)”重生,搜索引擎又行了?

長(zhǎng)按掃碼 閱讀全文