原標(biāo)題:全民參與、十萬(wàn)機(jī)構(gòu)、百萬(wàn)搜索詞:百度打響公立機(jī)構(gòu)官網(wǎng)保護(hù)戰(zhàn)
提起城市中熟悉的醫(yī)院,相信大家會(huì)脫口而出一連串諸如“某某三院”、“某軍某院”、“幾零幾醫(yī)院”等一系列名字。我們很容易發(fā)現(xiàn),其實(shí)我們所熟悉的醫(yī)院名字基本都是俗稱、簡(jiǎn)稱。除去這些,還有些全國(guó)知名醫(yī)院的俗稱幾乎讓人摸不著頭腦:例如因?yàn)榉宽斒羌t色所以被稱為“紅房子醫(yī)院”的復(fù)旦大學(xué)婦產(chǎn)科醫(yī)院和一直用著曾用名“南京皮研所”的中國(guó)醫(yī)學(xué)科學(xué)院皮膚病醫(yī)院。
有時(shí)仔細(xì)想想,會(huì)發(fā)現(xiàn)很多時(shí)候我們只知道這些醫(yī)院的俗稱、簡(jiǎn)稱,而不知道他們的全名。對(duì)于那些跨省就醫(yī)的人來(lái)說(shuō),更是很難分辨信息。而被這些復(fù)雜名稱弄糊涂的,不僅僅有普通人,還有搜索引擎。
此前百度已經(jīng)對(duì)超過(guò)21000家公立醫(yī)院實(shí)行了品牌保護(hù)。在百度中搜索這些公立醫(yī)院的全稱時(shí),搜索結(jié)果的第一位是這些公立醫(yī)院的官方網(wǎng)站。百度希望以此來(lái)保證搜索用戶可以準(zhǔn)確地找到自己想找的公立醫(yī)院。
但問(wèn)題很快出現(xiàn)了:在搜索公立醫(yī)院時(shí),很多用戶不知道這些醫(yī)院的全稱,或者習(xí)慣性地使用民間稱呼去搜索,導(dǎo)致有可能無(wú)法準(zhǔn)確找到自己真正想要就醫(yī)的醫(yī)院官網(wǎng)。
如何確保用戶在不搜索全稱的情況下也能準(zhǔn)確搜索到自己想找的公立醫(yī)院?百度必須盡可能全面地統(tǒng)計(jì)不同公立醫(yī)院的簡(jiǎn)稱、俗稱。在沒(méi)有現(xiàn)成統(tǒng)計(jì)數(shù)據(jù)的情況下,百度開(kāi)始嘗試“集思廣益”。先是百度內(nèi)部員工開(kāi)始收集提交自己所知道的醫(yī)院俗稱,接下來(lái)又號(hào)召身邊的親戚朋友收集信息。
來(lái)自全國(guó)的公立醫(yī)院資料被陸陸續(xù)續(xù)地匯總起來(lái)。但很快百度又發(fā)現(xiàn),很多用戶會(huì)從自己理解角度去“創(chuàng)造”出一些搜索關(guān)鍵詞,光靠百度自己的力量,很難實(shí)現(xiàn)對(duì)于這些關(guān)鍵詞的全面覆蓋。于是百度干脆發(fā)動(dòng)了群眾的力量,對(duì)外公開(kāi)收集信息,并在雙微上打開(kāi)溝通窗口。得來(lái)的信息,也要根據(jù)衛(wèi)健委的名單反復(fù)核驗(yàn),甚至去實(shí)地走訪。
目前,百度已經(jīng)為超過(guò)3萬(wàn)家公立醫(yī)院、14.5萬(wàn)個(gè)詞條(包括全稱詞、簡(jiǎn)稱詞、俗稱詞、變體詞)提供保護(hù),覆蓋率高達(dá)99%。
這一場(chǎng)“名稱之戰(zhàn)”,才剛剛吹響戰(zhàn)歌。
公立機(jī)構(gòu)官網(wǎng)保護(hù):以權(quán)威之名
實(shí)際上,除了公立醫(yī)院之外,學(xué)校、景點(diǎn)、政府機(jī)關(guān)等公立機(jī)構(gòu)都會(huì)面對(duì)類似的問(wèn)題。百度“公立機(jī)構(gòu)官網(wǎng)保護(hù)計(jì)劃”正是為解決這些問(wèn)題而生。通過(guò)該計(jì)劃,網(wǎng)民在百度搜索政府機(jī)關(guān)、事業(yè)單位等公立機(jī)構(gòu)時(shí),百度將優(yōu)先展示經(jīng)過(guò)認(rèn)證的公立機(jī)構(gòu)官網(wǎng)或相關(guān)信息,并對(duì)搜索結(jié)果標(biāo)注官方認(rèn)證標(biāo)識(shí)。
截至目前,百度“公立機(jī)構(gòu)官網(wǎng)保護(hù)計(jì)劃”已引入超過(guò)10萬(wàn)家公立機(jī)構(gòu)官網(wǎng),涉及700萬(wàn)個(gè)搜索詞,覆蓋了政府機(jī)關(guān)、事業(yè)單位、醫(yī)院、殯儀館、學(xué)校、博物館、景區(qū)等公立機(jī)構(gòu),未來(lái)覆蓋范疇還將持續(xù)增加。
為什么執(zhí)著于做公立機(jī)構(gòu)的官網(wǎng)保護(hù)?如果把搜索引擎比作一個(gè)碼頭,聚集來(lái)的人們有著不同的目的地。有人想要知道某一座城市的天氣,有人想要知道某一位明星的信息。但最“古老”同時(shí)又需求量極大的目的地,一定是“尋址需求”,幫助用戶找到權(quán)威官方網(wǎng)站發(fā)布的內(nèi)容或正確的地址。換句話說(shuō),就是為用戶提供權(quán)威信息,保證能讓他們搭乘上安全的船只,去往正確的方向。
但“保證權(quán)威”這件事并沒(méi)有想象中那么簡(jiǎn)單。搜索引擎的應(yīng)用率越高、用戶量越大,人與計(jì)算機(jī)之間思維模式的差異就愈發(fā)凸顯。對(duì)于人類來(lái)說(shuō),建立在自己常識(shí)累積之上,可以對(duì)信息的正確與否進(jìn)行一個(gè)基本的判斷。但對(duì)于計(jì)算機(jī)來(lái)說(shuō),所有信息都是0和1的字符,同時(shí)也很難通過(guò)交互徹底理解搜索者的意圖。計(jì)算機(jī)本身沒(méi)有辨別權(quán)威的能力,那么人類是否能夠按照計(jì)算機(jī)的思維邏輯,建立出一套識(shí)別體系來(lái)?
答案是確定的。
為了保證搜索的權(quán)威性,百度多年來(lái)摸索出了一套適合自己的“權(quán)威性AI系統(tǒng)”,通過(guò)“基礎(chǔ)數(shù)據(jù)+搜索策略+前端展現(xiàn)”等手段,來(lái)保證公立機(jī)構(gòu)官網(wǎng)的優(yōu)先呈現(xiàn)。
首先,作為搜索引擎,百度的爬蟲(chóng)系統(tǒng)和日志系統(tǒng)會(huì)盡可能地窮盡網(wǎng)絡(luò)上的海量信息數(shù)據(jù),包括從網(wǎng)站的標(biāo)題、內(nèi)容、圖片、音視頻到網(wǎng)頁(yè)間的鏈接指向關(guān)系等,并通過(guò)人工智能、大數(shù)據(jù)等手段,進(jìn)一步分析各類數(shù)據(jù)中內(nèi)外部之間的關(guān)聯(lián)信息。
其次,在數(shù)據(jù)之上,百度通過(guò)自研的各種策略,進(jìn)一步過(guò)濾清洗數(shù)據(jù),降低互聯(lián)網(wǎng)中不良數(shù)據(jù)對(duì)各類搜索效果的影響,同時(shí)進(jìn)一步建立圍繞官網(wǎng)識(shí)別和排序的自動(dòng)化策略,當(dāng)用戶發(fā)起搜索需求時(shí),百度會(huì)將相關(guān)官網(wǎng)的信息優(yōu)先展現(xiàn)出來(lái)。
舉例來(lái)講,當(dāng)用戶搜索“蘋果手機(jī)電池維修”時(shí),更傾向于瀏覽蘋果官網(wǎng)中的內(nèi)容,而不是和關(guān)鍵詞匹配度更高的內(nèi)容。從人類思維的角度來(lái)看,多半是因?yàn)槿藗兤毡檎J(rèn)為在官方渠道修理手機(jī)更加安全保險(xiǎn)。當(dāng)百度通過(guò)數(shù)據(jù)識(shí)別到這種特殊情況,就會(huì)制定出專門的策略,讓官網(wǎng)內(nèi)容優(yōu)先顯示,以更好地滿足用戶需求。
最后,在前端展現(xiàn)上,百度通過(guò)對(duì)公立機(jī)構(gòu)官網(wǎng)增加“官網(wǎng)”標(biāo)志、優(yōu)先展示等方式,來(lái)讓用戶更放心地點(diǎn)擊進(jìn)入官網(wǎng)。
由此我們可以清晰地看到百度在增強(qiáng)搜索權(quán)威性時(shí)采取的邏輯:通過(guò)豐富的用戶行為累積,結(jié)合強(qiáng)大的數(shù)據(jù)分析能力,把人的經(jīng)驗(yàn)轉(zhuǎn)換成計(jì)算機(jī)的智能行為準(zhǔn)則。也就是說(shuō)在建立權(quán)威性AI系統(tǒng)的過(guò)程中,龐大的數(shù)據(jù)累積、強(qiáng)大的數(shù)據(jù)分析能力和AI構(gòu)建能力都是缺一不可的。
全民參與“名稱之戰(zhàn)”
但技術(shù)并非萬(wàn)無(wú)一失,“權(quán)威性AI系統(tǒng)”也會(huì)遇上難題。
比較明顯的例子,是前文提到的用戶搜索習(xí)慣問(wèn)題,不同地域的人們有著對(duì)本地機(jī)構(gòu)豐富的俗稱、簡(jiǎn)稱,光靠百度自己的能力很難把這些關(guān)鍵詞統(tǒng)統(tǒng)收錄起來(lái)。
另外一個(gè)難點(diǎn),存在于各種公立機(jī)構(gòu)官網(wǎng)本身的的不規(guī)范性。很多公立機(jī)構(gòu)在建站時(shí)完全依靠外包系統(tǒng),自身又缺乏互聯(lián)網(wǎng)方面的常識(shí)。有時(shí)會(huì)出現(xiàn)頻繁變更域名,又不在原來(lái)域名基礎(chǔ)上做定向跳轉(zhuǎn)的情況。這樣一來(lái),即使是AI系統(tǒng)也很難識(shí)別出域名變化,無(wú)法進(jìn)一步幫助官網(wǎng)進(jìn)行保護(hù)。
更別說(shuō)封禁IP和Robots聲明這樣的問(wèn)題了——個(gè)別官網(wǎng)本身不允許搜索引擎進(jìn)行抓取和收錄,或是封禁了搜索的IP。對(duì)于百度這樣的搜索引擎來(lái)說(shuō),不論是官網(wǎng)網(wǎng)址本身還是官網(wǎng)里面的內(nèi)容,都無(wú)法呈現(xiàn)給用戶。
在重重困難面前,百度仍然在借助技術(shù)手段,不斷優(yōu)化基礎(chǔ)數(shù)據(jù)和搜索策略、前端展現(xiàn)等環(huán)節(jié),盡力提升搜索體驗(yàn)。因?yàn)椴徽撍阉饕鎻腜C進(jìn)化到移動(dòng)端,還是像今天這樣打開(kāi)語(yǔ)音交互的入口,用戶對(duì)于權(quán)威信息的需求是從未改變的,這也是“名稱之戰(zhàn)”最需要獲得的戰(zhàn)果。
但顯然,想要獲得這一戰(zhàn)果,僅憑改善技術(shù)是不足夠的。百度也開(kāi)始尋求一種新的方式,來(lái)引入更多社會(huì)公眾的力量。百度“公立機(jī)構(gòu)官網(wǎng)保護(hù)共建平臺(tái)”誕生了。
當(dāng)你搜索的公立機(jī)構(gòu)官網(wǎng)不在百度保護(hù)之列,可以登陸“百度公立機(jī)構(gòu)官網(wǎng)保護(hù)共建平臺(tái)”進(jìn)行反饋和數(shù)據(jù)提交,經(jīng)百度審核通過(guò)后,該公立機(jī)構(gòu)官網(wǎng)即可在搜索結(jié)果中給予官網(wǎng)認(rèn)證、置頂和廣告避讓。
這場(chǎng)全民參與的“名稱之戰(zhàn)”,顯然比僅憑一己之力來(lái)得效率高?!肮C(jī)構(gòu)官網(wǎng)保護(hù)共建平臺(tái)”上線僅一個(gè)月,就收到了來(lái)自600多位用戶提交的748個(gè)網(wǎng)站數(shù)據(jù),覆蓋了1674個(gè)不同搜索名稱。經(jīng)審核后,最終上線了662個(gè)有效官網(wǎng),包含1249個(gè)“常用名稱”。
世界,與科技一起進(jìn)化
隨著科技互聯(lián)網(wǎng)的普及,科技產(chǎn)品與人們的生活已經(jīng)連接的非常的緊密。對(duì)于用戶來(lái)說(shuō),科技產(chǎn)品讓他們獲得了豐富的信息和便利的服務(wù),在未來(lái)還會(huì)關(guān)系到他們的出行、教育、金融、政務(wù)等等。在這樣的全面覆蓋之下,即使是一個(gè)小小的保護(hù)用戶權(quán)益的舉措,也能為整個(gè)社會(huì)帶來(lái)巨大的價(jià)值。
除了百度自己在加強(qiáng)搜索引擎的權(quán)威性以外,我們也能看到很多企業(yè)在做著相同的努力:智能音箱正在加入越來(lái)越多的障礙人士友好功能、AI技術(shù)可以幫助人們識(shí)別出聽(tīng)障人士的手語(yǔ)、大量級(jí)的互聯(lián)網(wǎng)平臺(tái)開(kāi)始向公益事業(yè)輸送流量……優(yōu)化自己的業(yè)務(wù),也間接改變了世界的模樣。
但是從百度公立機(jī)構(gòu)官網(wǎng)保護(hù)計(jì)劃的案例中,我們也有了新的發(fā)現(xiàn)??萍蓟ヂ?lián)網(wǎng)產(chǎn)品本身?yè)碛袕?qiáng)大的連接性,也正因如此,僅僅憑借科技企業(yè)本身,不能完全實(shí)現(xiàn)對(duì)用戶權(quán)益的保護(hù)。
相信類似的問(wèn)題絕不僅僅發(fā)生在搜索引擎中??萍颊诎颜麄€(gè)世界以一種不可想象的方式捏合在一起,為了讓這種組合更加安全和牢靠,僅僅依靠科技產(chǎn)業(yè)自己的努力是不夠的。被組合在一起的每一份子,都有去參與和改變的責(zé)任。
整個(gè)世界的滾滾向前,也就在每一份子的微小改變中被推動(dòng)著。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過(guò)熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無(wú)人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開(kāi)展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。