改變命運的知識,也會改變?nèi)斯ぶ悄艿陌l(fā)展軌跡?

摘要:2017年,知識經(jīng)濟日益火爆,分答、知乎、得到等知識平臺可謂如日中天。眼下這種火爆已在從人類延展到機器。互聯(lián)網(wǎng)巨頭紛紛對知識變得饑渴起來,知識成為數(shù)據(jù)之后的又一個香餑餑?;ヂ?lián)網(wǎng)巨頭對知識越來越青睞兩三

2017年,知識經(jīng)濟日益火爆,分答、知乎、得到等知識平臺可謂如日中天。眼下這種火爆已在從人類延展到機器?;ヂ?lián)網(wǎng)巨頭紛紛對知識變得饑渴起來,知識成為數(shù)據(jù)之后的又一個香餑餑。

互聯(lián)網(wǎng)巨頭對知識越來越青睞

兩三年來,互聯(lián)網(wǎng)大佬言必談數(shù)據(jù),特別是大數(shù)據(jù)。曾有人戲稱馬云應(yīng)該叫“Data Ma”,因為不懂技術(shù)的馬云,十分鐘愛談大數(shù)據(jù),馬云的“五新理論”中有一個是“新能源”,其認(rèn)為未來機器吃的不是電,而是數(shù)據(jù)。其外,李彥宏、馬化騰等大佬關(guān)于大數(shù)據(jù)都有不少言論,馬化騰說數(shù)據(jù)是AI應(yīng)用的四大要素之一,李彥宏也提到:“由數(shù)據(jù)、算力、算法‘三位一體’共同驅(qū)動的人工智能或?qū)⒊蔀橥苿咏?jīng)濟增長與時代進(jìn)步的新引擎。”

數(shù)據(jù)是AI的基礎(chǔ),也是互聯(lián)網(wǎng)公司的重要資產(chǎn),通過算法挖掘可以形成可觀價值,是毋庸置疑的。不過,我觀察到,今年互聯(lián)網(wǎng)巨頭們對于數(shù)據(jù)談得少了,談知識反而越來越多。

最具代表性的是百度,新春內(nèi)部演講中,李彥宏說,“知識圖譜(包括需求圖譜、用戶畫像等等),這些東西都是百度整個人工智能當(dāng)中非?;A(chǔ)的構(gòu)件,也是我們相對于其他任何一家公司的優(yōu)勢所在?!薄胺浅!币辉~足見李彥宏對于“知識”的重視。百度總裁兼COO陸奇在今年AI開發(fā)者大會上則指出,“知識就是力量,有了知識我們可以做預(yù)測、做自動化,解決任何重要的問題,人類歷史就是改造世界、認(rèn)識世界的歷史,AI就是幫助人類認(rèn)識世界、改造世界的工具,AI是人類歷史上重要的里程碑?!痹跇I(yè)務(wù)層面,百度在知識上的底層布局就是知識圖譜。

除了百度谷歌在知識圖譜上也一直在積極布局。2012年5月,Google就推出了知識圖譜(Google Knowledge Graph),利用其優(yōu)化搜索結(jié)果。2013年,Google收購自然語言處理技術(shù)公司W(wǎng)avii,將后者技術(shù)與Google Knowledge Graph整合。2015年谷歌推出醫(yī)療版知識圖譜?,F(xiàn)在谷歌語音搜索、Google Assistant、Google Lens、Google Home諸多軟硬件產(chǎn)品均已接入谷歌知識圖譜。

不只是百度、谷歌等搜索引擎在知識圖譜上布局,阿里、華為等玩家也已在部署知識圖譜,讓自己變得更有知識。從Data到Knowledge,為什么互聯(lián)網(wǎng)巨頭們青睞的事物會有這樣的轉(zhuǎn)變?

知識對于互聯(lián)網(wǎng)究竟有何價值?

知識對于互聯(lián)網(wǎng)第一層價值是內(nèi)容或者說信息價值——就像知乎、分答、百科、知道等等知識類產(chǎn)品一樣,它們滿足了用戶的知識生產(chǎn)、共享、獲取等需求。不過,長期來看,知識對于互聯(lián)網(wǎng)的價值主要在于,起到一個從數(shù)據(jù)到AI的“橋梁”作用,它不可或缺且會日益重要。

第一,知識讓機器具有認(rèn)知能力。

每家互聯(lián)網(wǎng)公司都在強調(diào)自己擁有海量數(shù)據(jù),不過,不同數(shù)據(jù)價值是截然不同的。從應(yīng)用場景看,搜索數(shù)據(jù)、社交數(shù)據(jù)、電商數(shù)據(jù)、支付數(shù)據(jù)、視頻數(shù)據(jù)等等的價值可以說大不相同;從數(shù)據(jù)形式看,結(jié)構(gòu)化與非結(jié)構(gòu)化的數(shù)據(jù)價值不同,前者更可能被機器利用;從數(shù)據(jù)性質(zhì)看,感知類和知識類數(shù)據(jù)價值截然不同,前者是視覺、聲音、運動等物理感知數(shù)據(jù);后者則是知識類數(shù)據(jù),“人類對物質(zhì)世界以及精神世界探索的結(jié)果總和?!敝挥腥祟惒拍墚a(chǎn)生、創(chuàng)作、總結(jié)和理解的數(shù)據(jù),比如支付、搜索、創(chuàng)作、語言等等數(shù)據(jù)。

而知識類數(shù)據(jù)最核心的價值在于,可讓機器形成認(rèn)知能力。百度AIG(人工智能技術(shù)體系)負(fù)責(zé)人王海峰曾提出,AI可以分為感知層和認(rèn)知層,感知是人類和動物都有的能力,機器一定程度也可以比人類更強;但認(rèn)知是人類的專屬能力。機器感知能力目前已趨于成熟(比如百度世界大會上語音技術(shù)可以實時生成字幕,再比如圖像識別很多時候比人準(zhǔn)),但認(rèn)知能力還有很大的提升空間。知識類數(shù)據(jù)可以讓機器在感知能力的基礎(chǔ)上形成認(rèn)知能力。

第二,知識可以讓機器與人類對話。

我們要機器成為合作伙伴也好,智能助理也罷,前提就是要能夠與機器溝通,就是交互。目前我們與機器的主要交互方式,是反人性的——用輸入法打字即便再簡單也需要一定的學(xué)習(xí)成本,只有觸摸、語音、視覺這樣的交互方式才是自然的,是小孩子都擁有的能力。

盡管眼下已經(jīng)有語音交互技術(shù)、圖像識別技術(shù),但整體來說還不夠智能,比如語音無法理解長句子等復(fù)雜句式,再比如圖像識別更多是對條形碼等簡易圖片有效。要機器實現(xiàn)與人類的自然對話,像一個真正的助理那樣與用戶交互,就需要它儲備足夠多的知識。有知識儲備的機器有了認(rèn)知,就不只是擁有語音或者圖像識別能力,而是具備語義理解能力,從聽清進(jìn)步到聽懂,從看出來升級到看得懂。

再舉個例子,一個真正的秘書不只是可以識別主人,還能根據(jù)主人表情揣摩其情緒,進(jìn)而做出響應(yīng)。iPhone X的Face ID目前只能識別主人的臉,如果有了知識就可以“讀臉”揣摩主人情緒,比如用戶愁眉苦臉時可以推薦一首歡快的歌曲。百度世界大會上李彥宏演示的“火車司機疲勞識別”,本質(zhì)上就是在圖像識別技術(shù)上加載了知識圖譜后的成果,機器可以理解“什么表現(xiàn)是疲勞駕駛”。

第三,知識可以讓機器智能決策。

如果機器只有感知能力,本質(zhì)上只是改變數(shù)據(jù)輸入方式——機器的數(shù)據(jù)輸入自動化、無人化、實時化,進(jìn)而提高輸入效率、降低人力成本,增加采集場景。然而機器的本質(zhì)還是傳統(tǒng)意義上的功能計算機。就算可以做出決定,本質(zhì)也只是“if this then that”的、在人類設(shè)定的規(guī)則下的按部就班。

然而,當(dāng)機器通過足夠多的知識建立認(rèn)知能力,對世界有自己的理解后,就可以進(jìn)行智能決策。一個例子是AlphaGo——相對于深藍(lán)等基于規(guī)則的下棋程序不同,它每一步的走棋,是基于對圍棋規(guī)則的認(rèn)知以及下贏對方的目標(biāo)而進(jìn)行的,它是真正意義上的AI下棋。AlphaGo Zero則是進(jìn)階版,它可以不借助任何圍棋棋譜與人類經(jīng)驗自我學(xué)習(xí)進(jìn)步,等于說是構(gòu)建了一套自主的知識體系,它成為知識的輸出者,棋譜也值得人類棋手去學(xué)習(xí)。當(dāng)然,前提也是有圍棋規(guī)則這個人類知識的輸入。

我們不論是招聘秘書,還是聘請管家,都希望找一個“有一定想法”的,會主動思考和自我決策的人,而不是找一個讓TA做什么才做什么的人。同樣的道理,要機器有“一定的想法”,能夠自我決策,變得智能,就必須要有足夠多的知識輸入,讓其形成認(rèn)知能力。

因此可以看到,在AI時代,我們要讓機器真正意義上認(rèn)知這個世界,要讓機器與我們更自然地交互,要讓機器可以智能做出決策,都必須要輸入足夠多的知識給機器。如何給機器輸入知識?核心技術(shù)就是知識圖譜,它就像AlphaGo“吃”的棋譜一樣,是將人類掌握的不同知識進(jìn)行關(guān)聯(lián)存儲于計算機中,形成網(wǎng)狀結(jié)構(gòu)并持續(xù)動態(tài)完善,讓機器不斷汲取知識,對世界的認(rèn)知日益完善。

看到這里就能明白,為什么李彥宏會說知識圖譜是百度整個人工智能非?;A(chǔ)的構(gòu)件了。知識圖譜對于人工智能可以說是不可或缺,陸奇說,“AI革命的本質(zhì)是快速的、自動地獲取知識”,王海峰則認(rèn)為知識圖譜是AI的基石。“如果知識是人類進(jìn)步的階梯,知識圖譜就是AI進(jìn)步的階梯”,知識是AI的基礎(chǔ)已得到行業(yè)共識——有數(shù)據(jù)的巨頭企業(yè)很多,然而有知識圖譜技術(shù)的巨頭卻屈指可數(shù)。

知識圖譜到底有哪些應(yīng)用場景?

說到語音技術(shù),人們就會想到Siri;說到圖像技術(shù),人們會想到iPhone X的Face ID;說到知識圖譜,人們可能會想到百度搜索結(jié)果右側(cè)的關(guān)聯(lián)內(nèi)容,這是百度2014年便已大規(guī)模應(yīng)用的知識圖譜產(chǎn)品,3年應(yīng)用量增加了160倍。

不過,知識圖譜的應(yīng)用場景遠(yuǎn)不止于搜索,它跟自然語言處理技術(shù)一樣更為底層,很多時候是透明的,許多AI應(yīng)用,背后都在應(yīng)用知識圖譜技術(shù),目前這些場景最典型:

1、資訊。

資訊行業(yè)正在迎來一場大變革——內(nèi)容創(chuàng)作進(jìn)入自媒體時代,內(nèi)容分發(fā)信息流日益流行,而信息流的基礎(chǔ)就是個性化推薦技術(shù)。要做好個性化推薦技術(shù)只需做好兩點:一個是理解用戶的閱讀興趣;另一個是理解資訊內(nèi)容。然而兩點要做到都不容易,理解用戶的前提是足夠多的用戶興趣數(shù)據(jù),理解內(nèi)容的前提則是知識圖譜,平臺必須要有一定的“認(rèn)知”才知道不同內(nèi)容意味著什么,適合哪些興趣的用戶,而不是簡單的關(guān)鍵詞匹配。

舉個例子,一個文章內(nèi)容是馬云最新演講解讀,是將其推薦給電商行業(yè)人士,還是希望獲得成功的年輕人,還是李彥宏等企業(yè)家們?每個人都可能感興趣,如何推薦就要結(jié)合對內(nèi)容的認(rèn)知,以及對用戶興趣以及當(dāng)前場景的理解,知識圖譜就派上用場了。特別是在視頻領(lǐng)域,要理解內(nèi)容不是靠文字識別,而是要靠機器視覺技術(shù),對內(nèi)容本身的理解難度更高,知識圖譜更重要。

現(xiàn)在,今日頭條、百度、一點資訊、搜狐、網(wǎng)易、企鵝、UC、微博等等都在做信息流。百度世界大會上宣布百度信息流月活超過6億,相比去年5月剛推出時日均閱讀量提升105倍,短視頻日均播放量提升169倍,這個成果,與知識圖譜的優(yōu)勢密不可分。

2、泛娛樂。

看上去,娛樂與人工智能八竿子打不著關(guān)系,更與知識圖譜沒什么瓜葛。實則不然,傳統(tǒng)娛樂或許確實不需要什么信息技術(shù),然而新娛樂時代,技術(shù)重要性與日俱增。今年百度世界大會上,愛奇藝CEO龔宇的演講是讓人印象十分深刻的環(huán)節(jié),徹底顛覆了許多人對娛樂的認(rèn)知。

愛奇藝通過自制內(nèi)容戰(zhàn)略取得突破,推動其會員模式成功,將于2018年IPO。很少人知道的是愛奇藝一直很強調(diào)對技術(shù)的應(yīng)用,創(chuàng)作、制造、宣發(fā)、營銷、預(yù)測等等環(huán)節(jié)都應(yīng)用AI技術(shù)。比如基于機器學(xué)習(xí)的多時間窗口預(yù)測電影票房,提前半年方差準(zhǔn)確率高達(dá)77%;比如《中國有嘻哈》這個小眾音樂節(jié)目的成功,也得益于愛奇藝對年輕受眾用戶畫像再采取針對性措施;再比如愛奇藝可以基于娛樂知識圖譜來預(yù)測哪個藝人會成為下一個黑馬。

早在2015年,愛奇藝就建立了“視頻深度學(xué)習(xí)產(chǎn)學(xué)聯(lián)合實驗室”,計劃通過可視計算、機器學(xué)習(xí)、大數(shù)據(jù)挖掘算法和自然語義分析,挖掘人與視頻間的多維關(guān)系,構(gòu)建視頻知識圖譜和視頻推薦系統(tǒng),提升愛奇藝智能推薦和流量、票房預(yù)測精度。百度正在輸出AI能力,相信愛奇藝會與大股東百度有更深層次的合作,特別是視頻知識圖譜領(lǐng)域,愛奇藝將是一個絕佳場景。

3、金融。

金融是百度最先商用的AI場景,正如李彥宏所說:“金融的數(shù)據(jù)化本質(zhì),加上業(yè)務(wù)規(guī)則清晰,使它成為人工智能最佳的應(yīng)用場景。”金融的知識相對垂直,因此也非常適合與知識圖譜技術(shù)結(jié)合。我記得2015年,百度就已將知識圖譜應(yīng)用在股票領(lǐng)域,旗下產(chǎn)品股市通通過數(shù)據(jù)、信息與股票的關(guān)系,以及股票與股票之間的關(guān)系,在股票領(lǐng)域首創(chuàng)知識圖譜,實現(xiàn)智能選股。不只是百度金融在應(yīng)用知識圖譜,整個金融行業(yè)都在將知識圖譜應(yīng)用在個人征信、貸款風(fēng)控、保險銷售、保險策劃、金融指數(shù)、反欺詐、客戶管理管理、智能客服等領(lǐng)域,出現(xiàn)了不少提供金融AI技術(shù)或者是金融知識圖譜服務(wù)的創(chuàng)業(yè)公司,百度金融也在積極地推進(jìn)智能金融科技的開放,包括金融知識圖譜的開放。

4、手機。

智能手機2017年最大賣點是全面屏,同時還有一個亮點是AI——iPhone X、華為Mate 10等等旗艦機都有不少AI元素。怎樣的手機稱得上真正的AI手機?關(guān)鍵在于智能化功能和智能化能力。智能化功能上除了像FaceID這樣可以識人外,還要有比Siri更聰明的助理,真正意義上成為用戶的個人助理,給用戶做決策,這離不開知識圖譜技術(shù)。智能化能力上就是要在芯片、系統(tǒng)、云端形成AI能力,可以越用越快、安全等等,要實現(xiàn)這些能力需要手機領(lǐng)域的知識圖譜。

可以說,智能手機要AI化離不開信息/服務(wù)知識圖譜和手機知識圖譜。不過,AI技術(shù)、云服務(wù)以及知識圖譜技術(shù)都是互聯(lián)網(wǎng)巨頭擅長的事情,是多數(shù)手機公司的短板。怎么辦?最近百度與小米就AI達(dá)成深度合作,聯(lián)系到此前DuerOS與HTC、vivo等合作來看,百度未來很可能會給手機公司提供知識圖譜技術(shù)助力智能手機真正“智能”起來。

知識圖譜的應(yīng)用場景遠(yuǎn)遠(yuǎn)不止這些,它是AI的基石,理論上來說每一個AI場景都是知識圖譜的場景,而AI將改變各行各業(yè),其應(yīng)用場景之廣泛可想而知了。截至目前,百度知識圖譜已經(jīng)應(yīng)用到幾十個領(lǐng)域,百度知識圖譜技術(shù)奠基人王海峰曾在一次演講中表示:“人工智能與傳統(tǒng)產(chǎn)業(yè)融合的過程中,要想為這個行業(yè)提供更好的服務(wù),就需要對這個行業(yè)進(jìn)行定制化,要有行業(yè)知識,這時候就需要在通用知識圖譜的基礎(chǔ)上,有相應(yīng)的行業(yè)知識圖譜,進(jìn)而幫助這個行業(yè)提升生產(chǎn)力,幫助這些行業(yè)、產(chǎn)業(yè)升級?!睆倪@段話可以看出,百度知識圖譜也會開放給更多行業(yè),讓各行各業(yè)吃上知識圖譜。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-12-09
改變命運的知識,也會改變?nèi)斯ぶ悄艿陌l(fā)展軌跡?
摘要:2017年,知識經(jīng)濟日益火爆,分答、知乎、得到等知識平臺可謂如日中天。眼下這種火爆已在從人類延展到機器。互聯(lián)網(wǎng)巨頭紛紛對知識變得饑渴起來,知識成為數(shù)據(jù)之后的又一個香餑餑。

長按掃碼 閱讀全文