本文選自:人工智能學(xué)家(公眾號(hào) AItists)
一、人工智能能否超越人類智慧的爭(zhēng)議
21世紀(jì)以來(lái),人工智能領(lǐng)域陸續(xù)爆發(fā)很多重要事件。其中最吸引人們眼球的,當(dāng)屬2016年戰(zhàn)勝了人類圍棋冠軍并開(kāi)始能夠從0自我學(xué)習(xí)的AlphaGo,
10月1日,美國(guó)CBNC,麻省理工科技評(píng)論等媒體報(bào)道根據(jù)中國(guó)研究團(tuán)隊(duì)的研究,谷歌、Siri、百度、Bing等人工智能系統(tǒng)智商仍然大幅度低于人類6歲兒童。
而與之形成鮮明對(duì)比的是,10月26日,軟銀CEO孫正義在沙特阿拉伯舉行的未來(lái)投資計(jì)劃大會(huì)上稱,未來(lái)30年內(nèi)AI的智商(IQ)將達(dá)到10000。這次大會(huì)上機(jī)器人公民索菲亞(Sophia)被宣布成為沙特阿拉伯的機(jī)器公民,這些事件讓人工智能與人類關(guān)系的討論變得更熱烈,更多人擔(dān)心機(jī)器人最終會(huì)使得人類變成無(wú)用的生物,甚至?xí)?dǎo)致人類的滅絕。
包括著名的物理學(xué)家霍金,微軟創(chuàng)始人比爾蓋茨,特斯拉CEO馬斯克,軟銀集團(tuán)創(chuàng)始人孫正義等。發(fā)表觀點(diǎn)指出人工智能將超越人類并對(duì)人類產(chǎn)生威脅。
另一方面,人工智能領(lǐng)域科學(xué)家對(duì)人工智能威脅論也提出了反駁或不同意見(jiàn)。這其中就包括Facebook人工智能實(shí)驗(yàn)室主任YannLeCun,前谷歌大腦創(chuàng)始人吳恩達(dá)等。
二、AI智商評(píng)測(cè)的發(fā)展與困難
面對(duì)AI的突然爆發(fā),人工智能威脅論的廣泛傳播,那么AI究竟能不能超越人類,AI智能水平究竟達(dá)到什么水平,各種智能產(chǎn)品究竟有多少智能,各種爆炸性的AI和機(jī)器人突破事件究竟是否真實(shí)?
這些問(wèn)題需要在科學(xué)上有一套方法,能夠?qū)ΠˋI系統(tǒng),人類和其他智能體進(jìn)行統(tǒng)一的智能水平測(cè)試,以判斷它們的發(fā)展水平。
目前人工智能定量評(píng)測(cè)面臨兩個(gè)重要挑戰(zhàn):第一,人工智能系統(tǒng)目前沒(méi)有形成統(tǒng)一的模型;第二,人工智能系統(tǒng)與以人類為代表的生命體之間的比較目前沒(méi)有統(tǒng)一的模型。
這兩個(gè)挑戰(zhàn)都指向了同一個(gè)問(wèn)題,即對(duì)于所有的人工智能系統(tǒng)和所有生命體(特別是以人類為代表的生命體)需要有一個(gè)統(tǒng)一的模型進(jìn)行描述,只有這樣才能在這個(gè)模型上建立智力測(cè)量方法并進(jìn)行測(cè)試。
從1950年圖靈測(cè)試提出以來(lái),科學(xué)家已經(jīng)為人工智能發(fā)展的評(píng)價(jià)體系做了很多工作。
1950年,圖靈提出了著名的圖靈實(shí)驗(yàn),采用提問(wèn)和人類裁判的方法,判斷一臺(tái)計(jì)算機(jī)是否具有同人相當(dāng)?shù)闹橇ΑW鳛樽畋粡V泛應(yīng)用的人工智能測(cè)試方法,但圖靈測(cè)試并不檢驗(yàn)Ai的智能發(fā)展水平,只是判斷智能系統(tǒng)能否與人類智能相同,而且受人為因素干擾太多,嚴(yán)重依賴于裁判者和被測(cè)試者的主觀判斷,因此往往有人在沒(méi)有得到嚴(yán)格驗(yàn)證的情況下宣稱其程序通過(guò)圖靈測(cè)試,
2015年3月24日“美國(guó)科學(xué)院院刊(PNAS)發(fā)表一篇論文,提出一種新的圖靈測(cè)試方法“Visual Turing test” ,這種測(cè)試方法用來(lái)對(duì)計(jì)算機(jī)的圖像認(rèn)知能力進(jìn)行更為深入的評(píng)估。
2014年美國(guó)佐治亞技術(shù)學(xué)院的瑞德教授(Mark O. Riedl)認(rèn)為,智能的本質(zhì)在于創(chuàng)造力。他設(shè)計(jì)了一個(gè)叫做Lovelace 2.0版本的測(cè)試。Lovelace 2.0的測(cè)試范圍包括:創(chuàng)作有虛擬故事的小說(shuō)、詩(shī)歌創(chuàng)作、油畫和音樂(lè)等。
在解決人工智能定量測(cè)試的問(wèn)題上,包括圖靈測(cè)試在內(nèi)的各種方案還存在兩個(gè)問(wèn)題:第一,這些測(cè)試方法沒(méi)有形成統(tǒng)一的智能模型,并以此為基礎(chǔ)進(jìn)行分析,區(qū)分智能的多個(gè)分類。導(dǎo)致無(wú)法將不同的智能系統(tǒng)包括人類進(jìn)行統(tǒng)一的測(cè)試;第二是這些測(cè)試方法無(wú)法定量分析人工智能,或者只定量分析智能的某個(gè)方面,但這個(gè)系統(tǒng)究竟達(dá)到人類智慧的百分之多少,發(fā)展速度與人類智慧發(fā)展速度比率如何,這些問(wèn)題在上述研究中沒(méi)有涉及。
三、標(biāo)準(zhǔn)智能模型的建立與AI智商測(cè)試
針對(duì)這一問(wèn)題,科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心劉鋒、石勇、劉穎團(tuán)隊(duì)參考馮·諾伊曼結(jié)構(gòu)、戴維·韋克斯勒人類智力模型、知識(shí)管理領(lǐng)域DIKW模型體系等。從2014年開(kāi)始發(fā)表論文建立“標(biāo)準(zhǔn)智能模型”,統(tǒng)一描述人工智能系統(tǒng)和人類的特征和屬性。
這其中馮?諾伊曼結(jié)構(gòu)給予我們的啟發(fā)是:標(biāo)準(zhǔn)智能系統(tǒng)模型應(yīng)包含輸入輸出系統(tǒng),能夠從外界獲取信息,能夠?qū)?nèi)部產(chǎn)生的結(jié)果反饋給外部世界,只有這樣,標(biāo)準(zhǔn)智能系統(tǒng)才能成為“活”的系統(tǒng)。
戴維.韋克斯勒關(guān)于人類智能的定義給予我們最大的啟示是:智力能力是由多個(gè)要素組成,而非圖靈測(cè)試或視覺(jué)圖靈測(cè)試那樣只關(guān)注智力能力的一個(gè)方面。
DIKW模型體系給予我們的啟發(fā)是:智慧是一種解決問(wèn)題,積累知識(shí)的能力;知識(shí)是人類不斷與外界交互后沉淀下來(lái)結(jié)構(gòu)化的數(shù)據(jù)和信息,這提醒我們,一個(gè)智能系統(tǒng)不僅僅體現(xiàn)出知識(shí)的掌握,更重要的還有關(guān)于解決問(wèn)題的創(chuàng)新能力。
這種關(guān)于知識(shí)的掌握能力,知識(shí)的創(chuàng)新能力與戴維.韋克斯勒理論、馮.諾依曼架構(gòu)結(jié)合,就可以形成智能系統(tǒng)智力能力的多層次結(jié)構(gòu)。
這種關(guān)于知識(shí)的掌握能力,知識(shí)的創(chuàng)新能力與戴維.韋克斯勒理論、馮.諾依曼架構(gòu)結(jié)合,就可以形成智能系統(tǒng)智力能力的多層次結(jié)構(gòu)。綜上所述,我們得出智能系統(tǒng)的標(biāo)準(zhǔn)模型應(yīng)該具備一下特點(diǎn):
第一、具有輸入輸出的功能,即可以與外界通過(guò)數(shù)據(jù)、信息和知識(shí)進(jìn)行交互的能力。
第二.具有存儲(chǔ)數(shù)據(jù)、信息、知識(shí)的能力,即將外界數(shù)據(jù)、信息和知識(shí)化為自身資源的能力。
第三.具有生成新數(shù)據(jù)、信息和知識(shí)的能力,即基于自身?yè)碛械闹R(shí),在新數(shù)據(jù)或信息的啟發(fā)下,對(duì)數(shù)據(jù)、信息和知識(shí)進(jìn)行創(chuàng)新從而產(chǎn)生新的數(shù)據(jù)、信息和知識(shí)的能力,如圖1.4所示(為了簡(jiǎn)化,本圖中數(shù)據(jù)、信息、知識(shí)統(tǒng)一用知識(shí)描述)。
為了更好的分析AI,人類等智能體的智能水平,研究團(tuán)隊(duì)把“知識(shí)的獲取,掌握,創(chuàng)新和反饋”又分成15個(gè)小分類,從更多維度評(píng)測(cè)AI,人類的智能。這15個(gè)小分類是:圖像、文字、聲音的識(shí)別和輸出,常識(shí)、計(jì)算、翻譯、排列,創(chuàng)作、挑癬猜測(cè)、發(fā)現(xiàn)等。研究人員根據(jù)這些分類的維度,在2014年,對(duì)世界50個(gè)AI系統(tǒng)和3個(gè)不同年齡段人類進(jìn)了測(cè)試。
2016年2月,研究團(tuán)隊(duì)開(kāi)展了“2016年人工智能系統(tǒng)的智商測(cè)試”,對(duì)包括谷歌、百度、搜狗、蘋果Siri、微軟小冰在內(nèi)的人工智能系統(tǒng)進(jìn)行了測(cè)試,從測(cè)試結(jié)果看,谷歌、百度等人工智能系統(tǒng)的性能比兩年前已有大幅提高,但仍與6歲兒童有一定差距。
相關(guān)研究方法和測(cè)試結(jié)論發(fā)表在IJIT & DM、Annals of Data Science、中國(guó)計(jì)算機(jī)學(xué)報(bào)等SCI、EI,中國(guó)核心期刊上,這一研究成果受到了美國(guó)著名財(cái)經(jīng)媒體CNBC,麻省理工科技評(píng)論,ZDNET,YAhoo等美國(guó),德國(guó)、日本、意大利、英國(guó)、法國(guó)、俄羅斯、新加坡、臺(tái)灣地區(qū)和中國(guó)大陸媒體的報(bào)道。
從近4年的持續(xù)研究看,雖然人工智能系統(tǒng)這兩年得分增長(zhǎng)很快。在知識(shí)的掌握方面得分比較高,在知識(shí)的獲取和反饋方面有很大提高,但還有很多不足。在創(chuàng)造性這個(gè)大分類上,得分一直進(jìn)展不大。而且由于這個(gè)分類的權(quán)重又比較高,因此目前為止依然無(wú)法超越6歲的兒童。
四、未來(lái)智能實(shí)驗(yàn)室:開(kāi)展第三次世界人工智能智商測(cè)試
2017年11月,研究團(tuán)隊(duì)成立未來(lái)智能實(shí)驗(yàn)室,基于實(shí)驗(yàn)室“標(biāo)準(zhǔn)智能系統(tǒng)”、“AI智商測(cè)試量表”、“智能系統(tǒng)7個(gè)等級(jí)劃分”、“互聯(lián)網(wǎng)(城市)云腦架構(gòu)”等研究成果,建設(shè)世界第一個(gè)智能系統(tǒng)智商評(píng)測(cè)與趨勢(shì)研究機(jī)構(gòu),致力于評(píng)測(cè)智能系統(tǒng)智商發(fā)展水平,研究智能系統(tǒng)未來(lái)發(fā)展趨勢(shì)。目標(biāo)是成為世界領(lǐng)先的智能系統(tǒng)評(píng)測(cè)和發(fā)展趨勢(shì)研究機(jī)構(gòu)。
未來(lái)智能實(shí)驗(yàn)室根據(jù)人工智能的最新發(fā)展,在人工智能學(xué)家,中國(guó)科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心的支持下啟動(dòng)2018年世界AI智商評(píng)測(cè)活動(dòng)(WorldAI IQ Test 2018),對(duì)世界范圍人工智能系統(tǒng)智能發(fā)展水平進(jìn)行新的評(píng)測(cè)。以觀察世界范圍內(nèi)人工智能最新發(fā)展水平以及與人類的差距。本次活動(dòng),實(shí)驗(yàn)室將開(kāi)展多種形成的研究和評(píng)測(cè)工作,除了測(cè)試2018年人工智能的發(fā)展水平,還將第一次對(duì)互聯(lián)網(wǎng)群體智慧的智商進(jìn)行測(cè)試。
2018年世界AI智商評(píng)測(cè)(WorldAI IQ Test 2018)的主要工作包括:
1.評(píng)測(cè)主流人工智能系統(tǒng)。選擇世界范圍具有代表性的人工智能系統(tǒng),包括但不僅限于谷歌、蘋果、百度、微軟、搜狗、騰訊、亞馬遜、IBM、科大訊飛、圖靈機(jī)器人,機(jī)器人索菲亞等科技企業(yè)的產(chǎn)品按照新的世界AI智商評(píng)測(cè)量表進(jìn)行評(píng)測(cè),并與人類測(cè)試者進(jìn)行對(duì)比。2018年的評(píng)測(cè)還將第一次測(cè)試互聯(lián)網(wǎng)群體智慧的智商,與AI系統(tǒng),單個(gè)人類的智商進(jìn)行對(duì)比研究
2.把AI智商測(cè)試擴(kuò)展到整個(gè)智能行業(yè)。根據(jù)研究團(tuán)隊(duì)標(biāo)準(zhǔn)智能模型,智能分級(jí)方法,構(gòu)建更為立體的智能系統(tǒng)智商評(píng)測(cè)體系,研究團(tuán)隊(duì)發(fā)現(xiàn)根據(jù)測(cè)量對(duì)象的角色定位不同,會(huì)存在相互關(guān)聯(lián)但又有重大區(qū)別的AI 智商評(píng)測(cè)體系。WorldAI IQ Test 2018的工作將就此展開(kāi)深入研究,并開(kāi)展垂直領(lǐng)域智能系統(tǒng)的AI智商量表建立和測(cè)試工作,測(cè)試對(duì)象包括但不僅限于聊天機(jī)器人,智能音箱,智能手機(jī),服務(wù)機(jī)器人,智能汽車,智能家電,智慧城市,互聯(lián)網(wǎng)云腦等。
3.形成第二版的世界AI智商評(píng)測(cè)量表。目前“標(biāo)準(zhǔn)智能模型”的測(cè)試分類包括“圖像、文字、聲音的識(shí)別和輸出,常識(shí)、計(jì)算、翻譯、排列,創(chuàng)作、挑癬猜測(cè)、發(fā)現(xiàn)等,根據(jù)人工智能的發(fā)展?fàn)顩r和我們對(duì)智能系統(tǒng)的進(jìn)一步了解,2018年世界AI智商評(píng)測(cè)活動(dòng)將對(duì)分類和權(quán)重進(jìn)行新的調(diào)整,形成第二版的世界AI智商評(píng)測(cè)量表。
五、實(shí)驗(yàn)室相關(guān)研究論文
一.論文題目:《TheSearch Engine IQ Test based on the Internet IQ Evaluation Algorithm》;作者:劉鋒,石勇;
發(fā)表刊物:Proceedings of the Second InternationalConference on Information Technology and Quantitative Management[J] ;.ProcediaComputer Science
發(fā)表日期:2014年4月25日
二.論文題目:《WorldSearch Engine IQ Test Based on the Internet IQ Evaluation Algorithms》;作者:劉鋒,石勇;汪波
發(fā)表刊物:International Journal of InformationTechnology & Decision Making
發(fā)表日期:2015年3月11日
三.論文題目:從機(jī)器人到谷歌大腦—人工智能的6個(gè)智能等級(jí);作者:劉鋒
發(fā)表刊物:《中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊》;
發(fā)表日期:2016年4月10日
四.論文題目:《IntelligenceQuotient and Intelligence Grade of Artificial Intelligence》;作者:劉鋒,石勇;劉穎
發(fā)表刊物:Annals of Data Science;https://arxiv.org/abs/1709.10242
發(fā)表日期:2017年6月15日
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )