外媒:百度在人工智能測試中作弊

百度攤上大事了,美國網(wǎng)站MIT科技評論近日撰文對百度在人工智能測試中違規(guī)一事做出評論。文章指出,相對于其他公司一周只“購買2張彩票”,百度行為如同一周“購買200張彩票”增加了“中獎概率”。而百度和其他科技公司不惜以違規(guī)手段吹噓成果,可見機器學習對這些公司意義非凡。

  以下為文章全文:

  人工智能測試領(lǐng)域剛剛曝出了第一起作弊丑聞。上月,中國搜索引擎公司百度宣布其圖片識別軟件在精確度標準化測試中領(lǐng)先于谷歌。但本周二,該公司承諾是通過違反測試規(guī)則實現(xiàn)的這一成績。

  負責維護該測試的學術(shù)專家表示,這導致百度之前的聲明毫無意義。作為該項目的負責人,百度研究員Ren Wu已經(jīng)公開道歉,并表示該公司正在評估結(jié)果。百度也對該軟件的技術(shù)論文進行了修訂。

  目前并不清楚此舉是個人行為還是整個團隊所為,但一家擁有數(shù)十億美元收入的科技公司為什么要在這樣一次測試中作弊呢?

  百度、谷歌、Facebook等大型科技公司最近幾年都投入巨資組建研發(fā)團隊,專門研究深度學習技術(shù),他們開發(fā)的機器學習軟件已經(jīng)在語音和圖像識別領(lǐng)域?qū)崿F(xiàn)了重大進展。這些公司都在不遺余力地聘請這個小領(lǐng)域的頂尖專家,經(jīng)常會相互挖角。雖然學術(shù)界目前的人工智能標準測試數(shù)量不多,但卻可以幫助這些研究團隊與其他團隊的成就進行對比,并向公眾展開宣傳。

  百度通過作弊獲得了不公平的優(yōu)勢。要進行ImageNet Challenge測試,首先需要用150萬張標準圖片對其進行訓練,然后將代碼提交給ImageNet Challenge服務(wù)器,針對這些軟件之前沒有見過的10萬張“驗證”圖片進行測試。

  按照規(guī)定,每周只能對代碼進行兩次測試,因為最終的結(jié)果包含概率因素。

  百度承認,該公司使用多個電子郵件帳號在短短6個月的測試期內(nèi)對其代碼展開了大約200次測試——超過規(guī)定測試數(shù)量的4倍。

  艾倫人工智能學院CEO表示,百度此舉相當于購買了多張彩票。“如果你一周購買2張彩票,你大概有一個中獎概率。但如果你一周買200張彩票,概率就會增加。”他說。這樣一來,用略有不同的代碼展開多次測試,便可幫助研究團隊針對一組獨特的驗證圖片進行優(yōu)化。

  在這種測試中,很小的優(yōu)勢也會產(chǎn)生巨大的不同。百度曾經(jīng)表示,該公司的錯誤率僅為4.58%,擊敗了谷歌3月的4.82%。但一些專家指出,這么小的領(lǐng)先差距在這項測試中變得越來越?jīng)]有意義。但百度和其他公司仍在努力吹噓自己的結(jié)果,甚至不惜違反規(guī)則,足以表明在機器學習領(lǐng)域獲得領(lǐng)先優(yōu)勢對他們而言的確意義非凡。

極客君點評:“勤能補拙”有時候看起來也不一定全對。百度此番算是攤上大事了,誠信被疑,預計會對該公司今后的國際化蒙上一層陰影。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2015-06-05
外媒:百度在人工智能測試中作弊
百度攤上大事了,美國網(wǎng)站MIT科技評論近日撰文對百度在人工智能測試中違規(guī)一事做出評論。文章指出,相對于其他公司一周只購買2張彩票,百度行為如同一周購買200張彩票增加了中獎概率。而百度和其他科技公司不惜以違規(guī)手段吹噓成果,可見機器學習對這些公司意義非凡?! ∫韵聻槲恼氯?

長按掃碼 閱讀全文