當(dāng)機(jī)器學(xué)習(xí)遇見(jiàn)“眾包”,新一代人工智能訓(xùn)練模式誕生

十多年前,我第一次接觸“眾包”這個(gè)概念,當(dāng)時(shí)我還是倫敦商學(xué)院的一名學(xué)生。那天,我們的教授拿著一罐硬幣走進(jìn)了教室。

他讓我們每個(gè)人都猜一下罐子里有多少錢。罐子在教室里傳了一圈,同時(shí)教授在白板上記下了每人的猜想數(shù)額,總共有100左右,當(dāng)時(shí)我估計(jì)里面有30英鎊。所有同學(xué)都估計(jì)完畢后,教授打開(kāi)了一個(gè)信封,從中取出了一張紙條并告訴我們:罐子里的硬幣實(shí)際金額為18.76英鎊。

最開(kāi)始我認(rèn)為教授想要告訴大家,“罐中幣”這個(gè)猜想本身是不合理的,但教授接下來(lái)的舉動(dòng)卻出乎我的意料:他計(jì)算了我們所有人的猜測(cè)數(shù)目的平均值,計(jì)算結(jié)果出奇地接近18.76英鎊。眾人智慧的力量就這樣呈現(xiàn)在我們眼前,并且比我們自己99%的估計(jì)值都要精準(zhǔn)(我們中只有一個(gè)人確實(shí)猜到了真實(shí)的數(shù)額)。

幾個(gè)月后,我和我的同學(xué)Janeen成立了一家眾包公司。當(dāng)時(shí)我們召集了最優(yōu)秀的安全和防務(wù)創(chuàng)新者來(lái)解決行業(yè)和政府客戶方面復(fù)雜難題。那是2005年,當(dāng)時(shí)的眾包浪潮孕育了InnoCentive、維基百科以及Amazon Mechanical Turk,這三家公司在獲取和使用大眾的知識(shí)和靈感方面處于領(lǐng)先地位。

現(xiàn)有公司還啟動(dòng)了各種眾包計(jì)劃,共同創(chuàng)建像My Starbucks Ideas(星巴克客戶意見(jiàn)及創(chuàng)意反饋網(wǎng)站)這樣的產(chǎn)品,以抓牢客戶和供應(yīng)商的心。

第二代眾包

在過(guò)去的幾年里,眾包已經(jīng)發(fā)展成為一種更務(wù)實(shí)的企業(yè)方法,企業(yè)們進(jìn)行眾包不再是為了共創(chuàng)產(chǎn)品或者提高創(chuàng)造力,而是為了對(duì)他們的人工智能系統(tǒng)進(jìn)行訓(xùn)練。

谷歌董事長(zhǎng)兼長(zhǎng)期服務(wù)首席執(zhí)行官Eric Schmidt在2016年表示,下一代谷歌將成為眾包AI公司。他說(shuō),如果他想創(chuàng)辦一家新公司,他會(huì)以眾包的形式從眾多專家中獲取數(shù)據(jù),并用于培養(yǎng)具有學(xué)習(xí)能力的人工智能,這些人工智能最終會(huì)變得比任何一位專家都更加優(yōu)秀,然后我們會(huì)將我們的人工智能反過(guò)來(lái)賣給這些專家。

還有一些大型企業(yè)利用眾包來(lái)提供那些通常由承包商或員工執(zhí)行的服務(wù)。例如,Swisscom收購(gòu)了眾包平臺(tái)Mila,并將其維護(hù)和維修工作進(jìn)行對(duì)外眾包。該公司似乎還希望通過(guò)智能手機(jī)和AR從這些人群中收集數(shù)據(jù),用于培訓(xùn)AI系統(tǒng)來(lái)執(zhí)行大部分人工工作。

那么人群目前來(lái)講只是AI的炮灰嗎?

眾包的關(guān)鍵是外包“微任務(wù)”,這些“微任務(wù)”往往不需要個(gè)人付出太多努力(比如猜測(cè)罐子里的硬幣數(shù)額),但當(dāng)這些任務(wù)被眾人執(zhí)行時(shí)卻能帶來(lái)真實(shí)的價(jià)值。

人工智能的時(shí)代,我們看到了這樣的一個(gè)反差現(xiàn)象:?jiǎn)为?dú)的個(gè)人數(shù)據(jù)是無(wú)用的,但數(shù)千個(gè)的眾人數(shù)據(jù)卻能夠共同創(chuàng)造出真實(shí)價(jià)值。

但我預(yù)測(cè)眾包會(huì)走的更遠(yuǎn)。今天,我們正在利用人群的知識(shí)以對(duì)數(shù)據(jù)進(jìn)行判斷——例如將圖片標(biāo)記為日落或日出。但下一步將是人群自主提供數(shù)據(jù)集,例如,我們可以每天以人工智能系統(tǒng)所需的數(shù)據(jù)格式提供有關(guān)我們自己的健康信息,以便醫(yī)藥公司開(kāi)發(fā)新藥。比如我曾經(jīng)推薦過(guò)的一家強(qiáng)大的非營(yíng)利性企業(yè),即CancerBase,就正在研究治療癌癥的方法。在下一代眾包中,人群將會(huì)因其提供數(shù)據(jù)而獲得報(bào)酬,或者像CancerBase一樣,人群將會(huì)自愿免費(fèi)提供數(shù)據(jù),以幫助推進(jìn)人類醫(yī)療水平的發(fā)展。

那么在新一代的眾包背景下,我的“罐中幣”問(wèn)題會(huì)變成什么樣呢?教授不會(huì)要求學(xué)生對(duì)硬幣的數(shù)量進(jìn)行估計(jì),而是要求他們每個(gè)人從錢包中拍下一組隨機(jī)的硬幣照片。然后,學(xué)生將會(huì)在照片上寫(xiě)上圖片中的硬幣數(shù)量,并將這張照片發(fā)送到AI應(yīng)用程序,然后該AI就精確地判斷出任何罐子中包含的硬幣數(shù)額。

歡迎來(lái)到一個(gè)嶄新的眾包世界,而我們每個(gè)人都將為眾包提供數(shù)據(jù)。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2018-09-04
當(dāng)機(jī)器學(xué)習(xí)遇見(jiàn)“眾包”,新一代人工智能訓(xùn)練模式誕生
十多年前,我第一次接觸“眾包”這個(gè)概念,當(dāng)時(shí)我還是倫敦商學(xué)院的一名學(xué)生。那天,我們的教授拿著一罐硬幣走進(jìn)了教室。他讓我們每個(gè)人都猜一下罐子里有多少錢。

長(zhǎng)按掃碼 閱讀全文