IBM Watson首席技術(shù)官:機(jī)器學(xué)習(xí)的三個挑戰(zhàn)

高層速讀

1.關(guān)鍵事件:IBM Watson的首席技術(shù)官Rob High接受采訪,談到當(dāng)前人工智能發(fā)展存在的問題與挑戰(zhàn);

2.關(guān)鍵信息:

1.目前機(jī)器學(xué)習(xí)中最大的技術(shù)挑戰(zhàn)就是如何使用較少的數(shù)據(jù)來訓(xùn)練模型,Rob High相信這可能實現(xiàn);

2.要實現(xiàn)更好的人機(jī)互動,機(jī)器要做的不止于完成語言對話;

3.當(dāng)前正在使用的許多機(jī)器學(xué)習(xí)模型都因為它們使用的訓(xùn)練數(shù)據(jù)而形成本質(zhì)上的偏見。

在巴塞羅那舉行的2018MWC世界移動大會上,IBM Watson*的首席技術(shù)官 Rob High接受采訪時,談到了當(dāng)前機(jī)器學(xué)習(xí)面臨的三個問題與挑戰(zhàn)。

IBM Watson首席技術(shù)官:機(jī)器學(xué)習(xí)的三個挑戰(zhàn)

IBM Watson:認(rèn)知計算系統(tǒng)的杰出代表,也是一個技術(shù)平臺。認(rèn)知計算代表一種全新的計算模式,它包含信息分析,自然語言處理和機(jī)器學(xué)習(xí)領(lǐng)域的大量技術(shù)創(chuàng)新,能夠助力決策者從大量非結(jié)構(gòu)化數(shù)據(jù)中揭示非凡的洞察。

一.用更少的數(shù)據(jù)訓(xùn)練模型

對于Rob High來說,目前機(jī)器學(xué)習(xí)中最大的技術(shù)挑戰(zhàn)就是如何使用較少的數(shù)據(jù)來訓(xùn)練模型?!斑@是一個挑戰(zhàn),一個目標(biāo),而且我們肯定有理由相信這可能實現(xiàn)?!?/p>

通常,機(jī)器學(xué)習(xí)模型需要在大量數(shù)據(jù)上進(jìn)行訓(xùn)練,以確保它們是準(zhǔn)確的,但是對于許多問題來說,大型數(shù)據(jù)集根本不存在。

然而,High認(rèn)為大型數(shù)據(jù)集的問題是可以解決的。為什么呢?“因為人類就是這么做的。我們有一個數(shù)據(jù)點(data point)。“他說,“要知道,即使某件人類正在做的事情已經(jīng)被證明,你也必須認(rèn)識到,這不僅僅是某個部分,不僅僅是某個時間段告訴人們?nèi)祟惾绾螌W(xué)習(xí),是這整個文本提供了很多有價值的東西。對于High而言,正是這種文本,才使得用更少數(shù)據(jù)培訓(xùn)模型,以及遷移學(xué)習(xí)方面的最新進(jìn)展成為可能。也就是說,采用一種經(jīng)過訓(xùn)練的模型,然后靠其數(shù)據(jù)來啟動另一個可以有更少訓(xùn)練數(shù)據(jù)的模型。

IBM Watson首席技術(shù)官:機(jī)器學(xué)習(xí)的三個挑戰(zhàn)

▲Rob High

二.真正理解人類互動

人工智能(尤其是對話型人工智能)的挑戰(zhàn)卻不止于此。“另一方面,我們一直在試圖弄明白機(jī)器如何才能更好地與人類互動,以一種自然的,并且能對他們的思維產(chǎn)生影響的方式?!盚igh說,“人類互動不僅受語言對話影響,對語音語調(diào)、韻律、表情、手勢等的感知也有影響作用。High認(rèn)為人工智能不是一定要以擬人化形式模仿人類互動,但也許需要其他形式,比如一種視覺提示裝置。

同時,大多數(shù)人工智能系統(tǒng)還需要更好地理解一個問題的意圖,以及這個意圖如何與先前某個問題相聯(lián)系,以及他們當(dāng)時的心理和性格狀態(tài)。

三.模型中的偏見

不過這也引出了另一個問題。目前正在使用的許多機(jī)器學(xué)習(xí)模型都因為它們使用的訓(xùn)練數(shù)據(jù)而形成本質(zhì)上的偏見。比如,如果你是白人男性,那么一個給定的模型將會運行得很好;但是,如果你是黑人女性,這個模型可能就不適用了?!笆紫?,我認(rèn)為這個問題有兩個方面。其一是,數(shù)據(jù)集可能存在總體偏差,我們必須對此敏感;這也迫使我們考慮一些其他數(shù)據(jù),從而在文化和人口統(tǒng)計學(xué)方面,拓寬其能代表的人。但是,另一方面,你實際上希望這種系統(tǒng)中的總體偏差能夠跨越個人偏見

例如,High引用IBM與斯隆凱特琳癌癥中心[點擊了解相關(guān)信息]合作的例子。IBM與其這家醫(yī)院的一些頂級癌癥外科醫(yī)生進(jìn)行合作,并以此為基礎(chǔ),訓(xùn)練了一個模型。“但是斯隆·凱特琳有一個關(guān)于如何制藥的特殊價值體系。因此這種價值體系嵌入在他們的偏見中。這是他們的制度偏見,是他們的品牌…并且任何即將被用于斯隆·凱特琳之外的系統(tǒng)都需要推進(jìn)同樣的價值體系。

“要確保這些東西的偏向正確,既要確保提交給正確的人,還要確保這些人代表能更廣泛文化。”High表示現(xiàn)在定期地與IBM的客戶一起進(jìn)行這樣的討論,在一個仍然經(jīng)常忽略這些話題行業(yè)里,這是一個積極跡象。

微信搜索【AI商業(yè)報道】,獲取最新行業(yè)資訊!

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-03-01
IBM Watson首席技術(shù)官:機(jī)器學(xué)習(xí)的三個挑戰(zhàn)
談到當(dāng)前人工智能發(fā)展存在的問題與挑戰(zhàn);2 關(guān)鍵信息:1 目前機(jī)器學(xué)習(xí)中最大的技術(shù)挑戰(zhàn)就是如何使用較少的數(shù)據(jù)來訓(xùn)練模型。

長按掃碼 閱讀全文