詳解AI領(lǐng)域“金發(fā)女郎效應(yīng)”:如何讓?xiě)?yīng)用型AI做到剛剛好?

雖然埃隆·馬斯克(Elon Musk)和馬克·扎克伯格一直在爭(zhēng)論AGI(通用人工智能,又稱強(qiáng)人工智能)的危險(xiǎn),但初創(chuàng)公司只是將人工智能應(yīng)用于解決特定領(lǐng)域問(wèn)題,例如提升銷(xiāo)售團(tuán)隊(duì)的績(jī)效以及提高生產(chǎn)線的運(yùn)營(yíng)效率,這些創(chuàng)企逐漸成長(zhǎng)為估值數(shù)十億美元的企業(yè)。然而,嚴(yán)格的定義問(wèn)題只是找到有價(jià)值的人工智能商業(yè)應(yīng)用的第一步。

為找到構(gòu)建人工智能業(yè)務(wù)的合適機(jī)會(huì),初創(chuàng)公司必須在不同的維度上運(yùn)用“金發(fā)姑娘原則”,以找到“合適”開(kāi)始的甜蜜點(diǎn)(sweet spot)——在不同維度之間注意平衡,切記不可過(guò)分專(zhuān)注一個(gè)維度。根據(jù)我們從與數(shù)千家AI創(chuàng)企合作中學(xué)到的知識(shí),以下是一些有抱負(fù)的創(chuàng)始人結(jié)合自己的人工智能策略尋找甜蜜點(diǎn)的一些方法。

“恰到好處”的預(yù)測(cè)時(shí)間范圍

與市面上其他智能軟件不同,人工智能會(huì)響應(yīng)其運(yùn)行的環(huán)境;算法接收數(shù)據(jù)并返回一個(gè)結(jié)果或預(yù)測(cè)。根據(jù)應(yīng)用程序的不同,可以對(duì)近期的情況進(jìn)行預(yù)測(cè),例如明天的天氣,也可預(yù)測(cè)出未來(lái)許多年的結(jié)果,比如患者是否會(huì)在20年內(nèi)患上癌癥。算法預(yù)測(cè)的范圍對(duì)其有效性以及是否提供構(gòu)建防御性的機(jī)會(huì)而言至關(guān)重要。

針對(duì)一個(gè)較長(zhǎng)的時(shí)間段進(jìn)行預(yù)測(cè)的算法很難做出評(píng)估和改進(jìn)。例如,算法可以使用承包商之前項(xiàng)目的時(shí)間表預(yù)測(cè)某個(gè)建筑項(xiàng)目將比計(jì)劃落后6個(gè)月并超預(yù)算20%。在新項(xiàng)目完成之前,算法設(shè)計(jì)者和最終用戶很難對(duì)此預(yù)測(cè)做出評(píng)論,只能判斷預(yù)測(cè)內(nèi)容在方向上是否正確——即項(xiàng)目是否延遲完成或成本是否更高。

即使最終的項(xiàng)目編號(hào)最終非常接近預(yù)測(cè)的數(shù)字,也很難完成反饋循環(huán)并積極地加強(qiáng)算法。許多因素會(huì)影響到復(fù)雜的程序,如建筑項(xiàng)目,因此很難利用A/B測(cè)試預(yù)測(cè)來(lái)梳理未知混雜因素的輸入變量。系統(tǒng)越復(fù)雜,算法完成加固循環(huán)所需的時(shí)間越長(zhǎng),精確訓(xùn)練算法也就越困難。

雖然很多企業(yè)客戶對(duì)使用AI解決方案持開(kāi)放態(tài)度,但為了完成銷(xiāo)售,初創(chuàng)公司必須能夠驗(yàn)證算法的性能。驗(yàn)證算法最有說(shuō)服力的方法就是借助客戶的實(shí)時(shí)數(shù)據(jù),但這種方法在試點(diǎn)期間可能很難實(shí)現(xiàn)。如果創(chuàng)企可獲權(quán)訪問(wèn)客戶的數(shù)據(jù),預(yù)測(cè)時(shí)限應(yīng)該盡量短一點(diǎn),以便在試驗(yàn)期間驗(yàn)證算法。

對(duì)于大多數(shù)AI創(chuàng)企而言,較慢的計(jì)算速度嚴(yán)重限制了應(yīng)用型人工智能的范圍。

歷史數(shù)據(jù)(若可用)可以作為訓(xùn)練算法的權(quán)宜之計(jì),并通過(guò)回溯測(cè)試暫時(shí)驗(yàn)證它。訓(xùn)練對(duì)歷史數(shù)據(jù)進(jìn)行長(zhǎng)時(shí)間范圍預(yù)測(cè)的算法是有風(fēng)險(xiǎn)的,因?yàn)檫^(guò)程和環(huán)境更有可能改變你對(duì)歷史記錄的了解,從而使得歷史數(shù)據(jù)集對(duì)當(dāng)前條件的描述性減弱。

其他情況下,雖然描述結(jié)果的歷史數(shù)據(jù)可用于訓(xùn)練算法,但可能無(wú)法捕獲在考慮范圍之內(nèi)的輸入變量。舉個(gè)建筑行業(yè)實(shí)例,你發(fā)現(xiàn)使用藍(lán)色安全帽的建筑工地更有可能按時(shí)完成項(xiàng)目,但由于帽子的顏色在之前并沒(méi)有對(duì)管理項(xiàng)目帶來(lái)任何幫助,該信息未記錄到存檔文件中。所以必須從頭開(kāi)始捕獲這些數(shù)據(jù),這將再度推遲企業(yè)的上市時(shí)間。

AI創(chuàng)企應(yīng)該建立多種算法,以較短的范圍進(jìn)行更小、更簡(jiǎn)單的預(yù)測(cè),而不是在長(zhǎng)時(shí)間范圍內(nèi)進(jìn)行單一的“hero”預(yù)測(cè)。將運(yùn)行環(huán)境分解為更簡(jiǎn)單的子系統(tǒng)或在過(guò)程中限制數(shù)據(jù)的數(shù)量,使其更容易控制混雜因素。Autodesk的BIM 360項(xiàng)目IQ團(tuán)隊(duì)將這種小型預(yù)測(cè)方法應(yīng)用于建筑行業(yè),消除了施工過(guò)程中的眾多低效問(wèn)題,并有助于消除潛在的設(shè)計(jì)與施工風(fēng)險(xiǎn)。其算法模型可預(yù)測(cè)安全性,并對(duì)供應(yīng)商和分包商的質(zhì)量/可靠性進(jìn)行評(píng)估,所有數(shù)據(jù)都可以項(xiàng)目進(jìn)行周期中進(jìn)行測(cè)量。

較短的時(shí)間范圍便于算法工程師監(jiān)控其性能變化并采取措施快速改進(jìn),而僅限于對(duì)歷史數(shù)據(jù)進(jìn)行回溯測(cè)試。時(shí)間范圍越短,算法的反饋回路越短。每個(gè)周期做出的反饋逐漸累加,可增強(qiáng)算法的性能,較短的反饋周期更有利于構(gòu)建防御性。

“恰到好處”的可操作窗口

大多數(shù)算法對(duì)動(dòng)態(tài)系統(tǒng)進(jìn)行建模并返回一個(gè)預(yù)測(cè)結(jié)果供人類(lèi)采納。由于系統(tǒng)更改頻繁,算法的輸出很難在長(zhǎng)時(shí)間內(nèi)保持有效性:很可能在用戶采取行動(dòng)之前,預(yù)測(cè)結(jié)果的有效性就大幅度“下降了”。為保證預(yù)測(cè)結(jié)果對(duì)最終用戶的有效性,必須設(shè)計(jì)算法以適機(jī)器與人類(lèi)速度的限制。

在典型的人工智能工作流程中,人類(lèi)將數(shù)據(jù)輸入算法中,算法運(yùn)行、計(jì)算輸入數(shù)據(jù),并輸出預(yù)測(cè)結(jié)果或建議行動(dòng)步驟;人類(lèi)解釋該信息以決定行動(dòng)方案,然后采取行動(dòng)。算法計(jì)算結(jié)果所花費(fèi)的時(shí)間以及人類(lèi)對(duì)輸出內(nèi)容進(jìn)行操作所花費(fèi)的時(shí)間是此工作流程中最大的兩個(gè)瓶頸。

對(duì)于大多數(shù)AI創(chuàng)企而言,較慢的計(jì)算速度嚴(yán)重限制了應(yīng)用型人工智能的應(yīng)用范圍。算法的預(yù)測(cè)取決于輸入數(shù)據(jù),輸入數(shù)據(jù)代表記錄過(guò)程的瞬時(shí)數(shù)據(jù)。如果數(shù)據(jù)描述的環(huán)境變化快于算法計(jì)算輸入數(shù)據(jù)的時(shí)間,則在算法完成其計(jì)算并返回預(yù)測(cè)時(shí),預(yù)測(cè)結(jié)果僅適用于過(guò)去的某個(gè)時(shí)刻,并且將不可操作。例如,音樂(lè)程序Shazam后臺(tái)的算法在首次“聽(tīng)到”歌曲到識(shí)別這首歌,期間可能需要花費(fèi)好幾個(gè)小時(shí),且需借助Windows 95系統(tǒng)的計(jì)算能力。

云計(jì)算的興起以及專(zhuān)為人工智能計(jì)算而優(yōu)化的硬件開(kāi)發(fā)極大地拓寬了應(yīng)用型人工智能可行且可負(fù)擔(dān)的領(lǐng)域。雖然宏觀技術(shù)的進(jìn)步極大地推進(jìn)了應(yīng)用型人工智能,但算法并不完全受制于當(dāng)前的計(jì)算限制;通過(guò)訓(xùn)練加強(qiáng)也可以改善算法的響應(yīng)時(shí)間。算法遇到的相同示例越多,就能越快地跳過(guò)計(jì)算過(guò)程得出預(yù)測(cè)結(jié)果。由于計(jì)算的加強(qiáng)與改善,如今Shazam僅用不到15秒的時(shí)間便可識(shí)別一首歌。

自動(dòng)化決策和操作還可以幫助用戶利用因過(guò)快失效而等不及人類(lèi)做出回應(yīng)的預(yù)測(cè)。Opsani就是這樣一家企業(yè),它運(yùn)用人工智能來(lái)做出數(shù)量龐大、快速變化的決策,以便人類(lèi)有效采用。與人類(lèi)DevOps(DevOps,即Development和Operations,是一組過(guò)程、方法與系統(tǒng)的統(tǒng)稱,用于促進(jìn)開(kāi)發(fā)應(yīng)用程序/軟件工程、技術(shù)運(yùn)營(yíng)和質(zhì)量保障部門(mén)之間的溝通、協(xié)作與整合)不同,人類(lèi)DevOps只是根據(jù)算法的建議快速地優(yōu)化性能,Opsani則是應(yīng)用人工智能來(lái)識(shí)別和自動(dòng)改進(jìn)應(yīng)用程序和云設(shè)施的操作,以便用戶享受到更好的性能。

然而,并非所有人工智能應(yīng)用都可以完全自動(dòng)化,如果感知風(fēng)險(xiǎn)對(duì)于最終用戶來(lái)說(shuō)太高而無(wú)法接受,或者法規(guī)要求必須有人類(lèi)來(lái)批準(zhǔn)該決策等情況下,人工智能應(yīng)用便無(wú)法完全自動(dòng)化。

“恰到好處”的性能最低限度

就像軟件創(chuàng)企會(huì)選擇在開(kāi)發(fā)了最小可行產(chǎn)品(MVP)以便從初始客戶中收集可采取措施的反饋時(shí)進(jìn)入市場(chǎng),AI初創(chuàng)公司應(yīng)該在達(dá)到早期用戶所需的最低算法性能(MAP)時(shí)正式進(jìn)入時(shí)市場(chǎng),在市場(chǎng)的大環(huán)境下,算法可以接受更多樣化和新鮮數(shù)據(jù)集的培訓(xùn),也可避免過(guò)度訓(xùn)練變成數(shù)據(jù)集。

大多數(shù)應(yīng)用程序并不需要達(dá)到100%準(zhǔn)確,也會(huì)有一定價(jià)值。例如,欺詐檢測(cè)算法可能只會(huì)在發(fā)生故障后的24小時(shí)內(nèi)立即捕獲5%的欺詐案例,但詐騙調(diào)查人員經(jīng)過(guò)一個(gè)月的分析也僅能捕獲15%的案例。在這種情況下,MAP為0,因?yàn)槠墼p檢測(cè)算法可以用作第一過(guò)濾器,以減少調(diào)查人員必須經(jīng)手的案例數(shù)量。該創(chuàng)企可立即進(jìn)入市場(chǎng),以確保訪問(wèn)用于培訓(xùn)其算法的大量欺詐數(shù)據(jù)。長(zhǎng)此以往,算法的準(zhǔn)確性必將能提高并減輕調(diào)查人員的負(fù)擔(dān),使其能專(zhuān)注于更復(fù)雜的案例。

為0或較低的MAP應(yīng)用程序構(gòu)建算法的初創(chuàng)公司將能快速進(jìn)入市場(chǎng),但若是算法達(dá)到高水平性能之前出現(xiàn)這些副本,則可能需要不斷調(diào)查跟風(fēng)抄襲的企業(yè)。

將算法從研究實(shí)驗(yàn)室轉(zhuǎn)向市場(chǎng)并沒(méi)有通用的方法。

專(zhuān)攻較低MAP問(wèn)題的初創(chuàng)公司也應(yīng)注意那些可通過(guò)非常小的訓(xùn)練集以近100%準(zhǔn)確度解決的問(wèn)題,其中建模的問(wèn)題相對(duì)簡(jiǎn)單,跟蹤的維度少,結(jié)果可能出現(xiàn)的變動(dòng)也比較少。

基于AI的合同處理是算法性能迅速提升的應(yīng)用一個(gè)很好的例子。合同類(lèi)型數(shù)以千計(jì),但大多數(shù)的關(guān)鍵板塊都是類(lèi)似的:涉及的各方、交換價(jià)值的項(xiàng)目、時(shí)間框架等。抵押貸款申請(qǐng)或租賃協(xié)議等特定文件類(lèi)型是高度標(biāo)準(zhǔn)化的,以符合監(jiān)管。在多個(gè)初創(chuàng)公司中,我們發(fā)現(xiàn)自動(dòng)處理這些文檔的算法在其他示例未幫助改進(jìn)之前,只需要幾百個(gè)示例就可訓(xùn)練到可接受的準(zhǔn)確度,從而使后來(lái)者更容易將現(xiàn)有企業(yè)和早期算法性能進(jìn)行匹配。

針對(duì)勞動(dòng)力低廉且能夠輕松達(dá)到高精度的應(yīng)用領(lǐng)域而設(shè)計(jì)的人工智能需要在找到早期用戶之前達(dá)到更高的MAP。例如,需要精細(xì)運(yùn)動(dòng)技能的任務(wù)尚未被機(jī)器人接替,人類(lèi)的表現(xiàn)需要了非常高的MAP來(lái)克服。拾取物體時(shí),為機(jī)器人手提供動(dòng)力的人工智能必須以高精度測(cè)量物體的硬度和重量,否則機(jī)器人手會(huì)損壞被處理的物體。而對(duì)人類(lèi)而言,無(wú)需任何訓(xùn)練,也能非常準(zhǔn)確地測(cè)量這些尺寸。攻擊高M(jìn)AP問(wèn)題的創(chuàng)企必須投入更多時(shí)間和資金來(lái)獲取足夠的數(shù)據(jù),才能達(dá)到MAP并正式進(jìn)入市場(chǎng)。

克服困難

在研究實(shí)驗(yàn)室中,限制領(lǐng)域人工智能(Narrow AI)可以在廣泛的應(yīng)用中取得了重大進(jìn)展。此外,圍繞Narrow AI的應(yīng)用程序建立業(yè)務(wù)需要新的算法集。此過(guò)程很大程度上取決于所有維度的特定用例,算法的性能只是一個(gè)起點(diǎn)。將算法從研究實(shí)驗(yàn)室轉(zhuǎn)移到市場(chǎng)并沒(méi)有通用的方案,還得具體問(wèn)題具體分析,但希望這些想法能夠?yàn)槟闾峁┮粋€(gè)擁有的藍(lán)圖。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2018-08-20
詳解AI領(lǐng)域“金發(fā)女郎效應(yīng)”:如何讓?xiě)?yīng)用型AI做到剛剛好?
雖然埃隆·馬斯克(Elon Musk)和馬克·扎克伯格一直在爭(zhēng)論AGI(通用人工智能,又稱強(qiáng)人工智能)的危險(xiǎn),但初創(chuàng)公司只是將人工智能應(yīng)用于解決特定領(lǐng)域問(wèn)題,例如提升銷(xiāo)售團(tuán)隊(duì)的績(jī)效以及提高生產(chǎn)線的運(yùn)營(yíng)

長(zhǎng)按掃碼 閱讀全文