誰來為AI解答疫情下人類異常行為數(shù)據(jù)的疑惑

作者:劉俊寰

你還記得,半年前,你打開淘寶,是在看衣服?化妝品?還是準(zhǔn)備換一個(gè)手機(jī)殼?

疫情打亂了人們的生活計(jì)劃,隨著年初疫情逐漸升溫,各大電商平臺(tái)的口罩上架后往往秒售罄,有人也因此養(yǎng)成了囤貨的習(xí)慣。

當(dāng)疫情向國外擴(kuò)散,這個(gè)變化也在歐美各國開始出現(xiàn)??偛课挥趥惗氐淖稍児綨ozzle專門為亞馬遜賣家做算法廣告,他們敏銳地注意到了這個(gè)變化,疫情之前,手機(jī)殼、充電器、樂高在亞馬遜銷售榜上從來沒有跌出過前十,但如今,這些在短短幾天內(nèi)就被擠出榜單,取而代之的是口罩、消毒液等。

他們還繪制了疫情相關(guān)產(chǎn)品的變化曲線圖:

4月12日至18日,亞馬遜網(wǎng)站上的十大搜索詞分別是:衛(wèi)生紙、口罩、口罩、洗手液、紙巾、來蘇爾噴霧劑、科樂士濕巾、口罩、來蘇爾、防菌口罩和N95口罩。

從這些商品內(nèi)容也可以追蹤新冠病毒的傳播軌跡,相關(guān)商品的銷售量在意大利率先達(dá)到峰值,其次是西班牙、法國、加拿大和美國,英國和德國緊隨其后。

“短短幾天時(shí)間就發(fā)生了如此不可思議的轉(zhuǎn)變。”Nozzle的CEO Rael Cline說道。這種漣漪效應(yīng)在整個(gè)零售供應(yīng)鏈中也現(xiàn)出真身,同時(shí),AI也受到了影響,在庫存管理、欺詐檢測、營銷等算法中已經(jīng)出現(xiàn)了造成了“打嗝”(hiccups)現(xiàn)象,也就是說,如今,以正常人類行為為基礎(chǔ)的機(jī)器學(xué)習(xí)模型已經(jīng)不能適應(yīng)社會(huì)的變化了。

根據(jù)全球AI咨詢公司Pactera Edge,“自動(dòng)化正在走下坡路”,一些工作人員表示,他們正在謹(jǐn)慎地關(guān)注著那些硬撐著的自動(dòng)系統(tǒng),以便在需要的時(shí)候介入人工修正。

從疫情中,也可以看出,我們的生活與AI交織得多么緊密,但也暴露出了一種微妙的依賴關(guān)系,我們的行為改變會(huì)改變AI的工作方式,而AI的工作方式的改變,反過來會(huì)再次影響到我們的行為。

“當(dāng)身處這樣與往常不同的環(huán)境時(shí),你永遠(yuǎn)不能坐而忘之。”Cline說。

世界變了,數(shù)據(jù)也會(huì)變

最開始,機(jī)器模型的設(shè)計(jì)就是為了應(yīng)對(duì)變化,但即使是現(xiàn)在,大多數(shù)模型仍然相當(dāng)脆弱,尤其當(dāng)輸入數(shù)據(jù)與訓(xùn)練過的數(shù)據(jù)差距過大,它們的表現(xiàn)就會(huì)很糟糕。Pactera Edge副總裁Rajeev Sharma表示,你以為在建立一個(gè)AI系統(tǒng)后就能一走了之?這是錯(cuò)誤的做法,“AI是一個(gè)有生命的、會(huì)呼吸的系統(tǒng)”。

根據(jù)Sharma與幾家公司的交流結(jié)果,不少公司因AI無法及時(shí)得到修正正在苦苦掙扎。

一家向印度零售商供應(yīng)醬料和調(diào)味品的公司表示,此前公司一直依靠AI的預(yù)測準(zhǔn)備訂購庫存,目前銷售預(yù)測與實(shí)際銷售情況存在較大出入。當(dāng)這種情況發(fā)生,自動(dòng)庫存管理系統(tǒng)就亟需被修復(fù),但“AI從未經(jīng)過這樣極端的訓(xùn)練”。

在新聞?lì)I(lǐng)域,也發(fā)生了相關(guān)問題。一家新聞網(wǎng)站使用AI評(píng)估文章情感偏向,再根據(jù)結(jié)果提供每日投資建議,但目前新聞比平時(shí)都更陰沉,AI給出的建議偏差也較大。

機(jī)器模型出現(xiàn)問題很大原因在于,越來越多的企業(yè)雖然購入了相關(guān)系統(tǒng),但缺乏維護(hù)系統(tǒng)所需的內(nèi)部知識(shí),而如果想要重新培訓(xùn)一個(gè)模型,可能需要專家級(jí)的人員重新建設(shè)。

當(dāng)前的危機(jī)下,即使是與訓(xùn)練集中的最壞情況相比,現(xiàn)實(shí)隨時(shí)都有可能變得更糟糕。

在Sharma看來,要訓(xùn)練更多AI,除此之外,訓(xùn)練內(nèi)容應(yīng)該包括過去的“怪胎事件”,比如20世紀(jì)30年代經(jīng)濟(jì)大蕭條、1987年黑色星期一股市暴跌、2008年金融危機(jī),“這些大災(zāi)變是建立更好的機(jī)器學(xué)習(xí)模型的基礎(chǔ)”。

但即便如此,也很難做到萬全準(zhǔn)備。一般來說,如果機(jī)器學(xué)習(xí)系統(tǒng)沒有看到它所期望看到的東西,那么就會(huì)出現(xiàn)問題。

用AI檢測信用卡詐騙的行為分析公司Featurespace創(chuàng)始人David Excell表示,令人驚訝的是,F(xiàn)eaturespace沒有看到自家AI系統(tǒng)受到太大打擊,在他們看來,人們?nèi)匀幌褚郧澳菢釉趤嗰R遜上買東西、訂閱Netflix,不過,人們不再購買大件商品,也不在新地方消費(fèi),這些行為還是足以引起懷疑。

Excell說,公司的工程師們只需要介入調(diào)整,以應(yīng)對(duì)購買園藝設(shè)備和電動(dòng)工具的人激增的情況,這些屬于欺詐檢測算法可能會(huì)發(fā)現(xiàn)的那種中間價(jià)格異常的購買行為。

“世界變了,數(shù)據(jù)也變了。”Excell說。

AI亟需修正,亞馬遜也逃不出這個(gè)命運(yùn)

倫敦的Phrasee正在動(dòng)手修改他們的AI系統(tǒng),該公司使用自然語言處理和機(jī)器學(xué)習(xí)技術(shù)代表客戶生成電子郵件營銷文案或Facebook廣告,保證文案語氣的正確是工作中相當(dāng)重要的一部分。在工作時(shí),AI能生成大量短語,通過神經(jīng)網(wǎng)絡(luò)運(yùn)行后挑選出最佳結(jié)果。

但是,鑒于生成的語言可能出錯(cuò),在平時(shí),Phrasee也保持讓人類來檢查其輸入和輸出的習(xí)慣。疫情爆發(fā)后,Phrasee意識(shí)到,在語言的使用上需要比平時(shí)更敏感準(zhǔn)確,于是他們開始著手過濾額外語言,禁止了一些特定的短語如“going viral”,不允許涉及被叫停的活動(dòng)如“party wear”,甚至刪除了可能會(huì)被解讀為高興或驚險(xiǎn)的表情符號(hào),以及可能引發(fā)焦慮的詞,如“OMG”“be prepared”“stock up”“brace yourself”等。

然而,作為整個(gè)零售行業(yè)的一個(gè)小小的分支,很多企業(yè)無法與亞馬遜抗衡,但這也是最微妙的地方。隨著亞馬遜和其250萬第三方賣家努力滿足市場需求,亞馬遜正對(duì)其算法進(jìn)行細(xì)微的調(diào)整,以幫助分擔(dān)賣家的負(fù)擔(dān)。

畢竟,大多數(shù)亞馬遜上的第三方賣家都是依靠亞馬遜的算法創(chuàng)造收入,賣家將商品存放在亞馬遜倉庫里,亞馬遜負(fù)責(zé)所有的物流,包括送貨到家、處理退貨等。交易完成后,亞馬遜會(huì)推廣完成訂單的賣家。

例如,你在亞馬遜上搜索Switch后,頂部顯眼的“添加到購物籃”按鈕旁邊的結(jié)果更有可能是使用亞馬遜物流的供應(yīng)商,否則就會(huì)被排到更后面的位置。


但在過去幾周里,亞馬遜上這一情況出現(xiàn)了180度扭轉(zhuǎn),為了緩解庫存壓力,亞馬遜的算法現(xiàn)在似乎更傾向于推廣能自己發(fā)貨的賣家。

市場動(dòng)蕩,人為干預(yù)不可少

如果沒有人工干預(yù),要實(shí)現(xiàn)這種調(diào)整是很難的,“情況太不穩(wěn)定了,上周算法工程師還在努力優(yōu)化衛(wèi)生紙,這周大家突然就都想買拼圖或健身器材了”。

亞馬遜對(duì)算法進(jìn)行的調(diào)整隨后影響到在線廣告上的投入,這些算法決定花在廣告上的金額取決于無數(shù)變量,但最終決定是基于用戶對(duì)其有多少價(jià)值的估計(jì),這其中,有許多方法可以預(yù)測客戶的行為,包括有關(guān)過去購買的數(shù)據(jù),以及廣告公司根據(jù)不同人的在線活動(dòng)進(jìn)行的推薦。

但是現(xiàn)在,Cline說,想要預(yù)測點(diǎn)擊廣告的人是否會(huì)購買產(chǎn)品,最佳的參考因素之一就是送達(dá)時(shí)間,這也是Nozzle在和客戶討論調(diào)整算法時(shí)提出的意見。例如,如果你認(rèn)為你不能比競爭對(duì)手更快地交付產(chǎn)品,那么想在廣告拍賣中超過他們,所進(jìn)行的花費(fèi)可能就是無效的。

這一切只有專業(yè)團(tuán)隊(duì)才能做到。Cline認(rèn)為,目前的情況讓很多人大開眼界,很多人以為自動(dòng)化系統(tǒng)都可以自己運(yùn)行,“但實(shí)際上,你需要一個(gè)數(shù)據(jù)科學(xué)團(tuán)隊(duì),從而把社會(huì)事件和算法事件聯(lián)系起來。一個(gè)算法永遠(yuǎn)也不會(huì)主動(dòng)挑選出這些東西”。

現(xiàn)在已經(jīng)步入了萬物相連的時(shí)代,從疫情中已經(jīng)可以廣泛地感受到,這也觸動(dòng)了在更典型的時(shí)代仍然隱藏著的機(jī)制。如果要尋找一線生機(jī),那么現(xiàn)在正是時(shí)候?qū)π卤┞冻鰜淼南到y(tǒng)進(jìn)行盤點(diǎn),同時(shí)弄清楚如何設(shè)計(jì)得更好,使系統(tǒng)更有彈性。

如果要信任機(jī)器,我們就需要對(duì)它們進(jìn)行監(jiān)督。

【本文是51CTO專欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號(hào)“大數(shù)據(jù)文摘(id: BigDataDigest)”】

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2020-05-28
誰來為AI解答疫情下人類異常行為數(shù)據(jù)的疑惑
作者:劉俊寰你還記得,半年前,你打開淘寶,是在看衣服?

長按掃碼 閱讀全文