近日,在斯坦福等院校和機(jī)構(gòu)發(fā)起的“多輪對(duì)話(huà)型閱讀理解評(píng)測(cè)”(QuAC)上,阿里巴巴人工智能模型“TransBERT”擊敗全球?qū)κ郑粌H拿下了評(píng)測(cè)的桂冠,更刷新了該項(xiàng)測(cè)試的世界紀(jì)錄。這也意味著,以阿里巴巴AI為代表的機(jī)器閱讀理解能力,又往前邁進(jìn)了一步。
QuAC(多輪對(duì)話(huà)型閱讀理解評(píng)測(cè))由華盛頓大學(xué)、斯坦福大學(xué)和艾倫人工智能研究院等研究機(jī)構(gòu)聯(lián)合發(fā)起,與SQuAD(文本理解挑戰(zhàn)賽)、CoQA(對(duì)話(huà)型機(jī)器閱讀理解挑戰(zhàn)賽)并稱(chēng)世界級(jí)閱讀理解評(píng)測(cè)競(jìng)賽,吸引了全世界頂級(jí)科學(xué)家和技術(shù)團(tuán)隊(duì)參與。本次競(jìng)賽的難點(diǎn)在于,要求參賽的AI模型閱讀篇幅更長(zhǎng)的多輪對(duì)話(huà),題目中還有“指代”和“省略”,甚至還存在原文中沒(méi)有對(duì)應(yīng)答案的模糊問(wèn)題,這就要求AI模型要有如同人類(lèi)般“聯(lián)系上下文”的能力,高度考驗(yàn)聯(lián)想和推測(cè)能力。
阿里巴巴智能服務(wù)事業(yè)部算法專(zhuān)家計(jì)峰介紹說(shuō),此次測(cè)試中出現(xiàn)了多次以“他”、“他們”進(jìn)行的第三人稱(chēng)指代,需要機(jī)器進(jìn)行上下文的主動(dòng)聯(lián)想,并作出綜合判斷;還有無(wú)法在原文中找到對(duì)應(yīng)答案的開(kāi)放式問(wèn)題,測(cè)試的是AI模型在基于文本的閱讀理解之外,調(diào)用日常儲(chǔ)備數(shù)據(jù)庫(kù)進(jìn)行推想的能力,幾乎無(wú)限接近人類(lèi)思考模式。
主辦方也認(rèn)為,多輪對(duì)話(huà)型閱讀理解是目前人工智能對(duì)話(huà)領(lǐng)域復(fù)雜性最高、最考驗(yàn)自然語(yǔ)言理解技術(shù)的,已經(jīng)接近人類(lèi)日常交流的真實(shí)場(chǎng)景。
圖:評(píng)測(cè)案例接近人類(lèi)日常交流的真實(shí)場(chǎng)景,高度考驗(yàn)AI模型的聯(lián)想和推測(cè)能力
憑借自主研發(fā)的“TransBERT”AI模型,阿里巴巴智能服務(wù)事業(yè)部、計(jì)算平臺(tái)事業(yè)部聯(lián)合浙江大學(xué)人工智能研究所,打敗國(guó)內(nèi)外競(jìng)爭(zhēng)者,以三個(gè)指標(biāo)總分144.1拔得頭籌,刷新了此測(cè)試的最高紀(jì)錄,其中兩項(xiàng)指標(biāo)大幅超過(guò)第二名。
圖:“TransBERT”AI模型以三個(gè)指標(biāo)總分144.1拔得頭籌,兩項(xiàng)指標(biāo)大幅超過(guò)第二名
AI技術(shù)面對(duì)多輪次對(duì)話(huà),以及“指代”、“省略”、“模糊語(yǔ)義問(wèn)題”等場(chǎng)景早已并非僅在測(cè)試環(huán)境中發(fā)生,在阿里巴巴平臺(tái)的客服機(jī)器人“阿里小蜜”的日常應(yīng)用中,此類(lèi)較為復(fù)雜的閱讀理解場(chǎng)景早已成為AI機(jī)器人發(fā)揮實(shí)質(zhì)性作用的“賽場(chǎng)”。
在阿里巴巴早前公布的一段視頻中,阿里小蜜已經(jīng)能夠以文字和語(yǔ)音等形式,與消費(fèi)者進(jìn)行多輪次的復(fù)雜對(duì)話(huà),問(wèn)題覆蓋售前售后服務(wù)中,常見(jiàn)的打斷、指代、省略、轉(zhuǎn)換話(huà)題等現(xiàn)實(shí)情況。
這也是阿里巴巴AI技術(shù)顯著區(qū)別于學(xué)界競(jìng)爭(zhēng)者的最大不同之處,阿里AI模型在阿里小蜜系列產(chǎn)品的長(zhǎng)期實(shí)際應(yīng)用中得到完善和突破,其技術(shù)能力立足現(xiàn)實(shí)場(chǎng)景,注重與人類(lèi)對(duì)話(huà)的真實(shí)互動(dòng)體驗(yàn),因此能夠在QuAC這類(lèi)測(cè)試中達(dá)到接近人類(lèi)對(duì)話(huà)的水平。
圖:阿里AI模型技術(shù)能力立足人工智能客服小蜜產(chǎn)品的現(xiàn)實(shí)服務(wù)場(chǎng)景
這并非阿里巴巴AI技術(shù)首次在機(jī)器閱讀領(lǐng)域打破世界紀(jì)錄。在斯坦福大學(xué)于2018年初發(fā)起的機(jī)器閱讀領(lǐng)域頂級(jí)賽事SQuAD(文本理解挑戰(zhàn)賽)上,阿里巴巴智能服務(wù)事業(yè)部就曾聯(lián)合阿里達(dá)摩院奪冠,實(shí)現(xiàn)了人工智能在閱讀能力上首次對(duì)人類(lèi)的超越。2019年初,阿里小蜜憑借在物流、智能助理等功能方面的出色表現(xiàn),入選《麻省理工科技評(píng)論》“全球十大突破性技術(shù)”榜單,被認(rèn)為是有望引領(lǐng)AI助手實(shí)現(xiàn)巨大進(jìn)化的代表。
在人工智能的驅(qū)動(dòng)下,客服行業(yè)也正在經(jīng)歷快速升級(jí)迭代。2018年,阿里小蜜全年對(duì)話(huà)輪次高達(dá)14億次,服務(wù)消費(fèi)者約4.9億人次。而基于實(shí)際場(chǎng)景不斷完善的算法技術(shù),也讓以阿里小蜜為代表的智能客服正以前所未有的速度和智能能力解決消費(fèi)者和商家的痛點(diǎn),提升商業(yè)效率。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 2024世界顯示產(chǎn)業(yè)大會(huì)啟幕,4K花園自研“滿(mǎn)天星”獲十大創(chuàng)新應(yīng)用
- 哈佛商學(xué)院:2024年全球96%代碼庫(kù)包含開(kāi)源組件 Rust采用率增長(zhǎng)500%
- 硅谷1/10程序員在摸魚(yú)?基本不干活卻能拿20-30萬(wàn)美元年薪
- 傳馬斯克的"友商"擔(dān)心被報(bào)復(fù) 紛紛示好特朗普
- 數(shù)智龍江向新而行:5G-A與AI等數(shù)智技術(shù)助力龍江打造新質(zhì)生產(chǎn)力
- 加州對(duì)特斯拉和SpaceX說(shuō)不,公報(bào)私仇觸怒馬斯克
- 華為Mate品牌盛典盛大舉行,Mate 70等十余款全場(chǎng)景新品重磅亮相
- 支付寶新升級(jí),手機(jī)碰一下就能點(diǎn)餐!全國(guó)10萬(wàn)家餐廳可用
- 華為徐直軍談鴻蒙:10萬(wàn)個(gè)應(yīng)用是鴻蒙生態(tài)成熟的標(biāo)志
- 數(shù)智江蘇 向新而行
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。