阿里AI研究成果入選國際頂會ICML 2020,AI推理速度提升3倍

近日,人工智能國際頂會ICML 2020公布了論文收錄結(jié)果,阿里巴巴7篇論文入選,是入選論文數(shù)量最多的中國科技公司。ICML是機(jī)器學(xué)習(xí)領(lǐng)域全球最具影響力的學(xué)術(shù)會議之一,今年接受率僅為21.8%。

根據(jù)ICML官方顯示,阿里7篇論文涵蓋在圖像識別、自然語言處理、搜索推薦等領(lǐng)域的研究成果,其中一篇《Boosting Deep Neural Network Efficiency with Dual-Module Inference》,提出了一種全新的AI推理方法,可大幅減少AI對計算和內(nèi)存資源的消耗,能將推理速度提升3倍。

近年來AI模型變得越來越復(fù)雜化,尤其是類似語言AI這類復(fù)雜模型,給計算、內(nèi)存資源帶來了新的挑戰(zhàn)。目前,業(yè)界通用的解決方法是采用更先進(jìn)的計算性能來運(yùn)行AI任務(wù),例如采用GPU、FPGA或者NPU等異構(gòu)計算,但該方法并沒有從根源上解決問題。

阿里巴巴達(dá)摩院設(shè)計出了一種“AI雙腦思考”的方法,能讓大型神經(jīng)網(wǎng)絡(luò)像人類一樣學(xué)會“快思考”與“慢思考”,從而進(jìn)行高效且準(zhǔn)確的推理過程。

該方法被稱為“雙模推理”, 即將一個復(fù)雜任務(wù)拆分成兩個任務(wù),例如在復(fù)雜AI推理任務(wù)過程中,可以先以很小的資源運(yùn)行“小網(wǎng)絡(luò)”,同時分析哪些網(wǎng)絡(luò)的區(qū)域較為敏感,然后只對敏感區(qū)域在“大網(wǎng)絡(luò)”中運(yùn)行計算。

達(dá)摩院的科學(xué)家從理論上證明了雙模推理的可行性,且在CPU上實(shí)現(xiàn)了該方法。實(shí)際效果顯示,該方法能在保證模型精度的基礎(chǔ)上,在語言模型上減小40%的訪存,達(dá)到1.54倍-1.75倍的性能提升,同時可以在僅損耗0.5%精度基礎(chǔ)上,提升3倍的推理速度。

近年來,阿里在AI領(lǐng)域迎來了基礎(chǔ)研究與產(chǎn)業(yè)應(yīng)用成果雙爆發(fā)的階段。三年前,阿里巴巴成立了內(nèi)部研究機(jī)構(gòu)達(dá)摩院,深入AI研究前沿。據(jù)了解,阿里AI已在國際頂級技術(shù)賽事上獲得了近60項(xiàng)世界第一,500多篇論文入選國際頂會。同時,阿里AI落地了多項(xiàng)重大研究成果,全面賦能各行各業(yè)。達(dá)摩院醫(yī)療AI團(tuán)隊疫情期間研發(fā)的AI診斷技術(shù),已在全球近600家醫(yī)院落地,完成50余萬例臨床診斷。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2020-06-19
阿里AI研究成果入選國際頂會ICML 2020,AI推理速度提升3倍
近日,人工智能國際頂會ICML 2020公布了論文收錄結(jié)果,阿里巴巴7篇論文入選,是入選論文數(shù)量最多的中國科技公司。ICML是機(jī)器學(xué)習(xí)領(lǐng)域全球最具影響力的學(xué)術(shù)會議之一,今年接受率僅為21.8%。

長按掃碼 閱讀全文