云知聲- CMU 合作論文入選全球 AI 頂會 NeurIPS 2020

近日,神經(jīng)信息處理系統(tǒng)大會 NeurIPS 2020(Conference and Workshop on Neural Information Processing Systems)于線上舉行。在官方公布的論文入選名單中,云知聲與 CMU (卡內基梅隆大學)張坤教授團隊等合作的針對機器學習典型的無監(jiān)督領域自適應問題論文《Domain Adaptation As a Problem of Inference on Graphical Models》,憑借基于數(shù)據(jù)驅動的圖模型框架解決方案的創(chuàng)新研究成功入選,彰顯了云知聲在人工智能與機器學習原創(chuàng)技術領域的持續(xù)創(chuàng)新能力。

云知聲- CMU 合作論文入選全球 AI 頂會 NeurIPS 2020

近幾年,得益于越來越多真實場景數(shù)據(jù)和充足的算力,現(xiàn)有技術在領域匹配或者數(shù)據(jù)覆蓋到的場景效果表現(xiàn)不錯,但是在跨領域場景,尤其是目標領域沒有標注(無監(jiān)督)的情況下性能還有進一步提升空間,如何利用無監(jiān)督領域自適應技術解決跨領域場景問題是目前人工智能技術發(fā)展的熱點研究領域,也是未來人工智能技術實現(xiàn)跨代發(fā)展和更加智能化繞不過去的技術門檻。

在本論文中,針對目前機器學習典型的無監(jiān)督領域自適應問題,提出了一種基于數(shù)據(jù)驅動的圖模型框架下的解決方案。典型的無監(jiān)督領域自適應問題是指利用源領域的數(shù)據(jù),如何在新的目標領域準確做出預測。一般來說,源和目標領域之間的數(shù)據(jù)分布是不同的。我們假設不同領域的數(shù)據(jù)是獨立同分布的,為了利用已知源數(shù)據(jù)對目標領域的數(shù)據(jù)分布進行建模,引入隱變量 θ 表示領域相關的變化因子,同時利用增強有向無環(huán)圖(DAG)來描述領域之間聯(lián)合分布,通過將在目標領域的預測問題轉化為增強圖模型框架下的貝葉斯推斷問題,實現(xiàn)基于數(shù)據(jù)自動驅動的無監(jiān)督領域自適應。在模擬數(shù)據(jù)和三個真實數(shù)據(jù)集上的實驗結果均表明利用圖模型解決無監(jiān)督領域自適應問題的有效性。

云知聲- CMU 合作論文入選全球 AI 頂會 NeurIPS 2020

本文提出的全自動的端到端的無監(jiān)督領域自適應技術方案除了為學術界提供新的研究思路外,對于工業(yè)界更具有重要的現(xiàn)實意義。在實際的應用場景中,這些大量異構未標注的數(shù)據(jù)如果能夠通過此項技術得到有效利用,將會極大的提高目前人工智能技術的魯棒性和跨場景下的性能。

美國計算機科學家和哲學家 Judea Pearl(圖靈獎獲得者、貝葉斯網(wǎng)絡之父)在社交網(wǎng)站上推薦本論文的研究成果,表示本文的基于因果思維的方案提供了有別于傳統(tǒng)機器學習方式的、新的、有保障的遷移學習方式。

云知聲- CMU 合作論文入選全球 AI 頂會 NeurIPS 2020

NeurIPS 是人工智能、機器學習和計算神經(jīng)科學領域頂級學術會議之一,也是 CCF 推薦的A 類國際學術會議。本屆 NeurIPS 會議共收到投稿 9454 篇,創(chuàng)下投稿數(shù)量歷史新高。其中錄用論文 1900 篇,接收率約 20.1%,為歷年難度最高的一屆。作為學術界、工業(yè)界公認的人工智能領域國際頂級會議的翹楚,NeurIPS 代表著當今人工智能研究的最高水平和技術發(fā)展趨勢,在谷歌發(fā)布的 2020 年最新版學術指標(Google Scholar Metrics, GSM)榜單中, NeurIPS 在人工智能領域學術影響力排名全球第一。

此次入選 NeurIPS 論文集,是云知聲全棧和硬核技術的一次新突破,也是繼吳文俊人工智能科技進步獎、北京市科學技術進步一等獎,CHIP2019 臨床術語標準化任務評測冠軍、CCKS 2020 醫(yī)療命名實體識別評測冠軍、BC 2020語音合成技術評測冠軍,以及多篇論文入選 NLP 國際頂會 ACL、語音 AI 頂會 InterSpeech 等諸多技術成果之后,在前沿技術上的又一次新突破。

人工智能底層技術方面的深厚積累,也將不斷促進云知聲人工智能系統(tǒng)的“智力”提升,推動其更好地應用于智慧生活、智慧城市以及出行、教育、醫(yī)療等千行百業(yè),為用戶創(chuàng)造更好的智能體驗。

(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )