【OFweek 年終盤點(diǎn)】NLP、NLU 2017又有哪些新動(dòng)作?

AI的應(yīng)用技術(shù)層主要圍繞計(jì)算機(jī)視覺和語音、自然語言處理/理解。具體來說,自然語言處理任務(wù)又可以分為問答系統(tǒng)(如Siri、小娜等)、情感分析、圖片題注、機(jī)器翻譯、詞性標(biāo)注、命名等幾個(gè)部分。

上一期我們盤點(diǎn)了計(jì)算機(jī)視覺2017年所發(fā)生的大事件,這一期的主要內(nèi)容為計(jì)算機(jī)視覺和語音、自然語言處理/理解(NLP/NLU)。

國(guó)際

Maluuba:被微軟收購 推出可視化數(shù)據(jù)集FigureQA

1月,微軟宣布,公司已經(jīng)收購以使用針對(duì)自然語言處理的深度學(xué)習(xí)技術(shù)為重點(diǎn),位于多倫多的人工智能初創(chuàng)企業(yè)Maluuba。通過這次收購,微軟旨在進(jìn)一步強(qiáng)化機(jī)器閱讀和編寫能力。據(jù)了解,Maluuba的人工智能系統(tǒng)能夠以接近自然人的能力閱讀和理解文本內(nèi)容。

10月,aluuba推出了一個(gè)用于推理的可視化數(shù)據(jù)集FigureQA,并將研究相關(guān)論文《FigureQA: An Annotated Figure Dataset for Visual Reasoning》發(fā)布在ArXiv上。據(jù)了解,通過對(duì)結(jié)構(gòu)化視覺信息的理解能幫助人們從大量文獻(xiàn)中提取信息。

亞馬遜&微軟:聯(lián)手語音助手 能否成功“狙擊”Google?

8月,隨著亞馬遜CEO貝索斯發(fā)了一條推文表示:“Alexa剛剛交了個(gè)新朋友”,亞馬遜與微軟走到了一起,這讓原本競(jìng)爭(zhēng)激烈的語音助手Alexa和Cortana成了一家人,而這一合作也被外界解讀為“狙擊”Siri和Google Assistant的最好方法。

兩者選擇合作最重要的原因是軟硬結(jié)合。微軟與亞馬遜的主攻方向有所不同,Cortana更加偏向?qū)I(yè)領(lǐng)域,直接打通了Office 365與Cortana,Alexa則擅長(zhǎng)勸用戶在亞馬遜上購物。如今,微軟Cortana的月活躍用戶已達(dá)1.45億,而搭載Alexa的亞馬遜Echo音箱則是智能音箱市場(chǎng)當(dāng)之無愧的統(tǒng)治者。

三星:Bixby2.0和Bixby中文版先后推出 智能語音領(lǐng)域再添巨頭

10月,在三星開發(fā)者峰會(huì)上,語音助手Bixby2.0正式推出。據(jù)了解,Bixby2.0采用了應(yīng)用深度集成的方式,支持自然語言處理功能,如自然語言命令和復(fù)雜語音處理,可以真正了解用戶和家庭成員。通過不斷深度學(xué)習(xí)用戶習(xí)慣及行為模式,可以成為個(gè)人化的人工智能秘書。據(jù)了解,三星將向第三方完全公開開發(fā)者工具,打造對(duì)抗亞馬遜Alexa和谷歌Assistant的人工智能助手開發(fā)平臺(tái)。

11月,在北京亦創(chuàng)國(guó)際會(huì)展中心,Bixby中文版正式發(fā)布,并11月30日在國(guó)內(nèi)正式上線,國(guó)行版三星 Galaxy S8、S8+ 和 Note 8 將率先支持。

Yandex:俄羅斯最大搜索引擎推出語音助手Alice

Yandex是俄羅斯最大的搜索引擎,占領(lǐng)俄羅斯約65%的搜索市場(chǎng)份額,其在俄羅斯的地位相當(dāng)于世界的Google和中國(guó)的百度。10月,根據(jù)俄羅斯媒體的消息,Yandex公布了Alice語音助手,該產(chǎn)品類似亞馬遜的Alexa。

據(jù)了解,Alice語音助手能夠展示接近人類水平的語言識(shí)別準(zhǔn)確度,可以響應(yīng)更隨意的查詢和基于上下文線索獲取信息。此外,相較于其它語音助手,Alice還有一個(gè)更加優(yōu)越的功能是“Chit-Chat”,這款功能讓語音助手更加擅長(zhǎng)于對(duì)話。

SoundHound:與ModiFace達(dá)成合作 AI工具嵌入到AR鏡像

5月,推出了“美妝直播”的ModiFace和“搜歌利器”SoundHound宣布達(dá)成合作,共同推出“美妝魔鏡”。

據(jù)了解,SoundHound的語音AI工具將被嵌入到ModiFace的AR鏡像軟件中,用戶因此可以通過語音控制軟件,借助 AI 語音,這些需求可以被即時(shí)識(shí)別,系統(tǒng)會(huì)為用戶匹配相應(yīng)的產(chǎn)品類型和色號(hào),幫助用戶進(jìn)行實(shí)時(shí)試妝。

國(guó)內(nèi)

科大訊飛:語音語義三大領(lǐng)域?qū)崿F(xiàn)突破

語音合成:在今年的Blizzard Challenge國(guó)際權(quán)威語音合成比賽上,科大訊飛以率先超過4.0分的成績(jī)連續(xù)12年蟬聯(lián)全球第一名,且依然是全世界唯一能讓語音合成技術(shù)能夠達(dá)到真人說話水平的應(yīng)用。

語音識(shí)別:今年,科大訊飛將其語音識(shí)別準(zhǔn)確率提升至98%。此外,在方言的識(shí)別方面,相對(duì)指標(biāo)比2016年提升了50%以上,方言識(shí)別準(zhǔn)確率超過90%的已經(jīng)接近十種,包括粵語、四川話、東北話、河南話、天津話、山東話、貴州話、寧夏話等。

語言文字識(shí)別:2017年,科大訊飛英文手寫識(shí)別準(zhǔn)確率由去年的92%達(dá)到97%,全世界排名第一。對(duì)數(shù)學(xué)題目中的圖形識(shí)別,準(zhǔn)確率達(dá)到92%以上。

搜狗:推出唇語識(shí)別新技術(shù) 準(zhǔn)確率超谷歌達(dá)60%以上

12月,搜狗在北京舉行的媒體溝通會(huì)上公開演示了唇語識(shí)別新技術(shù)。據(jù)了解,搜狗通過攝像頭從圖像中連續(xù)識(shí)別出人的唇形,提取說話人連續(xù)的口型變化特征,然后將這些唇語特征放入唇語識(shí)別模型進(jìn)行解碼,從唇語文本數(shù)據(jù)到唇語語言模型進(jìn)一步獲取發(fā)音單元,最終輸出文字。

據(jù)了解,搜狗在非特定人開放口語測(cè)試集上,即搜狗唇語識(shí)別系統(tǒng)的通用識(shí)別的準(zhǔn)確率在60%以上,超過google發(fā)布的英文唇語系統(tǒng)50%以上的準(zhǔn)確率;而在垂直場(chǎng)景下,如車載、智能家居等場(chǎng)景下已經(jīng)達(dá)到90%的準(zhǔn)確率。

出門問問:推出全球首款無線智能音箱Tichome Mini

11月,出門問問正式面向國(guó)內(nèi)市場(chǎng)發(fā)布全球首款便攜防水的無線智能音箱——小問音Tichome Mini。

據(jù)了解,Tichome Mini可以滿足用戶的多場(chǎng)景移動(dòng)需求,已實(shí)現(xiàn)語音控制40多個(gè)品類,上千款智能家電設(shè)備,具備兒童內(nèi)容、音樂電臺(tái)、智能家居、時(shí)間管理、新聞資訊、運(yùn)動(dòng)助理、生活服務(wù)、實(shí)用工具等多種功能,可以隨時(shí)隨地跟它智能語音交互。

云知聲:推出“Pandora”語音中控方案

6月,云知聲發(fā)布了最新產(chǎn)品“Pandora”語音中控方案。據(jù)了解,打造這款類似Amazon Echo的智能中控和音箱類產(chǎn)品是復(fù)雜的過程,中間涉及語音識(shí)別、語音喚醒、語義理解、用戶畫像、聲學(xué)等綜合技術(shù),同時(shí),聲學(xué)、結(jié)構(gòu)、麥克風(fēng)陣列等因素又互相關(guān)聯(lián)互相影響。復(fù)雜的AI技術(shù)元素和環(huán)節(jié)讓大部分智能中控的產(chǎn)品化之路止步不前。

而“Pandora”將遠(yuǎn)場(chǎng)語音識(shí)別、語義理解等復(fù)雜的AI技術(shù)元素整合為一個(gè)整體方案??蓭椭蛻魧?shí)現(xiàn)6個(gè)月快速集成,量產(chǎn)出貨,為產(chǎn)品智能化落地加速。

小米:“小愛同學(xué)”成史上被點(diǎn)名最多的同學(xué)

12月,小米AI音箱“小愛同學(xué)”最新使用次數(shù)達(dá)到102946421次,音頻播放總次數(shù)158673818次,這個(gè)數(shù)據(jù)在同行大幅領(lǐng)先,成為史上被點(diǎn)名最多的同學(xué)。

據(jù)了解,“小愛同學(xué)”能播放音樂、電臺(tái)點(diǎn)播、相聲、小說、脫口秀、教育學(xué)習(xí)等多種有聲讀物。除此之外,還能提供新聞、天氣、鬧鐘、倒計(jì)時(shí)、備忘、提醒、時(shí)間、匯率、股票、限行、算數(shù)、百科/問答、閑聊、笑話、菜譜、翻譯等各類交互功能。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2017-12-26
【OFweek 年終盤點(diǎn)】NLP、NLU 2017又有哪些新動(dòng)作?
AI的應(yīng)用技術(shù)層主要圍繞計(jì)算機(jī)視覺和語音、自然語言處理 理解。具體來說,自然語言處理任務(wù)又可以分為問答系統(tǒng)(如Siri、小娜等)、情感分析、圖片題注、機(jī)器翻譯、詞性標(biāo)注、命名等幾個(gè)部分。

長(zhǎng)按掃碼 閱讀全文