微軟AI:你我都能感知、能使用的AI

當微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負責人沈向洋博士與來自南京理工大學的碩士研究生宋昊旻站在2018微軟AI人工智能大會現(xiàn)場,借助微軟語音翻譯服務順利進行中英文對話時,會議現(xiàn)場響起了熱烈的掌聲。

這個掌聲是給特殊來賓宋昊旻的,宋昊旻在一歲時失去了聽力,被醫(yī)生判定將終生成為聾啞人,但在媽媽的鼓勵下,他堅持訓練發(fā)聲,并成功考上了南京理工大學的本科和碩士研究生,一路走來非常艱辛。這個掌聲同樣也是給微軟的,微軟語音服務根據(jù)宋昊旻聲音定制的語音識別模型能夠準確地、近乎實時地將他略顯吃力的語音轉換為更加流暢的普通話,還能同步翻譯成英語或其它語種,讓宋昊旻能夠和外界無障礙溝通。

宋昊旻只是眾多微軟AI技術中受益者之一,今天微軟的AI技術正在各個領域服務于我們,其中有像宋昊旻這樣的特殊人群,也有各種專業(yè)人士,而更多的是普普通通的你我。實際上,普通人觸手可及的AI正是微軟AI的一個鮮明特點,而這也很好的印證了微軟的愿景:予力全球每個人、每個組織,成就不凡。

 微軟AI:你我都能感知、能使用的AI

微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負責人沈向洋博士與南京理工大學研究生宋昊旻

讓更多人從AI中受益

“微軟作為一個技術平臺的公司,我們希望通過領先業(yè)界的云計算和人工智能服務與工具,能夠予力全球每一人、每一組織,成就不凡?!蔽④浫驁?zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負責人沈向洋博士在大會演講中表示。

基于這一愿景,微軟致力于普及人工智能,讓眾多普通人從中受益。微軟小冰就是一個很好的例子。小冰誕生于四年前,是一個面向情商(EQ)維度發(fā)展的人工智能系統(tǒng),目前已在中、日等多個國家落地。經(jīng)過這幾年持續(xù)不斷的技術迭代,現(xiàn)在的小冰功能越來越強大,從初期的簡單人機對話發(fā)展到今天不僅可以作詩、寫文章,還能唱歌,而最新應用的全雙工語音技術讓小冰的技能又上一層樓,讓小冰與人的對話更類似人與人的交流。

據(jù)悉,全雙工語音是微軟小冰身上最新的技術突破之一。這項新技術的作用在于可以實時預測人類即將說出的內容,實時生成回應,并控制對話節(jié)奏,從而使長程語音交互成為可能。它的實現(xiàn)需要同時具備文本、語音兩種能力,并要求兩種能力均達到更高的質量標準。目前,小米生態(tài)鏈企業(yè)億聯(lián)客開發(fā)的Yeelight語音助手中就是搭載了微軟技術的全雙工語音交互感官的智能設備,其硬件產(chǎn)品已開始進入千家萬戶。

“全雙工語音技術能夠使得人機交互進化為人機交流,一字之差,差之萬里。微軟小冰通過這項技術能和人類進行更長程、更自然流暢的對話?!鄙蛳蜓蟛┦吭谘葜v時表示。

 微軟AI:你我都能感知、能使用的AI

微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負責人沈向洋博士

在大會上,沈向洋還宣布微軟將基于小冰推出一項造福孩子的人工智能內容創(chuàng)造的全新技能:為每個孩子定制專屬于他們的有聲童話故事,讓每個家庭的孩子都可以擁有一位專屬于自己的故事主播。家長可以設置童話故事的主人公和故事傾向,如更偏教育意義等,然后安排微軟小冰完成創(chuàng)作。這項功能將于“六一”兒童節(jié)正式上線。

有必要指出的是,微軟研發(fā)小冰要做的不僅僅只是聊天機器人,小冰的背后是“對話機器人”市場,在銷售、市場、客戶都需要這種更智能的對話機器人服務。針對這個市場,微軟推出了“對話機器人”服務Azure Bot Services和對應的開發(fā)平臺,至今已經(jīng)有超過30萬人用這樣一個開發(fā)平臺去開發(fā)這樣對話機器人,如中國移動的智能客服就基于微軟的對話機器人技術實現(xiàn)。

實際上,在這些明顯貼有AI標簽的產(chǎn)品之外,微軟的AI技術早已隨著微軟的產(chǎn)品進入千家萬戶,比如最為我們熟悉的Windows 10桌面上的Cortana、幾乎人人都在用的Office 365和搜索引擎Bing,這些簡單易用的產(chǎn)品和服務背后都是微軟AI技術在支撐。

值得一提的是,在普及AI的道路上,微軟不僅致力于讓更多的普通人用上AI,還在努力讓類似宋昊旻這樣的非普通人從AI受益。在不久前的微軟Build大會上,微軟曾宣布推出“人工智能無障礙計劃”,將在未來五年內投入2500萬美元,用于研發(fā)能夠增強人類能力的人工智能技術,以造福全球各地超過10億殘障人士。

讓AI應用可以很簡單

除了讓AI更多地為人類服務外,微軟還在大力降低AI的使用門檻,讓每個開發(fā)者都有機會打造屬于自己的AI應用,并讓AI更簡單易用。比如,微軟在Azure上推出了24項認知服務,它們以API的形式為開發(fā)者提供簡單易用的人工智能技術,這些認知服務覆蓋了語音、視覺、語言、機器翻譯等,目前已經(jīng)有超過100萬開發(fā)者使用認知服務。

Azure Batch AI服務是微軟智能云上的一項托管服務,允許數(shù)據(jù)科學家和人工智能開發(fā)者以非常簡單的方式利用包括GPU在內的Azure云計算資源對人工智能模型進行訓練。數(shù)據(jù)科學家只需明確任務需求,設定輸入、存儲、輸出等設置,其它所有與基礎設施管理、規(guī)??s放、批量工作任務相關的繁雜的后臺工作都能由Azure Batch AI自動完成。

如果Azure上的這些認知服務不能滿足用戶需求,微軟還提供了定制化的AI服務,而且這種定制非常簡單。

“我們在預制化的AI人工智能服務上做了很多工作,讓它們很容易上手,開發(fā)者并不太需要知道這些東西如何工作。比如說,定制計算機視覺、定制語音或者定制自然語言,都可以很輕易地使用?!蔽④浫蛸Y深副總裁、云計算與人工智能事業(yè)部郭昱廷在接受采訪時表示。

 微軟AI:你我都能感知、能使用的AI

微軟全球資深副總裁、云計算與人工智能事業(yè)部郭昱廷

另外,微軟還把這些服務跟Visual Studio結合,推出了Visual Studio Tools for AI?!拔④浵M馨堰@些事情做得盡可能簡單,盡量幫助開發(fā)者以最簡單的方式使用人工智能。比如,讓定制視覺服務可以部署在各種手機上,并根據(jù)不同的手機自動優(yōu)化數(shù)據(jù)模型,而無需使用者去操心這些事情?!惫磐⒄f。

打通云+邊緣的AI

今天微軟談到AI往往是與Azure聯(lián)系到一起的。實際上,Azure已經(jīng)越來越成為微軟AI戰(zhàn)略的一個不可分割的重要組成部分,而微軟云計算與人工智能事業(yè)部的成立就是一個體現(xiàn)。

郭昱廷介紹說,“成立云計算與人工智能事業(yè)部,就體現(xiàn)了微軟對云計算和AI的決心。微軟將云計算與AI結合,能更好地讓這兩種技術落地。這樣我們給客戶的就不只是一般的計算、存儲或者是基礎設施服務,而是有更高價值的服務,是具有人工智能的價值服務?!?/p>

而交付這些高價值的AI服務就離不開的Azure。應該說,微軟Azure也的確為微軟AI提供了很好的制程,比如, Azure現(xiàn)已覆蓋全球50多個區(qū)域,并且獲得了不同地區(qū)的超過70項安全合規(guī)認證,遠高于其它任何公有云服務。Azure上匯聚了微軟在人工智能領域的全部投入與技術積累,是開發(fā)、部署、運行人工智能的最佳云平臺,包括微軟現(xiàn)在提供的24項認知服務都運行在Azure上。

還有,在不久前舉行的微軟Build開發(fā)者大會微軟發(fā)布了的Project Brainwave(預覽版)也可以運行在Azure上。Project Brainwave是一個旨在加速實時AI計算的硬件架構,可以滿足數(shù)據(jù)密集型AI應用的計算需求(比如圖像識別)。它能夠部署在Azure云端以及邊緣設備上,幫助用戶實現(xiàn)低成本的實時AI計算。

而且,Azure還是微軟將智能云與智能邊緣融會貫通的關鍵環(huán)節(jié)。郭昱廷在接受采訪時表示,智能邊緣現(xiàn)在也是微軟AI戰(zhàn)略的一部分,微軟不但要把AI放到云上,還要放到邊緣物聯(lián)網(wǎng)環(huán)境中。為此,微軟推出了Azure IoT Edge物聯(lián)網(wǎng)服務,同時,Azure 上的認知服務也可以擴展到Azure IoT Edge。目前微軟已經(jīng)推出了定制視覺服務,可以讓無人機或其他工業(yè)裝備無需連接到云。另外,為了給邊緣設備提供更好的安全保護,微軟發(fā)布了Azure Sphere預覽, Azure Sphere方案將提供經(jīng)過特殊設計的安全芯片、安全操作系統(tǒng)和能夠守護每臺設備的云端安全,是一個能夠為聯(lián)網(wǎng)微控制器(MCU)提供工業(yè)級安全保障的完整平臺級解決方案。

在打通微軟Azure云與邊緣的連接上,Azure Stack也是一個非常重要的組成部分。Azure Stack是微軟推出的一個可以獨立部署的軟硬一體化混合云解決方案,由于采用與Azure云同樣的架構,使得很多Azure云上的應用,包括認知服務、前面提到的Project Brainwave等都可以運行直接在Azure Stack,非常適合于那些邊緣計算的AI場景。

微軟AI的強大后臺

目前,在AI技術上微軟的領先性有目共睹,而微軟在AI領域有此地位與微軟在AI領域長期持久的投入不有關系,特別時與微軟研究院有直接關系。其實,微軟對AI的研究就發(fā)端于微軟研究院。在27年前,微軟研究院創(chuàng)立的時候,最早成立的三個研究組都是圍繞人工智能展開的:自然語言、語音與計算機視覺。

如今,微軟研究院在人工智能研究上成果卓著、令人矚目。沈向洋博士在大會上介紹了部分研究成果,包括:兩年前,在ResNet測試上以152層、96%的準確率拔得頭籌;一年前,在Switchboard語音識別基準測試中的錯誤率已經(jīng)降低至5.1%,達到了媲美人類專業(yè)速記員的水平;今年1月,微軟第一個在斯坦福大學發(fā)起的SQuAD文本理解挑戰(zhàn)賽上獲得超越人類的分數(shù);兩個月前,微軟在對新聞報道測試集的英中、中英機器翻譯上實現(xiàn)了比肩人工翻譯的水平。

另外,微軟亞洲研究院開發(fā)的OCR (Optical Character Recognition光學字符識別)技術,將為各種人工智能應用增加圖形文字識別功能,目前支持從Office到Skype、Bing、HoloLens的微軟應用,能識別打印字體、美術字、手寫字體,可以滿足從智能云到邊緣計算的各種場景。目前手寫識別OCR引擎V3.0版本的精度達到了70.5%,已經(jīng)部署于微軟認知服務,可供開發(fā)者用于自己開發(fā)的智能應用。

展望未來,人工智能的研究還將是一條慢慢長路。正如微軟語言技術的創(chuàng)世人、微軟全球資深技術院士、微軟云與人工智能事業(yè)部黃學東博士所總結的,目前所看到的人工智能技術的主要是“感知”方面,包括計算機視覺和語音識別等進步都很大。然而,在“認知”方面進步還是有限的,也就是至今我們還沒辦法真正讓機器理解我們人類的語言和思想,真正的自然語言理解還有很長的路要走。在這條道路上,微軟機器翻譯有了一個好的開端,但未來還有很多工作要做。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2018-05-31
微軟AI:你我都能感知、能使用的AI
當微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負責人沈向洋博士與來自南京理工大學的碩士研究生宋昊旻站在2018微軟AI人工智能大會現(xiàn)場,借助微軟語音翻譯服務順利進行中英文對話時,會議現(xiàn)場響起了熱烈的掌聲。

長按掃碼 閱讀全文