CCR2017在滬召開 搜狗COO茹立云:AI推動五項核心圖像技術取得突破

10月12-15日,中華醫(yī)學會第24次全國放射學學術大會(CCR 2017)在上海世博中心拉開帷幕,聚集了國內外一流的專家學者及業(yè)內人士共6000余人,集中展示和交流了中國影像醫(yī)學的歷史傳承與跨越式發(fā)展。搜狗公司COO茹立云受邀出席此次大會,以“人工智能在圖像領域的進展”為題,分享了人工智能推動圖像技術取得的五項重大突破,并指出人工智能技術在醫(yī)療領域應用前景廣闊,未來將能發(fā)揮更大作用。

  (搜狗公司COO茹立云出席CCR2017并發(fā)表主題演講)

隨著移動互聯(lián)網(wǎng)及社交網(wǎng)絡的發(fā)展,圖片成為主要的信息載體,在這種情況下,計算機的圖像識別技術就顯得尤為重要。茹立云介紹,21世紀初,圖像的檢索基本上是由人工去定義特征,在機器上做簡單的匹配。人工智能技術的發(fā)展,讓機器對圖像中內容的理解能力實現(xiàn)了全面提升。具體而言,面對一張圖片時,機器會最先判斷“圖像里有什么”,精準識別圖像中的內容;其次判斷“圖像中物體在哪兒”,以精準定位物體的位置;最后會對“圖像內容表達什么”進行智能語義分析。

“機器對圖像理解能力的提升,則直接推動了OCR文字識別、識圖搜索、人臉識別、圖文翻譯、圖像生成這五大圖像技術的突破。其中,前三項技術主要用于解決‘圖像里有什么’和‘圖像中物體在哪兒’的問題,后兩項則對應解決‘圖像內容表達什么’的問題。”茹立云指出,并一一介紹了這五大技術突破的具體發(fā)展情況。

在文字識別方面,其目標是檢測并識別圖像中的文字?!皞鹘y(tǒng)文字檢測方法步驟繁瑣、人工設計流程多,且無法應對復雜背景和低質量文字?,F(xiàn)有技術體現(xiàn)了深度學習模型的端到端的特點,減少了中間環(huán)節(jié),從而能降低識別錯誤率。圖片中的文字無論是印刷體、手寫體或者夾雜在復雜背景中,都能被機器準確讀出來。”茹立云還以搜狗翻譯APP最新推出的“菜單翻譯”功能為例,展示了文字識別技術的具體應用。這項功能基于搜狗領先的圖像識別技術,對于用戶從任意角度掃描的中英文菜單,均可準確識別,并在原菜單的對應位置標識出相應的翻譯結果。

  (圖:“菜單翻譯”功能翻譯前后對比截圖)

識圖搜索則旨在解決圖像分類、查找相同圖、相似圖等問題。茹立云表示,當前的識圖搜索技術,以深度學習算法替代了人工設計,有效提升了相同圖和相似圖搜索結果的質量?!叭缢压穲D片的拍照購物功能,用戶只需將喜歡的衣服拍照上傳,或者從手機里上傳相關照片,系統(tǒng)即可對上傳照片進行快速處理,并與數(shù)據(jù)庫中上億張商品圖片進行高速比對,為用戶找到相同和相近的商品。再如搜狗圖片的‘識狗’、‘識花’功能,用戶只需上傳相關照片,即可直接識別出狗或者花的種類?!比懔⒃婆e例說。

人臉識別方面,他指出,在深度學習以及大數(shù)據(jù)的驅動下,人工智能在人臉識別的某些方面已遠超人類的識別能力。并且,人臉識別的實際應用場景也已日趨成熟,已經(jīng)越來越多地應用到了機場安檢、人流監(jiān)控、疑犯查找、身份認證等場景下。例如商店的監(jiān)控器,就可以利用人臉識別技術,對經(jīng)常出入店鋪的熟客進行針對性營銷,將能更好提升銷量。

圖文翻譯技術,其目的是使機器準確理解圖像背后的語義?!皞鹘y(tǒng)的圖像識別技術,只能粗略識別出圖像中的基本內容,如圖像中有一個人。而人工智能支持下的圖文翻譯技術,不僅能告訴你圖片中有一個人,還能分辨出這個人的性別、他手上拿的東西、他周圍有什么物體等更細致的內容。”茹立云說,這項技術的突破,也能給人帶來極大便利,例如盲人朋友以前只能通過聲音或者文字轉化成的聲音來獲取信息,現(xiàn)在還能把圖片信息轉化成的聲音,讓他更好了解視覺化的世界。

而人工智能技術發(fā)展到更高階段,則是圖像生成技術,目前這一技術也已被廣泛應用到了人臉合成、圖像修復、風格遷移等方面?!袄鐖D像修復方面,AI能通過深度學習,將帶馬賽克或者畫面遮擋的圖片修復成完整圖片,再如黑白照片上色變成彩色照片,等等?!比懔⒃婆e例說。

回到大會核心話題——影像醫(yī)學領域,茹立云指出,未來圖像AI在醫(yī)療領域的應用前景將會非常廣闊,主要包括三方面:首先是輔助診斷,人工智能可以學習更多醫(yī)學影像方面的數(shù)據(jù),進一步輔助醫(yī)生診斷決策;其次是療效評估,對于腫瘤等重大疾病,可依據(jù)AI大數(shù)據(jù)分析,在治療前判斷治療方案對患者的療效;再次是預后預測,科學預測患者生存期,提取患者特征,建立模型,定量分析,給出預后預測。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2017-10-18
CCR2017在滬召開 搜狗COO茹立云:AI推動五項核心圖像技術取得突破
10月12-15日,中華醫(yī)學會第24次全國放射學學術大會(CCR 2017)在上海世博中心拉開帷幕,聚集了國內外一流的專家學者及業(yè)內人士共6000余人,集中展示和交流了中國影像醫(yī)學的歷史傳承與跨越式發(fā)展。搜狗公司COO茹立云受邀出席此次大會,以“人工智能在圖像領域的進展”為題,分享了人工

長按掃碼 閱讀全文