12月19日-20日,由騰訊發(fā)起的2020 Techo Park開發(fā)者大會于北京順利召開。作為面向全球開發(fā)者和技術(shù)愛好者的年度盛會,本次開發(fā)者大會針對行業(yè)開發(fā)者、ISV、科研機構(gòu)、高校師生、創(chuàng)業(yè)公司、開源社區(qū)工程師等設(shè)置了很多的亮點內(nèi)容和創(chuàng)新活動,來自國內(nèi)外200多位技術(shù)大咖為大家?guī)硪粓瞿甓鹊募夹g(shù)嘉年華。騰訊優(yōu)圖實驗室總監(jiān)黃小明出席大會并在AI分論壇上做了主題為《視覺AI技術(shù)的探索與實踐:“新基建時代”下的生產(chǎn)力》致辭分享。
騰訊優(yōu)圖實驗室總監(jiān) 黃小明
計算機視覺是機器認知世界的基礎(chǔ),也是最重要的人工智能技術(shù)之一。黃小明認為,計算機視覺將機器學習應(yīng)用于視覺領(lǐng)域,構(gòu)成人工智能的感知基礎(chǔ),加速人工智能在相關(guān)行業(yè)應(yīng)用落地。
黃小明表示,面對不同場景需求,計算視覺的準確度正在不斷提高。隨著視覺技術(shù)精度不斷提升,已經(jīng)廣泛應(yīng)用在零售及金融民生等領(lǐng)域。制造業(yè)中的質(zhì)量檢查和控制,成為工業(yè)視覺的重要應(yīng)用場景。中國是世界最大的制造業(yè)國家,它的生產(chǎn)力價值正在顯現(xiàn)。
“在未來的計算機視覺研究中,多模態(tài)融合、多技術(shù)融通是一個重要的趨勢。”黃小明表示,人工智能正在從語音、文字、視覺等單模態(tài)智能,向著多種模態(tài)融合發(fā)展,結(jié)合分布式平臺的計算能力,實現(xiàn)更高精度的場景構(gòu)建,和對動態(tài)場景的處理能力。
以下為黃小明演講實錄:
各位嘉賓:
我是騰訊優(yōu)圖實驗室的黃小明, 非常榮幸在這個場合有機會跟各位同仁就一些技術(shù)問題進行探討。
視覺AI技術(shù)是我研究的主要領(lǐng)域之一。近年來,深度學習技術(shù)、GPU算力以及海量數(shù)據(jù),作為AI技術(shù)發(fā)展的三大催化劑,加速了視覺技術(shù)在各行各業(yè)應(yīng)用落地,助力產(chǎn)業(yè)互聯(lián)網(wǎng)升級。計算機視覺的廣闊應(yīng)用前景,為我們展開了前所未有的壯麗圖景。
目前,計算機視覺已經(jīng)在工業(yè)視覺、OCR以及內(nèi)容理解等領(lǐng)域獲得重大突破,隨著計算機視覺技術(shù)精度和成熟度的提高,正不斷滲透到娛樂、醫(yī)療、零售行業(yè)等更多重點應(yīng)用場景,推動技術(shù)變革和用戶體驗提升。例如,在泛娛樂領(lǐng)域,以計算機視覺為基礎(chǔ)的人臉檢測技術(shù)、人臉關(guān)鍵點定位技術(shù)、人臉融合以及人像分割技術(shù)等AI視覺技術(shù),通過對泛娛樂場景各類基礎(chǔ)人臉研究和挖掘整合,打造出多項泛娛樂人像特效應(yīng)用,為泛娛樂行業(yè)用戶提供各類新奇酷炫的AI視覺特效和娛樂體驗。
疫情期間,由優(yōu)圖提供視覺AI技術(shù)支持的騰訊“防疫健康碼”,讓民眾通過申請涵蓋自身健康信息的二維碼,獲得電子出行憑證,方便民眾在疫情期間出入公共場所,也利于為政府部門統(tǒng)一管理。在各地復(fù)工復(fù)產(chǎn)的高峰期,各地健康碼互通,民眾出入不同省市都只用進行一次健康狀況的認證,加快復(fù)工復(fù)產(chǎn)進度,也使國家在疫情期間對信息的統(tǒng)一管理更加精準有效。騰訊“防疫健康碼”是服務(wù)用戶最多、增長速度最快的健康碼。截至目前,騰訊防疫健康碼服務(wù)9億用戶、累計亮碼150億人次,累計訪問量500億次。背后都有我們的視覺AI在發(fā)揮作用。
在未來的計算機視覺研究中,多模態(tài)融合、多技術(shù)融通是一個重要的趨勢。人工智能正在從語音、文字、視覺等單模態(tài)智能,向著多種模態(tài)融合發(fā)展,結(jié)合分布式平臺的計算能力,實現(xiàn)更高精度的場景構(gòu)建,和對動態(tài)場景的處理能力。
當然我們的工作還面臨著諸多挑戰(zhàn)。目前還無法建立一個通用的“視覺機器”,無法做到統(tǒng)一模型同時滿足不同場景要求。這意味著當下機器學習的訓練成本較高,也沒有達到產(chǎn)業(yè)化應(yīng)用的理想狀態(tài)。要解決這個問題,需要從端到端打通各個模態(tài)之間的關(guān)系,形成可以真正多維度交互的智能機器,讓感知智能升級為認知智能。
計算機視覺的技術(shù)前景是令人興奮的,還有很多未抵達的神奇地域等著我們?nèi)ヌ剿?。阿蘭·圖靈曾說過:“這不過是將來之事的前奏,也是將來之事的影子。”從人類開辟出人工智能領(lǐng)域,到今天真正的應(yīng)用落地,時光只不過是歷史一瞬。未來,讓我們仰望星空,腳踏實地,共同創(chuàng)造中國計算機視覺的新輝煌,期待各位的分享。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )