為了更懂人類,人工智能正在修煉的三大技術(shù)

人工智能自1956年Dartmouth學(xué)會上提出,在經(jīng)歷一個又一個寒冬之后,如今真正登上了人類舞臺。當(dāng)下,不論是計(jì)算機(jī)視覺、自然語言處理還是安全監(jiān)控以及智能駕駛,人工智能技術(shù)的應(yīng)用都近在咫尺,但那些一直期盼它能像人類一樣具備思維的夙愿,至今卻仍未實(shí)現(xiàn),為了更懂人類,全球人工智能科學(xué)家都在沖擊技術(shù)高點(diǎn),不遺余力的為AI技術(shù)帶來全新突破,這其中就包括近年來被認(rèn)為會顛覆人工智能格局的三大技術(shù)。

對抗性神經(jīng)網(wǎng)絡(luò)

對抗性神經(jīng)網(wǎng)絡(luò)(Generative Adversarial Network,GAN)最早出現(xiàn)在2014年在蒙特利爾大學(xué)博士生Ian Goodfellow的學(xué)術(shù)論證中,他采用兩個神經(jīng)網(wǎng)絡(luò),支持大多數(shù)現(xiàn)代機(jī)器學(xué)習(xí)的人腦簡化數(shù)學(xué)模型,讓他們在數(shù)字游戲中彼此對抗。

在這個過程中就會出現(xiàn)兩個神經(jīng)網(wǎng)絡(luò)的角色,一個是生成網(wǎng)絡(luò)(Generator),另一個是判別網(wǎng)絡(luò)(Discriminator),前者負(fù)責(zé)不斷生成內(nèi)容,后者負(fù)責(zé)不斷判別生成的內(nèi)容,彼此互博,最終在長期對抗中提升各自的能力。經(jīng)過長時間的互博結(jié)果,一個不斷“造假”,一個不斷“驗(yàn)真”,生成網(wǎng)絡(luò)的“造假”能力劇增,產(chǎn)出的逼真內(nèi)容已經(jīng)讓判別網(wǎng)絡(luò)無法辨識。

對抗性神經(jīng)網(wǎng)絡(luò)的關(guān)鍵性突破就在于,通過這種對抗機(jī)制,機(jī)器開始理解人類所看到和聽到的世界結(jié)構(gòu),并最終賦予機(jī)器在創(chuàng)造一個全新的東西時所需要想象力,生成的結(jié)果非常逼真。

目前,對抗性神經(jīng)網(wǎng)絡(luò)有兩種應(yīng)用,一是完全從無到有的生成逼真度極高的語音或者圖像;另一個則是利用對抗性神經(jīng)網(wǎng)絡(luò)來改進(jìn)已有傳統(tǒng)的AI應(yīng)用,例如超分辨率、照片自動美化、機(jī)器翻譯等,包括Google Brain、DeepMind、Nvidia、Open AI都是這項(xiàng)技術(shù)的重要參與者。

生物特征識別

所謂生物識別技術(shù)就是,通過計(jì)算機(jī)與光學(xué)、聲學(xué)、生物傳感器和生物統(tǒng)計(jì)學(xué)原理等高科技手段密切結(jié)合,利用人體固有的生理特性,如指紋、指靜脈、掌靜脈、臉象、虹膜等,以及行為特征,如筆跡、聲音、步態(tài)等,來進(jìn)行個人身份的鑒定。

由于人體特征具有人體所固有的不可復(fù)制的唯一性,通常屬于私密安全范疇,這一生物密鑰無法復(fù)制,偷竊或者遺忘,因而利用生物識別技術(shù)進(jìn)行身份認(rèn)定,具有非常高的安全性和準(zhǔn)確性,而目前一些常見的口令往往都不免存在著被復(fù)制及被盜用的不利因素,因此采用生物特征作為識別的“鑰匙”,能夠大幅度提升識別效果以及降低安全風(fēng)險。

未來,伴隨著生物特征識別技術(shù)的不斷成熟,也將迎來全新的市場變化和需求,盡管單一的生物識別技術(shù)各有優(yōu)劣,在安全要求較高的場景,仍舊存在提升空間,但目前而言,生物特征識別技術(shù)的應(yīng)用正在各行業(yè)擴(kuò)展開來,尤其在物聯(lián)網(wǎng)的應(yīng)用上會成為著力點(diǎn),在配合安全、監(jiān)控、管理系統(tǒng)整合,實(shí)現(xiàn)自動化管理上,市場前景廣闊。

情感計(jì)算

情感計(jì)算的概念是在1997 年由麻省理工學(xué)院(Massachusetts Institute of Tech-nology,MIT)媒體實(shí)驗(yàn)室 Rosalind Picard 教授提出的,她的著作《Affective Computing》開創(chuàng)了計(jì)算機(jī)科學(xué)和人工智能學(xué)科中的新分支——“情感計(jì)算”,她指出情感計(jì)算與情感相關(guān),是源于情感或能夠?qū)η楦惺┘佑绊懙挠?jì)算。

由于人類交流中80%的信息都是情感性的內(nèi)容,而人工智能系統(tǒng)只有在對人類情感得到充分了解之后,才能發(fā)揮具備智力因素的情感反饋,實(shí)現(xiàn)真正的強(qiáng)人工智能。因而,情感計(jì)算就是要賦予機(jī)器類似于人一樣的觀察、理解和生成各種情感特征的能力,最終使讓機(jī)器像人一樣正確感知環(huán)境、理解用戶情感和意圖,以作出自然、親切和生動的交互。這種技術(shù)手段的出發(fā)點(diǎn)是通過心理學(xué)、生理學(xué)、認(rèn)知學(xué)、行為學(xué)和腦科學(xué)等相關(guān)的綜合學(xué)科,來進(jìn)行機(jī)器的情感化操作,在此基礎(chǔ)上,人類需求分析、情感表達(dá)、人機(jī)交互才能成為可能。

因而,傳統(tǒng)的人機(jī)交互應(yīng)用在情感計(jì)算的不斷成熟中正在被逐漸迭代,通過語音情感識別、人臉表情識別和生理信號情感識別等,進(jìn)行喜、怒、憂、思、悲、恐、驚七種基本情感計(jì)算,完成情感反饋,進(jìn)而在情感語音合成、面部表情合成和肢體語言合成上具備精準(zhǔn)結(jié)果。情感計(jì)算未來在醫(yī)療健康、安全駕駛、遠(yuǎn)程教育、智能家電等領(lǐng)域都具備超前的應(yīng)用前景,賦予機(jī)器擬人化的工作狀態(tài),修煉“讀心術(shù)”。盡管如此,目前情感計(jì)算領(lǐng)域存在的挑戰(zhàn)還很多,包括情感獲取與建模、情感識別與理解、情感表達(dá)等,亟待全球頂尖人工智能科學(xué)家?guī)碜钚峦黄啤?/p>

在AlphaGo獲勝的那一刻,我們都不愿承認(rèn)歷經(jīng)億萬年所進(jìn)化的人類智慧被機(jī)器超越,但事實(shí)上,我們又希望冷冰冰的機(jī)器能憑借人工智能成為更懂人類的那個伙伴,我們期待的不僅僅是讓機(jī)器“更智能”,還是“更像人”,當(dāng)人工智能技術(shù)能夠解決這些障礙時,他才能支撐起自己思維的物質(zhì)世界。不論是微軟小冰通過情緒特征感知而不斷升級的共感模型、Facebook研究人員試圖通過觀看視頻來教AI來理解現(xiàn)實(shí)、曠視科技正在從各個角度攻破視覺識別領(lǐng)域障礙、還是極鏈科技Video++通過千萬次訓(xùn)練來讓AI理解視頻內(nèi)容所表達(dá)的不同情感等,都能看到人工智能研究者正在卯足勁向前,盡管我們要承認(rèn)機(jī)器學(xué)習(xí)中的技能轉(zhuǎn)移也許不總是有效,但正是這種與現(xiàn)實(shí)的差距,才能不斷激勵技術(shù)進(jìn)步,未來仍舊可期。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2018-10-13
為了更懂人類,人工智能正在修煉的三大技術(shù)
人工智能自1956年Dartmouth學(xué)會上提出,在經(jīng)歷一個又一個寒冬之后,如今真正登上了人類舞臺。

長按掃碼 閱讀全文