谷歌AI負(fù)責(zé)人Jeff Dean:一文回顧谷歌的2018技術(shù)進(jìn)展

一年一度的谷歌AI總結(jié)公布了。

1月15日,谷歌高級(jí)研究員、谷歌AI負(fù)責(zé)人Jeff Dean發(fā)表了博文,回顧總結(jié)了2018年谷歌的技術(shù)研究進(jìn)展。

Jeff Dean從谷歌的人工智能、量子計(jì)算、感知技術(shù)、算法理論、AutoML、機(jī)器人以及TPU等多個(gè)技術(shù)層面,系統(tǒng)地還原了谷歌AI的2018。

眾所周知,在去年一整年,谷歌遭遇了諸多危機(jī),尤其是不作惡的原則受到內(nèi)外的質(zhì)疑。Jeff Dean博客中首要提到的便是谷歌的道德原則和AI。

道德原則和人工智能

今年,我們發(fā)布了Google AI原則,但是,由于AI的發(fā)展非常迅速,AI原則中諸如“避免制造或加強(qiáng)不公平的偏見”、“對(duì)人民負(fù)責(zé)”等也在不斷變化和改進(jìn)。

其中,機(jī)器學(xué)習(xí)公平性和模型可解釋性等領(lǐng)域的新研究,正反向推動(dòng)我們的產(chǎn)品進(jìn)步,使其更具包容性。例如我們?cè)诠雀璺g中減少“性別偏見”,并允許探索和發(fā)布更具包容性的圖像數(shù)據(jù)集和模型,使計(jì)算機(jī)視覺能夠適應(yīng)全球文化的多樣性。

社會(huì)公益

Jeff Dean舉例了AI應(yīng)用于解決現(xiàn)實(shí)公共問題的案例:

洪水預(yù)測(cè)工作。該研究與Google的許多團(tuán)隊(duì)合作,旨在提供有關(guān)洪水發(fā)生可能和范圍的準(zhǔn)確細(xì)粒度信息,使洪水易發(fā)地區(qū)的人們能夠更好地保護(hù)自己及其財(cái)產(chǎn)。

地震余震預(yù)測(cè)的工作。谷歌展示了機(jī)器學(xué)習(xí)(ML)模型可以比傳統(tǒng)的基于物理的模型更準(zhǔn)確地預(yù)測(cè)余震位置。

除此之外,還有許多Google研究人員和工程師合作,使用TensorFlow等開源軟件解決各種科學(xué)和社會(huì)問題,例如使用卷積神經(jīng)網(wǎng)絡(luò)來識(shí)別座頭鯨的位置,檢測(cè)新的系外行星,識(shí)別患病的木薯植物等。

AI輔助技術(shù)

為了使ML和計(jì)算機(jī)科學(xué)幫助用戶更快更有效地完成任務(wù),谷歌推出了智能語音技術(shù)Google Duplex。

這是一個(gè)囊括自然語言研究和對(duì)話理解以及文本、語言識(shí)別的技術(shù)。其核心是一個(gè)循環(huán)神經(jīng)網(wǎng)絡(luò),使用的是TensorFlow Extend(TFX)的機(jī)器學(xué)習(xí)平臺(tái)構(gòu)建。

當(dāng)Google Duplex撥打電話時(shí),它的聲音近乎真實(shí)的普通人。你可以聽到Google Duplex幫你打電話預(yù)約理發(fā)。

其他應(yīng)用案例還包括Smart Compose,它可以使用預(yù)測(cè)模型提供有關(guān)如何撰寫電子郵件的相關(guān)建議,使電子郵件撰寫過程更快更容易的工具。

我們研究的一個(gè)重點(diǎn)是讓Google智能助理這樣的產(chǎn)品支持更多語言,并且可以更好地理解語義相似性。

量子計(jì)算

在過去的一年里,我們制作了許多令人興奮的量子計(jì)算新成果,包括開發(fā)了一種新的72比特通用量子計(jì)算設(shè)備Bristlecone,該設(shè)備可以擴(kuò)大量子計(jì)算機(jī)在量子領(lǐng)域可以解決的問題。

我們還發(fā)布了量子計(jì)算機(jī)的開源編程框架Cirq,并探討了量子計(jì)算機(jī)如何用于神經(jīng)網(wǎng)絡(luò)。最后,我們分享了量子處理器性能波動(dòng)的經(jīng)驗(yàn)和技術(shù)以及量子計(jì)算機(jī)如何作為神經(jīng)網(wǎng)絡(luò)計(jì)算基板的一些想法。

自然語言理解

2018年,Google的自然語言研究在基礎(chǔ)研究和以產(chǎn)品為中心的合作上都取得了非常棒的成果。我們?cè)谥暗臋C(jī)器學(xué)習(xí)模型基礎(chǔ)上開發(fā)了一個(gè)新的并行版本的模型 Universal Transformer,它在包括翻譯和語言推理在內(nèi)的許多自然語言任務(wù)中都顯示出強(qiáng)大的技術(shù)能力。

我們還開發(fā)了BERT,這是第一個(gè)深度雙向,無監(jiān)督的自然語言處理模型,僅使用純文本語料庫進(jìn)行預(yù)訓(xùn)練,就能使用遷移學(xué)習(xí)對(duì)各種自然語言任務(wù)進(jìn)行微調(diào)。

感知

我們的感知研究解決了允許計(jì)算機(jī)理解圖像,聲音以及為圖像獲取,壓縮,處理,創(chuàng)造性表達(dá)和增強(qiáng)現(xiàn)實(shí)提供更強(qiáng)大工具的難題。

Google AI使命的一個(gè)關(guān)鍵是讓其他人能夠從我們的技術(shù)中受益,今年我們?cè)诟倪M(jìn)作為Google API一部分的功能和構(gòu)建塊方面取得了很大進(jìn)展。比如通過ML Kit 在Cloud ML API和面部相關(guān)設(shè)備構(gòu)建塊中實(shí)現(xiàn)視覺和視頻的改進(jìn)和新功能。

MobileNetV2是谷歌的下一代移動(dòng)計(jì)算機(jī)視覺模型,我們的MobileNets廣泛應(yīng)用于學(xué)術(shù)界和工業(yè)界。MorphNet提出了一種有效的方法來學(xué)習(xí)深層網(wǎng)絡(luò)的結(jié)構(gòu),從而在計(jì)算資源有限的同時(shí),改進(jìn)圖像和音頻模型上的性能。

計(jì)算攝影

手機(jī)拍照性能的提升不僅僅在于物理傳感器的改進(jìn),更大部分要?dú)w咎于計(jì)算攝影技術(shù)的發(fā)展。

我們的計(jì)算攝影技術(shù)正在與Google的Android和消費(fèi)者硬件團(tuán)隊(duì)密切合作,將這項(xiàng)研究交付給最新的Pixel和Android手機(jī)及其他設(shè)備。2014年,我們推出了HDR +,可以在軟件中對(duì)齊幀,并將它們與計(jì)算軟件結(jié)合,使圖片具有比單次曝光更高的動(dòng)態(tài)范圍。這是2018年我們能夠在Pixel 2中開發(fā)Motion Photos,以及Motion Stills中開發(fā)增強(qiáng)現(xiàn)實(shí)模式的基礎(chǔ)。

今年,我們?cè)谟?jì)算攝影研究方面的主要工作之一就是創(chuàng)造一種名為Night Sight的新功能,即便在沒有閃光燈的情況下,也能讓Pixel用戶在非?;璋档膱?chǎng)景中拍出清晰的照片。

算法和理論

在過去的一年中,我們的研究涵蓋從理論基礎(chǔ)到應(yīng)用算法,從圖形挖掘到隱私保護(hù)計(jì)算等廣泛領(lǐng)域。我們?cè)趦?yōu)化方面的工作涉及從研究機(jī)器學(xué)習(xí)的持續(xù)優(yōu)化到分布式組合優(yōu)化的領(lǐng)域。在前一領(lǐng)域,我們研究用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的隨機(jī)優(yōu)化算法的收斂性(其贏得了ICLR 2018)最佳論文獎(jiǎng)),展示了流行的基于梯度的優(yōu)化方法(例如ADAM的一些變體)的問題,為新的基于梯度的優(yōu)化方法提供了堅(jiān)實(shí)的基礎(chǔ)。

軟件系統(tǒng)

我們對(duì)軟件系統(tǒng)的大部分研究仍然與構(gòu)建機(jī)器學(xué)習(xí)模型,尤其是TensorFlow有關(guān)。我們的一些新研究引入了Mesh TensorFlow,這使得用模型并行性指定大規(guī)模分布式計(jì)算變得容易。另外,我們還使用TensorFlow發(fā)布了一個(gè)可擴(kuò)展的深度神經(jīng)排序庫。

另一個(gè)重要的研究方向是將ML應(yīng)用于軟件系統(tǒng)的堆棧層面。在安全漏洞問題方面,我們的編譯器研究團(tuán)隊(duì)將他們用于測(cè)量機(jī)器指令延遲和端口壓力的工具集成到LLVM中,從而可以做出更好的編譯決策。

我們研究了Google軟件定義網(wǎng)絡(luò)WAN,這是一個(gè)獨(dú)立的聯(lián)合查詢處理平臺(tái),可以在許多存儲(chǔ)系統(tǒng)中對(duì)基于不同文件格式存儲(chǔ)的數(shù)據(jù)執(zhí)行SQL查詢(BigTable,Spanner, Google Spreadsheets等)

運(yùn)行內(nèi)容托管等大型Web服務(wù)需要在動(dòng)態(tài)環(huán)境中實(shí)現(xiàn)穩(wěn)定的負(fù)載平衡。我們開發(fā)了一致的哈希方案,對(duì)每臺(tái)服務(wù)器的最大負(fù)載提供了嚴(yán)格的可證明保證,并將其部署到Google Cloud Pub / Sub中的云客戶。

AutoML

去年,我們展示了如何使用進(jìn)化算法自動(dòng)發(fā)現(xiàn)最先進(jìn)的神經(jīng)網(wǎng)絡(luò)架構(gòu),快速構(gòu)建計(jì)算機(jī)視覺模型的AutoML。還探討了強(qiáng)化學(xué)習(xí)如何應(yīng)用于除神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索之外的其他問題,表明它可以用于1)自動(dòng)生成圖像變換序列,以提高各種圖像模型的準(zhǔn)確性,以及2)找到新的符號(hào)優(yōu)化表達(dá)式,比常用的優(yōu)化更新規(guī)則更有效。

我們的另一個(gè)重點(diǎn)是自動(dòng)發(fā)現(xiàn)計(jì)算效率高的神經(jīng)網(wǎng)絡(luò)架構(gòu),以便它們可以在自動(dòng)駕駛環(huán)境中運(yùn)行,這些環(huán)境對(duì)計(jì)算資源或推理時(shí)間有嚴(yán)格的限制。為此,我們認(rèn)為在強(qiáng)化學(xué)習(xí)架構(gòu)搜索的獎(jiǎng)勵(lì)函數(shù)中將模型的準(zhǔn)確性與其推理計(jì)算時(shí)間相結(jié)合,可以找到高度準(zhǔn)確的模型,同時(shí)滿足特定的性能約束。我們還探索了使用ML來學(xué)習(xí)自動(dòng)壓縮ML模型以獲得更少的參數(shù)并使用更少的計(jì)算資源。

TPU

TPU已經(jīng)實(shí)現(xiàn)了谷歌研究方面的突破,例如BERT(前面已討論過)。它還允許世界各地的研究人員通過開源建立谷歌研究,并尋求自己的新突破。例如,任何人都可以通過Colab免費(fèi)對(duì)TPU上的BERT進(jìn)行微調(diào),而TensorFlow Research Cloud讓數(shù)千名研究人員有機(jī)會(huì)從更大量的免費(fèi)云TPU計(jì)算能力中受益。

在谷歌內(nèi)部,TPU還推動(dòng)了Google的核心產(chǎn)品的重大改進(jìn),包括搜索,YouTube,Gmail,Google智能助理,谷歌翻譯等等。

開源軟件和數(shù)據(jù)集

我們的開源工具TensorFlow已經(jīng)被下載超過3000萬。2018年,TensorFlow有八個(gè)主要版本,并增加了快速執(zhí)行和分發(fā)策略等功能。隨著TensorFlow Lite、TensorFlow.js 和TensorFlow Probability等相關(guān)產(chǎn)品的推出,TensorFlow生態(tài)系統(tǒng)在2018年大幅增長。

除了繼續(xù)開發(fā)現(xiàn)有的開源生態(tài)系統(tǒng)之外,我們?cè)?018年引入了一個(gè)新的框架,用于靈活和可重復(fù)強(qiáng)化學(xué)習(xí)的可視化工具,可以快速了解數(shù)據(jù)集的特征(無需編寫任何代碼)。

今年,我們很高興發(fā)布Google數(shù)據(jù)集搜索,這是一種從所有網(wǎng)絡(luò)中查找公共數(shù)據(jù)集的新工具。多年來,我們還策劃并發(fā)布了許多新穎的數(shù)據(jù)集。

我們發(fā)布了Open Images V4數(shù)據(jù)集,包含190萬張圖片,共計(jì)600個(gè)類別,共標(biāo)記了1540萬個(gè)邊界框,這是迄今的有對(duì)象位置注釋的最大數(shù)據(jù)集。這些邊界框大部分都是由專業(yè)注釋人員手動(dòng)繪制的,確保了它們的準(zhǔn)確性和一致性。

健康

在過去幾年中,我們一直將ML應(yīng)用于健康,我們?cè)谶@個(gè)領(lǐng)域的一般方法是與醫(yī)療保健組織合作解決基礎(chǔ)研究問題(利用臨床專家的反饋優(yōu)化技術(shù)),然后將結(jié)果發(fā)表在同行評(píng)審的科學(xué)和臨床期刊上。一旦研究得到臨床和科學(xué)驗(yàn)證,我們就會(huì)進(jìn)行用戶和HCI研究,以了解我們?nèi)绾卧诂F(xiàn)實(shí)臨床環(huán)境中進(jìn)行部署。2018年,我們?cè)谟?jì)算機(jī)輔助診斷上取得新的突破。

2018年,我們研發(fā)了一個(gè)可以與視網(wǎng)膜專家相媲美的深度學(xué)習(xí)模型。我們與Verily的Alphabet同事合作,在印度的Aravind Eye Hospitals和泰國衛(wèi)生部附屬的Rajavithi醫(yī)院等 10多個(gè)地點(diǎn)部署了這種糖尿病視網(wǎng)膜病變檢測(cè)系統(tǒng)。

我們還發(fā)表了一種機(jī)器學(xué)習(xí)模型的研究,該模型可以評(píng)估視網(wǎng)膜圖像的心血管風(fēng)險(xiǎn),可以幫助臨床醫(yī)生更好地了解患者的健康狀況。

研究之外

2018年,我們?cè)诩蛹{阿克拉建立了我們?cè)诜侵薜牡谝粋€(gè)人工智能研究辦公室,同時(shí)擴(kuò)大了在巴黎,東京和阿姆斯特丹的人工智能研究,并在普林斯頓開設(shè)了一個(gè)研究實(shí)驗(yàn)室。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2019-01-17
谷歌AI負(fù)責(zé)人Jeff Dean:一文回顧谷歌的2018技術(shù)進(jìn)展
1月15日,谷歌高級(jí)研究員、谷歌AI負(fù)責(zé)人Jeff Dean發(fā)表了博文,回顧總結(jié)了2018年谷歌的技術(shù)研究進(jìn)展。

長按掃碼 閱讀全文