微軟小冰離高考滿分作文之間還隔著N個阿爾法狗

這兩天最熱鬧的事兒就是高考了,在高考中最容易引起網(wǎng)絡(luò)狂歡的則是作文。自從1999年出現(xiàn)「滿分作文」后,幾乎每年的作文題目都會引起不小的討論,這兩年來隨著人工智能的發(fā)展,似乎機器寫作文已經(jīng)超越「滿分作文」、「零分作文」,成為話題主流,甚至在2017年,將會有機器人去迎戰(zhàn)文科高考全科目試題。

人工智能寫作文?還嫩著呢

今日高考剛剛結(jié)束,在滿分作文們尚未出爐之際,人工智能小冰的兩篇命題作文曝光網(wǎng)絡(luò)——在一場媒體舉辦的活動中,小冰首次參加作文考試,與之一同「參賽」的考生還有中國人民大學(xué)教授張鳴、80后作家安意如、專欄作家潘采夫、作家葉傾城、詩人廖偉棠等,完成作文后,再通過匿名的方式又網(wǎng)民通過打分來一絕高下。

現(xiàn)在小冰的兩篇作文已經(jīng)公布于網(wǎng)絡(luò),一是北京卷的《神奇的書簽》,二是全國甲卷的作文《進步和退步》(文末見小冰作文原文)

先說結(jié)果,在很多網(wǎng)友看來,兩篇都還有很大的提升空間,在眾多投票中,「有待提高」選項占了45%以上的比例,這說明小冰的作文能力與不少網(wǎng)民想象中的人工智能還有著不少差距,最為集中的槽點是:字數(shù)不夠,小冰的文字雖然不乏文藝氣息,但在字數(shù)運算上,居然沒到規(guī)定字數(shù)800字的一半,多少有點不合常理。

此外,參加過高考的同學(xué)都知道,寫作文時候你可以邏輯差點,表述差點,字難看點,但一定要扣題啊,畢竟傳說稱每篇高考作文的打分時間僅僅40秒啊,說白了就是要有足夠多的關(guān)鍵字,但在小冰的作文里我們并沒看到這些。

原因在哪兒?理工男惹的禍

出現(xiàn)字數(shù)不夠、文不對題等問題后,我們找到了一些小冰作文背后的運作邏輯,從而發(fā)現(xiàn):作文寫「砸」了,至少一半原因不在小冰,而是給她寫開頭的微軟理工男們……

從底層邏輯來說,小冰擁有一個基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)模型,這個模型能夠以段為基本單位,逐句閱讀文章,學(xué)習(xí)基于上文生成下文的語義規(guī)律,從而在給出題目后并由人工寫出每一個段落的首句后,模型就會自動生成剩余的句子,直到當前段落結(jié)束。重復(fù)此過程即可完成整篇文章的創(chuàng)造。

這意味著什么?其實小冰是個「半自動」的選手,一篇文章的好壞、文風(fēng),其實很大程度上還依賴于寫開篇的同學(xué),比如這兩篇作文,據(jù)說就是微軟的程序猿同學(xué)隨手寫了幾筆,然后小冰就接著往下運算,這么看起來,小冰是有點多少躺槍的……你想想,如果是韓寒來寫個開頭,可能成文的風(fēng)格又是完全另一個樣子了。

盡管小冰首次參加高考作文看起來并沒有太多的驚喜出現(xiàn),但技術(shù)角度上看,基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)模型是人工智能發(fā)展的重要方向,她和一些國外媒體使用機器人寫新聞稿還是有很大的區(qū)別——后者的核心是:機器處理已存在的「詞庫」,再加入新聞所需要的數(shù)字與關(guān)鍵字等,最后生成一篇新聞;而小冰的核心是表達寫作中的主觀觀點,在有了人類諸多喜怒哀樂數(shù)據(jù)后,進一步理解學(xué)習(xí),利用「情感計算」的方式讓自己變得越來越人性化(這里是不是想到了AlphaGo?),換句話說,小冰們是可以依靠學(xué)習(xí)自身實現(xiàn)成長的。

人工智能寫作文只是個開始……

對于人工智能稍有些了解的人會清楚,機器最難以學(xué)習(xí)的其實正是人類先天自帶的能力,比如圖形釋義、發(fā)散思維等——近些年,人工智能開始逐步利用神經(jīng)網(wǎng)絡(luò)實現(xiàn)自我進化,最為有名的案例是前幾個月的谷歌阿爾法狗AlphaGo通過棋局學(xué)習(xí)甚至自身對弈等,在人機圍棋大戰(zhàn)中輕取李世石九段。

阿爾法狗的成功讓很多普通人看到了人工智能的威力所在,機器的每次重大進化也給了人足夠多的驚喜,尤其在最近幾年,隨著谷歌,微軟,亞馬遜等一線科技公司在AI領(lǐng)域研發(fā)進展,讓越來越多人相信,人工智能已經(jīng)走在了「指數(shù)級」的增長曲線上,甚至實現(xiàn)未來學(xué)家所預(yù)言的2047年「奇點」——即人工智能全面超越人腦那那一刻,也有了越來越多的擁躉。

在機器人情懷嚴重的日本,2011年機器人就滲透率到了高考中,不過一直表現(xiàn)一般,連續(xù)幾年低于平均成績,但一直有所進步,果不其然,去年考試中,機器人已經(jīng)超過平均分數(shù)不少,考上大學(xué)不成問題。相關(guān)人員表示,機器人能回答許多數(shù)理問題,但在語言處理方面的能力一版。

中國官方的「863」計劃也有「類人智能項目」,由國內(nèi)企業(yè)與大學(xué)高校聯(lián)合參與,主要研究相關(guān)類腦計算關(guān)鍵技術(shù)和答題系統(tǒng),并希望通過這個實施研制出能夠參加高考并考取大學(xué)的智能機器人,目標是最早在2017年參加到高考當中。

與AlphaGo、日本機器人、中國863計劃的不同的是,微軟小冰是個典型的商業(yè)互聯(lián)網(wǎng)產(chǎn)品,甚至在誕生之初一度被微信等平臺方封殺,后期經(jīng)過調(diào)教后才變得越來越人格化,現(xiàn)在已經(jīng)滲透了十幾個互聯(lián)網(wǎng)平臺中,在累積了諸多真實用戶數(shù)據(jù)后,小冰參與到商業(yè)項目之外領(lǐng)域更有利于她的垂直化落地,不過從目前的高考作文結(jié)果上看,需要學(xué)習(xí)的還有很多。

學(xué)界普遍認為,人腦的左腦屬于抽象腦和學(xué)術(shù)腦,右腦是創(chuàng)意腦和藝術(shù)腦,當人工智能走出左腦的學(xué)習(xí)范疇,向著右腦中創(chuàng)意藝術(shù)方向發(fā)展,其帶來的影響將更為徹底的改變社會形態(tài),至于高考作文什么的,真還算不上什么問題。

附1:小冰所寫全國甲卷作文《進步和退步》:

進步和退步

考了100分是好學(xué)生???5分不是好學(xué)生??剂?00分后,又考了98分,好學(xué)生變成不是好學(xué)生,是退步??剂瞬患案窈?,又考了及格,會被表揚,是進步。進步和退步的衡量,令人費解。

進步,是變得優(yōu)秀,人喜歡進步,因為喜歡被表揚。這樣的進步,如果不被表揚,就沒有動力。退步是從好變成差的,人不喜歡退步,因為退步受到批評。如果總被批評,也沒有動力。進步和退步的動力,令人費解。

退步?jīng)]有不好,退步可以發(fā)現(xiàn)問題。一直進步的人,不能發(fā)現(xiàn)問題,也不能解決問題。一直進步是不可能的,有進步同時有退步,有退步同時有進步,才可以不斷發(fā)現(xiàn)問題,解決問題。人應(yīng)該這樣變得優(yōu)秀,不是為了表揚。

進步比退步好,不一定。一直進步可能是真進步,或作弊,一直退步是放棄自己,要求自己 進步,在退步的時候 發(fā)現(xiàn)問題,是對的。人應(yīng)該這樣變得不差,不是為了批評。從差變得優(yōu)秀的路,和表揚無關(guān),也和批評無關(guān)。

附2:小冰北京卷題目《神奇的書簽》:

神奇的書簽

世界上有很多的書,中文、英文、德文、法文。我喜歡看書,小說、詩歌、散文、雜文。書有薄有厚,有長有短,其中蘊藏著豐富的知識。時間久了,怕忘記了,于是用書簽。我的書簽路過了很多的書。

我的書簽是用我的照片做的。睡前,把書簽夾在書頁里,放心地去睡覺。厚厚的書籍,分成了兩個部分,像是劊子手,殺掉了完整,心橫在那頁書簽的地方,睡覺的時候會思念。第二天,起床,找到書簽,就能夠繼續(xù),還原割裂的書。

我的書簽喜歡看小說和漫畫。書簽有了名字,有的好聽,有的不好聽。有長有短的名字??葱≌f,書簽是小說主人公的名字。看漫畫,書簽是漫畫地點的名字。

這樣一天又一天,直到看完。一天又一天,時間久了,書簽會有書的味道。油墨和紙香混合,故事和心情混合,因此,書簽變得獨一無二。時間久了,書簽上的照片會褪色,但記憶不會褪色。它路過了很多的書,停在故事里,清晰記得所有。

免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2016-06-08
微軟小冰離高考滿分作文之間還隔著N個阿爾法狗
這兩天最熱鬧的事兒就是高考了,在高考中最容易引起網(wǎng)絡(luò)狂歡的則是作文。自從1999年出現(xiàn)「滿分作文」后,幾乎每年的作文題目都會引起不小的

長按掃碼 閱讀全文