AI助力:解讀抹香鯨的“語言代碼”

概要:

為了破譯抹香鯨復雜的語言系統(tǒng),科學家正在利用各種高科技手段收集足夠數(shù)據(jù)并訓練機器學習模型,希望能預測并逐步理解它們的交流模式。從給個體鯨魚“植入竊聽器”,到在海底布置聽站收音,再到設(shè)計各種新型機器人儀器牽涉其中,研究人員正在盡一切努力打開這扇通向另一個物種世界的大門。他們相信,如果成功理解鯨語對話,不僅科學上意義重大,更能喚起人類保護海洋生態(tài)的責任感。機器學習為此目標提供了希望,也讓人對跨物種交流充滿憧憬。

研究人員相信,人工智能可能讓我們與其他物種進行交流。

大衛(wèi)·格魯伯(David Gruber)的生涯起步于在伯利茲海岸研究藍條鱈魚,當時他還是本科生,他的工作是在夜間追蹤這些魚。他以星星為導航,睡在海灘的帳篷里?!斑@是個夢想,”他最近回憶道,“我不知道自己在做什么,但我正在扮演一個我認為的海洋生物學家的樣子?!?/p>

格魯伯后來在圭亞那工作,繪制森林樣條,在佛羅里達州,計算恢復大沼澤地需要多少水。他撰寫了一篇關(guān)于海洋碳循環(huán)的博士論文,并成為紐約城市大學的生物學教授。在這過程中,他對綠色熒光蛋白產(chǎn)生了興趣,這種蛋白質(zhì)由水母天然合成,但通過一點基因編輯,幾乎任何生物包括人類都可以產(chǎn)生。

當格魯伯在澳大利亞東北部的所羅門群島工作時,他發(fā)現(xiàn)了數(shù)十種熒光魚類,包括一種熒光鯊魚,這引出了新的問題。對另一條熒光鯊魚來說,這條熒光鯊魚看起來是什么樣的?格魯伯召集了光學研究人員的幫助,為他建造了一臺特殊的“鯊魚之眼”相機。(鯊魚只能看到藍色和綠色;事實證明,熒光對它們來說是更大的對比度。)與此同時,他也在康涅狄格州的神秘海洋館研究海蜇,試圖確定它們制造使自己發(fā)光的分子的確切方式。這引發(fā)了他對水母體驗世界的方式的思考。格魯伯召集了另一組合作者來開發(fā)可以溫柔地處理水母的機器人。

“我想知道:是否有一種方式可以讓機器人和人類建立起同理心?”他告訴我。

2017年,格魯伯獲得了一年的拉德克利夫高等研究院研究員職位,該院位于馬薩諸塞州劍橋。在那里,他偶然翻到一本自由潛水員寫的書,書中講述了他與一些抹香鯨的冒險之旅。這激起了格魯伯的好奇心,于是他開始研究這些動物。

作為世界上最大的掠食者,抹香鯨大部分生命都在獵食。為了在深海黑暗中找到它們的獵物——通常是魷魚——它們依賴回聲定位。通過頭部專門器官,它們產(chǎn)生點擊流來反彈至任何固體(或半固體)物體。抹香鯨還會產(chǎn)生稱為codas的點擊爆發(fā),它們之間會互相交換。這些交換似乎擁有談話的結(jié)構(gòu)。

一天,當格魯伯坐在拉德克利夫研究院的辦公室里,聽著抹香鯨聊天的錄音時,研究院的另一位研究員莎菲·戈德瓦瑟(Shafi Goldwasser)恰巧路過。戈德瓦瑟是圖靈獎獲得者計算機科學家,她對此很感興趣。當時,她正在組織一個關(guān)于機器學習的研討會,這種學習以后將導致ChatGPT的出現(xiàn)。也許,戈德瓦瑟沉思,機器學習可以用來發(fā)現(xiàn)鯨魚交流的含義。

“這不完全是一個玩笑,幾乎像是一個白日夢,”戈德瓦瑟回憶道,“但大衛(wèi)真的很興奮?!?/p>

格魯伯和戈德瓦瑟將解碼codas的想法帶到了第三位拉德克利夫研究員邁克爾·布朗斯坦(Michael Bronstein)那里。布朗斯坦也是一位計算機科學家,現(xiàn)在是牛津大學的DeepMind人工智能教授。

“這聽起來可能是我聽說過的最瘋狂的項目,”布朗斯坦告訴我,“但大衛(wèi)有一種力量,一種說服和吸引人的能力。我覺得這值得一試?!?/p>

格魯伯繼續(xù)推動這個想法。在專家中,許多人認為這很傻,同時也無法抗拒,包括哈佛大學的機器人學家羅伯特·伍德和麻省理工學院計算機科學與人工智能實驗室的主任丹尼拉·拉斯。這樣,鯨魚翻譯計劃- 項目CETI應運而生。(首字母縮寫發(fā)音為“塞蒂”,故意喚起SETI,即搜尋地外智能的項目。)CETI代表了有史以來對與其他物種交流做出的最雄心勃勃、最技術(shù)先進和資金投入最大的嘗試。

“我認為這是一件人們會感到非常興奮的事情:我們能否從科幻轉(zhuǎn)向科學?”拉斯告訴我,“我的意思是,我們能與鯨魚交談嗎?”

抹香鯨是游牧民族。據(jù)估計,一年中,一頭鯨魚至少游泳2萬英里。但在熱帶地區(qū),由于可能與魷魚有關(guān)的原因,有一些地方是鯨魚傾向于去的。其中一個地方是萊索托東部一個叫多米尼加的火山島附近的一片海域。

CETI在羅索市上方的一所出租房子里設(shè)立了非正式總部。該團隊的計劃是把多米尼加西海岸變成一個巨大的鯨魚錄音工作室。這涉及在該地安裝一個水下麥克風網(wǎng)絡(luò)來捕獲過往鯨魚的codas。它還涉及在鯨魚身上植入記錄設(shè)備——可以說是鯨魚“竊聽器”。這樣收集的數(shù)據(jù)然后可以用來“訓練”機器學習算法。

7月,我去了多米尼加,觀看CETI團隊進行鯨魚植入“竊聽器”。第一天上午,我在羅索以外與格魯伯見面,在一個潛水店的碼頭。格魯伯現(xiàn)年50歲,個子不高,有著深色卷發(fā)和開朗焦慮的氣質(zhì)。他拿著一個防水箱,穿著一件CETI T恤。不久,團隊中的其他幾個成員也出現(xiàn)了,也都拿著防水箱,穿著CETI T恤。我們登上了一個超大的Zodiac充氣船,名為CETI 2,然后啟程出海。

前一天晚上,一個熱帶風暴席卷了該地區(qū),狂風大作,暴雨滂沱,多米尼加的火山峰仍然籠罩在云層中。大海是一系列邊緣布滿白沫的涌浪。CETI 2快速前進,起起伏伏。有時候,飛魚矯健地沖過;它們在空中停留了如此之久,以至于我一度誤以為它們是鳥。

離岸約兩英里處,船長凱文·喬治停止了引擎。一名叫亞力·梅沃拉赫的研究生戴上一副耳機,將一個水下麥克風(hydrophone)放入海浪中。她聽了一會兒,然后微笑著把耳機遞給了我。

最著名的鯨魚叫聲是長鳴的座頭鯨發(fā)出的悲傷“歌聲”。抹香鯨的codas既不悲傷也不優(yōu)美。有些人將其比較為炒肉的聲音,其他人則比較為爆米花爆開的聲音。那天早上,當我戴著耳機聽時,我想到了馬蹄踏過鵝卵石路面的聲音。后來我改變了主意。這種喀喀聲更像機械化,好像在波浪深處,有人正在用手動打字機敲出備忘錄。

梅沃拉赫將耳機從麥克風上拔下來,然后插入一個看起來像汽車音箱騎在掃帚柄上的裝置。這個裝置后來我才知道是用各種元素組合制成的,包括金屬色拉碗,它的設(shè)計是為了定位發(fā)出點擊聲的鯨魚。在水中扭動它一會兒后,梅沃拉赫決定那些點擊聲來自西南方。我們向那個方向前進,不久喬治喊道:“噴氣!”

在我們幾百碼外是一個灰色脊背,看起來像一個畸形的木頭。(當鯨魚在水面休息時,只有它們巨大身體的一小部分可見。)那頭鯨再次噴氣,脊背左側(cè)噴出了如間歇泉般的氣霧。

當我們接近時,那頭鯨又噴氣了一次;然后它優(yōu)雅地彎曲的尾巴揚起水面,潛水了。我被告知它不太可能在近一個小時內(nèi)再次出現(xiàn)。

我們繼續(xù)搜尋它的同類。我們向南航行得越遠,涌浪就越高。有一刻,我覺得胃在翻江倒海,跑到船邊干嘔。

“我喜歡只是把東西吐出來然后繼續(xù)工作,”梅沃拉赫告訴我。

試圖在抹香鯨身上安裝錄音裝置有點像騎著水上摩托艇進行擊劍。這個練習需要用30英尺長的竿子把設(shè)備粘在動物身上,這反過來需要接近30英尺范圍內(nèi)的生物。那天,我們發(fā)現(xiàn)了幾頭鯨魚。但是盡管我們四處碰撞,CETI 2從未足夠接近一頭鯨魚以便使用標記竿。

第二天,海面平靜了些。我們再次發(fā)現(xiàn)鯨魚,指定的標記員奧黛爾·哈維幾次試圖標記一頭鯨魚。但所有努力都落空了。要么鯨魚在最后一刻潛水,要么記錄裝置從鯨魚背上滑落,不得不從水中撈起來。(這種裝置長約一英尺,狀如沖浪板,應該通過吸盤粘附。)每次新發(fā)現(xiàn),CETI 2上的情緒都會高漲;每次失敗,它就會低落。

在多米尼加的第三天,我加入了團隊中的不同人員,登上了另一艘船,試驗一種新的方法。這艘船是一艘40英尺長的雙體船,名為CETI 1,它帶著一架實驗性無人機,而不是長竿。這架無人機是在哈佛特別設(shè)計的,配備了視頻攝像頭和塑料鉗。

因為抹香鯨總是在移動,所以在多米尼加近海發(fā)現(xiàn)它們沒有保證;有時數(shù)周都不會有任何發(fā)現(xiàn)。但我們再次幸運,很快就發(fā)現(xiàn)了一頭鯨魚。一名本科生斯蒂法諾·帕加尼因為他的駕駛技巧而被帶來,他戴上了看似虛擬現(xiàn)實頭盔的東西,與無人機的視頻攝像頭相連。通過這種方式,他可以從無人機的視角看下面的鯨魚,并希望能將裝有記錄設(shè)備的鉗子植入鯨魚背上。

無人機起飛,飛向鯨魚。它懸停了幾秒鐘,然后急速下降。為了使吸盤粘附,無人機必須以恰當?shù)慕嵌群土Χ葥糁婿L魚。沖擊后,帕加尼顫抖著雙手將無人機駕駛回船上?!熬o張感會讓你不知所措,”他說。

“沒壓力,”格魯伯開玩笑說,“又不是有《紐約客》的記者在看或者什么的?!庇腥艘蠊恼啤4享懫饸g呼。鯨魚看起來毫不知情。橙色的記錄設(shè)備粘在它深灰色的皮膚上,它悠閑地隨波逐流。然后它潛入海底。

抹香鯨是世界最深潛的動物之一。它們通常潛2000英尺深,有時超過1英里。(人類戴著水肺最深潛大約1100英尺)。如果裝置粘附,它會記錄鯨魚在旅程中發(fā)出的任何聲音。它還將記錄鯨魚的路線、心跳和在水中的方向。吸力預計可持續(xù)大約8小時;在那之后——如果一切按計劃進行——裝置會脫落,浮到表面,并發(fā)射一個無線電信號以便回收。

我說,如果我們現(xiàn)在能理解鯨魚在說什么,那就太好了,因為也許這頭鯨在潛水前就通過點擊聲說出它要去哪里了。

“兩年后再來吧,”格魯伯說。

每頭抹香鯨的尾巴都是獨一無二的。在某些鯨魚身上,鯨尾由深深的缺口分開。在其他鯨魚身上,它們幾乎呈直線相接。有些鯨尾以點狀結(jié)束;有些更圓潤。許多鯨尾明顯缺失了部分,可能是受到虎鯨攻擊的結(jié)果。為了在野外識別鯨魚,研究人員通常依靠名為“鯨尾圖鑒”的照片數(shù)據(jù)庫。只有極少數(shù)科學家像CETI的首席野外生物學家香農(nóng)·格羅能僅憑肉眼識別。

格羅現(xiàn)年43歲,高大強壯,笑容燦爛,帶著明顯的加拿大口音。作為渥太華卡爾頓大學駐地科學家,他從2005年起就在多米尼加研究鯨魚?,F(xiàn)在,他已經(jīng)熟知它們,可以講述它們的勝利和考驗,以及誰生了小鯨魚和何時。十年前,當格羅開始有自己的孩子時,他開始提到他的“人類家庭”和“鯨魚家庭”。(他的人類家庭住在安大略省。)另一位海洋生物學家曾將格羅描述為聽起來“像阿哈布船長在進行了二十年心理治療后的樣子”。

當格魯伯接觸格羅,請求他加入CETI項目時,他起初很懷疑。“我收到很多這樣的電子郵件,像‘嘿,我認為鯨魚頭上有水晶,’和‘也許我們可以用它們來治療瘧疾’,“格羅告訴我,”大衛(wèi)首次發(fā)給我的電子郵件大意是‘嗨,我認為我們可以找到一些資金來翻譯鯨魚的語言。’我就‘哦,天吶’?!?/p>

幾個月后,兩人在華盛頓特區(qū)面對面見了一面,互相覺得合拍。兩年后,格魯伯確實找到了資金。CETI從“大膽項目”獲得了3300萬美元的資助,這是一個慈善合作項目,其背后的支持者包括理查德·布蘭森和雷·達利奧。(這筆資助分五年支付,將在2025年用完。)

在我待在多米尼加的整段時間里,格羅也一直在那里,監(jiān)督研究生并幫助標記工作。從他那里,我了解到第一天我看到的鯨魚名叫麗塔,后來出現(xiàn)的鯨魚包括吵鬧者、羅杰和麗塔的女兒瑞瑪。它們都屬于一個稱為R單元的群體,格羅將其描述為“關(guān)系密切且積極社交”。顯然,R單元也很熱心。幾年前,當一個稱為S單元的群體只剩下兩個成員——莎莉和TBB時——R單元收養(yǎng)了它們。

抹香鯨擁有地球上最大的大腦——比人類大6倍。它們的社會生活豐富復雜,有人會說是理想的。一個單元的成年成員全部都是雌性,可能由幾頭到幾十頭個體組成。公鯨可以跟著群體生活直到約15歲,然后,用格羅的話說,它們會被“社會排斥”。一些繼續(xù)在母親和姐妹周圍點擊,但沒有回應。然而,最終它們會明白這個消息。成年雄鯨是孤獨的生物。它們只會在交配時接近一群雌鯨——可能不是直接的親屬。為了宣告到來,它們會發(fā)出深沉而響亮的叫聲,稱為“鏗鏘聲”。沒有人確切知道什么使求偶的雄鯨對雌鯨有吸引力;格羅告訴我,他見過一些發(fā)出鏗鏘聲的雄鯨受到雌鯨的熱烈歡迎,也有的興趣缺缺。

與此同時,雌抹香鯨之間的關(guān)系非常密切。一個單元的成年個體不僅一起旅行和覓食;它們似乎還就重大決定進行商議。如果群體中有新母親,其他成員會在它覓食時照看小鯨魚。在某些單元中,抹香鯨甚至會相互哺乳幼崽,盡管R單元不會。當家庭受到威脅時,成年個體會聚在一起保護它們的后代,平靜時小鯨魚會玩耍。

“就像我的孩子和他們的表兄弟姐妹,”格羅說。

在我目睹成功的無人機飛行的第二天,我與格羅出海試圖回收記錄設(shè)備。24小時多過去了,它仍未被定位。格羅決定駕車前往多米尼加西南端的斯科茨黑德半島,他認為在那里可能會接收到無線電信號。當我們在這個島上狹窄危險的道路上行駛時,他向我描述了一個關(guān)于他的兒童讀物創(chuàng)意,一個方向講述住在船上的人類家庭看向海面,另一個方向講述住在船底下深海的鯨魚家庭向上看海浪的故事。

“對我來說,長時間生活在鯨魚文化中最有回報的部分,是發(fā)現(xiàn)這些基本的相似點和基本模式,”他說。“當然,它們不會有‘樹’這個詞。抹香鯨的某些體驗我們的靈長類大腦可能永遠無法理解。但我們共享的東西必須對我們存在這里的原因至關(guān)重要?!?/p>

過了一會兒,我們真的到達了公路的盡頭。在那之外有一個必須步行攀爬的山丘。格羅背著一個便攜式天線,我們到達山頂時他展開了它。如果記錄裝置浮出水面20英里范圍內(nèi)的任何地方,格羅計算我們都應該能檢測到信號。這讓我想到我們現(xiàn)在正在試圖傾聽一個傾聽裝置。格羅舉著天線,把耳朵貼在某種接收器上。他什么也沒聽到,所以,在欣賞了一會兒風景后,我們向下走去。格羅希望最終能回收到這個裝置。但據(jù)我所知,它現(xiàn)在仍在某個地方漂浮在加勒比海上。

關(guān)于抹香鯨的第一個科學或準科學研究是1835年一位名叫托馬斯·比爾的蘇格蘭船醫(yī)發(fā)表的小冊子。題為《抹香鯨的自然史》,它非常暢銷,以致比爾于四年后將小冊子擴充成書,使用相同的書名。

在那個時代,捕鯨是英國和美國的一個重要產(chǎn)業(yè)。這些動物尤其因其頭部巨大的Espermaceti蠟油而備受珍視。Espermaceti是優(yōu)質(zhì)潤滑劑,燃燒時產(chǎn)生清澈明亮的光;在比爾的時代,它的價格是普通鯨油的五倍。(正是由于精液和Espermaceti的相似之處,這一物種才有了令人尷尬的名字。)比爾認為抹香鯨是無聲的。他寫道:“最有經(jīng)驗的捕鯨者都知道,它們從不產(chǎn)生任何鼻音或發(fā)聲,除了噴氣時微不足道的嘶嘶聲?!彼f,這些鯨魚也溫順——“一種最膽小無害的動物”。在創(chuàng)作《白鯨記》時,梅爾維爾在很大程度上依靠了比爾的著作。他將一種“金字塔般的沉默”歸因于抹香鯨。

梅爾維爾寫道:“鯨魚沒有聲音?!彼^續(xù)寫道:“但話說回來,”他接著寫道,“鯨魚有什么要對這個世界說的呢?我很少知道任何深刻的存在對這個世界有什么要說的,除非是為了謀生而結(jié)結(jié)巴巴地說出一些話?!?/p>

直到1957年,人們才開始質(zhì)疑抹香鯨的靜默。那年,兩位來自伍茲霍爾海洋研究所的研究人員錄下了一群鯨魚發(fā)出的聲音,這群鯨魚是他們在北卡羅來納州近海遇到的。他們檢測到“尖銳的點擊聲”,并推測這些聲音是用于回聲定位。20年后,這兩位研究人員中的一位與伍茲霍爾的不同同事合作,確定了一些抹香鯨點擊聲以獨特的、經(jīng)常重復的模式出現(xiàn),這對研究人員將其稱為“codas”。他們推斷codas必然具有某種交流功能。

從那時起,鯨類學家已經(jīng)花費了成千上萬的時間傾聽codas,試圖弄清其功能可能是什么。格羅在他的博士論文中研究了抹香鯨之間的語音交流,他告訴我,關(guān)于codas的“普遍真理”之一是它們的時序。兩個coda開始之間總有4秒的間隔。大約2秒用于點擊聲;其余是寂靜。只有在暫停后,就像人類說話者在詞語之間會暫停一樣,點擊聲才會恢復。

顯然,codas是學習的或者用術(shù)語說是“社會傳播的”。東太平洋的鯨魚交換一套codas,東加勒比海的另一套,南大西洋的又一套。小抹香鯨會模仿其親屬的codas,在能夠熟練發(fā)出之前會“呱呱叫”。

多米尼加周邊鯨魚大約有25種codas。這些codas在點擊聲的數(shù)量和節(jié)奏上有所不同。例如,被稱為3R的coda由3次等間隔的點擊組成。7R coda由7次均勻間隔的點擊組成。相比之下,在7I(7增加)中,點擊之間的間隔變長了;在前兩次點擊之間約為50毫秒,而在最后兩次點擊之間是其兩倍長。在4D(4遞減)中,前兩次點擊之間有1/5秒,而最后兩次點擊之間只有1/10秒。然后,還有一些有節(jié)奏感的codas。R單元成員最常用的一個coda被稱為1+1+3,具有恰恰舞曲般的節(jié)奏,用英語可以表達為點擊......點擊......點擊-點擊-點擊。

如果說codas在某種程度上可比喻詞匯,那么25種是一個相當有限的詞匯量。但是,就像還沒人能說codas對抹香鯨意味著什么一樣,也沒有人能說對它們來說什么特征顯著??赡茉谒俣然蛞舾叩确矫娲嬖谌祟愡€未檢測到的細微差異。CETI團隊成員已經(jīng)識別出一種新的信號類型——單個點擊——可能作為某種標點符號。

當鯨魚靠近水面休息時,它們的交流可以持續(xù)一個小時甚至更長。即使以人類標準衡量,抹香鯨的聊天也是反復不斷的。“它們一直在彼此頂著說話,”格羅告訴我。

R單元兩頭鯨魚羅杰和麗塔(均為成年雌鯨)之間記錄的一小段對話如下。

羅杰:1+1+3
麗塔:1+1+3, 1+1+3
羅杰:9I
麗塔:1+1+3
羅杰:10I
麗塔:1+1+3, 1+1+3
羅杰:11I
麗塔:1+1+3
羅杰:10I, 11I, 1+1+3
麗塔:1+1+3

這種“交談”基本上就以這種方式繼續(xù)下去,直到麗塔終于改變了調(diào)子:

麗塔:1+1+3
羅杰:12R, 10I, 10I, 9I, 9I
麗塔:9I, 8I

最近,我在遭遇寫作障礙時請ChatGPT從鯨魚的角度重寫《白鯨記》。這款聊天機器人謙遜地開始了作品。它告訴我:“作為一個AI語言模型,我當然可以嘗試重寫一個小摘錄?!比缓笏_始了其標題為“白鯨記——白鯨的故事”的作品。

在ChatGPT版的“白鯨記”中,情節(jié)的核心在于一個不幸的誤會。另一頭鯨咬掉了阿哈布的腿;白鯨純潔如初雪。

ChatGPT寫道:

“我的心中充滿和平,我的靈魂與洋流的節(jié)奏合而為一,”我這個白鯨并不知道正醞釀著對我的復仇,因為我只是本能的生物,海洋的守護者。但是阿哈布船長對復仇的渴望巨大,我成為了他永恒憤怒的目標。他之前與我的同類相遇留下的傷疤讓他認定我是他終極的對手。在他眼中,我代表了一種自然力量,超出了他的理解,是海洋力量的不解之謎。

在第7段中,我驚喜地看到,這個鯨魚機器人提到了物種間交流的問題:

在海洋的深淵中,我思索著船長復仇的徒勞。我渴望與他交流,向他展示我的同族也有感情,也有需要保護的家人。但是我們世界之間的語言障礙仍然是一道不可逾越的鴻溝。

任何在過去十個月有知覺的人都知道,ChatGPT能做到驚人的事情。它可以寫作文、作詩、解釋科學概念并制作笑話(盡管這最后一項不一定有趣)。如果你問ChatGPT它是如何創(chuàng)建的,它會告訴你它首先受訓于來自互聯(lián)網(wǎng)的“大規(guī)模語料庫”。這一階段是所謂的“無監(jiān)督機器學習”,由復雜的節(jié)點數(shù)組稱為神經(jīng)網(wǎng)絡(luò)執(zhí)行。基本上,“學習”涉及填空;根據(jù)ChatGPT的說法,這項練習包括“根據(jù)上下文單詞預測句子中的下一個單詞”。通過消化數(shù)百萬網(wǎng)頁——并計算和重新計算可能性——ChatGPT在不理解英語的情況下掌握了這門語言。(它“流利”的其他語言包括中文、西班牙語和法語。)

至少在理論上,適用于英語(和中文、法語)的也適用于抹香鯨語。只要計算機模型受訓于足夠的數(shù)據(jù),它就應該能夠掌握coda預測。然后它可以——至少在理論上——生成抹香鯨會發(fā)現(xiàn)令人信服的coda序列。該模型本身并不理解抹香鯨語,但在某種意義上可以說它。稱之為ClickGPT。

目前,最大的coda集合是格羅在多米尼加多年收集的檔案。這些codas包含大約10萬次點擊。在去年發(fā)表的一篇論文中,CETI團隊成員估計,為實現(xiàn)其目標,該項目將需要收集大約40億次點擊,也就是說,比格羅的檔案大約40000倍。

團隊寫道:“使用現(xiàn)代深度學習技術(shù)分析抹香鯨(和更廣泛的動物)交流的一個關(guān)鍵挑戰(zhàn),是需要大量的數(shù)據(jù)集?!?

除了給個體鯨魚植入“竊聽器”,CETI還計劃在加勒比海海床鋪設(shè)一系列3個“聽站”。這些聽站應該能捕獲12英里開外鯨魚閑聊的codas。(雖然 codas在海面上聽不見,但抹香鯨的點擊聲可以記錄到230分貝,比槍聲或搖滾音樂會還大。)聽站收集的信息將比標簽提供的更豐富,但數(shù)量應該更多。

一天下午,我與格魯伯和CETI的聽站經(jīng)理亞尼夫·阿盧馬開車前往羅索港,那里存放著聽站的部件。這些部件形狀像巨大的水槽塞子,涂成明亮的黃色。格魯伯解釋說,黃色的塞子是浮標,聽站設(shè)備本質(zhì)上是大量的水聽器,會從浮標底部懸掛著電纜。電纜會用老式火車車輪壓住,將其錨定在海床上。附近有一堆生銹的橙色車輪。格魯伯突然對阿盧馬指著車輪堆說:“你知道,我們將需要更多這些?!卑⒈R馬黯然點頭。

聽站幾乎導致CETI延誤近一年。第一個聽站去年夏天安裝在6000英尺深的水域。由于魚類被浮標吸引,這個地點很快成為漁民們青睞的地方。大約一個月后,漁民注意到浮標不見了。CETI在多米尼加的員工在深夜出海試圖取回它。當他們到達浮標時,它已經(jīng)漂流到離岸近30英里的地方。與此同時,連接在生銹火車車輪上的水聽器陣落到了海底。

不久發(fā)現(xiàn)問題出在電纜上,它是由一家德克薩斯州的海上石油平臺設(shè)備制造商制造的?!八麄兲幚淼氖欠浅怨痰幕A(chǔ)設(shè)施,”阿盧馬解釋說。“但浮標有自己的生命。他們沒有很好地計算不同運動時的扭矩或負載——扭曲和橫向移動?!痹摴净藬?shù)月弄清纜線為何失效,最后認為解決了問題。6月,阿盧馬飛往休斯敦,觀看新設(shè)計的電纜進行應力測試。在測試中途,新設(shè)計又失敗了。為避免進一步延誤,CETI團隊重新配置了聽站。重新配置的聽站之一已在上個月底安裝。如果它沒有漂走或者其他故障的話,計劃是在今年秋季投放另外兩個。

抹香鯨的頭部占其身體近三分之一;其狹窄的下頜似乎完全與不同的動物相關(guān);它的鰭如此嬌小幾乎纖細。(該物種的正式名稱是Physeter macrocephalus,大致翻譯為“大頭噴氣孔”。)白頭常識上主要的抹香鯨專家之一(也是格羅的論文導師)寫道:“從幾乎任何角度來看,”抹香鯨都顯得“非常奇怪”。我想在游艇上不僅能看到這些外形怪異的生物的一小部分,所以在多米尼加的最后一天,我考慮參加一個商業(yè)旅游,如果能找到鯨魚的話,可以與其游泳。最后——部分因為我感覺到格魯伯不贊成這種做法——我放棄了這個想法。

相反,我加入了CETI 1的船員,本打算進行另一輪無人機標記。在海上航行大約兩個小時后,東北方檢測到了codas。我們向那個方向前進,很快就來到一處非凡的景象。船的右舷有至少10頭鯨魚。它們都面向同一個方向,緊密地排成一行。格羅確認它們是A單元的成員。A單元成員最初都是以瑪格麗特·阿特伍德小說中的人名命名的,包括神諭夫人、奧羅拉和神諭夫人的女兒Rounder。

早些時候CETI 2的船員發(fā)現(xiàn)了試驗鯨,也稱黑魚,據(jù)知會騷擾抹香鯨?!斑@看起來非常防御性,”格羅說,指的是那種編隊。

突然,有人大喊“Red!”一片猩紅在水中彌漫開來,像一面巨大的旗幟展開。沒人知道發(fā)生了什么。試驗鯨是否悄悄發(fā)動了攻擊?群體中的某條鯨魚受傷了嗎?鯨群擠得更攏了,幾乎把彼此壓在一起。

然后一個新頭出現(xiàn)在它們中間。“我X的天吶!”格魯伯喊道。

“我的天呀!”格羅喊道。他跑到船頭,驚喜地揪著頭發(fā)。“我的天呀!我的天呀!”那顆頭屬于一頭新出生的小鯨魚,約12英尺長,可能重1噸左右。在多年研究抹香鯨的過程中,格羅從未目睹過鯨魚分娩。他不確定是否有人見過。

作為一個整體,鯨群轉(zhuǎn)向雙體貓amaran。它們離船非常近,我可以看到它們巨大的、怪異的沒有表情的頭和粉紅色的下顎。它們似乎沒有注意到船只,現(xiàn)在船擋在它們面前。一頭撞到船體,前甲板顫抖了一下。

成年個體不斷把小鯨魚四處推來推去。它的母親和親戚擠得那么近,幾乎把小鯨魚提出水面。格羅開始擔心是否出了什么問題。現(xiàn)在,每個人,包括船長,都聚集在船頭。帕加尼和另一名本科生Aidan Kenny已經(jīng)啟動了兩架無人機,從空中拍攝著這一幕。與此同時,梅沃拉赫通過水聽器錄下鯨魚的聲音。

令所有人松了一口氣的是,小鯨魚開始自己游泳。然后試驗鯨出現(xiàn)了——數(shù)十條。

“我不喜歡它們游動的方式,”格魯伯說。

“它們肯定要進攻,”格羅說。試驗鯨特有的波浪形鰭在水中露出又隱沒。

接下來發(fā)生的事情就像海洋哺乳動物版的《指環(huán)王》。幾頭試驗鯨偷偷溜進抹香鯨中間。我們在船上只能看到大量的扭動翻騰。無處不在,40多頭弗雷澤豚突然出現(xiàn)。它們是來參與混戰(zhàn)還是僅僅圍觀?無法判斷。它們比試驗鯨小且體型纖細(盡管其名,試驗鯨也是海豚)。

“我沒有先驗知識來預測接下來會發(fā)生什么,”格羅宣布。幾分鐘后,試驗鯨退卻了。海豚在波浪中蜿蜒穿行。鯨群依然緊湊在一起。平靜重新來臨。然后試驗鯨又向抹香鯨發(fā)起一次進攻。水面泡沫翻騰。

“試驗鯨就是試驗鯨,”格羅評論道。但是很明顯,在CETI 1上的所有人在“生存斗爭”中都站在小鯨魚這一邊。

騷擾持續(xù)進行。試驗鯨退縮,然后再度逼近。無人機的電量開始見底。帕加尼和凱尼駕駛無人機返航雙體船,更換電池。電池已過熱,不得不放入船上的冰箱。有一刻,格羅認為他瞥見了新生兒,安然無恙。(后來他從無人機影像中確認了小鯨魚的母親是Rounder。)“這是個好消息,”他喊道。

試驗鯨在場超過兩個小時。然后突然它們都不見了。海豚也游走了。

“這種日子再也不會有了,”當CETI 1回航時格羅說。

那天晚上,所有在CETI 1和CETI 2上的人都聚集在碼頭邊的一家餐廳,舉行歡迎新生兒的晚宴。格魯伯發(fā)表了致辭。他感謝團隊的所有努力?!白屛覀兿M芘c那頭小鯨魚交流,”他說。

我和格魯伯、格羅坐在一張長桌的盡頭。在飲料之間,格魯伯提出,我們所目睹的可能不是一次攻擊。那個場景更像《獅子王》最后一幕,當各種動物聚集起來歡迎新小獅子。

“三種不同的海洋哺乳動物聚集在一起,慶祝和保護一個16個月妊娠期動物的新生,”他說。也許,他假設(shè),這是一種進化的求生戰(zhàn)術(shù),用于保護哺乳動物新生兒免受鯊魚襲擊,后者原本會被大量血液吸引過來,他指出,如果不是人類大量捕殺,它們的數(shù)量會更多。

“你的意思是小鯨魚受到試驗鯨保護免受這里根本沒有的鯊魚傷害?”格羅問道。他說,他甚至不知道如何測試這個理論。格魯伯說,他們可以查看無人機影像,看看抹香鯨是否曾讓試驗鯨接近新生兒,如果是,試驗鯨如何反應。我無法判斷他是認真的還是開玩笑。

“這是個不錯的故事,”梅沃拉赫插話說。

“我只是想拋出一些想法,”格魯伯說。

“天吶!你可不這么說!”動物醫(yī)生說。“你以前從未那樣對我說過話。”

“那有什么好處呢?”波利尼西亞說,一邊將一些餅干屑從左翅膀上撣掉?!凹词刮疫@樣對你說,你也聽不懂?!?/p>

——《多利ittle醫(yī)生的故事》

麻省理工學院計算機科學與人工智能實驗室(CSAIL)位于一座弗蘭克·蓋里設(shè)計的建筑內(nèi),這座建筑看起來永遠處于崩塌的邊緣。一些部分傾斜在奇怪的角度;其他的似乎要一分為二。大樓的門廳里有一臺售賣電線的自動售貨機,還有一臺售賣來自世界各地咖啡因飲料的機器。這里還有一種你可能在小學外看到的黃色牌子。上面是一個背著背包、提公文包的人,寫著“書呆子過馬路”。

丹妮拉·拉斯經(jīng)營著CSAIL(讀作“見賽爾”)。她是一名機器人學家?!白罱嘘P(guān)機器的討論非常瘋狂,”她告訴我。我們坐在她的辦公室,主宰這間辦公室的是一臺名為Domo的機器人,它坐在一個玻璃箱里。Domo有金屬軀干和過大的、圓鼓鼓的眼睛。“不是機器會毀滅我們,就是機器會解決我們所有問題。這兩者都不對。”

與CSAIL的幾名其他研究人員一道,拉斯一直在思考,CETI最終如何能夠從coda預測推進到某種程度的coda理解。這是一個巨大的挑戰(zhàn)。一個單元的鯨魚經(jīng)常在潛水前交談。但是它們在聊什么呢?潛多深,還是誰應該照看小鯨魚,或者是某些與人類經(jīng)驗無關(guān)的東西?

“我們試圖將行為與發(fā)聲聯(lián)系起來,”她告訴我,“然后我們可以開始獲得某些語音信號的意義的證據(jù)?!?/p>

她帶我來到她的實驗室,幾名研究生正在電子設(shè)備的叢林中調(diào)試。一個角落里是一個透明塑料管,里面裝滿了電路,連接著兩個白色塑料鰭。這個設(shè)置,拉斯解釋說,是一個機器海龜?shù)墓羌堋5厣咸芍}數(shù)乃芰蠚?。一個學生按下一個開關(guān),鰭開始劃動。另一名學生拿出一條兩英尺長的機器魚。魚和海龜都可以配置各種傳感器,包括水下攝像頭。

“我們需要新的方法來收集數(shù)據(jù),”拉斯說?!拔覀冃枰椒▉斫咏L魚,所以我們一直在討論是否可以把海龜或魚放在鯨魚旁邊的水中,這樣我們可以拍攝看不見的東西?!?/p>

CSAIL是一個巨大的運算,擁有1500多名員工和學生。“這里的人有點大膽,”拉斯說?!八麄冋娴南矚g瘋狂又有意義的想法。”她告訴我關(guān)于一個潛水員的事,據(jù)他自己說,他與多米尼加近海的抹香鯨游泳,并與一條鯨魚成為朋友。這條鯨魚似乎喜歡模仿這名潛水員;例如,當他垂直懸停在水中時,它也會這樣做。

“我一直在問自己:假設(shè)我們設(shè)置實驗,與鯨魚進行身體模仿,”拉斯說。“那么我們是否可以讓它們在進行動作時發(fā)出聲音?所以,我們可以讓它們說‘我往上’嗎?或者我們可以讓它們說‘我懸?!瘑?我認為,如果我們能發(fā)現(xiàn)一些少量的語音可以與某些意思相關(guān)聯(lián),這會幫助我們更深入地理解它們的對話結(jié)構(gòu)?!?

當我們聊天時,另一位CSAIL教授兼CETI合作者雅各布·安德烈亞斯出現(xiàn)了。安德烈亞斯是一位從事語言處理的計算機科學家,他說他是在一次教師退修會上聽說這個鯨魚項目的?!拔易隽艘粋€關(guān)于將神經(jīng)網(wǎng)絡(luò)理解為一種奇怪的翻譯問題的演講,”他回憶道,“丹妮拉在之后走過來對我說,‘哦,你喜歡奇怪的翻譯問題?這是一個奇怪的翻譯問題。’”

安德烈亞斯告訴我,僅僅通過重新分析格羅的檔案,CETI已經(jīng)取得了重大進展。該團隊不僅發(fā)現(xiàn)了一種新型信號,而且還發(fā)現(xiàn),codas的內(nèi)部結(jié)構(gòu)比以前認識到的要復雜得多。“這個系統(tǒng)可以傳遞的信息量要大得多,”他說。

“這里的圣杯——將人類語言與所有其他動物交流系統(tǒng)區(qū)分開來的東西——是所謂的‘雙重模式’,”安德烈亞斯繼續(xù)說道?!半p重模式”指的是無意義的單元——在英語中,像“sp”或“ot”這樣的音——可以組合成有意義的單元,像“spot”。如果如所懷疑的,點擊本身無意義,而coda指的是某種東西,那么抹香鯨也已經(jīng)到達了雙重模式。“根據(jù)我們對coda庫存的運作方式的了解,我對發(fā)現(xiàn)抹香鯨也具有這種雙重模式持樂觀態(tài)度——盡管仍不確定,”安德烈亞斯說。

任何物種是否擁有與人類“交流系統(tǒng)”相當?shù)南到y(tǒng)是一個懸而未決且備受爭議的問題。20世紀50年代,行為主義者B. F. 斯金納認為兒童通過正增強學習語言;因此,其他動物也應該能做到同樣的事情。語言學家諾姆·喬姆斯基持不同看法。他駁斥了孩子通過條件反射獲得語言的觀點,也駁斥了語言對其他物種可用的可能性。

20世紀70年代初,斯金納的一名學生赫伯特·特拉斯決定證實他導師的理論。當時特拉斯是哥倫比亞大學心理學教授,他收養(yǎng)了一只名為Nim Chimpsky的黑猩猩(這個名字是在嘲諷喬姆斯基)。從兩周大起,Nim就由人類撫養(yǎng),并受教授美國手語。特拉斯對Nim與護理人員的互動進行錄像,以便獲得它進步的客觀記錄。到Nim 3歲時,它已經(jīng)掌握了80個手勢,更重要的是,它經(jīng)常以序列的方式制作手勢,例如“香蕉 我 吃 香蕉”或“撓癢癢 我 Nim 玩”。特拉斯本打算寫一本關(guān)于Nim如何跨越語言障礙的書,以此證明其名聲受損的同名者錯誤。但是后來特拉斯重新查看錄像中的一些細節(jié)時感到震驚。當他仔細觀看視頻時,他對自己的賬目感到難過。Nim實際上沒有真正學會ASL;它只是學會模仿教師最后對它做的手勢。

自Nim之后,許多進一步的努力試圖證明不同物種——猩猩、倭黑猩猩、鸚鵡、海豚——具有語言能力。關(guān)注這些努力的幾只動物——大猩猩可可、灰鸚鵡亞歷克斯——成為國際知名人物。但大多數(shù)語言學家仍然認為,擁有語言的物種只有我們自己。

語言是“我們物種特有的能力”,它“是我們生物本性的一部分”,言語學會前任主席、耶魯大學榮休教授斯蒂芬·R·安德森在其《多利托醫(yī)生的妄想》一書中寫道。

抹香鯨的codas是否能挑戰(zhàn)這一信念,是CETI團隊成員說他們寧愿不談?wù)摰囊粋€問題。

“語言學家像喬姆斯基那樣固執(zhí)己見”,牛津大學教授布朗斯坦告訴我?!皩τ嬎銠C科學家來說,語言通常是某種形式系統(tǒng),我們通常談?wù)撊嗽煺Z言?!蹦ㄏ泠L的codas“可能不像人類語言那樣富有表達力”,他繼續(xù)說道,“但我認為稱它為‘語言’還是不稱其為‘語言’更多地是一個形式問題。”

“諷刺的是,這是關(guān)于語言含義的語義辯論,”格羅評論道。

當然,ChatGPT的出現(xiàn)進一步復雜化了這場辯論。一旦一組算法可以重寫小說,什么才算“語言能力”?誰或者什么可以決定?

“當我們說我們會成功翻譯鯨魚交流時,我們的意思是什么?”提出這個想法導致CETI成立的拉德克利夫研究員戈德瓦瑟問道。

“最近所有人都在談?wù)撨@些生成式AI模型,比如ChatGPT,”現(xiàn)任加州大學伯克利分校西蒙斯計算理論研究所主任的戈德瓦瑟繼續(xù)說道?!八鼈冊谧鍪裁?你給它們問題或提示,然后它們給你答案,它們這樣做的方式是通過預測完成句子或下一個詞。所以你可以說這是CETI的一個目標——你不一定理解鯨魚在說什么,但可以非常成功地預測它。因此,你可能可以生成一段對鯨魚來說可以理解的對話,但你可能不理解它。這是某種成功。”

戈德瓦瑟說,預測意味著“我們已經(jīng)實現(xiàn)了它們語音的模式。這不令人滿意,但至少是某種進展?!?

“那么理解的目標呢?”她補充道。“即使是這一點,我也不是悲觀主義者?!?

目前,世界海洋中估計有85萬頭抹香鯨。這比商業(yè)捕獵之前的估計200萬頭有所下降。通常認為抹香鯨最黑暗的時期是在19世紀中葉,當時梅爾維爾從新貝德福德的Acushnet號輪船上出海。事實上,大規(guī)模屠殺發(fā)生在20世紀中葉,當時抹香鯨被裝備柴油發(fā)動機、船身與工廠一般大小的船只追捕。19世紀40年代鼎盛時期的開放劃船捕鯨每年獵殺約5000頭抹香鯨;而在20世紀60年代,這個數(shù)字是其6倍之多。抹香鯨被煮沸制成馬格麗醬、牲畜飼料和膠水。即使在20世紀70年代,通用汽車也在其變速箱油中使用抹香鯨腦。

在工業(yè)捕鯨接近高峰期時,一位叫羅杰·佩恩的生物學家聽到了一則廣播報道,改變了他的生活,以及世界上余下鯨魚的生活。這則報道提到一頭鯨魚漂浮在佩恩工作的塔夫茨大學不遠的一個海灘上。佩恩原本研究是蛾類,開車出去看這頭死鯨。這頭動物的死對他影響深刻,以致他改變了研究重心。他的調(diào)查導致他遇見了一個海軍工程師,后者在監(jiān)聽蘇聯(lián)潛艇時錄下了一些奇異的水下聲音,他認為這來自座頭鯨。佩恩花了數(shù)年時間研究這些錄音;最后,他得出這些聲音非常美妙、復雜編織,應被稱為“歌曲”。1970年,他安排發(fā)行了《座頭鯨之歌》的LP唱片。

“我只是認為:全世界都應該聽到這個,”他后來回憶道。這張專輯暢銷,被知名音樂人如朱迪·科林斯取樣,并幫助啟動了“拯救鯨魚”運動。1979年,《國家地理》雜志發(fā)行了這些歌曲的“軟盤”版本,作為超過1000萬份雜志的插入內(nèi)容。三年后,國際捕鯨委員會宣布暫停商業(yè)捕獵,這項禁令至今仍在生效。這項舉措幫助幾種瀕臨滅絕的物種恢復過來,包括座頭鯨和長青鯨。

佩恩于今年6月去世,享年88歲,他是CETI團隊的早期熱心成員。(據(jù)格魯伯告訴我,盡管佩恩堅持抹香鯨不如座頭鯨聰明,他對這個項目集中在抹香鯨還是失望的。)就在他去世前幾天,佩恩發(fā)表了一篇評論文章,解釋他認為CETI為何如此重要。

鯨魚及地球上幾乎所有其他生物,現(xiàn)在正面臨新的嚴重威脅,其中包括氣候變化。我們該如何激發(fā)“我們自己和其他人類”來應對這些威脅?

“靈感是關(guān)鍵,”佩恩寫道?!叭绻覀兡芘c動物交流,問它們問題并得到答案——無論那些問題和答案可能會多簡單——這個世界可能很快就會行動起來,至少啟動遏制我們失控破壞生命的過程?!?/p>

CETI的幾名其他團隊成員表達了類似的觀點?!拔蚁M@個項目的一個重要結(jié)果是改變我們看待陸地和海洋生命的方式,”布朗斯坦說?!叭绻覀兝斫狻蛭覀冇蟹浅C鞔_的證據(jù),以語言類交流的形式——智能生物正生活在這里,而我們正在破壞它們,這可能會改變我們對待地球的方式?!?

“我總是以羅杰的工作作為指導之星,”格魯伯告訴我。“他推廣鯨魚之歌以及進行相關(guān)科學的方式導致了一個環(huán)境運動,拯救了幾種鯨魚免于滅絕。他認為CETI的影響力會更大。如果我們能理解它們在說什么,‘拯救鯨魚’會變成‘被鯨魚拯救’。”

“這個項目有點像一個獻禮,”他繼續(xù)說道?!凹夹g(shù)能否拉近我們與自然的距離?我們能否將所發(fā)明的這些驚人技術(shù)用于正面目的?”

ChatGPT也分享這個希望。或者至少由算法驅(qū)動的語言模型足夠聰明到能表達它。在由算法用鯨魚的聲音編寫的“白鯨記”版本中,故事以某種稍顯冗長但并不乏感染力的懇求結(jié)束:“希望終有一天,人類和鯨魚能夠理解彼此,在海洋懷抱的廣闊中找到和諧。”

本文譯自 New Yorker,由 BALI 編輯發(fā)布。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2023-09-06
AI助力:解讀抹香鯨的“語言代碼”
概要:為了破譯抹香鯨復雜的語言系統(tǒng),科學家正在利用各種高科技手段收集足夠數(shù)據(jù)并訓練機器學習模型,希望能預測并逐步理解它們的交流模式。

長按掃碼 閱讀全文