數(shù)學家利用人工智能在橢圓曲線中發(fā)現(xiàn)了意想不到的模式,這些模式類似于鳥類集體飛行的形態(tài),被命名為“murmurations”。這項發(fā)現(xiàn)不僅加深了人們對橢圓曲線的理解,也為解決千禧年難題之一——Birch 和 Swinnerton-Dyer 猜想提供了新思路。
橢圓曲線是現(xiàn)代數(shù)學中最令人著迷的對象之一。它們看起來并不復雜,但卻在高中數(shù)學和最深奧的研究數(shù)學之間架起了一座橋梁。在上世紀 90 年代,橢圓曲線在 Andrew Wiles 證明費馬大定理的過程中發(fā)揮了核心作用。它們是現(xiàn)代密碼學中的關鍵工具。2000 年,克萊數(shù)學研究所將橢圓曲線的統(tǒng)計特性猜想列為七個“千禧年難題”之一,每個難題的解決都能獲得一百萬美元的獎金。這個由 Bryan Birch 和 Peter Swinnerton-Dyer 在 1960 年代首次提出的猜想至今仍未被證明。
理解橢圓曲線是一項意義重大的挑戰(zhàn),也是數(shù)學研究的核心。因此,當 2022 年一個橫跨大西洋的合作團隊利用統(tǒng)計技術(shù)和人工智能在橢圓曲線中發(fā)現(xiàn)了完全出乎意料的模式時,這是一個令人歡迎的、意想不到的貢獻?!皺C器學習遲早會帶著有趣的東西登上我們的舞臺,這只是時間問題,” 高等研究院和普林斯頓大學的數(shù)學家 Peter Sarnak 說。最初,沒有人能解釋這些新發(fā)現(xiàn)的模式為何存在。從那以后,在一系列最近的論文中,數(shù)學家們開始解開這些模式背后的原因,并將它們命名為“murmurations”,因為它們類似于成群結(jié)隊的椋鳥所形成的流動形態(tài)。他們還開始證明這些模式不僅存在于 2022 年研究的特定例子中,而且在更一般的橢圓曲線中也普遍存在。
橢圓的重要性
理解這些模式是什么,我們需要先了解一下什么是橢圓曲線以及數(shù)學家如何對它們進行分類。
橢圓曲線將一個變量 (通常記為 y) 的平方與另一個變量 (通常記為 x) 的三次方聯(lián)系起來:y2 = x3 + Ax + B,其中 A 和 B 是滿足一定條件的兩個數(shù)字。這個方程定義了一個可以繪制在平面上的曲線,如下所示。(盡管名稱相似,橢圓 (ellipse) 并不是橢圓曲線 (elliptic curve)。)
雖然看起來很簡單,但橢圓曲線被證明是數(shù)論學家 (研究整數(shù)中模式的數(shù)學家) 的強大工具。數(shù)論學家不局限于讓變量 x 和 y 遍歷所有數(shù)字,而是喜歡將它們限制在不同的數(shù)系中,他們稱之為在給定的數(shù)系上定義曲線。限制在有理數(shù) (可以用分數(shù)表示的數(shù)) 上的橢圓曲線特別有用?!霸趯崝?shù)或復數(shù)上,橢圓曲線相當枯燥,” Sarnak 說,“只有有理數(shù)才深刻?!?/p>
以下是證明這一點的一種方法。如果你在橢圓曲線上的兩個有理點之間畫一條直線,這條直線再次與曲線相交的點也將是有理數(shù)。你可以利用這個事實來定義橢圓曲線上的“加法”,如下所示。
在 P 和 Q 之間畫一條直線。這條直線將在第三個點 R 處與曲線相交。(對于直線不與曲線相交的情況,數(shù)學家們有一種特殊的技巧,即添加一個“無窮遠點”。)R 關于 x 軸的鏡像就是 P + Q 的和。通過這個加法運算,曲線的所有解形成一個稱為群的數(shù)學對象。
數(shù)學家們利用這一點來定義曲線的“秩”。曲線的秩與它所擁有的有理數(shù)解的個數(shù)有關。秩為 0 的曲線只有有限個解。秩更高的曲線有無限個解,這些解彼此之間的關系可以用秩來描述,并通過加法運算來表示。
秩鮮為人知;數(shù)學家們并不總是能計算出秩,也不知道秩的最大值是多少。(已知特定曲線的最大秩為 20。)看起來相似的曲線可能具有完全不同的秩。
橢圓曲線還與素數(shù) (只能被 1 和它本身整除的數(shù)) 密切相關。具體而言,數(shù)學家們研究有限域上的曲線 - 為每個素數(shù)定義的循環(huán)算術(shù)系統(tǒng)。有限域就像一個時鐘,小時數(shù)等于素數(shù):如果你一直向上計數(shù),數(shù)字會重新開始。例如,在 7 的有限域中,5 加 2 等于 0,5 加 3 等于 1。
橢圓曲線與一個稱為 ap 的數(shù)列相關,該數(shù)列與曲線在由素數(shù) p 定義的有限域中的解的個數(shù)有關。ap 越小,解越多;ap 越大,解越少。雖然秩難以計算,但 ap 數(shù)列要容易得多。
基于對一臺早期計算機進行的大量計算,Birch 和 Swinnerton-Dyer 猜想了一個橢圓曲線的秩與其 ap 數(shù)列之間的關系。任何能夠證明他們猜想正確的人將贏得一百萬美元和數(shù)學界的永垂不朽。
意外的模式出現(xiàn)
2020 年 8 月,倫敦數(shù)學科學研究所的研究員 Yang-Hui He 決定接受一些新的挑戰(zhàn)。他本科主修物理,并在麻省理工學院獲得了數(shù)學物理博士學位。但他對數(shù)論越來越感興趣,并且鑒于人工智能的不斷進步,他認為可以嘗試用人工智能作為一種工具來尋找數(shù)字中的意外模式。(他之前已經(jīng)使用機器學習來分類卡拉比-丘流形,這是一種在弦理論中被廣泛使用的數(shù)學結(jié)構(gòu)。)
2020 年 8 月,隨著疫情的加劇,諾丁漢大學邀請他進行了一次線上演講。他對自己的進展和使用機器學習來發(fā)現(xiàn)新數(shù)學的可能性并不樂觀?!八挠^點是,數(shù)論很難,因為你無法用機器學習來學習數(shù)論,” 在場的西敏寺大學數(shù)學家 Thomas Oliver 說。正如 He 回憶的那樣,“我什么也找不到,因為我不是專家。我甚至沒有用正確的工具來研究這個問題?!?/p>
Oliver 和康涅狄格大學的數(shù)學家 Kyu-Hwan Lee 開始與 He 合作?!拔覀儧Q定做這件事只是為了了解機器學習是什么,而不是認真研究數(shù)學,” Oliver 說?!暗覀兒芸彀l(fā)現(xiàn),你可以用機器學習來學習很多東西?!?/p>
Oliver 和 Lee 建議 He 將他的技術(shù)應用于研究 L 函數(shù),這是一種與橢圓曲線密切相關的無限級數(shù),通過 ap 數(shù)列與橢圓曲線相關聯(lián)。他們可以使用一個名為 LMFDB 的在線橢圓曲線及其相關 L 函數(shù)數(shù)據(jù)庫來訓練他們的機器學習分類器。當時,該數(shù)據(jù)庫擁有超過 300 萬條有理數(shù)上的橢圓曲線。到 2020 年 10 月,他們發(fā)表了一篇論文,利用從 L 函數(shù)中收集的信息來預測橢圓曲線的特定性質(zhì)。11 月,他們又發(fā)表了一篇論文,利用機器學習來對數(shù)論中的其他對象進行分類。到 12 月,他們能夠以很高的準確度預測橢圓曲線的秩。
但他們并不確定為什么他們的機器學習算法如此有效。Lee 要求他的本科生 Alexey Pozdnyakov 看看他能否找出原因。碰巧的是,LMFDB 根據(jù)一個稱為導數(shù)的量對橢圓曲線進行排序,該量概括了曲線在哪些素數(shù)下無法正常工作的信息。因此,Pozdnyakov 嘗試同時查看具有相似導數(shù)的大量曲線 - 例如,所有導數(shù)在 7,500 和 10,000 之間的曲線。
這總共涉及約 10,000 條曲線。其中約有一半的秩為 0,另一半的秩為 1。(更高的秩極為罕見。)然后,他分別對所有秩為 0 曲線的 ap 值進行平均,對所有秩為 1 曲線的 ap 值進行平均,并將結(jié)果繪制出來。兩組點形成了兩個截然不同的、容易辨認的波浪。這就是機器學習分類器能夠正確確定特定曲線秩的原因。
“起初,我只是覺得自己完成了任務,” Pozdnyakov 說?!暗?Kyu-Hwan 立即意識到這種模式是令人驚訝的,這才變得真正令人興奮?!?/p>
Lee 和 Oliver 非常興奮?!癆lexey 向我們展示了這張圖,我說它看起來像鳥類做的那種事情,” Oliver 說?!叭缓?Kyu-Hwan 查了一下,說它叫做 murmurations,然后 Yang 說我們應該把論文命名為 ‘Murmurations of Elliptic Curves’。”
他們在 2022 年 4 月上傳了他們的論文,并轉(zhuǎn)發(fā)給了其他幾位數(shù)學家,忐忑不安地等待著被告知他們所謂的“發(fā)現(xiàn)”是眾所周知的。Oliver 說,這種關系是如此明顯,以至于應該早就被發(fā)現(xiàn)了。
解釋模式
2023 年 8 月,Lee、He 和 Oliver 在布朗大學的數(shù)學計算與實驗研究所 (ICERM) 組織了一次關于 murmurations 的研討會。Sarnak 和 Rubinstein 以及 Sarnak 的學生 Nina Zubrilina 都參加了會議。
Zubrilina 展示了她對模形式中 murmuration 模式的研究,模形式是特殊復函數(shù),與橢圓曲線一樣,具有相關的 L 函數(shù)。在具有大導數(shù)的模形式中,murmurations 會收斂成一條清晰定義的曲線,而不是形成一個可辨識但分散的模式。在 2023 年 10 月 11 日發(fā)表的一篇論文中,Zubrilina 證明了這種類型的 murmuration 遵循她發(fā)現(xiàn)的一個明確公式。
“Nina 的重大成就是她為此給出了一個公式;我稱之為 Zubrilina murmuration 密度公式,” Sarnak 說?!八梅浅>艿臄?shù)學,證明了一個完全符合數(shù)據(jù)的精確公式?!?/p>
她的公式很復雜,但 Sarnak 稱贊它是重要的全新函數(shù)類型,可與定義物理學中各種應用的微分方程解的 Airy 函數(shù)相媲美,應用范圍從光學到量子力學。
雖然 Zubrilina 的公式是第一個,但其他人也緊隨其后?!艾F(xiàn)在每周都會發(fā)表一篇新論文,” Sarnak 說,“主要使用 Zubrilina 的工具來解釋 murmuration 的其他方面?!?/p>
布里斯托大學的 Jonathan Bober、Andrew Booker 和 Min Lee 以及 ICERM 的 David Lowry-Duda 在另一篇 10 月份的論文中證明了模形式中存在另一種類型的 murmuration。Kyu-Hwan Lee、Oliver 和 Pozdnyakov 證明了狄利克雷特征中存在 murmuration,狄利克雷特征與 L 函數(shù)密切相關。
Sutherland 對導致 murmuration 發(fā)現(xiàn)的重大偶然性印象深刻。如果橢圓曲線數(shù)據(jù)不是按導數(shù)排序,murmurations 就會消失。他說:“他們很幸運能夠從 LMFDB 中獲取數(shù)據(jù),該數(shù)據(jù)庫根據(jù)導數(shù)進行了預排序。” “這是將橢圓曲線與相應的模形式聯(lián)系起來的原因,但這并不明顯。… 兩個看起來非常相似的曲線的導數(shù)可能非常不同。” 例如,Sutherland 指出 y2 = x3 – 11x + 6 的導數(shù)為 17,而將減號符號翻轉(zhuǎn)為加號,y2 = x3 + 11x + 6 的導數(shù)為 100,736。
即使這樣,murmurations 也只因 Pozdnyakov 的缺乏經(jīng)驗而被發(fā)現(xiàn)。Oliver 說:“我認為如果沒有他,我們不可能發(fā)現(xiàn)它,” “因為傳統(tǒng)上,專家會對 ap 進行歸一化,使其絕對值為 1。但他沒有對它們進行歸一化… 所以振蕩非常大且明顯。”
人工智能算法用于根據(jù)秩對橢圓曲線進行排序的統(tǒng)計模式存在于具有數(shù)百個維度的參數(shù)空間中 - 這對于人們來說,即使是可視化,也無法在腦海中進行排序,Oliver 指出。但盡管機器學習發(fā)現(xiàn)了隱藏的振蕩,“直到后來我們才理解它們是 murmuration。”
本文譯自Quanta Magazine,由 BALI 編輯發(fā)布。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )