當AI遇上核聚變,「50 年悖論」的可控核聚變會提前實現嗎?
自 20 世紀 40 年代以來,物理學家們進行了各種試驗,但還沒有人創造出有效的核聚變反應。
不可控核聚變,在上世紀科學家已經研究出來了——氫彈。
可控核聚變能具有安全、清潔、燃料豐富等優點,是解決人類未來能源問題的主要選擇之一。
在可控核聚變領域有一個著名的「50 年悖論」,意思就是說距離實現可控核聚變永遠都只有 50 年,爲了讓核聚變「可控」,科學家們已經研究了 50 多年,接下來還要繼續……
但,人工智能和機器學習 (ML) 已被證明在很多行業和應用中能夠檢測人類無法識別的數據中的微妙模式。
那麼神經網絡和爲其提供動力的 GPU 是否有助於核聚變?這是一個巨大的挑戰,它將加速全球對「馴服」熱等離子體不穩定性的探索,並最終提供一種可持續、無碳能源的來源。
核聚變和可控核聚變
核聚變(nuclear fusion)是兩個較輕的原子核(例如氘和氚)聚合爲一個較重的原子核(例如氦),並釋放出能量的過程。通常有重力場約束、慣性約束和磁約束三種方式來產生核聚變。
自然界中最容易實現的聚變反應是氫的同位素——氘與氚的聚變,這種反應在太陽上已經持續了 50 億年。可控核聚變俗稱「人造太陽」,因爲太陽的原理就是核聚變反應。
可控核聚變能具有安全、清潔、燃料豐富等優點,是解決人類未來能源問題的主要選擇之一。如果人類能夠掌握有序釋放核聚變的能量的方法,就等於掌握了太陽的能量來源,等於掌握了無窮無盡的礦石燃料、風力和水力能源。因此,可控核聚變反應堆當之無愧地被稱作「人造太陽」。
科學家正在努力研究可控核聚變,核聚變可能成爲未來的能量來源。核聚變燃料可來源於海水和一些輕核,所以核聚變燃料是無窮無盡的。
激光約束(慣性約束)核聚變,如我國的神光計劃,美國的國家點火計劃等;磁約束核聚變,比如託卡馬克、仿星器、磁鏡、反向場、球形環等。
2021 年 5 月 28 日,中科院合肥物質科學研究院有「人造太陽」之稱的全超導託卡馬克核聚變實驗裝置(EAST)創造了新的世界紀錄,成功實現了可重複的 1.2 億攝氏度 101 秒和 1.6 億攝氏度 20 秒等離子體運行,將 1 億攝氏度 20 秒的原紀錄延長了 5 倍。
圖示:升級改造後的全超導託卡馬克核聚變實驗裝置(EAST)。(來源:中科院合肥物質科學研究院等離子體物理研究所。)
中科院合肥物質科學研究院等離子體物理研究所所長宋雲濤介紹說,本次 EAST 的新紀錄進一步證明了核聚變能源的可行性,也爲邁向商用奠定了物理和工程基礎。
以下爲深度學習和機器學習,最近在覈聚變方面的應用研究:
深度學習在覈聚變研究中的三種用途
葡萄牙里斯本大學(University of Lisbon)信息系統教授 Diogo Ferreira 說:「物理學家開發理論模型,編寫方程,用數學方法處理事物。但這是有限度的。」 他說,人工智能可以提供幫助。
最近,Ferreira 與英國歐洲聯合環 (Joint European Torus,JET) 的同事合作進行了一項研究,該研究詳細介紹了深度學習模型在覈聚變研究中的三種不同用途。
該研究於 6 月 24 日以《Using HPC infrastructures for deep learning applications in fusion research》爲題發表在《Plasma Phys. Control. Fusion》雜誌上。
論文鏈接:https://iopscience.iop.org/article/10.1088/1361-6587/ac0a3b
該研究給出了深度學習模型的 3 個示例,即:用於圖像重建的卷積神經網絡 (CNN);循環神經網絡 (RNN) 進行中斷預測;用於異常檢測的變分子編碼器 (VAE)。
Ferreira 使用連接到 JET 反應堆的 48 個傳感器(稱爲熱輻射計)的診斷數據訓練他的模型,這些傳感器用於收集功率和輻射數據。
RNN 用於中斷預測
第一個機器學習模型預測了超熱等離子體的破壞。在研究中,Ferreira 解釋說,根據它的訓練方式,該模型可以預測中斷的可能性——這可能導致等離子體脫離限制、震動設備、大幅降低等離子體的溫度並結束反應——或者預測中斷髮生的時間。
研究證明了基於 JET 熱輻射計開發的用於中斷預測的深度學習模型可行性。等離子體輻射剖面提供了有關破壞相關行爲的重要線索。
圖示:脈衝 92 213 從 48.1 秒到 54 秒的重建,時間步長爲 0.1 秒。(來源:論文)
圖示:用於中斷預測的深度學習模型的結構。(來源:論文)
VAE 用於異常檢測
在深度學習領域,最常用於異常檢測的模型類型是 VAE。異常檢測依賴於 VAE 重建給定輸入樣本的能力。當 VAE 重新輸入樣本時,這表明它以前從未見過這種行爲,因此這種行爲被歸類爲異常。
第二個機器學習模型檢測等離子體中的異常。該模型僅針對未發生中斷的反應進行訓練,可以重現這些「良好」的實驗。如果數據源自以中斷結束的實驗,該模型可以識別數據何時以及如何與成功反應的數據不同。科學家可以使用這個過程來更好地瞭解最終導致中斷的原因,並最終產生中斷可能性較小的反應。
圖示:用於異常檢測的深度學習模型的結構。(來源:論文)
CNN 用於圖像重建
另一個應用涉及等離子體輻射模式的視覺表示。CNN 用於等離子斷層掃描。
通過大約 400 個樣本的批量大小,在具有 16 GB 內存的單個 Nvidia P100 GPU 上訓練網絡,需要花費將近一天(16 小時)的時間來訓練。相比之下,在具有 8 個 Nvidia P100 GPU 的多 GPU 節點上,可以在幾個小時(2-3 小時)內訓練模型。
該研究表明訓練過程的強大擴展性,且將訓練分佈在多個 GPU 上是有益的。
訓練後,該模型可用於在幾秒鐘內生成整個脈衝的重建(而不是使用原始方法花費幾分鐘來生成單個重建)。
圖示:用於等離子斷層掃描的深度學習模型的結構。(來源:論文)
Ferriera 說,執行蠻力、直接計算,每個反應可能需要 20 分鐘。相比之下,一個機器學習模型可以在幾秒鐘甚至更短的時間內生成類似的圖像。Ferriera 說,「這太快了,有朝一日可能會在實時實驗中完成。」
機器學習預測等離子體行爲
等離子體是由大量帶電粒子組成的,宏觀上呈准中性的電離氣體,在長程電磁力作用下表現出獨特的集體振盪的動力學行爲。
看似「神秘」的等離子體,其實是宇宙中一種常見的物質,在太陽、恆星、閃電中都存在等離子體,它佔了整個宇宙的 99%。太陽就是一個天然的等離子體物理和核聚變實驗室。
等離子體是高度非線性和多尺度的,這對理解、建模和控制這些系統提出了嚴峻的挑戰。理論、數據驅動和機器學習方法正在徹底改變高維非線性系統的分析、建模和控制,尤其是在流體力學領域。降階建模發展迅速,但許多進展尚未被等離子體物理學界採用。
華盛頓大學研究人員最近的一項研究,詳細介紹了一種使用機器學習來預測等離子體行爲的方法。爲了促進可重複的研究,提供了用於該分析的 Python 代碼。該研究爲流體力學中廣泛的伽遼金文獻(Galerkin literature)架起了一座橋樑,並促進了基於投影和數據驅動的等離子體模型的未來原則性發展。
該研究以《用於磁流體動力學的受物理約束的低維模型: 第一性原理和數據驅動的方法》(Physics-constrained, low-dimensional models for magnetohydrodynamics: First-principles and data-driven approaches) 爲題,於 7 月 13 日發表在《Physical Review E 》雜誌上。
論文的共同作者 Hansen 說,雖然研究中的模型在實驗中運行得不夠快,但他認爲它最終可以。
項目地址:https://github.com/akaptano/POD-Galerkin_MHD
論文鏈接:https://journals.aps.org/pre/abstract/10.1103/PhysRevE.104.015206
這項工作利用基於投影和數據驅動的流體建模數十年的進展,爲可壓縮等離子體開發了降階建模框架。
首先將非線性磁動流體力學(magnetohydrodynamics MHD)系統的基於投影的簡化模型形式化。爲了避免對磁、速度和壓力場進行單獨的模態分解,引入了能量內積以將所有場合成爲尺寸一致的降階基礎。接下來,通過 Hall-MHD 方程在這些模式上的 Galerkin 投影獲得解析模型。
圖示:填充等離子體模型層次結構較低層級方法:(a) 收集數據,(b) 執行基於投影的模型簡化, (c) 使用物理約束系統識別發現數據驅動模型。(來源:論文)
論文一作 Alan A. Kaptanoglu 表示:「我們的模型使用更少的數據、計算力和時間。將促進基於投影和數據驅動的等離子體模型的發展。」
基於深度學習的 PIC 模擬方法
粒子模擬(Particle-in-Cell,PIC) 方法是用於模擬等離子體的最強大和最常用的計算方法之一,可應用於聚變反應堆、激光等離子體裝置、加速器、空間物理學和天體物理學。PIC 模擬分析極大地促進了我們對複雜現象和系統中等離子體動力學的理解。
最近,瑞典斯德哥爾摩 KTH 皇家理工學院計算機科學副教授 Stefano Markidis 與他的同事 Xavier Aguilar 一起創建了一個深度學習模型,該模型解決了確定信息的計算密集型步驟之一:等離子體——計算其電場。該方法速度更快,在某些情況下,比涉及複雜數學方程的傳統方法更準確。
研究表明,將 DL 技術集成到傳統計算方法中是開發下一代 PIC 算法的可行方法。
該研究於 7 月 5 日以《用於等離子體模擬的基於深度學習的 Particle-in-Cell 方法》(A Deep Learning-Based Particle-in-Cell Method for Plasma Simulations)爲題,發表在 arXiv 上。
論文鏈接:https://arxiv.org/abs/2107.02232
該研究有兩個目標:第一個目標是設計和開發一種新的 PIC 方法,在 PIC 計算週期中採用 DL 技術。第二個目標是確定基於 DL 的 PIC 方法與傳統 PIC 方法相比,在穩定性和準確性方面的優勢。
雙流不穩定性(two-stream instability)是等離子體物理學中很常見的不穩定因素。該研究設計並開發了一種用於等離子體模擬的新 PIC 方法。訓練了一個多層感知器 (Multilayer Perceptron,MLP) 和一個卷積神經網絡 (CNN) 來解決雙流不穩定測試。
圖示:基於 DL 的 PIC 方法。(來源:論文)
研究人員比較了基於 DL 的 PIC 方法與傳統 PIC 方法的精度和性能。研究表明基於 DL 的 PIC 方法在總能量和動量變化可接受的情況下再現了雙流不穩定性的正確結果。然而,基於 DL 的 PIC 方法對冷光束不穩定性很穩定。
圖示:雙流不穩定性的傳統和基於 DL 的 PIC 模擬中總能量和動量演化的比較。(來源:論文)
研究人員表示:「未來的工作將包括表徵基於 DL 的 PIC 計算性能。我們還打算擴展該方法來研究電磁問題的二維和三維繫統。」
人工智能和機器學習在覈聚變系統中並非沒有缺點。機器學習算法,尤其是深度學習模型,是「黑匣子」——並不總是可能知道一個模型是如何得到結果的。但是通過使用這些算法,科學家們可以收集這些模型所見的一些細節,並瞭解有關等離子體和聚變物理學的更多信息。
「歸根結底,解決核聚變問題的將是我們的思想,」Stefano Markidis 說。「這只是我們使用什麼工具的問題,人工智能和機器學習將成爲關鍵工具。」