近來,一組來自CMU和UC等研究機構(gòu)的研究人員率先推出了全球首個AI宇宙三維模擬器。這個模擬器除了速率快但是精度高,調(diào)參后無需訓(xùn)練仍能確切模擬,甚至連它的創(chuàng)造者都不曉得它是怎么做到的。
宇宙中暗物質(zhì)的數(shù)目都能估算
幾六年來,科學(xué)家們?nèi)匀皇褂糜嬎銠C模擬來嘗試并用數(shù)字技術(shù)對我們宇宙的起源和演變進行逆向工程。使用現(xiàn)代技術(shù)的最佳的傳統(tǒng)方式須要幾分鐘時間來形成良好的結(jié)果。如今,這個全球首個AI宇宙模擬器在幾微秒內(nèi),才能形成更高精度的結(jié)果。
論文中談到:“在這兒,我們構(gòu)建了一個深層的神經(jīng)網(wǎng)路來預(yù)測宇宙的結(jié)構(gòu)產(chǎn)生。它優(yōu)于傳統(tǒng)的快速剖析近似法,而且可以在訓(xùn)練數(shù)據(jù)之外精確地進行外推。”
也就是說,它除了做了開發(fā)人員建造它做的事情——模擬不同引力條件下宇宙的演變——它還為它沒有訓(xùn)練過的變量形成了精確的結(jié)果。比如,它報告的一個讓科學(xué)家們震驚的特殊參數(shù)是,宇宙中暗物質(zhì)的數(shù)目。
研究小組沒有按照暗物質(zhì)濃度不同的數(shù)據(jù)來訓(xùn)練這個名為“深密度位移模型”(D3M)的系統(tǒng),但是AI(依據(jù)研究,精確地)按照它所訓(xùn)練的數(shù)據(jù)的結(jié)論改變了這種值。
正如論文的專著者Ho所言:“這如同用大量的貓狗圖片教圖象辨識軟件一樣,但此后軟件才能辨識小象。沒有人曉得它是怎樣做到的,這是一個很吃驚的謎。”
8000種不同模擬訓(xùn)練模型
像D3M那樣的計算機模擬已成為理論天體化學(xué)學(xué)的必要條件。科學(xué)家們想曉得宇宙在不同的情況下是怎樣演變的,比如,例如暗能量將宇宙拉離的時間是不同的。這種研究須要進行數(shù)千次模擬,做一個閃電般快速且高度精確的計算機模型成為現(xiàn)代天體化學(xué)學(xué)的主要目標(biāo)之一。
D3M模擬引力怎樣打造宇宙。研究人員選擇僅關(guān)注引力,由于它是迄今為止宇宙大規(guī)模演變中最重要的力量。
最精確的宇宙模擬估算了引力怎樣在宇宙的整個生命中聯(lián)通數(shù)十億個單個粒子。這些精度須要時間,一次模擬須要大概300個估算小時。更快的方式可以在兩分鐘內(nèi)完成相同的模擬天體物理模擬器,但代價就是精度會增加。
研究人員通過從可用的最高精度模型中提供了8,000種不同的模擬,來訓(xùn)練D3M使用的深度神經(jīng)網(wǎng)路。神經(jīng)網(wǎng)路獲取訓(xùn)練數(shù)據(jù)并對數(shù)據(jù)進行估算;之后研究人員將結(jié)果與預(yù)期結(jié)果進行比較。通過進一步訓(xùn)練,神經(jīng)網(wǎng)路會隨著時間的推移而適應(yīng),因而形成更快、更確切的結(jié)果。
在訓(xùn)練D3M以后,研究人員對6億光年的箱形宇宙進行了模擬,并將結(jié)果與慢速和快速模型的結(jié)果進行了比較。慢速但確切的方式每次模擬須要數(shù)百小時的估算時間,而現(xiàn)有的快速技巧須要幾分鐘,但D3M可以在30微秒內(nèi)完成模擬。
D3M也能形成確切的結(jié)果。與高精度模型相比,D3M的相對偏差為2.8%。使用相同的比較,現(xiàn)有的快速模型的相對偏差為9.3%。
研究人員表示,D3M在處理訓(xùn)練數(shù)據(jù)中未發(fā)覺的參數(shù)變化方面具有非凡的能力,這促使它成為一個非常有用和靈活的工具。不僅模擬其他力,如流體動力學(xué),研究團隊希望了解更多關(guān)于模型是怎樣運作的。
圖1:由D3M形成的位移矢量場(左)和由此形成的密度場(右)。
圖2:各列通過各類模型顯示了完整粒子分布(上)和位移矢量(下)的2D切塊:,目標(biāo)truth,基于PM解算器(A)的近似N體模擬方案;ZA天體物理模擬器,沿初始速率矢量(B)演變粒子的簡單線性模型;2LPT,常用的剖析近似(C)和本文的深度學(xué)習(xí)模型D3M(D)。其實(A)是研究團隊的truth,B-D包括點或向量的顏色。顏色表示目標(biāo)位置(A)或位移矢量與各類方式(B-D)預(yù)測分布之間的相對差別()/。偏差條表明,密度較大的區(qū)域所有方式都有較大的偏差,這表明對于所有模型(D3M,2LPT和ZA),很難正確預(yù)測高度非線性區(qū)域。她們的D3M模型在上述B-D模型中預(yù)測和truth之間的差別最小。
圖3:(藍色),2LPT(紅色)和c(紅色)(底部)的位移和密度功率譜;傳遞函數(shù)-即預(yù)測的功率譜與truth(中部)之比的平方根;以及1–r2,其中r是預(yù)測場與真場(頂部)之間的相關(guān)系數(shù)。結(jié)果是1,000個測試模擬的平均值。從大到中,D3M預(yù)測的傳遞函數(shù)和相關(guān)系數(shù)接近完美,顯著優(yōu)于基準(zhǔn)2LPT。(B)對于幾個三角形配置,兩個3PCF的多極系數(shù)(ζ1(r1,r2))(與目標(biāo))的百分比。結(jié)果在10次測試模擬中取平均值。偏差條(填充區(qū)域)是從10次測試模擬得出的SD。該百分比表明D3M的3PCF比她們的目標(biāo)更接近2LPT,殘差更小。
圖4:上圖顯示當(dāng)她們改變宇宙參數(shù)As和m時,粒子分布和位移場的差別。(A)偏差條顯示As=A0與As=0.2A0(中心)和As=1.8A0(右)之間的兩個極值之間的粒子分布(上)和位移場(下)之間的差別。(B)類似的比較,顯示m∈{0.1,0.5}的較小和較大值的粒子分布(上)和位移場(下)的差別,用于訓(xùn)練的m=0.3089。其實較小的As(m)值的差別較大,但較大的As(m)的位移愈發(fā)非線性。這些非線性是由質(zhì)量集中造成的,并使預(yù)測愈發(fā)困難。
圖5:與圖3A類似,不僅在不改變訓(xùn)練集(具有不同的宇宙參數(shù))或訓(xùn)練模型的情況下,改變宇宙參數(shù)時,測試兩點統(tǒng)計量。當(dāng)在不同的As(A)和Ωm(B)上測試時,顯示了來自D3M和2LPT的預(yù)測。她們展示了傳遞函數(shù)-即預(yù)測功率譜與truth(上)之比的平方根-和1-r2,其中r是預(yù)測場與真實場(下)之間的相關(guān)系數(shù)。不僅最大尺度,D3M預(yù)測在所有尺度上都優(yōu)于2LPT預(yù)測,由于擾動理論在線性區(qū)域(大尺度)中工作良好。
AI將幫助人類更好的認識宇宙
不僅進一步展示黑匣子AI和深度學(xué)習(xí)的反復(fù)無常和不可預(yù)測的本質(zhì)外,AI宇宙模擬器本身還有潛力幫助天體化學(xué)學(xué)家和研究人員彌補我們宇宙背后的一些空白。
我們的宇宙是一個奇怪的,幾乎是未知的地方。人類剛才開始將我們的視線投向可觀測空間之外,以確定宇宙之外是哪些,以及它是怎樣產(chǎn)生現(xiàn)今的樣子的。人工智能可以幫助我們確切地理解影響我們宇宙進化的數(shù)十億個變量是怎樣作用于星體、行星甚至生命本身的出現(xiàn)的。
該研究的源代碼:
形成訓(xùn)練數(shù)據(jù)的代碼:
論文地址:
參考鏈接