久久天天躁狠狠躁夜夜躁,国产精品入口福利,97久久精品人人爽人人爽蜜臀 ,中文字幕国产精品一区二区

當前位置首頁 > 信息公告

人工智能是大數據天體化學時代的萬能鎖匙嗎?

更新時間:2023-10-18 文章作者:佚名 信息來源:網絡整理 閱讀次數:

我當初寫過一篇文章《和Wall-E一起凝望星空》,上面介紹了機器學習在大數據天體化學時代的應用,其高效性、自動化、準確性都給人們留下了深刻的印象。UBe物理好資源網(原物理ok網)

看起來,人工智能或許還能幫助天文學家有效地解決大數據天體化學時代所面臨的困局。但是,人工智能真的是萬能的么?本文將從目前機器學習的局限性闡述一下機器學習在天體化學中的應用范圍。UBe物理好資源網(原物理ok網)

01UBe物理好資源網(原物理ok網)

剛需:大數據天體化學時代到來UBe物理好資源網(原物理ok網)

隨著觀測技術的發展,天文數據呈指數型下降。諸如,知名的斯隆巡天(TheSloanSky)[1]開始于2000年,觀測到了約300萬個天體,數據量大概是40TB。而目前正在運行的暗能量巡天(TheDark)[2]的數據量起碼是斯隆巡天的100倍。未來法國的歐幾里得巡天()[3]以及英國的大視場時空巡天(LSST)[4]則會把數據量推到驚人的50PB和200PB(1PB=)。UBe物理好資源網(原物理ok網)

僅僅是可觀測星體一種天體的樣本數量,就將達到數十億。因而,往年傳統編程加人工處理方法的效率早已不足以應付這樣龐大的數據量了。比如,把上百億的星體根據哈勃星體圖表(圖1)分類的工作量就多到讓人望而興嘆,這還僅僅是天體化學學研究的基本操作。UBe物理好資源網(原物理ok網)

也就是說,高效的手動化數據處理將成為剛需。慶幸人工智能技術在過去的十幾年里有了突飛猛進的發展,例如圖樣辨識技術早已可以快速地把互聯網上的圖片進行分類。天文學家們受此啟發,開始把人工智能領域里的相關技術應用到天文數據的手動化處理中。UBe物理好資源網(原物理ok網)

圖1.哈勃星體分類圖表,最左邊分支(E)是橢圓星體,由左到右橢率漸漸減小。S0代表橢圓星體和旋渦星體的臨界點。Sa,b,c分支代表常規旋渦星體,由a到b星體的光度中漩臂占的比重越來越大。SB分支代表具有棒結構的旋渦星體,由a到b的排序不只考慮了光度比還考慮的懸臂的開放程度。圖片來源:UBe物理好資源網(原物理ok網)

02UBe物理好資源網(原物理ok網)

應用:分類、回歸與生成UBe物理好資源網(原物理ok網)

知名科學家赫伯特·西蒙(Simon,1975年圖靈獎和1978年諾貝爾經濟學獎得主)給機器學習下過定義——“機器學習是計算機程序通過攝入數據來自行改進性能的過程”。機器學習和傳統程序根本的不同就是編程邏輯:機器學習的理念是歸納法,而傳統編程更傾向于詮釋法。UBe物理好資源網(原物理ok網)

比如,假如想用傳統編程方式對星體的形狀分類,我們需先檢測星體的形狀參數,之后設定閥值,再依據形狀參數和閥值的關系對星體分類;而機器學習的邏輯則是:先構建一個普適的模型,不提供特定參數或閥值,只輸入星體圖象和歸類標簽,這個模型都會依照輸入的數據自我調整,從而演變成一個可用于星體形狀分類的分類器。圖2展示了傳統程序和機器學習程序工作流程的差別。UBe物理好資源網(原物理ok網)

圖2.傳統編程和機器學習編程邏輯的差別。圖片來源:UBe物理好資源網(原物理ok網)

眼下,天文學家主要應用機器學習解決分類、回歸、生成等分體,成功案例包括星體形狀分類和指定天體識別(圖3)、天體化學現象的快速手動化建模(圖5)以及仿真圖象的生成(圖6)。綜合來看機器學習在解決天體化學學問題上具有以下優點:1)覆蓋范圍廣,普適性好;2)數據驅動,上限顯著低于傳統方式;3)開發難度越來越低,移植性好。這種優點促使機器學習的方式在天體化學尤其是大數據時代的天體化學中越來越流行,幾乎在各個天體化學學領域甚至各個科學領域都能見到其身影。UBe物理好資源網(原物理ok網)

圖3.應用監督學習和非監督學習進行星體形狀分類的范例。上圖為監督學習分類結果的范例[5],右圖為非監督學習星體分類結果的范例[6]。兩個方式都能比較好地按照形狀對星體進行分類了,若果有興趣了解更多細節,請訪問圖片來源鏈接里的論文(文末參考文獻,下同)。UBe物理好資源網(原物理ok網)

圖4.應用機器學習解決“回歸問題”的實例。左圖為宇宙中的投影物質分布示意圖,下圖為機器學習的方式按照宇宙中的投影物質分布預言的宇宙學參數[7]。這個應用的基本思想是通過機器學習的算法構建起左圖和由圖中宇宙學參數的對應關系,這樣在將來有新的物質分布的數據的時侯,只要輸入訓練好的模型中,就可以快速地返回對應的宇宙學參數了。UBe物理好資源網(原物理ok網)

圖5.機器學習算法生成的仿真星體圖象與真實圖象的對比[8]。左圖為機器學習生成的無噪聲旋渦星體,中圖為添加噪聲以后的仿真圖象,下圖為哈勃望遠鏡所觀測到的圖象。生成盡可能真實的數值模擬的圖象有助于天文學家測試和校準數據處理軟件和科學建模軟件。UBe物理好資源網(原物理ok網)

03UBe物理好資源網(原物理ok網)

弱項:門檻、數據與黑袋子UBe物理好資源網(原物理ok網)

但是,機器學習并非無所不能。首先其超高的估算量和非常的硬件需求使其入門門檻要低于傳統方式。另外,模型設計十分復雜,要投入大量的人力、物力和時間來開發新算法及模型,大部份人只能使用現有的模型。并且,機器學習是一個隨機的過程,結果的統計性是自洽的,但未能在個體結果上實現多次完美再現。UBe物理好資源網(原物理ok網)

比如,應用機器學習實現分類操作時,小部份目標天體每次的分類結果就會不一樣;應用機器學習實現回歸估算時,每次預言的參數也都不是可重復的固定值,雖然不確定性很小。因而,應用機器學習研究天體化學學問題時,有明晰一對一關系的數學過程(如星體動力學仿真和引力透鏡光線追蹤仿真等)仍然須要傳統方式來實現。UBe物理好資源網(原物理ok網)

其次,機器學習是數據驅動的,所以缺乏數據的科學問題要慎重采用此方式,尤其是數據在參數空間的覆蓋范圍不夠完備的時侯,機器學習將給出有誤差的結果。其實,可以使用數值模擬的方法來改進數據的完備性和多樣性,但這又造成機器學習給出的結果強烈依賴仿真數據的生成模型,因而應用機器學習解決這種問題的時侯,須要盡可能詳細地設計仿真過程因而創建合理的訓練樣本。UBe物理好資源網(原物理ok網)

另一方面,在數據體量滿足條件的時侯,缺乏優質數據的科學問題也不太適宜采用機器學習來解決,由于大量的劣質數據會造成機器學習模型對噪聲(非真實優質的數據)作出響應,因而給出可效度很高的錯誤結果。解決這種問題時,對數據慎重地預篩選和后篩選是必要的,以盡量避開“錯進錯出(in,out)”現象。UBe物理好資源網(原物理ok網)

最后,也是最重要的:機器學習算法的不可解釋性是被人非議最多的弱項,因而機器學習仍然被比喻成黑盒,形象的地描述了機器學習算法對相關性敏感,但非常缺乏因果性的解釋。UBe物理好資源網(原物理ok網)

目前為止,機器學習,尤其是深度學習的惟一真正成功之處是在給定大量人類注釋數據的情況下,才能使用連續的幾何變換將空間X映射到空間Y,但是至于為什要從X映射到Y還須要科學家自己把控。據悉,從X映射到Y的具體細節也須要更深入的研究。UBe物理好資源網(原物理ok網)

相關研究[9]早已嘗試用微軟的Deep-Dream[10]工具包研究星體團質量構建過程中對特定數據點的敏感性(圖6),谷歌的[11]工具包則專注于神經網路模型中各部份的邏輯關系和數據流向(圖7),這兩個嘗試可以被看成“向黑袋子照入光”,幫助人們更好地理解其工作原理,其實結果仍很初步,離完全理解“黑袋子”還有很長的路要走。希望隨著對機器學習工作邏輯研究的深入,人類能最終打開黑盒,讓機器學習幫助科學家更好地探求宇宙。UBe物理好資源網(原物理ok網)

圖6.應用深度學習算法基于星體團的光度信息解構星體團的總質量分布的過程中,星體團光度場中數據點對構建結果貢獻的權重示意圖。兩側為星體團的廣度分布(星體粒子分布)[9],其中黑圈圈出星體團的中心星體的位置,紅圈圈出星體團的成員星體;兩側為Deep-Dream[10]處理后的結果,紅色的區域代表對結果貢獻比較大的數據點。UBe物理好資源網(原物理ok網)

圖7.機器學習模型解釋軟件簡介[11]。UBe物理好資源網(原物理ok網)

04UBe物理好資源網(原物理ok網)

總結:有效、有選擇、有未來UBe物理好資源網(原物理ok網)

大數據天體化學時代,機器學習能有效地幫助天文學家完成了海量數據的挖掘工作。但機器學習并不是萬能的鎖匙,不能盲目地應用機器學習去解決所有天文學問題天體物理萬能公式天體物理萬能公式,尤其是在問題范圍不明晰、數據體量不足以及數據質量不高的情況下。UBe物理好資源網(原物理ok網)

另外,不可解釋性是機器學習方式目前最大的弱項,因而按照機器學習的結果下因果性推論的時侯要尤為慎重。早已有一些先驅性工作嘗試解釋機器學習結果與數據的因果關系以及機器學習模型內部的邏輯關系,希望隨著這種研究的深入,人類能最終打開黑盒,讓機器學習也能從事推理和具象相關的科研工作。UBe物理好資源網(原物理ok網)

不過話說回去,真到哪個時侯,天文學家又將飾演何種角色呢?會不會成為待業的人群?歡迎留下你的想法。UBe物理好資源網(原物理ok網)

參考文獻:UBe物理好資源網(原物理ok網)

[1]UBe物理好資源網(原物理ok網)

[2]UBe物理好資源網(原物理ok網)

天體萬能公式應用范圍_天體物理萬能公式_萬能公式天體物理知識UBe物理好資源網(原物理ok網)

[3]UBe物理好資源網(原物理ok網)

[4]UBe物理好資源網(原物理ok網)

[5],S.etal.,-for,2015,MNRAS,Vol.450,Issue2,p.1141-1459UBe物理好資源網(原物理ok網)

[6],A.etal.,AnofUsing,2018,MNRAS,Vol.473,Issue1,p.1108-1129UBe物理好資源網(原物理ok網)

[7]Fluri,J.etal.,fromNoisyMapsDeep,2018,D,Vol.98,Issue12,id.UBe物理好資源網(原物理ok網)

[8],S.etal.,DarkwithDeepof,2017,AAAI-2017,,id.14765UBe物理好資源網(原物理ok網)

[9]Yan,Z.etal,MasswithDeepand,2020,MNRAS,Vol.499,Issue3,pp.3445-3458UBe物理好資源網(原物理ok網)

[10]UBe物理好資源網(原物理ok網)

[11]UBe物理好資源網(原物理ok網)

UBe物理好資源網(原物理ok網)

作者簡介UBe物理好資源網(原物理ok網)

李楠UBe物理好資源網(原物理ok網)

2013年在中國科大學學院年獲得天體化學學博士,現中國科大學國家天文臺副研究員,主要研究興趣為機器學習在天體化學中的應用、應用引力透鏡效應研究星體宇宙學問題。UBe物理好資源網(原物理ok網)

UBe物理好資源網(原物理ok網)

制版編輯|LivanUBe物理好資源網(原物理ok網)

賽先生UBe物理好資源網(原物理ok網)

啟蒙·探索·創造UBe物理好資源網(原物理ok網)

假如你擁有一顆好奇心UBe物理好資源網(原物理ok網)

假如你渴望知識UBe物理好資源網(原物理ok網)

假如你相信世界是可以理解的UBe物理好資源網(原物理ok網)

發表評論

統計代碼放這里
主站蜘蛛池模板: 秦安县| 故城县| 罗江县| 宁国市| 烟台市| 祁门县| 慈利县| 察隅县| 西平县| 建昌县| 慈溪市| 腾冲县| 寿宁县| 孟州市| 汝南县| 北川| 波密县| 正蓝旗| 呼玛县| 定陶县| 安新县| 寿宁县| 涟水县| 从化市| 客服| 通道| 策勒县| 赫章县| 十堰市| 邵武市| 明水县| 新田县| 邵阳市| 灌南县| 富蕴县| 东阳市| 五指山市| 怀来县| 深州市| 稷山县| 德安县|