■李衛(wèi)東、石京燕、汪璐、張曉梅、程耀東、齊法治、曾珊、顏田/文
高能化學(xué)研究組成物質(zhì)的基本粒子及其互相作用規(guī)律,是數(shù)學(xué)學(xué)研究中的最前沿。現(xiàn)今,高能化學(xué)實驗規(guī)模通常都很大,須要成百上千的科學(xué)家出席。高能化學(xué)實驗的周期比較長,從實驗設(shè)計到目標(biāo)的實現(xiàn)一般會經(jīng)歷十幾年甚至幾六年的時間。實驗形成的海量實驗數(shù)據(jù),須要利用先進(jìn)的計算機(jī)技術(shù)來處理和剖析,實驗的需求也促進(jìn)了計算機(jī)信息技術(shù)的不斷發(fā)展。
近些年來,我國化學(xué)學(xué)家在以我為主的高能化學(xué)實驗中取得了令人矚目的成績,其中包括上海正負(fù)電子對撞機(jī)實驗和惠州反應(yīng)堆中微子實驗。下邊我們將以這兩個實驗為例,介紹數(shù)據(jù)儲存、數(shù)據(jù)傳輸以及各類估算技術(shù)在高能化學(xué)實驗中的運用。
01
數(shù)據(jù)處理與剖析
通過觸發(fā)判選和在線選擇的例子,由在線數(shù)據(jù)獲取系統(tǒng)以二補(bǔ)碼文件的方式記錄出來。這些數(shù)據(jù)也稱原始數(shù)據(jù),主要包含偵測器電子學(xué)訊號的時間和幅度信息。通過高速以太網(wǎng),原始數(shù)據(jù)文件被傳輸?shù)酱艓煊谰帽4妗υ紨?shù)據(jù)進(jìn)行刻度和重建后,生成重建數(shù)據(jù),供化學(xué)剖析使用。
離線數(shù)據(jù)處理和化學(xué)剖析的簡化過程如圖1所示。
圖1離線數(shù)據(jù)處理流程
原始數(shù)據(jù)經(jīng)過離線刻度,就能去除實驗的各類外部條件(比如氣溫、氣壓)和偵測器本身條件(比如偵測器高壓)對電子學(xué)訊號與化學(xué)檢測量之間轉(zhuǎn)換關(guān)系的影響。離線刻度將按不同的子偵測器分別進(jìn)行,生成的大量刻度常數(shù)保存于數(shù)據(jù)庫。重建是離線數(shù)據(jù)處理的核心,數(shù)據(jù)重建算法使用刻度算法形成的刻度常數(shù),將偵測器記錄的原始數(shù)據(jù)轉(zhuǎn)化為粒子的動量、能量和運動方向等化學(xué)量,生成重建數(shù)據(jù)。
化學(xué)研究還須要形成與真實數(shù)據(jù)數(shù)目相當(dāng)?shù)哪M數(shù)據(jù),這部份數(shù)據(jù)也要進(jìn)行重建。和原始數(shù)據(jù)一樣,所有重建數(shù)據(jù)會被保存在磁帶庫中。化學(xué)剖析人員借助數(shù)學(xué)剖析工具比如運動學(xué)擬合、粒子衰變頂點找尋和粒子鑒定等軟件,剖析重建數(shù)據(jù),得到化學(xué)研究結(jié)果。
02
數(shù)據(jù)儲存與傳輸
高能化學(xué)估算屬于數(shù)據(jù)密集型高性能估算,數(shù)據(jù)儲存系統(tǒng)是影響估算性能的關(guān)鍵環(huán)節(jié)。數(shù)據(jù)儲存系統(tǒng)除了要保存海量數(shù)據(jù),同時還要考慮與數(shù)據(jù)處理系統(tǒng)的配合,增強(qiáng)數(shù)據(jù)剖析效率。大部份高能化學(xué)估算是高吞吐率的估算(High,HTC),追求系統(tǒng)整體而非單個作業(yè)的性能和效率。這兒吞吐率指一個計算機(jī)或數(shù)據(jù)處理系統(tǒng)單位時間內(nèi)的數(shù)據(jù)處理量或傳輸量。
在表示數(shù)據(jù)量的大小時,常用的單位有kB(103Bytes),MB(106Bytes),GB(109Bytes)和TB(1012Bytes)。在表示非常大的數(shù)據(jù)量時,都會用到PB(1015Bytes)和EB()。高能化學(xué)數(shù)據(jù)剖析的讀寫(Input/,簡稱I/O)模式以大文件(數(shù)百MB甚至GB級)、大塊(MB級記錄塊)讀寫、一次寫多次讀、吞吐率需求高(單個作業(yè)須要幾MB/s)為特點。同時,化學(xué)學(xué)家對大量小文件(kB級的程序和文檔)的查找和瀏覽也對元數(shù)據(jù)訪問性能提出了很高的要求。
高能化學(xué)數(shù)據(jù)以非結(jié)構(gòu)化數(shù)據(jù)為主。目前,常用的非結(jié)構(gòu)化數(shù)據(jù)儲存系統(tǒng)包括集群文件系統(tǒng)、應(yīng)用層儲存系統(tǒng)和分級儲存系統(tǒng)等。這兩者都采用了分布式儲存技術(shù),本身并沒有特別嚴(yán)格的分辨,只是關(guān)注的優(yōu)缺有所不同。
集群文件系統(tǒng)通常以傳統(tǒng)文件系統(tǒng)的方法來訪問,顧客端實現(xiàn)內(nèi)核模塊,完全兼容POSIX語義,因而下層的數(shù)據(jù)處理軟件無需任何更改即可使用海量的儲存空間,才能挺好地兼容原有應(yīng)用。常見的集群文件系統(tǒng)包括、、GPFS、等,其中全世界最快的超級計算機(jī)()中有70%以上都在使用系統(tǒng)。
應(yīng)用層儲存系統(tǒng)通常不實現(xiàn)文件系統(tǒng)內(nèi)核模塊,不完全兼容POSIX語義,針對特定的應(yīng)用場景進(jìn)行優(yōu)化,因而常常表現(xiàn)出更好的可擴(kuò)充性和性能,而且下層應(yīng)用程序必需要調(diào)用特定的應(yīng)用程序插口(API)能夠訪問。
分級儲存系統(tǒng)是指依照文件的訪問頻度、熱度等誘因,將不同的文件分配到不同的儲存設(shè)備上儲存。基于c盤-磁帶的分級儲存系統(tǒng)比較成熟,例如、等系統(tǒng)廣泛應(yīng)用于高能化學(xué)領(lǐng)域。當(dāng)前,基于固態(tài)硬碟(SSD)和并口機(jī)械硬碟(SATA)做分級儲存是研究熱點,如開源項目?和擴(kuò)充項目?等。
現(xiàn)有的分布式儲存系統(tǒng)還有微軟文件系統(tǒng)(,GFS)和分布式文件系統(tǒng)(File,HDFS)等,其中HDFS是一套開源軟件,在互聯(lián)網(wǎng)的大數(shù)據(jù)儲存中應(yīng)用尤為廣泛。科研大數(shù)據(jù)的儲存量常常達(dá)到PB級甚至更高,因而儲存的成本和性價比也是重要的考慮誘因。為了使用部份云估算資源以及解決數(shù)據(jù)的異地復(fù)制需求,高能化學(xué)估算領(lǐng)域也在考慮云儲存技術(shù)與估算框架的結(jié)合和性能優(yōu)化。
高能化學(xué)研究所(以下簡稱高能所)的估算環(huán)境中,儲存系統(tǒng)分為c盤文件系統(tǒng)和分級儲存系統(tǒng)兩個部份,如圖2所示。
圖2高能所的儲存系統(tǒng)構(gòu)架
數(shù)千個估算節(jié)點和近百個儲存服務(wù)器之間通過千兆以太網(wǎng)路聯(lián)接,儲存軟件為估算作業(yè)屏蔽了復(fù)雜的前端構(gòu)架,用戶可以像使用單機(jī)儲存設(shè)備一樣使用海量儲存空間。
兩側(cè)的c盤儲存系統(tǒng)包括50多臺數(shù)據(jù)服務(wù)器,100多臺c盤儲存陣列,才能提供約3PB儲存空間,40GB/s的峰值聚合帶寬。同時,估算中心開發(fā)了手動優(yōu)化、進(jìn)程快照、行為剖析、故障報案等附加功能,增強(qiáng)系統(tǒng)的自適應(yīng)性、可靠性和管理效率。
兩側(cè)的分級儲存系統(tǒng)用于儲存不頻繁訪問、需要常年保存的數(shù)據(jù),比如備份數(shù)據(jù),原始數(shù)學(xué)數(shù)據(jù)等。系統(tǒng)采用IBMTotal3584智能磁帶庫和LTO4磁帶,可儲存6000多盤磁帶,提供5PB以上的儲存空間。
目前,系統(tǒng)就能提供90MB/s單驅(qū)動器讀寫性能,2GB/s的聚合讀寫性能。
在實際應(yīng)用中,單個儲存設(shè)備很難滿足高能化學(xué)估算PB甚至EB級的儲存和數(shù)十GB/s乃至TB/s的吞吐率需求,高能化學(xué)數(shù)據(jù)儲存系統(tǒng)必須是分布式、多服務(wù)器、多設(shè)備的。在一個龐大的網(wǎng)路聯(lián)接的系統(tǒng)中,設(shè)備故障、網(wǎng)絡(luò)中斷和延時、服務(wù)器關(guān)機(jī)是常態(tài)。因而高能化學(xué)估算對儲存系統(tǒng)的可擴(kuò)充性、易用性、數(shù)據(jù)可靠性和高可用性提出了不小的挑戰(zhàn)。同時,考慮到儲存需求的遞增性和儲存設(shè)備的更新?lián)Q代,儲存資源總是逐漸擴(kuò)張的。儲存系統(tǒng)軟件還必須挺好地解決性能的可擴(kuò)充性以及數(shù)據(jù)的手動負(fù)載均衡問題。
高能化學(xué)實驗每天都會形成大量的實驗數(shù)據(jù),部份高能化學(xué)實驗本身具有跨地域建設(shè)特點,這種實驗數(shù)據(jù)須要傳輸?shù)竭h(yuǎn)程的數(shù)據(jù)和估算中心進(jìn)行離線剖析,怎么將這種數(shù)據(jù)實時、可靠、高效地傳輸?shù)竭h(yuǎn)程的數(shù)據(jù)和估算中心則是目前高能化學(xué)實驗中須要解決的一個重要問題。
目前高能化學(xué)數(shù)據(jù)傳輸系統(tǒng)大多數(shù)都基于支持并發(fā)傳輸?shù)墓ぞ撸ㄈ纭bftp等)來實現(xiàn),其基本框架如圖3所示,以惠州數(shù)據(jù)傳輸系統(tǒng)為例,現(xiàn)場的數(shù)據(jù)傳輸系統(tǒng)將在線數(shù)據(jù)獲取系統(tǒng)中的數(shù)據(jù)遠(yuǎn)程傳輸?shù)礁吣芩浪阒行模⒈4嬖诜植际讲⑿形募到y(tǒng)和數(shù)據(jù)備份系統(tǒng)中,之后再將數(shù)據(jù)分發(fā)到其他合作單位,便于全球的科學(xué)家進(jìn)行數(shù)據(jù)剖析和處理。
圖3數(shù)據(jù)傳輸系統(tǒng)布署構(gòu)架圖
為了保證數(shù)據(jù)傳輸?shù)目煽啃裕瑪?shù)據(jù)傳輸系統(tǒng)都具有傳輸過程管理和傳輸性能監(jiān)控的功能。數(shù)據(jù)傳輸系統(tǒng)提供圖形化的監(jiān)視模塊對數(shù)據(jù)傳輸量、傳輸效率和可靠性等參數(shù)進(jìn)行實時監(jiān)控和剖析,如圖4所示。
圖4數(shù)據(jù)文件傳輸過程療效監(jiān)控圖
為了保證數(shù)據(jù)交換的高效性,數(shù)據(jù)傳輸系統(tǒng)的性能也依賴于傳輸鏈路上的廣域網(wǎng)性能。目前,高能所已然和各合作組成員國之間構(gòu)建了良好的廣域網(wǎng)鏈路,是國際網(wǎng)路出口帶寬最大的研究機(jī)構(gòu),如圖5所示:惠州、羊八井、東莞采用專線將數(shù)據(jù)傳輸?shù)缴虾#瑤挒椋桓吣芩?jīng)過巴黎到歐洲共享帶寬為5Gbps,經(jīng)過北大學(xué)院到日本的共享帶寬為。
圖5高能所廣域網(wǎng)鏈路拓?fù)鋱D
高能化學(xué)數(shù)據(jù)交換與共享的需求,促使著信息技術(shù)的發(fā)展,高能所于1986年建成中國第一條國際計算機(jī)通信線路,并向美國發(fā)出中國第一封Email;1988年成為中國在國際互聯(lián)網(wǎng)上的第一個節(jié)點;1993年建成中國第一根國際互聯(lián)網(wǎng)專線;1994年構(gòu)建中國第一個WWW網(wǎng)站。近幾年來,高能所跟蹤網(wǎng)路技術(shù)和構(gòu)架的發(fā)展,將最新的網(wǎng)路技術(shù)(比如SDN技術(shù)、網(wǎng)絡(luò)性能檢測技術(shù)以及40G/100G以太網(wǎng)技術(shù)等)同高能化學(xué)應(yīng)用需求相結(jié)合,服務(wù)于高能化學(xué)數(shù)據(jù)共享,不斷提高數(shù)據(jù)交換和共享的效率。
03
數(shù)據(jù)密集型估算
高能化學(xué)實驗的估算與儲存需求量巨大,是典型的數(shù)據(jù)密集型估算,借助估算集群進(jìn)行數(shù)據(jù)處理是高能化學(xué)估算的主要手段。估算集群是指把一組計算機(jī)通過高速網(wǎng)路聯(lián)接在一起,構(gòu)成一個整體,提供用戶估算服務(wù)。一個估算集群一般由用戶交互結(jié)點、計算結(jié)點、存儲文件系統(tǒng)和資源管理作業(yè)調(diào)度服務(wù)構(gòu)成。為了保證集群強(qiáng)壯運行,集群通常還配備有軟件安裝布署服務(wù)、運行監(jiān)視服務(wù)和數(shù)據(jù)備份服務(wù)等。
高能化學(xué)估算是在大量化學(xué)例子中找尋很少量具有特定化學(xué)意義的例子,化學(xué)例子之間互相獨立,沒有相關(guān)性。通用的做法是將一批化學(xué)例子按專用的數(shù)據(jù)格式儲存于數(shù)據(jù)文件中;大量高能化學(xué)數(shù)據(jù)文件由集群文件系統(tǒng)統(tǒng)一管理,提供交互結(jié)點及估算結(jié)點的讀寫訪問。因為例子互相之間的無關(guān)性,多個不同文件可以分別被多臺估算節(jié)點同時處理,估算節(jié)點之間無需相互通信,因而不僅估算儲存設(shè)備的硬件性能以外,估算結(jié)點數(shù)目多少也會直接影響整體數(shù)據(jù)處理速率。
一個典型的高能化學(xué)估算集群構(gòu)架如圖6所示。通過高速、可靠的網(wǎng)路將交互結(jié)點,估算結(jié)點,儲存設(shè)備和管理服務(wù)器聯(lián)接上去。根據(jù)功能不同,每位組件的軟件及配置各不相同,其功能也互相獨立,但整體上協(xié)同工作,提供多用戶批作業(yè)估算服務(wù)。
圖6典型的高能化學(xué)估算集群
用戶在交互結(jié)點上設(shè)置各自的估算環(huán)境,編撰調(diào)試程序,進(jìn)行少量估算以確認(rèn)程序的正確性,再將程序包裝為作業(yè)后遞交給估算集群。集群作業(yè)中除了包含了需運行的程序,還有運行該程序所必需的軟硬件資源需求說明。資源管理與作業(yè)調(diào)度服務(wù)是估算集群最核心的組件,它依據(jù)集群中所有估算結(jié)點的當(dāng)前狀態(tài)和等待運行作業(yè)的實際需求,為作業(yè)分配一個最適宜的估算結(jié)點運行,此過程稱之為作業(yè)調(diào)度。一個估算集群同時為好多用戶提供估算服務(wù),不同用戶作業(yè)運行需求各不相同,資源管理與作業(yè)調(diào)度服務(wù)根據(jù)一定的調(diào)度策略實現(xiàn)作業(yè)調(diào)度。估算集群通常還需配備軟件安裝升級,運行監(jiān)控和數(shù)據(jù)備份等管理服務(wù)器。
有些高能化學(xué)集群用LSF、SGE等知名的商業(yè)軟件進(jìn)行作業(yè)管理,除此之外一些開源的批作業(yè)調(diào)度軟件因為免費易用,便捷靈活等特征在高能化學(xué)領(lǐng)域中也得到廣泛應(yīng)用,其中以Maui、、SLURM最為有名。
由最初的PBS批作業(yè)管理軟件發(fā)展而至,曾被大量用于在高能化學(xué)估算集群。用于估算資源和作業(yè)隊列管理;Maui實現(xiàn)作業(yè)調(diào)度,可以提供作業(yè)填土,用戶優(yōu)先級等多種調(diào)度算法。但近些年來此款開源軟件缺乏更新,用戶社區(qū)不夠活躍,對于大規(guī)模集群的作業(yè)調(diào)度性能不高,正在逐步淡出使用。
是由日本佛羅里達(dá)學(xué)院開發(fā)的一款驍龍量作業(yè)調(diào)度軟件,它精減了復(fù)雜的調(diào)度算法,追求高效的調(diào)度性能。提出了分類廣告板()機(jī)制,用于高效地匹配資源懇求者(作業(yè))與資源提供者(機(jī)器)之間需求。作業(yè)和估算節(jié)點遵守機(jī)制可以十分靈活地描述各自需求與擁有屬性,并由進(jìn)行匹配以實現(xiàn)作業(yè)調(diào)度。因為這些高效的調(diào)度機(jī)制十分適宜高能化學(xué)估算作業(yè)簡單大量的特征,被越來越多的高能化學(xué)集群所采用。
SLURM是近些年來特別活躍的一款開源軟件,世界最快的小型計算機(jī)海珠II也用其作為資源管理與調(diào)度軟件。它的高度可伸縮及容錯性的特征很適用小型估算集群作業(yè)調(diào)度。SLURM以一種排他或非排他的方法為作業(yè)分配使用估算節(jié)點(取決于資源的需求);提供框架結(jié)構(gòu)啟動、執(zhí)行和監(jiān)視作業(yè);通過管理一個待處理工作的隊列實現(xiàn)作業(yè)與資源管理。與相比,SLURM除了可以支持小型估算集群的作業(yè)管理,還對MPI這些CPU密集型估算作業(yè)有著良好的支持,因而被更多科學(xué)研究估算領(lǐng)域采用。
04
網(wǎng)格估算
隨著高能化學(xué)實驗大數(shù)據(jù)時代的將至,原先單一的數(shù)據(jù)中心早已遠(yuǎn)遠(yuǎn)不能滿足高能化學(xué)實驗的數(shù)據(jù)處理和剖析的估算和儲存需求,高能化學(xué)對估算環(huán)境提出更高的要求:強(qiáng)悍的估算能力和海量的數(shù)據(jù)儲存能力。
為了適應(yīng)這一須要,一種全新的估算技術(shù)——網(wǎng)格估算蘊育而生。互聯(lián)網(wǎng)為高能化學(xué)實驗實現(xiàn)了實驗數(shù)據(jù)的高速共享,WWW服務(wù)為高能化學(xué)學(xué)家實現(xiàn)了科研信息的充分共享,網(wǎng)格則是基于互聯(lián)網(wǎng)為高能化學(xué)實驗帶來了估算資源和儲存資源的全球共享。網(wǎng)格估算技術(shù)將分布在互聯(lián)網(wǎng)上的估算資源和儲存資源融合成一個整體,致使高能化學(xué)研究人員在世界上任何一個角落可以通過互聯(lián)網(wǎng)透明地使用分布在世界上各個地方的資源,所以我們可以將網(wǎng)格系統(tǒng)比喻成一個坐落全球范圍的超小型計算機(jī),如圖7所示。
圖7網(wǎng)格示意圖
一個完整的網(wǎng)格系統(tǒng)包括安全服務(wù)、網(wǎng)格基礎(chǔ)軟件和網(wǎng)格應(yīng)用軟件這三個部份組成。
安全服務(wù)如同網(wǎng)格的“衛(wèi)士”,負(fù)責(zé)對步入網(wǎng)格系統(tǒng)的用戶進(jìn)行身分確認(rèn)和訪問權(quán)限確定。因而安全服務(wù)包括身分認(rèn)證和權(quán)限管理兩部份,其中身分認(rèn)證是通過電子網(wǎng)格證書來實現(xiàn),用戶通過合法的證書簽發(fā)機(jī)構(gòu)(Certi?cate,CA)申請和獲得證書。坐落高能所的就是由國際網(wǎng)格信任聯(lián)盟IGTF認(rèn)證的中國最早的CA。網(wǎng)格用戶是通過虛擬組織(VO)進(jìn)行分組,每位實驗通過虛擬組織管理系統(tǒng)(VOMS)對本實驗用戶進(jìn)行管理。
網(wǎng)格基礎(chǔ)軟件也叫網(wǎng)格中間件(),是網(wǎng)格的核心部件,它建造了網(wǎng)格的“基礎(chǔ)設(shè)施”,正是它實現(xiàn)了估算和儲存資源的互聯(lián),并為網(wǎng)格用戶提供了使用網(wǎng)格的基本服務(wù),包括資源信息管理、作業(yè)管理、數(shù)據(jù)管理、監(jiān)控統(tǒng)計等。每位加入網(wǎng)格系統(tǒng)的資源都須要安裝網(wǎng)格中間件以保證資源被列入統(tǒng)一管理和調(diào)度。得到授權(quán)的網(wǎng)格用戶通過資源信息管理服務(wù)可以查詢到可用的資源,通過作業(yè)管理服務(wù)可以進(jìn)行作業(yè)的遞交、查詢和拿回結(jié)果,通過數(shù)據(jù)管理服務(wù)可以進(jìn)行數(shù)據(jù)儲存、查詢和獲取,通過監(jiān)控統(tǒng)計服務(wù)獲取資源的狀態(tài)以及使用信息。也就是說,用戶可以通過統(tǒng)一的插口和服務(wù),無縫地使用到網(wǎng)格的估算和儲存資源。現(xiàn)今常用的網(wǎng)格中間件有、gLite、OSG、GOS等幾種。
網(wǎng)格應(yīng)用軟件則是基于網(wǎng)格中間件面向特定應(yīng)用和便捷化學(xué)用戶進(jìn)行開發(fā)的軟件,典型的包括大規(guī)模作業(yè)遞交、實驗數(shù)據(jù)集管理、實驗作業(yè)監(jiān)控和統(tǒng)計,它為最終的化學(xué)用戶提供直接和專門的“服務(wù)設(shè)施”。整個網(wǎng)格系統(tǒng)的層次結(jié)構(gòu)如圖8所示。
圖8網(wǎng)格系統(tǒng)示意圖
國際上應(yīng)用最廣的高能化學(xué)網(wǎng)格平臺有歐共體的EGEE(GridsforE-)、美國的OSG(OpenGrid)等。中國國家網(wǎng)格()是中國為科學(xué)實驗用戶提供的小型網(wǎng)格估算和應(yīng)用平臺。亞洲粒子化學(xué)中心(CERN)是最大也是最為成功的網(wǎng)格用戶,基于小型強(qiáng)子對撞機(jī)LHC實驗建設(shè)的WLCG(LHCGrid)網(wǎng)格應(yīng)用系統(tǒng),包含了42個國家的170個數(shù)據(jù)中心的資源,每年處理和分享30PB的數(shù)據(jù),使用了包括EGEE和OSG在內(nèi)的多個網(wǎng)格平臺,坐落高能所的上海站點也是其中的一部份。WLCG為重大數(shù)學(xué)成果——Higgs粒子的最終發(fā)覺做出了巨大的貢獻(xiàn)。
05
云估算
云估算是一種新興的共享基礎(chǔ)構(gòu)架的方式,近幾年在產(chǎn)業(yè)界和學(xué)術(shù)界造成了廣泛的關(guān)注。云估算是一種以服務(wù)為特點的估算模式,它通過對所有資源進(jìn)行整合、抽象后以新的業(yè)務(wù)模式提供高性能、低成本的持續(xù)估算、存儲及各類軟件服務(wù),支撐各種信息化應(yīng)用。云估算具有資源池化、彈性可伸縮、按需自助服務(wù)、服務(wù)可計量等特點,同時具有靈活性、可靠性、可擴(kuò)充性、數(shù)據(jù)集中儲存、部署周期短、成本低等優(yōu)勢。
高能化學(xué)仍然是估算技術(shù)強(qiáng)有力的推進(jìn)者,在國際互聯(lián)網(wǎng)、WWW技術(shù)、網(wǎng)格估算的發(fā)展中都做出了積極的貢獻(xiàn)。在云估算時代,高能化學(xué)一直有著強(qiáng)烈的需求。亞洲核子中心CERN啟動了虛擬機(jī)項目,并在此基礎(chǔ)上發(fā)起LHC云估算項目,為小型強(qiáng)子對撞機(jī)LHC提供虛擬化的應(yīng)用環(huán)境。CERN還啟動了項目,支持批處理估算服務(wù),以提升資源借助率并簡化管理。目前CERN使用管理了12萬顆CPU核和1.5萬個虛擬機(jī)。日本DESY、美國等大部份國際高能化學(xué)實驗室都在使用云估算技術(shù)。下邊簡單介紹兩個典型的高能化學(xué)云估算項目:和虛擬集群。
年,法國核子中心CERN啟動了項目,用于解決小型強(qiáng)子對撞機(jī)(LHC)化學(xué)估算中的虛擬機(jī)管理問題。的基本思想是將操作系統(tǒng)與應(yīng)用程序打包,弄成輕量級的虛擬機(jī)映像文件,因而實現(xiàn)在全球網(wǎng)格系統(tǒng)上的調(diào)度或是用戶桌面級的數(shù)據(jù)剖析。并不是將所有的應(yīng)用程序與依賴庫文件都打包在一起(一般是10GB量級),而是初始放入大約100MB左右的“瘦應(yīng)用”,與應(yīng)用相關(guān)的程序以及數(shù)據(jù)通過CVMFS(文件系統(tǒng))從遠(yuǎn)程軟件庫房按需下載、更新和緩存,一般情況下一個應(yīng)用保持在1GB以下。圖9是的示意圖。
圖9示意圖
除了解決了虛擬機(jī)映像文件規(guī)格與更新的問題,但是最大程度的保持了用戶的使用習(xí)慣。支持、、Xen、KVM等大部份主流虛擬機(jī),可以運行在、Linux或則MacOS等操作系統(tǒng)上。
虛擬集群隨著估算系統(tǒng)規(guī)模的不斷擴(kuò)大,操作系統(tǒng)與應(yīng)用軟件的不斷升級,CPU等硬件性能的持續(xù)提高,傳統(tǒng)的集群或則網(wǎng)格估算模式面臨著資源借助率不高、應(yīng)用遷移復(fù)雜、多應(yīng)用支持困難等問題。因此,高能所啟動了虛擬集群項目。虛擬集群的系統(tǒng)構(gòu)架如圖10所示。
圖10虛擬集群示意圖
底層是基于的私有云。是一個開源的云估算管理平臺,它能管理一組化學(xué)機(jī)節(jié)點上運行的虛擬機(jī)構(gòu)成的資源池。這種虛擬機(jī)可以從不同的鏡像啟動。不同的鏡像里有不同的操作系統(tǒng)或應(yīng)用軟件配置。用戶可以按照須要選擇合適的鏡像來啟動虛擬機(jī)。
中間層是虛擬資源調(diào)度器,它依據(jù)任務(wù)隊列情況和調(diào)度策略物理虛擬實驗室免費,彈性啟動或則中止虛擬的估算節(jié)點(上的虛擬機(jī))。當(dāng)有新作業(yè)時,選擇合適的鏡像啟動虛擬機(jī);當(dāng)作業(yè)完成后,關(guān)掉虛擬機(jī),釋放資源。
最下層是虛擬集群隊列,它將底層的云估算封裝成用戶熟悉的批處理隊列界面,致使整個系統(tǒng)對用戶以及基于WLCG的網(wǎng)格應(yīng)用都是透明的。在用戶看來,一直是傳統(tǒng)集群的使用方式,何必改變原先的使用方法。系統(tǒng)也可以支持WLCG網(wǎng)格估算等傳統(tǒng)的高能化學(xué)估算模式。
06
結(jié)束語
高能化學(xué)實驗的離線估算效率直接決定了高能化學(xué)實驗化學(xué)結(jié)果的產(chǎn)出速率和科學(xué)發(fā)覺的進(jìn)程,而先進(jìn)的計算機(jī)技術(shù)無疑是離線估算的“推進(jìn)器”。本文介紹了高能化學(xué)實驗從數(shù)據(jù)采集、存儲、傳輸、處理和剖析、最終獲得化學(xué)結(jié)果的整個過程,以及前沿計算機(jī)技術(shù)在高能化學(xué)實驗數(shù)據(jù)的生命周期中所起的重要作用。高能化學(xué)實驗的離線估算具有數(shù)據(jù)量和吞吐量大的突出特征,先進(jìn)的儲存、網(wǎng)絡(luò)和集群技術(shù)早已成為離線估算不可或缺的基本保障。
我們可以看見,PB級的并行文件系統(tǒng)技術(shù)早已成為海量高能化學(xué)實驗數(shù)據(jù)儲存和獲取的必要手段,高速的千兆網(wǎng)路更是在聯(lián)接估算資源和數(shù)據(jù)資源、實現(xiàn)數(shù)據(jù)在全球高能化學(xué)實驗參與單位中共享的不可缺乏的基礎(chǔ)設(shè)施,集群技術(shù)將松散的估算資源集成獲得的強(qiáng)悍的估算能力是高能化學(xué)實驗數(shù)據(jù)處理與剖析的必要保障。
另一方面,高能化學(xué)實驗也不斷推進(jìn)著估算技術(shù)的創(chuàng)新和發(fā)展。二六年多前,高能化學(xué)實驗的需求造就了WWW服務(wù)的誕生。明天隨著高能化學(xué)實驗的規(guī)模不斷擴(kuò)大物理虛擬實驗室免費,數(shù)據(jù)量飛速膨脹,對估算技術(shù)也提出了新的、更高的需求。現(xiàn)代的高能化學(xué)實驗數(shù)據(jù)早已邁入EB量級的時代,儲存和網(wǎng)路技術(shù)也因而須要向更快和更靈活的方向發(fā)展,出現(xiàn)了EB級儲存技術(shù)、分布式儲存、百萬兆網(wǎng)路通訊、網(wǎng)絡(luò)虛擬化技術(shù)SDN等。
同時,單一的集群技術(shù)早已不能滿足所有的估算需求,網(wǎng)格估算是又一個繼WWW服務(wù)以后的技術(shù)改革,它促使布滿于全球的高能化學(xué)實驗資源整合成一個“超級計算機(jī)”來共同完成同一個數(shù)據(jù)處理與剖析任務(wù)成為可能。網(wǎng)格估算技術(shù)的出現(xiàn)和WLCG的建成和廣泛使用直接促使了Higgs粒子的發(fā)覺,在高能化學(xué)史上記下了重要的一筆。
近些年來,繼網(wǎng)格估算以后,虛擬化技術(shù)和云估算技術(shù)的快速發(fā)展,正在為高能化學(xué)實驗的科學(xué)估算輸送更加大勁的估算能力。
因而,綜觀高能化學(xué)實驗的發(fā)展歷史,可以看出未來的高能化學(xué)實驗仍需與先進(jìn)估算技術(shù)緊密結(jié)合、互相推動,最終能夠保證高能化學(xué)領(lǐng)域的長遠(yuǎn)發(fā)展。
來源:《現(xiàn)代化學(xué)知識》第28卷第3期,原文題為“高能化學(xué)實驗的離線估算”