中國超算探索“雲端”共享模式 加速應用落地

今年的SC20大會上傳來好消息,超算行業頂級獎項戈登貝爾獎頒發給了深度勢能(DP)團隊,以獎勵他們在分子與材料模擬領域做出的貢獻。

所謂“工欲善其事必先利其器”,要想獲得出色的應用測試成績,必須先有領先的計算平臺。伴隨着神威太湖之光的出現,中國人已經連續獲得了2016和2017兩屆戈登貝爾獎。

除了神威・太湖之光和天河二號A之外,中國排名第三的超算平臺北京超級雲計算中心A分區,賽前也被用來進行相關的計算任務。據悉,深度勢能(DP)團隊計劃將核心軟件部署在這套系統中,並通過同樣部署在平臺上的軟件系統實現對於CPU/GPU資源的調取,加速計算提升效率。這種“雲化”的方式可以幫助項目團隊大大節省系統採購、搭建和運維的成本,實現了按需支付、按量付費,讓隊員將更多時間和精力投入於科研本身。

這個用於提供“算力池”的平臺有多強計算力呢?據最新公佈的中國高性能計算機TOP100榜單介紹,北京超級雲計算中心A分區的Linpack測試性能達到了3.74PFlops,成爲HPC TOP100榜單第三名。相比前兩家國字頭的超算中心,成立於2011年的北京超級雲計算中心一直走的都是市場化路線,通過“雲化”的超級雲計算服務模式佈局通用超算市場,着力服務於對算力不同需求的科研用戶

其實,“雲化”的超級雲計算服務模式並不是一個新概念,早在公有云開始普及的時代,就有先行者進行超算“雲化”的研究。在許多人印象中,“雲”爲計算帶來的更多是便捷性而不是性能優勢,或者說彈性可擴展才是“雲”的核心,而對於性能和穩定性要求極高的超算似乎並不適合“雲化”。

但現實卻給持有這些觀點的人“上了一課”,這次戈登貝爾獎就是最好的證明。有人說:那麼多大型的超算中心,難道還不能保障算力嗎?事實上,雖然國內有多家超算中心可供選擇,但許多時候這些超算中心承載的都是國家級關鍵科研項目,正因爲“尖端”的定位,使得這些超算中心自然優先爲這些項目提供充足的算力保障,而對於中小超算用戶來說,一旦遇到這樣的情況就好比“交通管制”一樣,對於正在進行的業務也會造成無可估量的影響。

因此,許多用戶將目光聚焦到北京超級雲計算中心的身上。作爲專業的超算雲化服務平臺,北京超級雲計算中心可以提供相對充足的算力給客戶,滿足廣大中小微企業的需求,並且在服務上有專業人員進行系統維護與程序調優,保障每一項作業都運行在優化狀態;而在價格上,北京超級雲計算中心也重點突出性價比優勢,用戶通過租賃來完成業務部署,可以從複雜的自建與運維中解脫出來,更專注於科研本身。

如何滿足超算用戶“更多計算資源、更快計算速度、更好用戶服務體驗”的需求?北京超級雲計算中心相關負責人介紹,中心將原有的計算、存儲、網絡設備實現了硬件解耦,構成了一個個資源池。用戶在租賃資源的時候絲毫不需要考慮選擇怎樣的設備或者怎樣的平臺,只要確定自己所需的資源數量,平臺就會從資源池中劃分對應的份額,改變了以往超算中心資源排隊的情況。

除了計算層面的硬件優勢之外,豐富的解決方案也是“超級雲計算”的特色之一。能源行業領跑者金風科技正是看中了該中心提供的行業化專屬資源支持方案。針對能源行業的算力需求特性,北京超級雲計算中心提供了獨佔、包核時等多種使用方式,同時在高峰期還提供了彈性擴展能力。

如今,北京超級雲計算中心按“隨需供應、動態擴容”劃分爲多個分區,其中包括了A分區、T分區、M分區、IO分區以及科技雲9分區、12分區、15分區、17分區、19分區等等不同的分區,滿足各種層級客戶的需求。

超算是一個完整的生態,從超算中心到上層應用,從計算、存儲、網絡到服務、運維、管理,這背後的每個環節都需要大量的投入,包括超算人才的培養也不是一朝一夕能實現的。該負責人表示,北京超級雲計算中心所代表的僅僅是如何“用好”超算的環節之一,業界還需要付出更多的努力,推動中國從超算大國到超算強國轉型,向着百億億次的目標堅定邁進。