中科曙光在其舉辦的“2016中科曙光技術創(chuàng)新大會(IDIC2016)”上宣布,由其牽頭的E級高性能計算機(簡稱“E級超算”)原型系統(tǒng)項目正式發(fā)布。
(E級超算原型機研發(fā)項目啟動)
中國三大超算軍團 發(fā)力搶占E級高地
作為體現(xiàn)一個國家綜合國力和科技創(chuàng)新能力的重要標志,各國在超算領域的競爭日趨激烈。尤其是在“太湖之光”把最快計算機的持續(xù)計算速度刷新到93PFlops之后,E級超算已成為當前各國競相角逐的戰(zhàn)略制高點。
目前,美國、歐洲、日本等國家和地區(qū)都提出了自己的E級超算研發(fā)計劃。中國也將百億億次超級計算機及相關技術的研究寫入了國家“十三五”規(guī)劃,希望在2020年左右實現(xiàn)這一宏偉研究計劃。在國家“十三五”高性能計算專項課題中,中科曙光、國防科技大學以及江南計算技術研究所同時獲批牽頭E級超算的原型系統(tǒng)研制項目,形成了中國E級超算“三頭并進”的局面。
E級超算“原型系統(tǒng)研制”是在E級超算項目正式進入日程之前的預研工作。中科院計算所研究員、中國計算機學會高性能計算專委會秘書長張云泉表示,原型系統(tǒng)的研制可以驗證一些關鍵的技術設想,對一些關鍵技術難點進行測試和改進,為最后建造全部的系統(tǒng)掃清障礙,避免出現(xiàn)大的技術錯誤和難題,類似的預研項目“非常必要”。
對于E級超算系統(tǒng)的建設,國際上對運算速度、能耗比等都有其公認的標準。那么,國產(chǎn)E級超算可采取何種架構、何種技術路線?能否實現(xiàn)10萬節(jié)點規(guī)模的擴展能力?能效比能否有所突破?歷軍表示,基于原型機的研制與測試,類似上述疑問的謎底將一一被揭開。
專注技術深耕 曙光開通“E級路線”
曙光副總裁沙超群在其“E級挑戰(zhàn)‘億’觸即發(fā)”的大會報告中對中科曙光E級超算原型系統(tǒng)項目的規(guī)劃和研究路線進行了詳細的解讀。他在大會上報告了曙光預研項目的任務目標:完成E級原型機系統(tǒng),驗證E級機研制的關鍵技術和路線圖,形成E級機的完整方案,為國產(chǎn)E級超算的研制奠定技術基礎。
按照這一目標,曙光將憑借深耕高性能計算20余年的豐富經(jīng)驗,在體系結構、計算、存儲、網(wǎng)絡、系統(tǒng)軟件、系統(tǒng)冷卻和可靠性等方面對未來E級超算的建設進行有益探索。
在體系結構方面,曙光提出一種超融合自適應并行處理體系結構(HCAPP),。“節(jié)點內(nèi)異構架構仍是未來頂級超算的主流。”沙超群說。同時,“先進的6D-Torus高維網(wǎng)絡架構和層次化網(wǎng)絡系統(tǒng),使系統(tǒng)具有10萬節(jié)點的擴展能力,可以穩(wěn)定擴展至E級規(guī)模”。
原型系統(tǒng)采用的存儲系統(tǒng),則是基于曙光承擔的863課題“曙光EB級云存儲系統(tǒng)研制”的研究成果。沙超群指出,層次多協(xié)議的高性能存儲系統(tǒng)具有超強的EB級擴展性和支持千億級文件的存儲能力。
在節(jié)能方面,曙光擬采用目前最高效、最先進的服務器冷卻技術——全浸沒式相變液冷技術。沙超群介紹說,絕緣冷媒的相變潛熱是比熱的一百倍,換熱效率高、安全性好,冷媒與發(fā)熱器件直接接觸,能一次性解決全部元件的散熱問題,同時能大幅提升系統(tǒng)的可靠性。
超算E勢力 助推全球發(fā)展
此外,曙光E級高性能計算系統(tǒng)原型機,在完成E級系統(tǒng)關鍵技術驗證的同時,具有良好的生態(tài)環(huán)境和廣泛應用適用性。沙超群稱,原型系統(tǒng)可以良好的支撐高性能計算、深度學習、大數(shù)據(jù)、云計算等領域應用,加快技術成果產(chǎn)業(yè)化應用,對我國高性能計算產(chǎn)業(yè)的發(fā)展有重大支撐作用。
“隨著科技的飛速發(fā)展,知識和技術創(chuàng)新成為經(jīng)濟、社會發(fā)展的主要驅(qū)動力。”沙超群指出“曙光原型機作為工業(yè)標準的高性能計算系統(tǒng),不僅可以為國家科技創(chuàng)新和產(chǎn)業(yè)轉(zhuǎn)型升級提供基礎設施保障,還將促進中國高性能計算產(chǎn)業(yè)成果走向世界,推動全球基礎科學研究、工業(yè)轉(zhuǎn)型升級、數(shù)字化行業(yè)發(fā)展等,為全人類進步做出貢獻。”