在本次大會上,國防科技大學楊學軍院士作了《E級計算的挑戰(zhàn)與思考》的報道,介紹了E級計算是超級計算領域的下一個目標,楊學軍教授談到,高性能計算機的計算速度每十年提高一千倍,大規(guī)模應用也表現(xiàn)出超高的E級計算機能力需求。
楊學軍院士
楊學軍院士認為E級計算的挑戰(zhàn)正面臨五個挑戰(zhàn).
訪問墻:問題仍然是提升計算速度的第一大難題,處理器的處理速度和訪問速度之間的不匹配,處理器單個引腳的信號傳輸速度和引腳受限。多核處理器的出現(xiàn)只是提高了計算速度,不但沒有緩解訪問問題,反而使其變得更加嚴重。
通信墻:超級計算的規(guī)模不斷增加,互聯(lián)網絡對計算性能的影響越來越大,E級計算對互聯(lián)網絡提出了更高的要求,互聯(lián)網絡已成為制約超級計算機發(fā)展的核心因素之一。
可靠性:當性能性能由P級向E級擴展時,保存全局檢查點的時候可能達到甚至超過系統(tǒng)的MTBF!
能耗墻:ITRS估計高性能CPU的功耗將達到120~200W。世界排名第一Blue Gence的能耗達到7.8MW,如此發(fā)展下去E級系統(tǒng)功耗將達3.5GW,超過三峽水電站2008年平均供電能力的3分之1。
上述四堵墻,嚴重制約并行計算的可擴展性,并行計算機課擴展性度量模型指導著計算機的發(fā)展。解決計算機的并行可擴展性的難點在于要素的量綱不統(tǒng)一,事件離散,應用千變萬化,系統(tǒng)、技術的千差萬別。
要素的量綱不統(tǒng)一,歸約到時間量綱,通過“容錯開銷”的度量,將可靠性問題的描述統(tǒng)一至時間量綱,進而將可靠性引入加速比公式,對可靠性墻進行量化研究?,F(xiàn)有容錯方法都會引起可靠性墻,必須研究故障影響系統(tǒng)的規(guī)律,探索新的方法。
楊學軍院士表示,通用處理器+專用處理器是異構體系結構的一種解決方案。給予流處理的異構并行體系結構,大規(guī)??茖W工程應用的可流化理論,大規(guī)模科學工程應用的高效流化方法。在可流化路理論和高效流化方法的基礎上提出了CPU和流處理器相結合的異構融合并行體系結構。
硬件技術的發(fā)展在緩解通信墻、可靠墻、和功耗墻的同時,加劇了編程墻。楊學軍院士談到,提升抽象層次沒實現(xiàn)面向領域的問題求解框架,實現(xiàn)跨領域協(xié)作,零編程或少編程,解決編程墻問題和底層框架優(yōu)化技術緩解訪問墻、通信墻問題。