NVIDIA百億億次超級計算芯片更深入細節(jié)

每顆Echelon芯片可以視為一個節(jié)點,進而四顆組成一個模塊,然后32個模塊再加上路由模塊就組成一個機柜,合計性能高達 2.56PFlops(每秒千萬億次運算),內存容量32TB、帶寬205TB/s。更進一步,這種機柜還可以繼續(xù)多個并聯,浮點性能自然也是繼續(xù)直線上升。

NVIDIA同時表示,為了降低如此超大規(guī)模芯片的功耗,流處理器必須以不到10皮焦的耗電量處理一次雙精度浮點操作,相當于費米架構的二十分之一,同時每個流處理器必須在單個時鐘周期內完成四次浮點操作。

更進一步地,NVIDIA計劃在芯片內集成1024個可配置的256KB SRAM Bank。如此大容量的片上內存能夠盡可能地將數據保留在芯片內部,距離處理單元也盡可能的近,從而避免非常耗電的拾取操作。這些SRAM Bank既可以配置為通用內存池,也可以作為專用緩存。

NVIDIA百億億次超級計算芯片更深入細節(jié)

Echelon現在還只是NVIDIA遠景規(guī)劃圖上的一個設想,實現起來還有太多難題要解決,不止有硬件設計上的麻煩,還需要自我感應操作系統、自我感應運行時、位置感應編譯器和調試器的軟性配合。

有趣的是,美國國防部DARPA也同樣找上了Intel,希望其能夠從傳統CPU的角度出發(fā),同樣實現百億億次高性能計算。 Intel的計劃是利用其正在研發(fā)的超多核心(MIC)架構,而且已經有了測試樣品,甚至會在今年內推出相應的商用產品,似乎更快一步。

很顯然,這是CPU、GPU之間的一場終極對決。

分享到

zhabin

相關推薦