本文作者:Jeff McVeigh英特爾副總裁兼超級計算事業(yè)部總經(jīng)理

隨著我們進入 E 級(Exascale)計算時代并邁向 Z 級(Zettascale)計算時代,科技行業(yè)也越來越影響著全球的碳排放。據(jù)估計,到 2030 年數(shù)據(jù)中心的能耗估計將達到全球能源產(chǎn)量的 3%-7%1,而計算基礎設施將成為新增用電量的主要驅動因素。

今年,英特爾承諾到 2040 年實現(xiàn)全球業(yè)務的溫室氣體凈零排放,并開發(fā)更加可持續(xù)的技術解決方案。在創(chuàng)造可持續(xù)未來的同時滿足對計算永無止境的需求,這是高性能計算(HPC)面臨的最大挑戰(zhàn)之一。這個任務雖然艱巨,但如果我們能夠把芯片、軟件和系統(tǒng)這些 HPC計算堆棧的每個部分都做好,它就是可以實現(xiàn)的。

我在德國漢堡舉行的 2022 國際超算大會(ISC 2022)上發(fā)表了主題演講,上述內容就是我在演講中傳達的核心信息。

從芯片和異構計算架構開始

英特爾公布了直到 2024 年的高性能計算產(chǎn)品路線圖,期間我們將致力于提供多樣化的異構架構。這些架構不僅將使我們能夠實現(xiàn)幾個數(shù)量級的性能提升,同時亦可降低通用工作負載及諸如人工智能、加密、分析等新興工作負載的能耗。

以內置高帶寬內存(HBM),代號為 Sapphire Rapids的英特爾? 至強? 處理器為例,該款處理器能夠很好地展示我們如何利用先進的封裝技術和芯片創(chuàng)新,為高性能計算帶來性能、帶寬和節(jié)能方面的顯著提升。通過封裝高達 64 GB 的高帶寬內存 HBM2e 并把加速器集成到 CPU 中,我們能夠釋放內存敏感型工作負載的潛力,為這些關鍵的高性能計算應用場景大幅提升性能。在對比第三代英特爾? 至強? 可擴展處理器和即將推出的內置高帶寬內存(HBM)的 Sapphire Rapids 處理器時,我們發(fā)現(xiàn),后者把氣候研究、能源、制造和物理學工作負載的性能提升了 2-3倍2。在主題演講中,Ansys 首席技術官 Prith Banerjee還展示了內置高帶寬內存的 Sapphire Rapids 為 Ansys Fluent 和 ParSeNet 的實際工作負載帶來了高達 2 倍的性能提升3。

為實現(xiàn)跨 HPC 和 AI 超算工作負載的幾個數(shù)量級的性能提升,計算密度是另一必不可少的要素。代號為 Ponte Vecchio 的英特爾首個旗艦級數(shù)據(jù)中心圖形處理器(GPU),已經(jīng)在復雜的金融服務應用以及 AI 推理和訓練工作負載方面展現(xiàn)出了卓越的優(yōu)勢。

創(chuàng)新不止于此。今天,我們還宣布這款出色數(shù)據(jù)中心 GPU 的下一代產(chǎn)品代號為Rialto Bridge。通過升級 Ponte Vecchio 架構,并結合使用下一代制程節(jié)點技術制造的增強型芯片子模塊,Rialto Bridge 將大幅提高計算密度、性能和效率,同時提供軟件一致性。

展望未來,F(xiàn)alcon Shores 是我們路線圖中下一個重要的架構創(chuàng)新,即把 x86 CPU 和 Xe GPU 集成在同一插槽中。這一架構計劃將在 2024 年推出,它將在每瓦性能、計算密度、內存容量與帶寬方面均實現(xiàn)超過 5 倍的性能提升4

成功的軟件戰(zhàn)略遵循三個原則:開放、選擇、信任

如果沒有軟件為芯片注入活力,它將僅僅只是砂礫。英特爾的軟件策略是促進整個堆棧的開放式發(fā)展,并提供工具、平臺和軟件 IP,以幫助開發(fā)者提升工作效率,產(chǎn)出可擴展、更高性能、更高效的代碼,這些代碼能充分利用最新的芯片創(chuàng)新,沒有重構代碼的負擔。oneAPI行業(yè)計劃為 HPC 開發(fā)者提供了跨架構編程,使代碼能透明、可遷移地適用于 CPU、GPU 和其他專用加速器。

目前,在世界各地領先的科研和學術機構中已有 20 多個 oneAPI 卓越中心(CoE),它們正取得重要的進展。例如,布里斯托大學科學系的 Simon McIntosh-Smith 和他的團隊,正在使用 oneAPI 和 Khronos Group 的 SYCL 抽象層進行跨架構編程,為在 E 級計算規(guī)模上實現(xiàn)性能可移植性開發(fā)最佳實踐。他們的工作將確??茖W代碼能在大規(guī)模異構超算系統(tǒng)上實現(xiàn)高性能。

聚力整合:實現(xiàn)可持續(xù)的異構計算

隨著數(shù)據(jù)中心和 HPC 工作負載越來越多采用分布式架構和異構計算,我們需要借助工具來幫助有效管理和應對復雜多樣的計算環(huán)境。

今天,我們將推出一款開源解決方案 Intel? XPU Manager,它可以在本地或遠程監(jiān)測和管理英特爾數(shù)據(jù)中心 GPU。該解決方案旨在簡化管理,并通過綜合診斷更好地實現(xiàn)可靠性和延長設備運行時間,以及提升利用率并支持固件更新。

針對能耗很高的數(shù)據(jù)傳輸和存儲任務,分布式異步對象存儲(DAOS)文件系統(tǒng)提供了系統(tǒng)級的優(yōu)化。DAOS 可以顯著地改善文件系統(tǒng)的性能,它不僅可以縮短整體訪問時間,而且能夠降低存儲所需的容量,從而減少數(shù)據(jù)中心的占用空間并提高能源效率。相比于 Lustre 在 I/O 500 中的測試結果,DAOS 實現(xiàn)了直接寫入文件系統(tǒng)性能 70 倍5的提升。

應對HPC的可持續(xù)性挑戰(zhàn)

我們很榮幸能夠與全球志同道合的客戶和行業(yè)領先的科研機構合作,朝著實現(xiàn)更具可持續(xù)性和開放性的高性能計算而努力。我們近期取得了一系列成果——我們與巴塞羅那超算中心合作建立了開創(chuàng)性的 RISC-V Z 級計算實驗室;并與劍橋大學和戴爾繼續(xù)合作,將當前的 E 級計算實驗室進一步打造成為新的劍橋 Z 級計算實驗室。

獨木難支,完整生態(tài)的構建需要在制造、芯片、互連、軟件和系統(tǒng)等各方面攜手共進。通過與整個生態(tài)的協(xié)作,我們致力于將本世紀最大的 HPC 挑戰(zhàn)轉化為前所未有的機遇,創(chuàng)造改變世界的技術,讓未來更美好。

分享到

songjy

相關推薦