本次MLPerf? 評測吸引了包括NVIDIA、浪潮信息、Intel、高通、阿里巴巴、戴爾、壁仞等全球21家廠商和研究機構參與,共提交超10000項評測成績。

在本次倍受矚目的數(shù)據(jù)中心BERT評測任務中,浪潮AI服務器突破性地全球首次實現(xiàn)單機搭載24顆國際通用GPU,通過深入優(yōu)化GPU輪詢調(diào)度策略,充分發(fā)揮每塊GPU性能,大幅提升了BERT推理性能,最終實現(xiàn)每秒鐘回答7.5萬個問答任務,相較于上次評測最佳成績提升達93.81%,這也是浪潮AI服務器第4次獲得MLPerf?推理BERT任務性能冠軍。

同時引人注目的是,在本次MLPerf評測中,浪潮AI服務器成功搭載國產(chǎn)GPU芯片廠商壁仞科技自研的高端通用GPU,在BERT和ResNet50兩項重要任務中取得了8卡和4卡整機的全球最佳性能,實現(xiàn)了國產(chǎn)芯片在國際AI賽場上的精彩亮相,并取得歷史性突破。

自MLPerf?發(fā)起至今,浪潮信息持續(xù)積極推動AI基準評測發(fā)展創(chuàng)新,先后10次參與評測,多次獲得冠軍總數(shù)第一。浪潮信息在AI服務器的整機系統(tǒng)優(yōu)化、軟硬件協(xié)同優(yōu)化等多方面持續(xù)創(chuàng)新,不斷打破性能記錄,并將領先技術分享到MLCommons社區(qū),被大量參賽廠商采用并廣泛應用于后續(xù)評測中。

在算法優(yōu)化層面,浪潮首先在MLPerf訓練中應用超參優(yōu)化方案,大幅提高訓練性能。浪潮開創(chuàng)性提出ResNet 收斂性優(yōu)化方案,在ImageNet數(shù)據(jù)集上,僅使用85%的原迭代步數(shù)就達到了目標精度,將MLPerf訓練性能記錄提升了15%;率先在MLPerf推理中使用自研卷積合并算法的plugin算子方案,優(yōu)化后算法性能從原算法123TOPS提升到141TOPS,性能提升達14.6%。

在架構優(yōu)化方面,浪潮率先采用JBOG方案,極大提升了AI服務器搭載超多數(shù)量GPU設備的能力。本次評測中,浪潮NF5468M6J產(chǎn)品突破性地實現(xiàn)了單機搭載24顆GPU。同時,浪潮針對高負載多GPU協(xié)同任務調(diào)度以及NUMA節(jié)點與GPU之間的數(shù)據(jù)傳輸性能進行了深度優(yōu)化,實現(xiàn)了CPU和GPU的利用率線性擴展、多個任務并發(fā)場景同步運行,大幅提升性能。

浪潮信息是全球領先的AI計算廠商,AI服務器市場份額全球第一,連續(xù)五年中國市場份額超過50%。浪潮信息致力于AI計算平臺、資源平臺和算法平臺的全棧創(chuàng)新,并通過元腦生態(tài)攜手領先伙伴共同加速AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化進程。

MLPerf??

MLPerf? 是影響力最廣的國際AI性能基準評測,由圖靈獎得主大衛(wèi)?帕特森(David Patterson)聯(lián)合頂尖學術機構發(fā)起成立。2020年,非盈利性機器學習開放組織MLCommons基于MLPerf? 基準測試成立,其成員包括Google、Facebook、NVIDIA、英特爾、浪潮信息、哈佛大學、斯坦福大學、加州大學伯克利分校等50余家全球AI領軍企業(yè)及頂尖學術機構,致力于推進機器學習和人工智能標準及衡量指標。目前,MLCommons每年組織2次MLPerf? AI訓練性能測試和2次MLPerf? AI推理性能測試,以便快速跟進迅速變化的計算需求和計算性能提升,為用戶衡量設備性能提供權威有效的數(shù)據(jù)指導。

分享到

xiesc

相關推薦