▲HPC China 2011專題

北京并行科技有限公司(Paratera)CTO陳健作了《從Linpack年代到真實(shí)應(yīng)用性能年代》的報(bào)告。

陳健談到,雖然人們一提及高性能計(jì)算機(jī)時(shí),往往會(huì)用Linpack測(cè)試值來衡量HPC機(jī)器的性能,如TOP500排行榜,但實(shí)際上用戶對(duì)這種衡量標(biāo)準(zhǔn)并不滿意,因?yàn)樗诟咝阅苡?jì)算機(jī)的選型、優(yōu)化過程中無法提供有效的參考。憑借在聯(lián)想做了3年方案、在英特爾做了5年調(diào)優(yōu)的經(jīng)驗(yàn)積累,陳健對(duì)用戶真正想要的東西很清楚。

在此次會(huì)議上,他介紹了并行科技公司新推出的Paramon應(yīng)用運(yùn)行特征收集器、Paratune應(yīng)用運(yùn)行特征分析器等性能監(jiān)控管理工具軟件,并表示其目的是要讓高性能計(jì)算機(jī)的性能可以“看得見”,讓HPC用戶和從業(yè)人員可以更簡(jiǎn)單有效地掌握機(jī)器性能,從而快速采取相應(yīng)的對(duì)策。

陳健從最終用戶的需求出來,指出了當(dāng)前高性能計(jì)算性能優(yōu)化面臨的幾個(gè)重要問題:

一是絕大多數(shù)實(shí)際運(yùn)行的軟件只發(fā)揮硬件很少的計(jì)算能力,問題是如何快速準(zhǔn)確測(cè)量當(dāng)前軟件發(fā)揮了多少計(jì)算能力?

二是軟件優(yōu)化技術(shù)太復(fù)雜、太耗時(shí),問題是如何讓調(diào)優(yōu)普及化,如何用20%的時(shí)間挖掘出80%的優(yōu)化空間?

三是高性能計(jì)算應(yīng)用為先,需要提供匹配關(guān)鍵應(yīng)用的硬件方案,問題是如何快速確定應(yīng)用對(duì)硬件各組件的需求情況?

針對(duì)上述問題,北京并行科技有限公司提出了“快速應(yīng)用運(yùn)行特征分析方法”這一解決方法(包括面向最終用戶的Paramon應(yīng)用運(yùn)行特征收集器和面向軟硬件廠商開發(fā)人員的Paratune應(yīng)用運(yùn)行特征分析器),盡可能讓高性能計(jì)算機(jī)實(shí)際運(yùn)行過程中的所有性能數(shù)據(jù)都能“可視化”,從而幫助用戶更有效地實(shí)現(xiàn)系統(tǒng)的選型、配置、調(diào)優(yōu)與管理。

據(jù)介紹,其中,Paramon應(yīng)用運(yùn)行特征收集器,通過實(shí)時(shí)監(jiān)控機(jī)群管理/登錄節(jié)點(diǎn)、計(jì)算節(jié)點(diǎn)、IO節(jié)點(diǎn)等服務(wù)器的處理器、內(nèi)存、網(wǎng)絡(luò)和存儲(chǔ)性能數(shù)據(jù),提供機(jī)群系統(tǒng)中應(yīng)用軟件隨時(shí)間變化的運(yùn)行特征。Paramon軟件面向IT管理人員、硬件管理員、機(jī)房管理員等用戶角色,通過實(shí)時(shí)監(jiān)控、采集機(jī)群中服務(wù)器的CPU、GPU、內(nèi)存、網(wǎng)絡(luò)和存儲(chǔ)等關(guān)鍵設(shè)備的系統(tǒng)級(jí)和微架構(gòu)級(jí)性能數(shù)據(jù)(Gflops、Memory Bandwidth、Vectorization、CPI、GIPS),以圖形化的方式直觀顯示,快速反映提供機(jī)群系統(tǒng)中應(yīng)用軟件隨時(shí)間變化的運(yùn)行特征,同時(shí)了解硬件環(huán)境的運(yùn)行現(xiàn)狀,快速了解機(jī)群中隱含的硬件問題,從而在問題發(fā)生時(shí)第一時(shí)間給出解決方案。

Paratune應(yīng)用運(yùn)行特征分析器,則可以分析Paramon生成的.para應(yīng)用運(yùn)行特征文件,顯示應(yīng)用運(yùn)行時(shí)各節(jié)點(diǎn)中處理器、內(nèi)存、網(wǎng)絡(luò)和磁盤的性能數(shù)據(jù),重構(gòu)機(jī)群應(yīng)用運(yùn)行過程,高效、準(zhǔn)確地描述應(yīng)用的運(yùn)行特征。硬件廠商機(jī)群方案設(shè)計(jì)人員根據(jù)用戶應(yīng)用運(yùn)行特征圖,可以清楚的了解應(yīng)用在運(yùn)行的各個(gè)階段,對(duì)硬件設(shè)備處理器、內(nèi)存、網(wǎng)絡(luò)和磁盤等各部分的需求情況,基于這樣準(zhǔn)確的數(shù)據(jù)分析,方案人員可以提供有針對(duì)性、真正符合客戶應(yīng)用需求的HPC機(jī)群設(shè)計(jì)方案。應(yīng)用軟件優(yōu)化人員根據(jù)用戶應(yīng)用運(yùn)行特征圖,可以準(zhǔn)確了解用戶應(yīng)用程序的運(yùn)行狀態(tài),了解程序運(yùn)行熱點(diǎn)段對(duì)各種硬件部件的依賴程度,快速定位系統(tǒng)性能瓶頸,找到應(yīng)用優(yōu)化的空間和方向。

陳健表示,目前Paramon應(yīng)用運(yùn)行特征收集器在全國已經(jīng)安裝了100套,用戶可以在www.paratera.com上直接下載試用。

分享到

zhouxiaoli

相關(guān)推薦