ZDnet 發(fā)表于:14年06月06日 10:30 [綜述] DOIT.com.cn
基于開(kāi)源軟件的集群和Linux操作系統(tǒng)統(tǒng)治著高性能計(jì)算(HPC)系統(tǒng),主要原因正是其成本效益以及靈活性,還有豐富的開(kāi)源應(yīng)用可以使用。
IBM Platform HPC在單一產(chǎn)品中提供完整的高性能計(jì)算(HPC)管理解決方案,它包含豐富的即取即用功能集,通過(guò)減少HPC環(huán)境的復(fù)雜性和加速解決問(wèn)題,賦予高性能技術(shù)計(jì)算用戶強(qiáng)大的能力。
IBM Platform HPC(PHPC)在單一產(chǎn)品中提供了基于Linux集群的一整套技術(shù)和高性能計(jì)算管理功能,通過(guò)自動(dòng)部署操作系統(tǒng)和軟件組件,系統(tǒng)管理員可以使用Platform HPC將復(fù)雜的集群作為單一系統(tǒng)進(jìn)行管理。Platform HPC提供了配置和維護(hù)能力,它還包括集中化的監(jiān)控,帶有警報(bào)和可定制的警報(bào)措施。
具體而言,Platform HPC包括以下功能:
集群管理(內(nèi)嵌的xCAT作為配置引擎)
工作負(fù)載管理(基于IBM Platform LSF Express)
工作負(fù)載監(jiān)控和報(bào)告
系統(tǒng)監(jiān)控和報(bào)告
強(qiáng)健的商業(yè)MPA Library(基于IBM Platform MPI標(biāo)準(zhǔn)版)
應(yīng)用支持(集成應(yīng)用腳本/模板)
加速器支持,包括GPU和英特爾至強(qiáng)Phi處理器調(diào)度、管理和監(jiān)控
PHPC集群環(huán)境的高可用性
統(tǒng)一的Web門(mén)戶
Platform HPC的應(yīng)用
通過(guò)一個(gè)易于使用的Web界面,IBM Platform HPC允許制造、石油、天然氣、生命科學(xué)以及高等教育等行業(yè)的技術(shù)型計(jì)算用戶配置、管理和使用他們的HPC集群,這為用戶最大限度減少了設(shè)置和管理集群所花費(fèi)的時(shí)間,讓他們把精力集中于應(yīng)用運(yùn)行,而不是管理基礎(chǔ)設(shè)施上。
IBM Platform HPC具有完整的針對(duì)ANSYS Mechanical、ANSYS Fluent、ANSYS CFX、LS-DYNA、MSC Nastran、Schlumberger ECLIPSES、Simulia、Abaqus、NCBI Blast、NWChem、ClustalW以及HMMER的任務(wù)提交模板。
通過(guò)配置這些基于環(huán)境的應(yīng)用設(shè)置模板,可以從一開(kāi)始使用集群就不需要編寫(xiě)腳本。那些配置自主或者開(kāi)源應(yīng)用的集群用戶可以使用Platform HPC腳本指導(dǎo)方針。這些界面可以最大程度上減少任務(wù)提交錯(cuò)誤,并且是自我記錄的,讓用戶能夠創(chuàng)建自己的任務(wù)提交模板。
Platform Application Center(PAC)集成:Platform HPC中并不包含Platform LSF插件,用戶必須單獨(dú)下載并安裝這個(gè)插件。Platform HPC包括PAC的一些功能,如任務(wù)提交、任務(wù)管理以及應(yīng)用模板。
如果一個(gè)用戶購(gòu)買(mǎi)了PAC標(biāo)準(zhǔn)版,同時(shí)會(huì)收到授權(quán),可以通過(guò)這個(gè)授權(quán),在現(xiàn)有的Platform HPC上啟用其他功能,如遠(yuǎn)程2D和3D可視化。不過(guò),PAC雙體中包含PAC標(biāo)準(zhǔn)版的其他功能,因此,如果用戶需要這些功能,比如Role Based Access Control,必須單獨(dú)安裝PAC。
組件模型
Platform HPC軟件組件支持各種運(yùn)行于集群上的計(jì)算密集型應(yīng)用。在開(kāi)始任何軟件應(yīng)用之前,所有節(jié)點(diǎn)都要安裝操作系統(tǒng)和應(yīng)用軟件,這個(gè)功能是通過(guò)配置引擎提供的。在這里,用戶創(chuàng)建或者使用一個(gè)預(yù)先設(shè)定的配置模板,這個(gè)模板描述了計(jì)算節(jié)點(diǎn)軟件需要的特性。這個(gè)配置引擎通過(guò)一個(gè)選定的網(wǎng)絡(luò)接收啟動(dòng)請(qǐng)求,給系統(tǒng)安裝相應(yīng)的操作系統(tǒng)和應(yīng)用軟件,安裝完成之后,就可以運(yùn)行系統(tǒng)和目標(biāo)應(yīng)用了。
盡管計(jì)算圖像可以運(yùn)行應(yīng)用軟件,但是對(duì)這些圖像的訪問(wèn)通常是被任務(wù)調(diào)度器(Platform LFS)控制的,它作為一個(gè)工作負(fù)載管理器運(yùn)行。這個(gè)調(diào)度器的功能是確保在計(jì)算節(jié)點(diǎn)上的計(jì)算資源不被序列化的訪問(wèn)過(guò)度消耗。
這個(gè)調(diào)度器的屬性通常是在安裝過(guò)程中定義的,可以配置這個(gè)調(diào)度器,將不同工作負(fù)載分配提交給任務(wù)代理之一(Platform LSF代理),這個(gè)任務(wù)代理在接收到任務(wù)調(diào)度器的請(qǐng)求時(shí)開(kāi)始特定的工作負(fù)載,系統(tǒng)中有多個(gè)任務(wù)代理,每個(gè)操作系統(tǒng)圖像上有一個(gè)。
這個(gè)監(jiān)控和資源代理向配置代理和任務(wù)調(diào)度器返回每個(gè)操作系統(tǒng)圖像的系統(tǒng)狀態(tài)報(bào)告,并提供一個(gè)機(jī)制,在發(fā)生故障的時(shí)候發(fā)出警報(bào),確保任務(wù)只在可用且有資源的操作系統(tǒng)圖像上進(jìn)行調(diào)度。
網(wǎng)絡(luò)門(mén)戶則為管理員提供了一個(gè)易于使用的機(jī)制,來(lái)控制和監(jiān)控整個(gè)集群,同時(shí)對(duì)于用戶來(lái)說(shuō),它提供了對(duì)系統(tǒng)易于使用的訪問(wèn),以進(jìn)行任務(wù)提交、管理和報(bào)告。
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.