挑戰(zhàn): 減少高要求的大學環(huán)境中的高性能計算的成本
解決方案: 一個128節(jié)點的DellTM PowerEdgeTM 1550服務器群集,每個節(jié)點配置了Intel® Pentium® III處理器,并運行Linux® 操作系統(tǒng)
優(yōu)勢: 節(jié)省費用;超級計算機等級的性能使新的研究類型成為可能;計算機資源供更多的研究人員使用;更高的可用性
大學研究者傳統(tǒng)上都使用大量的計算資源。在建模從天氣到經(jīng)濟理論的各種事情,他們可能會使用成千上萬的MIPS(每秒數(shù)百萬條指令)。但在大多數(shù)學校,都不能提供足夠的計算資源。傳統(tǒng)上用來進行數(shù)字密集型研究的超級計算機需要花費數(shù)百萬美元?而且需要專業(yè)化的昂貴的管理和維護。
賓西法尼亞州立大學(賓州大學)開創(chuàng)了一個新的途徑。他們利用DellTM PowerEdgeTM 服務器中數(shù)百個現(xiàn)成的Intel® 處理器提供超級計算機的處理性能,但成本僅占超級計算機的一小部分。
賓州大學在1998年夏季使用Dell PrecisionTM 工作站進行了第一次評測。在確認了擴展性之后,學校使用33個Dell PowerEdge 4350 服務器構建了一個完整的群集。64處理器 LION-X 群集 – 以學校的吉祥物和群集的操作系統(tǒng)命名 – 為30多個研究者提供計算能力,這些研究者從事的工作不盡相同,從材料的設計到天氣的建模。
以四分之一的空間提供兩倍性能
在2001年,賓州大學通過構建它的第二個Dell-Linux群集,提高了性能,降低了價格。這個群集包括Dell PowerEdge 15501 服務器,其中的CPU是第一個群集中的CPU的性能兩倍,但空間是以前的服務器的四分之一。
“我們的兩個LION-X群集對于我們支持并行計算和增強計算研究人員的環(huán)境的能力來說非常關鍵,”高級研究程序員Jeff Nucciarone說,”充分利用Dell PowerEdge服務器的可靠性和性能以及基于標準的計算環(huán)境經(jīng)濟高效的特點,我們可以使研究人員訪問具有強大運算功能的硬件系統(tǒng),幫助他們解決復雜的計算問題。”
圖1:機柜優(yōu)化Dell PowerEdge服務器在小空間內(nèi)最大化了計算能力
群集作為可擴展的企業(yè)計算和一個經(jīng)濟、價格具有競爭力的學術研究和科學計算方法的一個新模型,正在快速贏得大家對它的關注。Dell服務器構成的一個群集,再加上分解和在網(wǎng)絡上發(fā)布處理任務的計劃軟件,使得基于標準的日用設備即可以提供可與專用的、更為昂貴、高性能的計算機相媲美的計算速度。
每平方英寸的性能是原來的八倍
賓州大學在評測過程中考慮了很多因素?初始價格,易于維護,可靠性,占用面積和外形,最后選擇了Dell作為供應商。”我們已經(jīng)與Dell建立了穩(wěn)固的聯(lián)系,因此我們確信我們將會得到很好的支持,”賓州大學高性能計算和可視化部門主管Vijay Agarwala說,”Dell的定價極具競爭力,而且他們的服務器的范圍滿足了我們的需求規(guī)范。他們的系統(tǒng)具有足夠的冗余性滿足我們對運行時間和恢復的需要。最后,我們需要一個機柜安裝的系統(tǒng)來滿足我們的物理空間需要,PowerEdge很好地滿足了這一類型的配置需要。”
新的LION-XE群集包括128個PowerEdge 1550服務器,每臺服務器配置了兩個1GHz的Intel Pentium® III處理器,配備了2GB內(nèi)存和36GB SCSI硬盤。其它的特性還包括一個快速64位、66MHz的外設部件互聯(lián)(PCI)總線,連接到兩個Gigabit 2 網(wǎng)絡,并在主板上集成了兩個以太網(wǎng)適配器。
超薄的1U外形是PowerEdge 1550的另一個優(yōu)勢。”因為PowerEdge 1550很薄而且處理器的性能比我們第一個群集中的處理器更高,我們現(xiàn)在每平方英寸的能力是以前的八倍,”Agarwala說,”在專用系統(tǒng)世界中您不會看到如此快速的改進性價比。”
開放源碼Linux的自由
Linux® 操作系統(tǒng)在軟件方面提供了同樣的自由、低成本和快速創(chuàng)新。”因為Linux是開放源碼軟件,我們可以輕松進入Linux世界,”研究編程人員Jason Holmes說,”我們不會受到專用系統(tǒng)的限制。開放性使我們能夠與其它人合作,貢獻和利用其它人員開發(fā)的解決方案。我們不用等待提供商開發(fā)我們需要的應用。”
由于在線提供,LIOX-X和LION-XE群集的性能已經(jīng)超過了預期值。賓州大學研究計算的工作人員運行的基準測試同樣證明了它們的出色性能。這些基準提供在LION-XE網(wǎng)站上(http://gears.aset.psu. edu/hpc/systems/lionxe/performance/)。
高需求
來自校內(nèi)的各個系的需求非常高,因此Holmes實現(xiàn)了一個計劃系統(tǒng)來容納每個人的項目。LION-XE群集實際上是由賓州大學的13個不同的研究小組和學術計算中心共同購買的。沒有提供資助的其它研究者也可以使用它。
“這些小組認識到可以將他們的資金集中起來購買一個大型的共享計算機,而不是每個小組購買一臺小型的機器,”Holmes說,”現(xiàn)在他們都可以使用一個更為強大的系統(tǒng),因為群集在各個任務之間會出現(xiàn)休閑時間,所以我們實現(xiàn)了一個計劃系統(tǒng),允許運行較短的任務,另外還支持其它的小組在群集沒有被優(yōu)先的團隊使用時使用群集。”
一切都與數(shù)據(jù)相關
總體看來,大約80%的研究者在全時地使用LION-XE群集。LION-XE群集為大量的研究性工作提供支持。
昆蟲學和生物學教授Ottar N. Bjornstad使用LION-XE群集來研究傳染性疾病流行性的升降,重點是了解感染的空間分布和預測本地流行的范圍。他的研究工作廣泛使用了群集來估計空間網(wǎng)絡和隨機模擬時空模型。對于設計干預戰(zhàn)略和控制人類的疾病和bioterror agents來說,這項工作有著十分重要的切實可行的結果。
而Garrison小組利用LION-XE群集進行分子動態(tài)(MD)模擬,從而對能源的快速分解過程進行建模。其中的一個過程是激光切除。這個小組已經(jīng)開發(fā)一個新的呼吸球模型,使他們可以延長仿真的時間和長度。激光切除應用中包括對大型生物分子進行大量的光譜測定、薄膠片分解以及醫(yī)療過程,例如眼睛手術LASIK。
“我們十分吃驚地看到使用現(xiàn)成的技術能夠使科研團體更好地訪問并行計算資源,”學術計算中心的高級主管Kevin Morooney說,”利用LIOX-XE群集,我們已經(jīng)采取了一個均衡的方法,提供了不僅具有非??斓牟⑿杏嬎阒芷诙揖哂懈呖捎眯缘沫h(huán)境。”
賓州大學正在評測基于Intel新的64位架構的Dell的服務器。”毫無疑問,它是我們的未來,”Agarwala說,”64位架構是很多大規(guī)模計算的理想選擇。Dell服務器的發(fā)展速度是驚人的。”