提升高性能計算的性能與效率:不要再看CPU
[導讀]無論是賴能和還是張鐵鋼,他們已經意識到,單純依靠CPU提高工作負載能力、加速石油行業(yè)高性能計算性能的時代已經一去不復返
DOSERV服務器在線 8月8日原創(chuàng)報道: 誰拯救了美國的能源危機?不是奧巴馬,也不是??松梨?,更不是一直動蕩不安的中東石油,而是頁巖氣,自2006年起,美國頁巖氣產量大幅增長,到2011年,美國頁巖氣產量高達1800億立方米,占美國天然氣產量的34%。
其間,在2009年,美國天然氣產量達到6240億立方米,首次超過俄羅斯成為世界第一天然氣生產國,此后一直維持在這一位置。2012年美國天然氣產量6810億立方米,是世界天然氣增產最迅速的國家,比位居第二的俄羅斯天然氣產量多出900億立方米。
此后,頁巖氣革命對美國的能源結構產生重大影響:美國每百萬英熱(計量單位)天然氣均價為2.86美元,同期東亞同等熱值天然氣價格為16美元~18美元,歐洲12美元~14美元——雖然頁巖氣的價格下跌導致很多頁巖氣開采氣田和石油公司無利可圖,但如此價廉、清潔、高效和儲藏量龐大的頁巖氣資源,讓美國擺脫了石油和天然氣價格高企的今天所面臨的能源危機。
而現在,美國已經開始考慮開采頁巖油,與傳統油氣資源類似,頁巖層中的油氣資源也相伴而生,頁巖油屬于輕質油,油質好,但比之傳統直井油田直接從油層抽取原油,開采頁巖油采用水平鉆井和水力壓裂技術從頁巖層中獲得,其開采成本也更高一些,即便如此,在較高的國際油價面前,開采頁巖油仍有利可圖。
但無論開采頁巖氣還是頁巖油,工程建設與開采技術都是其中的關鍵。以頁巖氣為例,頁巖氣,是指位于暗色泥巖或者高碳泥頁巖中,以吸附或者游離狀態(tài)為主要存在方式的天然氣聚集,地質結構復雜、蘊藏機制莫測、開采難度較高,事實上,自20世紀70年代就有企業(yè)開始探索頁巖氣的開采技術,但直到90年代才有成熟的開采、探測技術,而頁巖氣可以通過成熟、穩(wěn)定的手段實現快速的發(fā)現、蘊藏量預測和開采,已經距離頁巖氣開采的提出者們的大膽想法,足足過了三十年。
“在勘探新的資源——頁巖氣——的過程中,要探測不同類型的巖層,但頁巖——泥頁巖和致密巖石——之間的區(qū)別并不大,這就對數據采集密度、精確度有著極高的要求,需要進行很大量的數據分析,這些都需要工程技術、信息化技術的支撐。”中國石油大慶油田公司勘探開發(fā)研究院總工程師張鐵鋼表示,在發(fā)現頁巖氣和未來頁巖油的工作中,工程技術、信息化技術——計算、分析、存儲——的需求量十分巨大,而也正是依靠——也必須依靠——這些技術,才能夠實現大慶讓老油田煥發(fā)青春的目標。
張鐵鋼表示,大慶油田的宗旨,就是“圍繞資源優(yōu)化,結合能源應用的特點高效利用工程和信息化技術”,讓大慶油田能夠不斷完成國家交予的能源支持任務,實現讓大慶油田能夠持續(xù)實現產油、產氣的重要保障。
在英特爾2013年度企業(yè)高性能計算研討會上,來自全國能源行業(yè)的CIO代表們齊聚一堂,信息技術對國內能源行業(yè)——尤其是石油行業(yè)——發(fā)展的重要推動作用已經被他們清晰地認識到,他們來到冰城哈爾濱的目的,是希望能夠了解到信息技術的發(fā)展與走向,以及交流如何利用信息化技術更快一步達成“好找油,找好油”的目標,尋找更多的油氣資源。
而也正是在這次會議上,東方地球物理公司研究員處理中心總工程師賴能和老師提出:“不再需要關心處理器,而是要關心其它東西。”的驚人觀點,為國內能源行業(yè)、石油行業(yè)的信息化技術利用提出了新的發(fā)展思路。
賴能和:不要看CPU了
“不用太過看重CPU,現在的CPU已經非常快了。”賴能和談到,從2007年的宜賓到2013年的哈爾濱,七屆高性能計算會議一路走來,他看到了x86架構處理器在過去七年不斷的加速、加速、再加速,處理器的性能不斷提升,而且“是完全不需要關心它(CPU)的性能提升速度和步伐”,在這樣的背景下,石油行業(yè)的高性能計算卻仍然遇到了挑戰(zhàn)。
賴能和談到,伴隨油氣勘探采集與處理新機遇的,是高密度海量數據處理正面臨新的挑戰(zhàn):1、可控震源高效采集技術快速發(fā)展并廣泛應用;2、高密度、高覆蓋采集與處理技術提高勘探深度;3、高密度財季成為新的趨勢,數據體越來越大。
“高頻率、寬頻帶單點、單源的高效采集技術,使得每天產生的數據量大增,總數據量相關前約270TB,相關后90TB,一天就是7.5TB的數據(相關前),現在一炮(探測炸點)的數據相關后就是490MB,但是往往一天就要放5000炮。”賴能和認為,石油能源行業(yè)的地質、地震勘探正在朝著三維化、立體化、高密度、高覆蓋度發(fā)展,這有效提高了對地層探測的精確程度和成像效果,但問題是:數據量越來越龐大,而高性能計算集群的計算性能卻永遠滿足不了需求。
“CPU計算資源需求和海量數據存儲需求都在急劇增長,對傳統HPC技術提出了挑戰(zhàn)。”賴能和表示,無論是從總套數、每套核數、還是每套的計算性能上來看,油氣行業(yè)的高性能計算系統的水平都在提高,這說明高精度的地震成像、地質勘探算法需要海量的處理器資源,但既然已經買了很多的處理器,且處理器的性能提升越來越快,甚至“僅從計算量上來看已經問題不大”,但為什么卻仍然難以滿足需求,無法得到更精確的處理結果呢?
賴能和答案是“效率”:“我們以前處理器的效率非常低,最高才百分之十幾,最低的時候只有2%,后來優(yōu)化之后,效率最高能夠接近40%,但是低的時候也只有15%,關鍵是要提高計算集群的效率。”賴能和提出,針對海量數據的高性能計算解決方案,要從五個角度來解決問題:
1、 高性能:采用最先進的CPU、PCIe架構
2、 高配置:采用大內存、大內置盤
3、 高帶寬:采用全線速、無阻塞的高速網
4、 高效率:采用高可擴展的并行存儲系統
5、 高吞吐:針對不同應用,選擇存儲軟硬件架構
“你像我們的第一套系統,投入了2000多萬,全部使用高性能并行存儲系統、10GbE萬兆以太網,而且都裝了5塊15k轉的6G SAS硬盤,使用雙路英特爾E5-2670服務器,經過調優(yōu)后,并發(fā)運行后的效率從之前的最低3.65%現在提高到了44.37%。”賴能和說,這一數據實際上還有提升的空間,“通過優(yōu)化配置,處理器的利用率能夠大幅度提升,我的觀點是,先不用著急買處理器,先把自己現在的處理器用好了再說。況且用好了現在的東西,才好說再去買,到時候就可以說‘你看,我們已經用的很好了’。”
賴能和還展示了一套大約2、3年前采購得高密度海量處理系統(基于至強X5660雙路服務器)的優(yōu)化結果:通過擴展24GB內存到96GB,增加計算節(jié)點內置盤及更換512K Cache的RAID卡,全面升級萬兆以太網,新增14個計算和I/O節(jié)點,并使用并行存儲系統取代原有的普通存儲——在作業(yè)數為10、50、100的測試中,此次改造分別提高了4倍、10倍和8倍。
“馬上我們計劃第三、四套高密度海量處理系統,除了使用英特爾至強E5-2670雙路服務器之外,我們會加大內存、內置盤以及使用萬兆以太網,只有這樣才不會浪費處理器極大的計算資源。”賴能和表示,使用高性能的處理器,必須要在網絡、內置盤、帶寬等層面予以全面配合,再加上協處理器,才能夠達到想要的效果,處理器的效率才能夠發(fā)揮出來,因此他對HPC新技術的應用提出了基于石油行業(yè)的需求與展望。
1、 CPU+協處理器組成的協同計算平臺:基于多核、眾核CPU技術、CPU+協處理器或CPU+GPU組成的HPC和多路服務器仍將成為主要的應用平臺。
2、 高性能并行存儲軟硬件系統及固態(tài)硬盤SSD技術:以大容量、高性能、低功耗、低熱量和低噪音的并行存儲和新型節(jié)能存儲介質技術將高速發(fā)展。
3、 高速網絡技術:萬兆網絡技術將成為應用主流。
4、 基于水冷等新型節(jié)能技術,將成為關注的重點。
5、 云或移動計算平臺:基于計算、存儲、可視化資源池等基礎設施整合的新的商業(yè)模式,將向用戶提供服務。
張鐵鋼:老油田比新油田“有料”
“地質學家有一個論斷:‘在一個大油田,已知油田中發(fā)現的儲量要比在新區(qū)發(fā)現的油田的儲量多60%’ ,甚至于說基本上新的油氣資源都是在老油田之間更深的地方找到的。”中國石油大慶油田公司勘探開發(fā)研究院總工程師張鐵鋼在接受DOIT記者采訪時表示,在中國的油氣行業(yè),每年都可以找到新的油田——正是在老油田或是老油田之間,他表示,無論是老油田煥發(fā)青春,還是繼續(xù)發(fā)掘新的油氣資源,對老油田的深耕必不可少。
因此,在我國傳統的油氣資源產區(qū)大慶油田,“利用多種綜合勘探手段判斷潛在資源”,是現在最重要的挖掘油氣資源的方式,據張鐵鋼介紹,最近幾年,大慶油田通過不斷挖掘老油田、老油田之間油氣產區(qū)的資源,不僅完成了國家要求的穩(wěn)產任務,而且現在的油氣產量并不比20、30年前差,作為開采已經幾十年的老油田,“大慶穩(wěn)產4000萬噸”的目標仍然年年實現。
但實現穩(wěn)產、挖掘老油氣田資源,老油田比新油田“有料”不是簡簡單單就能夠完成的任務,從油氣資源成像上來看,產油的致密砂巖和不含油的砂巖密度差不多,原來油氣資源豐富的時候,勘探開采比較容易,技術探測相對比較簡單,但“現在的判斷復雜度就高很多了,資源勘探的采集數據的密度較要加大,以前采集間隔小、數據量小,現在網格采集的密度則非常高,采集的點覆蓋密度小可能就遺漏了。”
張鐵鋼表示,如今大慶油氣勘探數據采集的密度越來越高,正如賴能和在會議演講上所說的:“要高密度、高覆蓋的采集數據,挖掘更多的油氣資源。”,但這樣做的成果也非常顯著,不僅是老油田大慶實現了年年穩(wěn)產,我國位居老油田前列的克拉瑪依和勝利油田,“年年都能找到新的油田”,這其中,勝利油田就通過三維全覆蓋技術以及高密度三維技術,不斷發(fā)現了新的油氣資源。
支撐三維全覆蓋技術、高密度三維技術的關鍵是先進的工程建設與科學計算技術,如張鐵鋼來說“技術的進步就會帶來資源的解放”。
“以往做地震、地質測試研究,區(qū)塊都比較小,數據量很小,幾十GB很多,但是現在高密度采集48平方公里,16TB的數據,尤其是針對已經開發(fā)過的油場,進行二次勘探,數據量更大、難度更大。”張鐵鋼介紹,現在使用高性能計算系統、多路服務器、英特爾至強處理器、高性能存儲系統,多方協同三維數據解析的工作進展順利,而基于虛擬化技術讓兩個專業(yè)軟件同時運行,“這在以前是不可想象的”。
除此以外,在會議的演講上,張鐵鋼還介紹了大慶使用云計算技術構建云門戶的經驗,通過構建云計算門戶,大慶油田在內部服務、勘探資源的調配和快速上線上,獲得了很大的收益,而利用虛擬化技術對門戶服務器的優(yōu)化,目前大慶油田門戶服務器的利用高達70%,專業(yè)應用的系統利用率從20%提升到了40%,并“利用虛擬機管理許可證,隨時利用空閑許可證,讓資源靈活和浮動起來。”
“機器的性能和效率提高了,人的效率也就提高了,雖然初期需要購買一些管理軟件,但長期的效益是巨大的。”張鐵鋼向記者表示。
英特爾服務高性能計算:不止是CPU
無論是賴能和還是張鐵鋼,他們已經意識到,單純依靠CPU提高工作負載能力、加速石油行業(yè)高性能計算性能的時代已經一去不復返,在英特爾的處理器——至強和至強融核——不斷加速并將其他IO遠遠甩在身后的情形下,提高高性能計算的性能,正在成為一場“全面戰(zhàn)爭”。
在這場戰(zhàn)爭中,需要被現代化的包括一長串名單:更快的、更大容量的內存;應當被閃存(或者說是SSD)取代的運轉緩慢的傳統磁盤;無法響應網絡需求帶寬嚴重滯后的1Gb以太網;應當更具擴展性的文件系統,凡此種種,這不僅是賴能和與張鐵鋼們的挑戰(zhàn),也是英特爾的挑戰(zhàn)。
因此,在高性能計算行業(yè),英特爾所提供的產品并不僅限于英特爾至強和至強融核處理器,而是一個全面的高性能計算效率與性能提高的方案。
首先,英特爾如今在提供面向數據中心的DC S3500和S3700固態(tài)硬盤,這兩款產品雖然都基于SATA接口,但提供了足夠高性能計算平臺所需要的隨機小塊讀寫性能,以及更長期的壽命,而在PCIe閃存卡領域,英特爾的910系列閃存卡則更能夠顯著提高高性能計算系統每節(jié)點的IO吞吐量。
其次,英特爾一直在以太網領域提供大量的技術、產品和知識產權,英特爾不僅提供萬兆網以太網適配器,現在還在提供融合網絡適配器X520、X540系列,其中絕大部分都使用英特爾自己的控制器。
第三,英特爾在高性能計算的編譯器、編程工具等領域,提供了大量基于標準的開發(fā)、編程工具以及不少行業(yè)標準的編譯器。這些工具包括了VTune性能分析器、英特爾編譯器(Intel Compilers)、Intel Thread Checker、Intel Performance Libraries、Intel Threading Tools、Intel Cluster Tools等,它們可以幫助高性能計算應用軟件開發(fā)商或最終用戶分析自己的高性能計算系統及應用軟件特性,并最大限度優(yōu)化其高性能計算機軟硬件系統,發(fā)掘其最大性能潛力。
第四,針對高性能計算目前的文件系統問題,英特爾自2012年收購超級計算機集群解決方案文件系統Lustre之后,今年正式發(fā)布了英特爾發(fā)行版的Lustre文件系統,有效的提高了這一文件系統及大量高性能計算系統的的文件存儲能力。
除此以外,英特爾公司還推出了“真實應用負載計劃”,來幫助用戶針對其真實的應用負載,而非通用的基準測試軟件來進行調優(yōu),從而幫助他們從自己的系統上獲取最大化的收益——從以上這些內容來看,英特爾在高性能計算領域絕不僅僅是推動CPU的升級和發(fā)展那么簡單,再有可能成為高性能計算瓶頸的任何地方,英特爾都在投入技術、精力和時間,從而形成全面的高性能計算技術、產品提供商。

崔昊