圖:數(shù)據(jù)存儲整合前的存儲孤島
新疆油田數(shù)據(jù)中心根據(jù)業(yè)務(wù)需求,先后購買了兩套不同品牌的集中存儲系統(tǒng)。但是隨著技術(shù)的不斷成熟、業(yè)務(wù)種類的不斷豐富、用戶需求的不斷提高,對后臺的支撐系統(tǒng)提出了更高的要求。以前的存儲架構(gòu)已經(jīng)不足以滿足業(yè)務(wù)發(fā)展的需求,對現(xiàn)有數(shù)據(jù)存儲的基礎(chǔ)架構(gòu)提出了新的調(diào)整要求:在不影響現(xiàn)有應(yīng)用的情況下,需要對已有的HDS 9585和EMC CX700存儲系統(tǒng)實現(xiàn)整合,解決隨著業(yè)務(wù)的增長而不斷產(chǎn)生的問題。
新疆油田數(shù)據(jù)中心在2007年九月購買了在存儲虛擬化存儲市場領(lǐng)域處于領(lǐng)先地位的廠商–HDS的具有強大虛擬化功能的NSC55產(chǎn)品,實現(xiàn)了對原有系統(tǒng)的整合。目前新疆油田數(shù)據(jù)中心已經(jīng)擁有了一個統(tǒng)一的存儲資源平臺、可以實現(xiàn)統(tǒng)一存儲資源調(diào)度;并且NSC55帶來的一些全新的存儲功能可以完全應(yīng)用到以前的存儲資源,使原有的存儲空間得到了增值;統(tǒng)一的存儲平臺完全消除了原有存儲基礎(chǔ)架構(gòu)的瓶頸。
圖:數(shù)據(jù)存儲整合后的統(tǒng)一存儲平臺信息基礎(chǔ)架構(gòu)
目前在這個統(tǒng)一的存儲平臺上運行著新疆油田數(shù)據(jù)中心的所有應(yīng)用系統(tǒng),包括地球科學(xué)與鉆井系統(tǒng)A1所有的應(yīng)用(CDS、MDS、PE、LMK、TSM、GQS、PCEDM等)、上游生產(chǎn)信息系統(tǒng)A2所有的應(yīng)用(EDM、CITRIX、QVM、OpenWells、TWS、Crystal Report等)、勘探數(shù)據(jù)庫、開發(fā)數(shù)據(jù)庫、地理信息數(shù)據(jù)庫、基礎(chǔ)地理影院系統(tǒng)、三維地理影院系統(tǒng)、項目管理應(yīng)用系統(tǒng)、辦公自動化系統(tǒng)和公司門戶應(yīng)用系統(tǒng)等將20多個應(yīng)用系統(tǒng)。統(tǒng)一的數(shù)據(jù)存儲平臺保證了這20多套信息系統(tǒng)的正常運行,使新疆油田數(shù)據(jù)中心數(shù)據(jù)管理的集成度得到大幅度提高。
新疆油田數(shù)據(jù)中心存儲虛擬化存儲整合項目的實施為新疆油田公司在2008年力爭全面完成數(shù)字油田的建設(shè)打下了堅實的IT架構(gòu)的基礎(chǔ),為完善油田信息集成平臺、一體化應(yīng)用系統(tǒng)等重點基礎(chǔ)系統(tǒng)建設(shè)提供了統(tǒng)一數(shù)據(jù)存儲的保障。為未來油田的數(shù)據(jù)和應(yīng)用容災(zāi)建設(shè)、各種應(yīng)用升級,ERP系統(tǒng)建設(shè)、完善工程技術(shù)與生產(chǎn)服務(wù)業(yè)務(wù)信息系統(tǒng)、加強生產(chǎn)自動化技術(shù)的推廣應(yīng)用、完善生產(chǎn)自動化數(shù)據(jù)管理系統(tǒng)和擴大自動化設(shè)施數(shù)據(jù)采集監(jiān)測等應(yīng)用提供了充分的數(shù)據(jù)存儲可持續(xù)擴展支持能力。這一項目的成功實施將促進(jìn)新疆油田繼續(xù)由數(shù)字油田向智能化油田不斷邁進(jìn)。
存儲系統(tǒng)整合前面臨的問題
直接使用各自獨立部署的HDS和EMC陣列,隨著業(yè)務(wù)的發(fā)展一些問題也變得越來越緊迫:
問題1.?dāng)?shù)據(jù)復(fù)制問題。
基于存儲的數(shù)據(jù)復(fù)制技術(shù)目前已經(jīng)是最重要的存儲技術(shù),它是數(shù)據(jù)備份、應(yīng)用開發(fā)、數(shù)據(jù)挖掘、應(yīng)用測試、數(shù)據(jù)容災(zāi)的基礎(chǔ),幾乎所有的企業(yè)級用戶都會使用這種基于存儲的數(shù)據(jù)復(fù)制技術(shù)來解決各種應(yīng)用難題或提供增值的存儲服務(wù)。這種基于存儲的數(shù)據(jù)復(fù)制技術(shù)對于新疆油田數(shù)據(jù)中心同樣重要,而對于現(xiàn)有的不同品牌的HDS9585和EMC CX700,它們互相之間無法實現(xiàn)基于磁盤卷的數(shù)據(jù)復(fù)制,無法直接在存儲間進(jìn)行在線的數(shù)據(jù)轉(zhuǎn)移,數(shù)據(jù)復(fù)制必須通過主機來實現(xiàn),造成效率低、結(jié)構(gòu)復(fù)雜。
問題2.容災(zāi)問題。
這個問題同時出現(xiàn)在HDS9585和EMC CX700上。如果沒有虛擬存儲的統(tǒng)一管理,將來實現(xiàn)異地容災(zāi)的時候,HDS9585和EMC CX700要通過各自的容災(zāi)機制分別建設(shè),但是這是不可能的,不僅因為多套不統(tǒng)一的容災(zāi)系統(tǒng)建設(shè)復(fù)雜,無法實現(xiàn)一致的容災(zāi)系統(tǒng)接口,管理、維護(hù)難度極高,而且從理論和實踐上,HDS9585和EMC CX700屬于中端模塊化產(chǎn)品,性能和功能等方面是根本無法支撐30-1000KM的異地容災(zāi)!
問題3.沒有存儲虛擬化帶來的其它問題
可以看出,與眾多的存儲整合項目一樣,本項目的存儲整合涉及了存儲系統(tǒng)設(shè)計的可靠性、可管理性、擴展性、性能、數(shù)據(jù)容災(zāi)復(fù)制等若干關(guān)鍵性環(huán)節(jié)。但是應(yīng)該注意到,與前期系統(tǒng)建設(shè)不同的是,目前階段的建設(shè)已經(jīng)躍升到一個新的層面,現(xiàn)階段需要的不僅僅是一個局限于設(shè)備參數(shù)的簡單方案,而是一個從實際業(yè)務(wù)應(yīng)用角度出發(fā)的,真正能夠解決存儲設(shè)備管理維護(hù)難度問題、設(shè)備可靠性問題、數(shù)據(jù)量膨脹問題、設(shè)備綜合利用等等問題的存儲一體化解決方案,以及一個著眼現(xiàn)狀、兼顧未來發(fā)展,融存儲系統(tǒng)的整合、管理、容災(zāi)安全保護(hù)為一身的長遠(yuǎn)系統(tǒng)規(guī)劃,以改善前期系統(tǒng)在建設(shè)、運行的過程中逐漸體現(xiàn)出來的若干問題。
項目主體需求體現(xiàn)在以下幾個方面:
在存儲管理方面,如何對數(shù)量龐大、日趨復(fù)雜的存儲系統(tǒng)設(shè)備進(jìn)行集中統(tǒng)一管理,如何利舊?
在 “分階段規(guī)劃、逐步實施”的整體建設(shè)指導(dǎo)原則下,數(shù)據(jù)中心的存儲系統(tǒng)在各個建設(shè)階段必然會引入不同型號、不同品牌、種類繁多的基本存儲設(shè)備。不同的設(shè)備在各個時期的重要性不同,隨著存儲技術(shù)的演化發(fā)展,舊設(shè)備的存儲能力會逐漸降低。系統(tǒng)建設(shè)面臨的問題是:隨著新系統(tǒng)、新設(shè)備的不斷引入,從成本控制的角度看,淘汰舊設(shè)備顯然是系統(tǒng)建設(shè)的下策。但是,在日益復(fù)雜的存儲環(huán)境中,舊設(shè)備的再度利用又會面臨管理界面復(fù)雜,管理成本上升的難題。依據(jù)現(xiàn)代存儲”數(shù)據(jù)生命周期管理”的理論,不同業(yè)務(wù)系統(tǒng)的數(shù)據(jù)在不同時間階段的重要性會發(fā)生很大的變化。因此,利用智能存儲的技術(shù)手段,將重要性降低的數(shù)據(jù)自動的重新部署到關(guān)鍵性降低的舊設(shè)備上,并通過一個統(tǒng)一的管理界面進(jìn)行各種舊設(shè)備的資源集中整合和統(tǒng)一規(guī)劃分配,是解決上述問題最為合理的途徑。
在性能方面,如何在存儲層面保證各省關(guān)鍵業(yè)務(wù)的響應(yīng)時間?
隨著應(yīng)用業(yè)務(wù)系統(tǒng)的逐步集中,業(yè)務(wù)重要性的不斷提升,關(guān)鍵業(yè)務(wù)對存儲系統(tǒng)的響應(yīng)時間也提出了嚴(yán)格的要求。BSS業(yè)務(wù)選擇的高端智能存儲設(shè)備,由于采用了先進(jìn)的技術(shù)架構(gòu),從IOPS、吞吐量等性能指標(biāo)來看完全可以滿足關(guān)鍵業(yè)務(wù)高峰流量的處理需求。但是,應(yīng)該注意到,各個不同的業(yè)務(wù)系統(tǒng)的建設(shè)目標(biāo)是為了滿足同需求,因此存儲數(shù)據(jù)的訪問需求是復(fù)雜多變的。當(dāng)各業(yè)務(wù)并行上線之后,各種數(shù)據(jù)業(yè)務(wù)必將互相競爭存儲資源。顯然,當(dāng)非關(guān)鍵業(yè)務(wù)的訪問需求臨時增大時,會增加對存儲系統(tǒng)內(nèi)部Cache、CPU、及總線等基本資源的占用,并直接影響到基于同一存儲系統(tǒng)的重要關(guān)鍵業(yè)務(wù)的I/O響應(yīng)時間。因此,在處理能力方面,智能存儲系統(tǒng)不僅需要滿足業(yè)務(wù)系統(tǒng)的基本處理需求,還需要進(jìn)一步面對業(yè)務(wù)系統(tǒng)中發(fā)生的各種動態(tài)訪問需求,保證最關(guān)鍵的業(yè)務(wù)系統(tǒng)保持擁有最穩(wěn)定的存儲服務(wù)質(zhì)量(QoS),并獲得最佳的I/O響應(yīng)時間。
在安全性方面,如何將存儲系統(tǒng)的可靠性提升到一個新的層面?
存儲系統(tǒng)是數(shù)據(jù)中心業(yè)務(wù)的生命線。隨著數(shù)據(jù)的全面集中,將形成海量級的數(shù)據(jù)存儲系統(tǒng)。龐大的存儲系統(tǒng)非常重要,對數(shù)據(jù)信息的可靠性、存儲設(shè)備的連續(xù)運轉(zhuǎn)能力提出了近乎苛刻的要求,底層存儲設(shè)備的任何缺陷都會成為數(shù)據(jù)丟失、業(yè)務(wù)中斷的重大隱患。經(jīng)過長時間的運行觀察,可以看出:以往使用的存儲設(shè)備在增加設(shè)備可靠性、減少日常管理維護(hù)難度等方面還存在較多需要改善的環(huán)節(jié),因此迫切需要采用新的技術(shù)手段來加固數(shù)據(jù)中心業(yè)務(wù)的數(shù)據(jù)基礎(chǔ),實現(xiàn)存儲系統(tǒng)可靠性的大幅度躍升。
如何規(guī)劃未來的容災(zāi)體系架構(gòu),最大程度的減少災(zāi)難引起的數(shù)據(jù)損失?
隨著數(shù)據(jù)的全面集中,存儲系統(tǒng)的正常安全運轉(zhuǎn),直接關(guān)系到信息系統(tǒng)的可靠性、安全性。應(yīng)該看到,系統(tǒng)建設(shè)的長遠(yuǎn)目標(biāo)必然是全面防范各種區(qū)域性電力中斷、地震、地域性疾病而建立的遠(yuǎn)距離異地容災(zāi)系統(tǒng),而異地容災(zāi)系統(tǒng)建設(shè)的技術(shù)復(fù)雜程度遠(yuǎn)遠(yuǎn)超過同城容災(zāi)系統(tǒng),其中,如何最大程度的減少異地數(shù)據(jù)的丟失、如何保證遠(yuǎn)程通信線路的傳輸速度和通信質(zhì)量、如何減少災(zāi)備系統(tǒng)對于生產(chǎn)系統(tǒng)性能的沖擊,如何減少災(zāi)備系統(tǒng)的建設(shè)成本并充分利用其資源緩解生產(chǎn)系統(tǒng)的壓力,是異地災(zāi)備系統(tǒng)需要解決的重大關(guān)鍵問題。
存儲系統(tǒng)整合后的狀況
圖示:HDS存儲虛擬存儲技術(shù)在新疆油田數(shù)據(jù)中心的應(yīng)用架構(gòu)
本項目實施后,在不影響原有系統(tǒng)的基本條件下,實現(xiàn)對現(xiàn)有SAN存儲環(huán)境的整合,具體來說,就是于現(xiàn)有的存儲系統(tǒng)HDS9585和EMC CX700,實現(xiàn)利舊并使用其存儲空間。
這個項目的實施解決了存儲整合前的一系列問題,達(dá)到了預(yù)期的設(shè)計目標(biāo),也使新疆油田數(shù)據(jù)中心成為中國石油內(nèi)部異構(gòu)存儲數(shù)據(jù)整合最成功和IT架構(gòu)最先進(jìn)的單位之一,也為未來在與烏魯木齊數(shù)據(jù)中心之間的異地容災(zāi)建設(shè)打下了很好的基礎(chǔ),為企業(yè)的可持續(xù)發(fā)展提供了數(shù)據(jù)基礎(chǔ)架構(gòu)級別的保障。
HDS虛擬存儲方案的優(yōu)勢
針對前面所述存儲系統(tǒng)的典型問題,HDS提供了基于高端磁盤陣列系統(tǒng)HDS NSC55的整體虛擬化存儲整合解決方案。HDS NSC55作為核心搭建的存儲系統(tǒng)架構(gòu)由三個層面組成:
應(yīng)用主機層–集中了所有的業(yè)務(wù)系統(tǒng)主機。
核心存儲和虛擬化引擎層–由HDS NSC55搭建。
異構(gòu)存儲池–由系統(tǒng)中的若干利舊設(shè)備,如HDS、EMC等廠商的各檔存儲設(shè)備組成。
上述的三層架構(gòu)實現(xiàn)的存儲優(yōu)化拓展功能包括:
1.核心引擎–滿足高性能及高可靠性需求。在上述三層架構(gòu)中,HDS NSC55智能控制器系統(tǒng)和磁盤子系統(tǒng)由HDS公司進(jìn)行統(tǒng)一設(shè)計,傳承了延續(xù)數(shù)代的高可靠性技術(shù)和高性能技術(shù),因此完全能夠擔(dān)負(fù)起整個存儲系統(tǒng)的核心指揮職能。HDS NSC55是全球最開放的、可連結(jié)多種主機平臺的高端存儲系統(tǒng),具有全球最好的可靠性、可用性、高帶寬和高性能系統(tǒng)表現(xiàn),提供100%的數(shù)據(jù)可用性,完全可以支持業(yè)務(wù)高吞吐和不停頓的運作,是業(yè)界性能最高、擴充能力最強、功能最多和最堅固的數(shù)據(jù)集中和計算以及容災(zāi)平臺。HDS NSC55是成熟、可靠的第三代產(chǎn)品,全球已有數(shù)千成功案例,其最關(guān)鍵的核心技術(shù),如”Cache鏡像”、”三層交換體系”、”Cache LUN”等,已經(jīng)有超過6年的歷史,在安全性方面,目前全球的使用情況是”零宕機”、”零數(shù)據(jù)丟失”。
2.存儲分區(qū)–增強數(shù)據(jù)可靠性及訪問性能。目前核心關(guān)鍵數(shù)據(jù)保存在HDS NSC55的內(nèi)置磁盤上。為了進(jìn)一步保證各省關(guān)鍵業(yè)務(wù)的存儲響應(yīng)時間,HDS NSC55可以端口、Cache以及磁盤為單位,劃分獨立的存儲分區(qū),形成數(shù)個存儲子系統(tǒng)與各業(yè)務(wù)相對應(yīng),在每個子系統(tǒng)內(nèi)部存儲資源的訪問可以被相應(yīng)的應(yīng)用業(yè)務(wù)所獨享,保證關(guān)鍵業(yè)務(wù)系統(tǒng)具有穩(wěn)定的I/O服務(wù)質(zhì)量。
3.存儲整合–通過存儲虛擬化技術(shù)實現(xiàn)利舊整合。在HDS NSC55自帶虛擬化引擎的驅(qū)動下,異構(gòu)存儲池被映射成HDS NSC55的內(nèi)部存儲資源。應(yīng)用主機層不必關(guān)心異構(gòu)存儲池的設(shè)備組成,只需使用面向HDS NSC55的統(tǒng)一接口就能夠透明的訪問異構(gòu)存儲池資源。HDS9585、CX700等舊的存儲設(shè)備被虛擬化管理以后,主機僅需要連接HDS NSC55即可同時訪問新、舊存儲,在HDS NSC55提供的統(tǒng)一連接通道上,由HDLM軟件實現(xiàn)統(tǒng)一的負(fù)載均衡及故障通道的自動切換,規(guī)避了在同一主機上多家負(fù)載均衡軟件并存帶來的不確定因素。
4.分級存儲–通過存儲虛擬化技術(shù)實現(xiàn)數(shù)據(jù)自動分級轉(zhuǎn)移部署。非關(guān)鍵的業(yè)務(wù)數(shù)據(jù)、以及隨著時間發(fā)展重要性漸漸降低的歷史數(shù)據(jù)被HDS NSC55虛擬化引擎逐步遷移到異構(gòu)存儲池中,關(guān)鍵業(yè)務(wù)數(shù)據(jù)、最新業(yè)務(wù)數(shù)據(jù)在HDS NSC55的自帶內(nèi)置硬盤空間上進(jìn)行保留。生產(chǎn)系統(tǒng)上用于統(tǒng)計查詢的原始數(shù)據(jù)可通過HDS NSC55的快照技術(shù)直接復(fù)制到異構(gòu)存儲池中,同時,測試數(shù)據(jù)也可通過HDS NSC55快照技術(shù)直接復(fù)制到異構(gòu)存儲池中。上述流程對主機完全透明,無需增加主機應(yīng)用的復(fù)雜性。
5.應(yīng)急系統(tǒng)聯(lián)機恢復(fù)–通過存儲虛擬化技術(shù)實現(xiàn)在線應(yīng)急恢復(fù)。利用HDS NSC55虛擬化引擎在線不停機進(jìn)行數(shù)據(jù)遷移的功能,虛擬化之后的CX700作為應(yīng)急系統(tǒng)啟用后,可在主機業(yè)務(wù)運行的情況下,在線轉(zhuǎn)移回到HDS NSC55主存儲系統(tǒng),無需調(diào)度生產(chǎn)業(yè)務(wù)系統(tǒng)的停機,整個流程對主機完全透明。
6.異構(gòu)系統(tǒng)災(zāi)備–通過存儲虛擬化技術(shù)實現(xiàn)異構(gòu)數(shù)據(jù)統(tǒng)一復(fù)制。系統(tǒng)的二期建設(shè)必然面臨災(zāi)備系統(tǒng)的實施。HDS NSC55虛擬化引擎的異構(gòu)容災(zāi)技術(shù),支持異構(gòu)存儲池中的任意存儲設(shè)備進(jìn)行遠(yuǎn)程互備,大大簡化了容災(zāi)系統(tǒng)的部署和管理。數(shù)據(jù)復(fù)制的方式是實時復(fù)制,能夠靈活的利用通信線路的帶寬,最大程度的減少數(shù)據(jù)損失,縮短異地數(shù)據(jù)庫系統(tǒng)和應(yīng)用系統(tǒng)的啟動時間。上述第三代數(shù)據(jù)復(fù)制技術(shù)基于USP強大的處理能力,可用來復(fù)制HDS9585、CX700等中低端存儲設(shè)備的數(shù)據(jù),彌補了中低端存儲設(shè)備性能、功能較差,無法支撐長距離異地復(fù)制的缺陷。
可以看出,本項目HDS采用HDS NSC55進(jìn)行虛擬化解決方案的部署,擺脫了 “存儲盒子(BOX)”級別的簡單方案,使其作為一個先進(jìn)的、功能全面的存儲平臺,完善業(yè)務(wù)系統(tǒng)的存儲架構(gòu),從而全面解決了數(shù)據(jù)中心在存儲管理方面面臨的諸多”難點”問題。