近年來存儲數(shù)據(jù)呈現(xiàn)驚人的成長,存儲設備為了適應各種新的運用需求??從而使得虛擬帶庫,高清非線編,數(shù)據(jù)化監(jiān)控系統(tǒng)等等不斷出現(xiàn)令人興奮地發(fā)展。存儲設備不但可支持更高速的傳輸,更大的容量存儲,及更高的I/O存取,而且相對應的對數(shù)據(jù)保護的技術也有所進展??如snap shot、CDP等等。操作系統(tǒng)也增進了對存儲設備的支持,如Microsoft Windows 2003推出了一系列對存儲技術的支持,如VSS,VDS,MPIO 等。在各廠商的積極創(chuàng)新與努力推展下,各家的儲存設備功能變得更強大,總體持有成本也有顯著的降低。但性價比的提供,不代表使用者就能有效地去駕御他所擁有的存儲設備,就能充分的應用其功能去解決所面臨的IT困境。我們希望能提供一些想法與建議去幫助存儲設備的使用者如何去規(guī)劃適用的盤陣功能。

你的傳統(tǒng)盤陣真的發(fā)揮了它的功能,解決了您的問題嗎?

九成以上盤陣的使用者通常在系統(tǒng)安裝完成后,便不再去進行盤陣系統(tǒng)功能的變更了。

我想有幾種原因:


以上幾點有必要進行澄清與糾正.


一般傳統(tǒng)盤陣的選擇不外乎取決于幾點:


有幾點是我們必須要考慮的:


針對個別的應用必須有相對應的優(yōu)化參數(shù)設定

I/O的模式:


減少任何可能造成系統(tǒng)增加MTBF的機會

○ 使用者可以因任務的需求來選擇合適的硬盤,在在線的服務上,需要的是高I/O傳輸,loading會較重,他可以選擇Fibre硬盤及SCSI硬盤,而近線及offline的應用,就可以用較經(jīng)濟的SATA硬盤來配合,SAS的盤陣出現(xiàn)又帶給企業(yè)更具彈性的解決方案,使用者可以在同一個盤陣系統(tǒng)進行SAS及SATA硬盤的配置,最后,除了選擇合適容量的硬盤之外,還必須要考慮硬盤與盤陣系統(tǒng)的兼容性;

圖示一:硬盤應用示意圖



○ RAID 設定:提供多種的容錯RAID設定,以減少硬盤故障可能影響系統(tǒng)的可用性,尤其RAID6可允許同時有兩個硬盤發(fā)生故障,更大大的提高可用性;

○ 系統(tǒng)的環(huán)境及偵測:企業(yè)的IT環(huán)境必需,一個好的盤陣系統(tǒng)陣RAID的功能外,還必須俱備一個穩(wěn)定持續(xù)的系統(tǒng)環(huán)境.因為硬盤在長時間的高速存取會產(chǎn)生高溫,讀取頭會因些許的振動而導致撞擊盤片而造成數(shù)據(jù)的損毀.好的盤陣必須能夠保持系統(tǒng)散熱,風流,電壓,電流的持續(xù)穩(wěn)外,更要能夠偵測整體的狀況,當不穩(wěn)定狀況發(fā)生時,還能保持系統(tǒng)及數(shù)據(jù)完整,并能通知管理者清楚的事件反應,讓管理者能迅速做適當?shù)奶幹靡耘懦收弦驗椋?br />

I、 二段式風扇設計:溫度過高,風扇自動切換高轉速

II、事件反應機制:當溫度過高,風扇故障,控制器故障時切換快取模式,或執(zhí)行系統(tǒng)關機,以保護整體系統(tǒng)

○ 無壞點考慮(無單點故障設計:由服務器至盤陣-叢集節(jié)點,端口,多路徑,交換機,冗余控制器,冗余電源,冗余風扇)。

○ 容易服務的模塊化的設計:重要組件的故障常導致系統(tǒng)無法繼續(xù)提供服務,或可能導致系統(tǒng)處于不安全的狀態(tài) ,如盤陣控制器,BBU,電源供應器,風扇模塊,硬盤模塊等,要讓重要組件能夠被輕易地更換,迅速排除故障,以繼續(xù)提供服務。

圖示二:無壞點及易維護的模塊化設計


圖示三:系統(tǒng)的環(huán)境及偵測


數(shù)據(jù)安全的保障:

理由:

一般使用者在規(guī)劃RAID時,較常使用的是RAID5,而其它常見的則會有RAID1,RAID3,RAID4 等等,這些RAID level允許至多一塊盤故障,并能重建數(shù)據(jù),可是很不辛的事,常見的情況如下:當一個屬于RAID5的硬盤發(fā)生故障時,系統(tǒng)管理者嘗試換上一塊新的硬盤 或以現(xiàn)有的熱備援硬盤進行RAID的重建。但是很不幸在重建過程中在另一塊硬盤上遇到壞塊,而根據(jù)RAID的同位運算奇偶校驗功能,他只允許一個條帶是壞的,才能重新產(chǎn)生原來的數(shù)據(jù),這個壞塊將造成RAID在被重建的硬盤里無法重建數(shù)據(jù),導致這些數(shù)據(jù)永遠遺失。若只遇到少數(shù)的壞塊,并且這筆數(shù)據(jù)是關于系統(tǒng)開機或重要的系統(tǒng)文件的,則可能造成無法開機的狀況。要避免這種情況發(fā)生可采用下面的方式來避免:

方式:

○ 重建奇偶校驗碼:

可使用盤陣的奇偶校驗功能,他的原理很簡單,就是將RAID上的數(shù)據(jù)每一個軌道讀出來重新進行奇偶校驗,在讀取的過程中就能先發(fā)現(xiàn)壞塊,而在邏輯硬盤還未處于降級狀態(tài)時,這個壞塊上讀不出來的數(shù)據(jù)是可以重新產(chǎn)生的,將其余硬盤上的數(shù)據(jù)進行奇偶校驗運算去還原數(shù)據(jù),再回寫入壞塊. 通常磁性媒體上的壞塊是所謂的瞬時的壞塊,可以借由寫的動作將壞塊覆蓋。若該壞塊無法用寫的動作去修復,則盤陣會啟動硬盤的重新分配地址功能,去另行配置保留的扇區(qū)與壞塊的地址進行交換,由這個扇區(qū)去取代壞塊,下次存取這壞塊位置時,實際是存取這個新的扇區(qū)

○ 盤片掃描:

盤陣的奇偶重建功能,原理很簡單,可是有個問題,因為它會消耗盤陣控制器的運算及占用內(nèi)部頻寬,當執(zhí)行奇偶重建等于是對整個邏輯硬盤的重建,會嚴重影響整體系統(tǒng)的性能. 盤片掃描是一個較好的壞塊偵測方式,是由盤陣控制器下命令叫硬盤自己執(zhí)行校驗檢查,當硬盤自己檢查過程中就能先發(fā)現(xiàn)壞塊,而在邏輯硬盤還未處于降級狀態(tài)時,這個壞塊上讀不出來的數(shù)據(jù)是可以重新產(chǎn)生的,將其余硬盤上的數(shù)據(jù),和進行奇偶校驗運算去還原數(shù)據(jù),再回寫入壞塊. 通常磁性媒體上的壞塊是所謂的瞬時的壞塊,可以借由寫的動作將壞塊覆蓋. 若該壞塊無法用寫的動作去修復,則盤陣會啟動硬盤的重新分配地址功能,去另行配置保留的扇區(qū)與壞塊的地址進行交換,由這個扇區(qū)去取代壞塊,下次存取這壞塊位置時,實際是存取這個新的扇區(qū)

圖示四:盤片掃描


○ 預定盤片掃描:

盤片掃描可以預先發(fā)現(xiàn)壞塊,避免壞塊造成數(shù)據(jù)在邏輯硬盤處于降級狀態(tài)模式時丟失,并且只用很少的盤陣控制器來操作。 但我們認為若能將其何時執(zhí)行,持續(xù)執(zhí)行進行自動化操作才能對數(shù)據(jù)提供更好的保護. 這是就要有所謂的盤片掃描時間表,我們可以借由盤片掃描時間表提供彈性的時程安排去執(zhí)行盤片掃描,例如可以按排不同部門的數(shù)據(jù)盤,在不同時段,或非工作時間去執(zhí)行盤片掃描,可以更充分地利用盤陣控制器的運算能力及頻寬,

圖示五:預定盤片掃描



彈性的RAID設定:

RAID 的選擇:在安裝盤陣時就會預先規(guī)畫應該實行什么樣的RAID來作為數(shù)據(jù)的存儲空間,以下對各種不同的RAID level作一個簡述

RAID Level 0即數(shù)據(jù)分割,是最基本的方式。在一個普通硬盤驅動器上,數(shù)據(jù)被存儲在同一張盤的連續(xù)扇區(qū)上。RAID 0至少使用兩個磁盤驅動器,并將數(shù)據(jù)分成從512字節(jié)到數(shù)兆字節(jié)的若干塊,這些數(shù)據(jù)塊被交替寫到磁盤中。第1段被寫到磁盤1中,第2段被寫到磁盤2中,如此等等。當系統(tǒng)到達數(shù)據(jù)中的最后一個磁盤時,就寫到磁盤1的下一分段,以下如此。

分割數(shù)據(jù)將I/O負載平均分配到所有的硬盤。由于硬盤可以同時寫或讀,性能得以顯著提高。但是它卻沒有數(shù)據(jù)保護能力。如果一個磁盤出故障,數(shù)據(jù)就會丟失。RAID 0不適用于關鍵任務環(huán)境,但它卻非常適合于視頻生產(chǎn)和編輯或圖像編輯。

RAID Level 1是磁盤鏡像??寫到磁盤1中的一切也寫到磁盤2中,從任何一個磁盤都可以讀取。這樣就提供了實時備份,但需要的磁盤驅動器數(shù)量最多,不能提高性能。RAID 1在多用戶系統(tǒng)中提供最佳性能和容錯能力,是最容易實施的配置,這最適用于財務處理、工資單、金融和高可用數(shù)據(jù)環(huán)境。

RAID Level 3包括數(shù)據(jù)分割,另外,它還指定一個硬盤來存儲奇偶信息。這就提供了某種容錯功能,在數(shù)據(jù)密集型環(huán)境或單一用戶環(huán)境中尤其有益于訪問較長的連續(xù)記錄。RAID 3需要同步主軸硬盤來預防較短記錄硬盤的性能下降。

RAID Level 5類似于Level 0,但是它不是將數(shù)據(jù)分成塊,而是將每個字節(jié)的位拆分到多個磁盤。這樣會增加管理費用,但是,如果一個磁盤出現(xiàn)故障,則它可以更換,數(shù)據(jù)可以從奇偶和糾錯碼中重建。RAID 5包括所有的讀/寫運行。它需要三到五個磁盤來組成數(shù)據(jù),最適合于不需要關鍵特性或幾乎不進行寫操作的多用戶系統(tǒng)。

RAID Level 6它使用特別的算法去產(chǎn)生二筆的Redundant 數(shù)據(jù)(我們稱之為P,Q),擴展了RAID 5。它能承受多個硬盤同時出現(xiàn)故障,但是,性能??尤其是寫操作卻很差,而且,系統(tǒng)需要一個極為復雜的控制器。(Infortrend EonStor 提供了P,Q 同時產(chǎn)生功能,提供了絕佳的RAID6效用。RAID5,RAID6性能差異近10%)

圖示六:RAID Level 示意圖







RAID 之間的切換

理由:

隨著企業(yè)的成長數(shù)據(jù)勢必也會不斷地增長,相關的擴充及備份方案必需因整體的IT環(huán)境去做調整,原來的RAID規(guī)劃可能是配合數(shù)據(jù)庫隨意運用。而現(xiàn)在的運用必需轉成對更大條帶大小的支持,或者原有只有RAID5的規(guī)劃,因新系統(tǒng)有RAID6的功能,在原來的做法上必須將原來的數(shù)據(jù)備分,再重建RAID邏輯硬盤,再將數(shù)據(jù)灌回。這樣做不但耗時而且不具彈性.

方法:RAID Migration:

盤陣可以提供所謂的RAID Migration或者RAID重建功能,RAID Migration可以讓系統(tǒng)管理者來改變邏輯硬盤的RAID級別. 它可以借由進行RAID邏輯硬盤數(shù)據(jù)的重新分配達成,更先進的盤陣還能在RAID Migration上提供條帶大小的變更. 可以更有彈性地為系統(tǒng)管者提供強大的功能,以應IT任務的需求。

圖示七:RAID Migration:


特殊運用的考慮:

a) 近線存儲的運用:在近線存儲的運用上,盤陣的角色是處于在線和離線的存儲設備之間,duty cycle的部分不像在線服務,而是隨時被叫用,在這種情況下,將硬盤馬達關閉的功能啟動,讓盤陣在系統(tǒng)閑置一段時間后就將硬盤的馬達關閉,而當服務器要存取盤陣時,盤陣控制器會自動喚醒馬達,立即回復服務功能,硬盤馬達關閉功能可以有效地減少電源的消耗,可以有效地節(jié)省總體的電源達50%以上.

圖示八:近線存儲的運用


b) 非線編及影音多媒體的運用:影音運用要求的系統(tǒng)能夠提供一個穩(wěn)定的性能來輸出,盤陣對每一個I/O的響應必須能夠及時快速,若處理I/O無法在適當?shù)臅r間響應,則會造成影音電影的播放畫面或影像播放停滯. 如下頁,在讀與寫的I/O可以看到很明顯的性能落差,這在多媒體的播放是不允許的。

c) Spiky read performance 


原因:盤陣的設計主要是為數(shù)據(jù)存儲做優(yōu)化處理,故在數(shù)據(jù)的處理上不是以主機端的最快響應速度為目的,其主要任務是保持數(shù)據(jù)的正確性,再將通用型的盤陣運用在媒體播放影音的運用中,最常見的問題有:

a) 硬盤的壞塊處理導致主機端來不及響應;

b) 混合的讀寫需求讓快取的切換來不及響應;

c) 對單一媒體流(通常是一個大的連續(xù)的的檔案,如電影影片)及多媒體流(如broadcast,IPTV)的優(yōu)化是無法同一對待的。

解決方法:

AV選項通常會有兩種優(yōu)化選項:單一媒體流和多媒體流。針對單一媒體流,盤陣控制器可從硬盤預讀較多的數(shù)據(jù)以供大的媒體流。而多媒體流的優(yōu)化則是盤陣控制器優(yōu)化內(nèi)存機制,避免讓多個服務同時落在同一硬盤,因此多媒體流可以盡可能被滿足。

a) 啟動盤陣的最多響應時間:只要RAID邏輯硬盤不是處于降級狀況,而硬盤本身在處理壞塊,或者其它原因無法在限定時間內(nèi)響應,盤陣控制器可立即由其它硬盤去算出數(shù)據(jù),并將其立即響應至主機端。

b) 設定對單一媒體流的優(yōu)化或多媒體流的優(yōu)化:針對任務的需求來設定單一媒體流的優(yōu)化或多媒體流的優(yōu)化,盤陣的內(nèi)存就能依據(jù)設定來進行最佳化管理。

c) 使用RAID 6也可避免因硬盤處理壞塊而導致的主機端來不及響應。

分享到

多易

相關推薦