虛擬磁帶庫就是在備份服務(wù)器或網(wǎng)絡(luò)端上體現(xiàn)為傳統(tǒng)磁帶庫的磁盤或磁盤陣列。
我們將用磁盤為備份介質(zhì)來存儲數(shù)據(jù),并且本身能夠仿真成物理磁帶庫的產(chǎn)品,稱之為虛擬磁帶庫。
真正的虛擬磁帶庫,其使用方式與傳統(tǒng)磁帶庫幾乎相同,但由于采用磁盤作為存儲介質(zhì),備份和恢復速度可達100MB/s以上,遠遠高于目前最快的磁帶機。同時,磁盤陣列的RAID保護技術(shù)使虛擬磁帶庫系統(tǒng)的可用性、可靠性均比普通磁帶庫高出若干量級。
虛擬磁帶庫的概念早在10余年前即已被IBM,StorageTek等著名存儲廠商所采用。然而,受限于磁盤和虛擬磁帶技術(shù)的發(fā)展,以及廠家為了保護其既有模擬磁帶庫市場的考量,長期以來虛擬磁帶庫以價格高昂著稱,使其通常作為大型磁帶庫的前端緩存使用,且依附于特定的主機系統(tǒng)(”封閉系統(tǒng)”),市場認知度一直很低。而在近些年,磁盤技術(shù)快速發(fā)展,出現(xiàn)了多種類型磁盤(SCSI、FC、ATA、SATA),使單位容量磁盤存儲的價格急劇下降,進而使磁盤陣列作為備份設(shè)備的應用也愈加廣泛。
磁盤備份 ≠ 虛擬磁帶庫
虛擬磁帶庫是磁盤備份的主流方式,但并非唯一方式。在使用磁盤介質(zhì)的備份解決方案中,還有一類被稱為”磁盤到磁盤(Disk to Disk)”的解決方案。
“磁盤到磁盤”的備份通常指以磁盤或磁盤陣列作為備份設(shè)備的備份數(shù)據(jù)存儲方式。
使用磁盤或磁盤陣列與使用虛擬磁帶庫的不同點在于,磁盤、磁盤陣列必需以主機相關(guān)的文件系統(tǒng)方式使用。因此,會存在以下幾個問題:
容易被誤刪除或被病毒感染;
文件系統(tǒng)讀寫低于裸設(shè)備讀寫,并且產(chǎn)生文件系統(tǒng)碎塊,進一步降低I/O效率;
以文件目錄方式存儲數(shù)據(jù),不便于結(jié)合成熟的基于磁帶庫的備份策略;
不便于在SAN環(huán)境中統(tǒng)一管理和優(yōu)化使用。
不支持磁盤陣列到磁帶庫直接的數(shù)據(jù)轉(zhuǎn)儲,必須借用備份管理軟件的備份數(shù)據(jù)或備份卷拷貝功能。
虛擬磁帶庫:系統(tǒng)可用性較磁帶庫提高若干量級
虛擬磁帶庫中,一般采用磁盤陣列作為后端存儲設(shè)備。磁盤陣列采用的RAID技術(shù)能夠保證當盤陣中某一塊磁盤出現(xiàn)故障時,盤陣上的數(shù)據(jù)仍然可以正常讀寫。用戶可以在線更換損壞的磁盤,然后對盤陣邏輯卷進行動重建。用戶亦可設(shè)置在線熱備盤,在出現(xiàn)一塊磁盤(RAID6可以同時出現(xiàn)兩塊磁盤)損壞時,RAID控制器可以自動隔離故障盤,并立即開始邏輯卷自動重建,實現(xiàn)自動在線熱恢復。保持了設(shè)備的連續(xù)可用性。
而磁帶庫的機械手、磁帶驅(qū)動器和磁帶均為非封閉的精密部件,也不具備容錯能力,很容易受灰塵、潮濕等環(huán)境因素的影響而導致故障。多個部件組合后整體系統(tǒng)的可用性將更低。
可用性低也就使維護成本提高。據(jù)統(tǒng)計,2002 年在美國磁帶庫的平均年維護成本高達磁帶庫采購成本的10~15%,尤其令用戶煩惱的是,磁帶庫修復必須由專業(yè)人員進行。維修反應時間長,常造成日常運營混亂。用戶常因此而被迫購買冗余磁帶驅(qū)動器 – 而驅(qū)動器恰恰是模擬磁帶庫中的主要昂貴部件,進一步加大了用戶的總體擁有成本。
虛擬磁帶庫:備份可靠性較傳統(tǒng)模擬磁帶庫提高若干量級
備份本身不是目的,必須能夠保障數(shù)據(jù)恢復,備份才有意義。而備份介質(zhì)的可靠性決定了備份數(shù)據(jù)的可靠性。磁盤是密封結(jié)構(gòu),而磁帶則暴露在空氣中,易受粉塵、濕度、磁粉、粘連、霉點等因素的影響,出現(xiàn)讀寫錯誤。所以磁盤的MTBF(平均無故障間隔)一般為磁帶的5倍以上。顯而易見,采用受RAID保護的磁盤陣列系統(tǒng)存放備份數(shù)據(jù),比只用單盤磁帶存放數(shù)據(jù)的可靠性要高得多。
為了提高磁帶存儲的可靠性,很多用戶采用磁帶復制方式,實現(xiàn)數(shù)據(jù)雙備份,這樣不僅費時費力,同時將造成額外的運營成本。
虛擬磁帶庫、磁帶庫、磁盤陣列的比較
作為傳統(tǒng)虛擬磁帶庫的一個有益的補充方案,SURESAVE虛擬磁帶庫通過光纖連接到備份服務(wù)器,為數(shù)據(jù)存儲提供了高速、高效的解決方案,致力于最小化用戶備份所需時間。更重要的是,它通過冗余和熱插拔設(shè)計保證了系統(tǒng)的不停頓,實現(xiàn)連續(xù)的備份。用戶利用現(xiàn)有的網(wǎng)絡(luò),幾步簡單步驟就能夠完成配置。這些特點保證了最小化用戶總體投資和最大化性能和商業(yè)投資回報。同為數(shù)據(jù)存儲設(shè)備,磁帶庫、磁盤陣列、虛擬磁帶庫在許多方面有差異。下表中將3種設(shè)備之間的不同進行對比。
虛擬磁帶庫技術(shù)與發(fā)展趨勢:
虛擬磁帶庫的主要實現(xiàn)方式
” 純軟件虛擬磁帶庫方案(第Ⅰ代D2D)
將磁帶庫模擬軟件直接安裝在備份服務(wù)器上,把備份服務(wù)器的某些文件系統(tǒng)分區(qū)模擬成磁帶庫,從而使備份軟件以磁帶庫方式使用磁盤文件系統(tǒng)。
此類方案下的備份磁盤暴露于主機的操作系統(tǒng),本質(zhì)上依然”在線” 。在用戶看來,依然在線的數(shù)據(jù)一定是不安全的。舉例來說,如果備份服務(wù)器不幸被病毒感染,該病毒完全可能在損毀在線磁盤上數(shù)據(jù)的同時,損毀備份盤陣上的數(shù)據(jù)。
另外,此類方案占用主機資源,性能受限。
這種方案多由備份管理軟件作為一個功能模塊提供,價格比較低廉。但由于受制于文件系統(tǒng),使其應用場合、I/O性能及數(shù)據(jù)安全性具有一定局限。
因此,此類方案主要用于備份緩存 – 也即先備份到磁盤,然后在服務(wù)器不忙時再將備份轉(zhuǎn)移到物理磁帶庫上。
” 專用服務(wù)器級虛擬磁帶庫方案(第Ⅱ代)
該方案實際上是另外一種虛擬磁帶庫的軟件實現(xiàn)方案:通過把虛擬磁帶庫管理軟件安裝在一臺獨立的專用服務(wù)器(一般是PC服務(wù)器)內(nèi),而將該服務(wù)器及所連接的磁盤存儲設(shè)備模擬成磁帶庫。
這種方式下,備份服務(wù)器或其它應用主機通過FC或SCSI與專用的服務(wù)器連接,此時專用服務(wù)器及所連接的磁盤存儲系統(tǒng)一起體現(xiàn)為虛擬磁帶庫(虛擬磁帶庫)。
與純軟件虛擬磁帶庫方案不同點是,備份服務(wù)器或應用服務(wù)器把專用服務(wù)器及其磁盤陣列當作了一臺磁帶庫設(shè)備,實現(xiàn)了虛擬磁帶庫設(shè)備與主機設(shè)備的物理和邏輯上的分離。主機對這種方案下的虛擬磁帶庫的讀寫方式是數(shù)據(jù)塊級(Block-Level)讀寫,比純軟件方案的讀寫速度快,并且不會從主機方對備份數(shù)據(jù)產(chǎn)生誤刪除操作,主機上的病毒也不會影響備份數(shù)據(jù)。
此類方案下,虛擬磁帶介質(zhì) – 磁盤邏輯卷, 不再是操作系統(tǒng)格式化的扇區(qū),而是和磁帶一樣的裸介質(zhì)(”raw disk”);其上備份數(shù)據(jù)也是按順序Byte to Byte存放的,在物理層上實現(xiàn)了磁盤讀寫的線性化,避免了文件系統(tǒng)的碎塊問題,充分利用了磁盤設(shè)備的高速I/O性能。
這種方案的不足是需要利用一臺具有一定擴充能力的PC服務(wù)器作為虛擬磁帶庫管理器,系統(tǒng)優(yōu)化性略低,另外控制器部分采用PC服務(wù)器結(jié)構(gòu),不夠精簡。
” 專用控制器級集成虛擬磁帶庫設(shè)備方案(第Ⅲ代)
將磁帶庫模擬管理軟件固化在特別設(shè)計的硬件設(shè)備中,就形成了專用的虛擬磁帶庫設(shè)備,這種設(shè)備需要配置一定數(shù)量和類型的主機接口和后端存儲磁盤陣列接口,有的專用虛擬磁帶庫設(shè)備還配置了歸檔磁帶庫接口。專用的虛擬磁帶庫設(shè)備硬件結(jié)構(gòu)與不同于PC服務(wù)器,設(shè)計采用了精簡的硬件模塊和精簡的操作系統(tǒng)內(nèi)核(一般為Linux內(nèi)核),并且充分考慮了與主機及存儲設(shè)備的連接能力。
專用的虛擬磁帶庫設(shè)備標志著虛擬磁帶庫技術(shù)終于突破了操作系統(tǒng)和PC服務(wù)器架構(gòu)的限制,使虛擬磁帶庫真正成為了一種獨立的外設(shè),其使用方式也更接近普通磁帶庫,而其優(yōu)越性能也體現(xiàn)得更加充分。
專用虛擬磁帶庫設(shè)備方案具有如下特點:
1) 性能大幅提高–可支持接近磁盤陣列極限速度的備份/恢復速度;
2) 免疫病毒–數(shù)據(jù)安全性等同普通磁帶庫;
3) 避免磁盤碎片–保障性能持續(xù)性;
4) 兼容性好–標準FC、SCSI或iSCSI接口設(shè)備,兼容流行的主機設(shè)備和操作系統(tǒng)。
5) 實用性好–與現(xiàn)有磁帶庫應用方式一致,不用更改現(xiàn)有存儲應用軟件的管理策略,保護用戶投資。