SIR,即單實例存儲 (Single Instance Repository),是飛康公司在虛擬磁帶庫 (VirtualTape Library, VTL)技術(shù)的重復數(shù)據(jù)刪除擴展。具備SIR性能 的 VTL 會對磁帶庫中的數(shù)據(jù)進行分析并創(chuàng)建一個僅包含唯一數(shù)據(jù)的單一實例的存儲庫,該過程即是“重復數(shù)據(jù)刪除”。重復數(shù)據(jù)之前占用的空間可釋放出來并用于其他用途。
2.如果只有單一實例,如何保護我的數(shù)據(jù)?
存儲庫會像其它關(guān)鍵存儲一樣通過鏡像和復制實施保護。內(nèi)置的同步鏡像功能,可用于預防本地磁盤故障。IPStor 的復制功能也可用于存儲庫,但在沒有VTL的情況下,存儲庫內(nèi)容毫無意義,因此可用 VTL 的復制選項代之進行存儲庫的復制,以實現(xiàn)集中管理和災(zāi)難恢復。
3.SIR 是否會導致備份作業(yè)變慢?
不會,當備份作業(yè)完全寫入虛擬磁帶后,才會進行重復數(shù)據(jù)刪除操作。具備SIR性能 的 VTL 的重復數(shù)據(jù)刪除對備份性能毫無影響。
4.SIR可以節(jié)省多少空間?節(jié)省的存儲空間如何處理?
存儲量節(jié)省幅度直接取決于數(shù)據(jù)本身以及用于保護數(shù)據(jù)的備份策略。一般而言,數(shù)據(jù)備份越頻繁且保留時間越長,使數(shù)據(jù)保持在線狀態(tài)所需存儲空間的節(jié)省幅度就越大。部分計劃處理程序會使用一個分析工具來計算特定環(huán)境中的實際重復數(shù)據(jù)量。
帶庫中釋放出的空間通常用于創(chuàng)建附加的虛擬磁帶,使更多數(shù)據(jù)保持更長時間在線,以在更長的時間內(nèi)提供更快的恢復速度。
5.市場中有的產(chǎn)品宣稱縮減比率達到 300 比 1,飛康SIR的縮減比率是多少?
不論其他公司的宣傳數(shù)據(jù)如何,任何重復數(shù)據(jù)刪除過程中的縮減量完全取決于單個數(shù)據(jù)和備份策略。我們也曾遇到縮減比率達到 1000 比 1 的重復數(shù)據(jù)刪除案例,但我們不會將它作為真實的代表案例來宣傳。對于一般的企業(yè)數(shù)據(jù)和備份策略,我們認為 30 比 1 更符合實際情況,但具體縮減比率會因公司而異。
6.出于安全考慮,目錄保存在哪里?
與 VTL 目錄一樣,SIR 目錄保存在自己的 LUN 上。兩者都可以使用同步鏡像來保護,以預防本地磁盤故障。由于VTL 的復制選項可對所有 SIR 內(nèi)容和元數(shù)據(jù)進行復制,因此可用于集中管理和災(zāi)難恢復。
7.VTL 如何知道何時進行重復數(shù)據(jù)刪除?
重復數(shù)據(jù)刪除策略與復制策略一樣是在 VTL 中設(shè)置的??梢詾檎麄€庫、庫中的磁帶組、甚至針對單個磁帶設(shè)置,觸發(fā)重復數(shù)據(jù)刪除的策略??梢愿鶕?jù)一天中的時間、卸載后時間、復制前時間、剩余庫容量、創(chuàng)建后保留時間長度等標準來設(shè)置策略。
8.如果磁帶正在進行重復數(shù)據(jù)刪除時有人需要使用該磁帶,怎么辦?
請求使用某個磁帶時,會暫停重復數(shù)據(jù)刪除處理。使用完畢并卸載虛擬磁帶后,SIR 會決定繼續(xù)還是重新啟動重復數(shù)據(jù)刪除。
9.如果寫入到已刪除重復數(shù)據(jù)的虛擬磁帶會怎樣?
具備SIR性能 的 VTL 不會更改虛擬磁帶的可訪問性。可以像平時一樣,對這些磁帶進行訪問、重新寫入或添加。重復數(shù)據(jù)刪除是獨立進行的。
10.重復數(shù)據(jù)刪除對復制有何影響?
由于 SIR 是 VTL 的擴展,所以 VTL 中的復制策略可以保持不變。由于只復制唯一數(shù)據(jù),所以具備SIR性能 的 VTL 復制效率更高,極大的減少降低了提供災(zāi)難恢復時對帶寬的需求。
當被復制到中央站點的虛擬索引磁帶所指向的數(shù)據(jù)塊尚不存在于中央存儲庫中時,何時復制新的數(shù)據(jù)塊?當中央 VTL SIR 發(fā)現(xiàn)存在新的唯一數(shù)據(jù)塊時,中央 SIR 會立即從遠程存儲庫中讀取并存儲這些新塊。
11.重復數(shù)據(jù)刪除有多快?
在我們的測試的配備雙核處理器和充足 RAM的服務(wù)器系統(tǒng)上,其重復數(shù)據(jù)刪除加上貯存的處理速度高達每節(jié)點 400 MB/sec,恢復速度為 480 MB/sec。
SIR 支持多節(jié)點集群以提高性能。對于首發(fā)的版本,可配置 1、2 或 4 節(jié)點集群。在今后的版本中,將增至 8 和 16 節(jié)點。
12.SIR 是否可以進行負載平衡?
可以。集群中的各成員將采用簡單的循環(huán) (round-robin) 法自動進行磁帶重復數(shù)據(jù)刪除。通過將相等大小的散列值子集分配給每個節(jié)點,將實際的數(shù)據(jù)存儲分散到集群。
13.恢復性能是否會受影響?
不會,從具備 SIR 性能的 VTL 復原與基礎(chǔ) VTL 中的速度一樣快。
14.通過 WAN 的恢復性能如何?
由于只有虛擬索引磁帶和唯一數(shù)據(jù)塊需要復制回來,因此使用 SIR 可大幅度提高通過 WAN 的復原性能。
15.高可用性如何?
SIR 可配置為具有主動/被動故障切換功能的 N+1 集群,以確保節(jié)點發(fā)生故障時仍具有高可用性。
16.如果需要的存儲量超出原來提供給 SIR 的量,怎么辦?
IPStor® 驅(qū)動的SIR具備了虛擬化技術(shù),所以可以不間斷地隨時增加存儲空間。
17.存儲庫應(yīng)使用什么類型的存儲器?
SIR 以歷經(jīng)驗證的 IPStor 技術(shù)為基礎(chǔ),所以它與存儲器連接類型或供應(yīng)商無關(guān)。選擇 FC 還是 SATA 磁盤存儲器取決于環(huán)境的性能和預算要求。我們建議多數(shù)用戶使用 FC 連接的陣列。
18.SIR 如何判斷數(shù)據(jù)是否重復?
SIR 使用眾所周知的 SHA-1 散列技術(shù),根據(jù)數(shù)據(jù)內(nèi)容計算出一個值。隨后與已存儲的數(shù)據(jù)散列值進行對比檢查。如果存在匹配,我們就有相當?shù)陌盐?,可以確定該數(shù)據(jù)與已存儲的某項內(nèi)容重復。即便某個塊發(fā)生很細微的變化,其散列值也會發(fā)生巨大變化,因此幾乎可以萬無一失地判定該數(shù)據(jù)的散列值是唯一的。SHA-1 散列算法與安全應(yīng)用程序無關(guān),因此即使SHA-1已經(jīng)破解,也可以保證數(shù)據(jù)的安全。
19.不同數(shù)據(jù)是否會具有相同的散列值?
是,但與您每天面對的其他風險危險相比,這種可能性微乎其微。即使是 16 PB 數(shù)據(jù),這種“散列沖突”的可能性也比磁帶或磁盤子系統(tǒng)中硬件故障導致的數(shù)據(jù)丟失可能性小 100,000 倍。數(shù)據(jù)量較小時,這種風險將更以指數(shù)方式降低。
20.重復數(shù)據(jù)刪除是否只能在單一虛擬磁帶上執(zhí)行?
不能,無論跨多個磁帶還是多個磁帶庫,都能刪除重復數(shù)據(jù)。事實上,如果將多個具備SIR性能的 VTL 系統(tǒng)復制到一個集中存儲庫,將跨系統(tǒng)隱刪除重復的數(shù)據(jù)。
21.是否可將一個 SIR 用于多個 VTL?
是。標準版 SIR 將重復數(shù)據(jù)刪除添加到標準版 VTL 系統(tǒng),并支持一對 HA 的 VTL。企業(yè)版 SIR 將重復數(shù)據(jù)刪除添加到企業(yè)版 VTL 環(huán)境中,它支持的標準版或企業(yè)版 VTL 系統(tǒng)數(shù)量不受限制。
22.SIR 是否可對 VTL 之前壓縮的虛擬磁帶進行重復數(shù)據(jù)刪除?
可以。SIR 是 VTL 的完全集成的擴展。
23.SIR 數(shù)據(jù)是否已壓縮?
否,因為這毫無實用價值。當觸發(fā)重復數(shù)據(jù)刪除的塊大小低于特定值時,無論您如何壓縮數(shù)據(jù),所用的物理存儲量都不會減少。
24.如何檢索已進行重復數(shù)據(jù)刪除的數(shù)據(jù)?
SIR 重復數(shù)據(jù)刪除是 VTL 的擴展,所以數(shù)據(jù)檢索方式不變。對于所有主機軟件和備份/恢復應(yīng)用程序,SIR 重復數(shù)據(jù)刪除都是透明的。
25.重復數(shù)據(jù)刪除是否會導致我的虛擬磁帶不再適用于物理磁帶?
重復數(shù)據(jù)刪除不影響虛擬磁帶與物理磁帶之間的關(guān)系。
26.刪除虛擬磁帶時,是否會從存儲庫中刪除數(shù)據(jù)?
如果所刪除的磁帶是對唯一數(shù)據(jù)的最后引用,則會刪除。如果其他磁帶仍需要該數(shù)據(jù),則不會。
27.是否可將已進行重復數(shù)據(jù)刪除的數(shù)據(jù)導出到物理磁帶?
可以。重復數(shù)據(jù)刪除不會更改或刪除任何 VTL 功能。
28.SIR 重復數(shù)據(jù)刪除對加密有何影響嗎?
已進行重復數(shù)據(jù)刪除的虛擬索引磁帶仍然可以使用加密選項,因為該選項本來就用于原來的虛擬磁帶。
29.是否提供測試模式,以便對縮減情況做出評估?
“測試模式”意味著已安裝 SIR。作為替代,我們將為存儲架構(gòu)師及合作伙伴提供一個分析工具,用于整體系統(tǒng)設(shè)計過程。這樣可根據(jù)特定環(huán)境的實際數(shù)據(jù)預計縮減幅度,而不是概括的宣傳數(shù)據(jù)。
它在數(shù)據(jù)流外進行離線重復數(shù)據(jù)刪除,可實現(xiàn)存儲經(jīng)濟效益,同時不會影響備份窗口。
30.具備SIR性能 的 VTL 有哪些典型優(yōu)勢?
無需更改數(shù)據(jù)保護策略、步驟或軟件—實現(xiàn)最大資產(chǎn)價值保護
與 VTL 無縫集成,實現(xiàn)即時、不間斷部署
無需安裝代理,將部署復雜性和客戶端性能影響降至最低
在最大程度上消除冗余部分,將資源需求降至最低,成本得到降低
高效存儲,在更長的時間內(nèi)保留更多在線數(shù)據(jù)
異地數(shù)據(jù)遷移成本更低、時間更短,實現(xiàn)最大程度的災(zāi)難恢復
集中式存儲庫,便于磁帶整合與集中管理
可識別備份磁帶格式,實現(xiàn)重復數(shù)據(jù)刪除的最大效率
根據(jù)數(shù)據(jù)和備份策略,存儲和帶寬縮減率達 30 比 1
N+1 集群,可實現(xiàn)高性能和最短停機時間
提供套裝軟件或整體應(yīng)用解決方案 (Turnkey Appliance) 的形式,供用戶部署