最近,ODSP進(jìn)行了全新升級,帶來了大量的新特性。其中安全、效率方面的諸多特性讓人眼前一亮,給用戶帶來了更好的數(shù)據(jù)體驗(yàn)。今天,我們就來看一看ODSP升級后的特性。
IDDC2.0?用AI排查隱患盤
IDDC全稱是Initiative Disk Diagnosis Center,主動式磁盤診斷中心。不久前,宏杉科技發(fā)布IDDC2.0技術(shù),實(shí)現(xiàn)了磁盤預(yù)檢測中心、磁盤診斷中心、智能磁盤預(yù)警中心這三大功能。其中,智能磁盤預(yù)警中心是最大的看點(diǎn)。宏杉科技把AI技術(shù)引入到其中,通過篩查指紋、復(fù)位指紋、慢盤指紋、壽命指紋對隱患盤進(jìn)行預(yù)警排查,把隱患硬盤消滅在萌芽中。
眾所周知,硬盤是IT系統(tǒng)中最容易出現(xiàn)故障的器件。包括RAID在內(nèi)的硬盤保護(hù)機(jī)制大多是后處理型,也就是硬盤發(fā)生故障后進(jìn)行恢復(fù)。有沒有方法提前找出存儲設(shè)備中哪些磁盤存在隱患?宏杉科技對歷年來累積的用戶局點(diǎn)磁盤錯誤信息和現(xiàn)象、返廠故障盤分析等大量的工程數(shù)據(jù)做了專項(xiàng)分析,找到了其中一些規(guī)律,并基于這些規(guī)律研發(fā)了智能磁盤預(yù)警中心。根據(jù)分析大量工程數(shù)據(jù)找到的規(guī)律,智能磁盤預(yù)警中心定義了特征指紋,對于匹配到特征指紋的磁盤,采取不同的處理方案,進(jìn)行“修復(fù)”或者“預(yù)警”。其中,關(guān)鍵指紋如下:
篩查指紋:集成磁盤廠家的原廠檢測工具,采用先進(jìn)武器精準(zhǔn)篩查故障盤。
復(fù)位指紋:根據(jù)數(shù)據(jù)流上實(shí)時錯誤,立即修復(fù)磁盤。
慢盤指紋:一旦發(fā)現(xiàn)慢盤,立即處理。
壽命指紋:根據(jù)磁盤使用情況,預(yù)測壽命。
將AI技術(shù)進(jìn)入到隱患盤的排查,使得提前預(yù)測硬盤故障成為一種可能。當(dāng)前IDDC 的智能磁盤預(yù)警中心只是牛刀小試。隨著不斷的實(shí)踐深入,一定會給我們帶來更大的驚喜。
復(fù)制、鏡像、雙活、快照、克隆 更全面地應(yīng)對軟災(zāi)難和硬災(zāi)難
數(shù)據(jù)保護(hù)和災(zāi)備是存儲系統(tǒng)的重要功能。在已有的復(fù)制、鏡像、雙活、快照、快照視圖特性的基礎(chǔ)上,ODSP2.0又新增了克隆、本地鏡像、本地復(fù)制等功能,使得功能更加完善??粗@些生硬又相近的名字,是不是感覺有點(diǎn)暈?看看下面這種圖,大概就清楚了。
“軟災(zāi)難”,故名思議,指“軟”的災(zāi)難,通常指由于誤操作、軟件Bug、病毒等導(dǎo)致生產(chǎn)數(shù)據(jù)邏輯上損壞或者不能讀取。比如:近期讓人崩潰的勒索病毒就屬于“軟災(zāi)難”?!坝矠?zāi)難”,則是指“硬”的災(zāi)難,通常指硬盤故障導(dǎo)致RAID故障、設(shè)備故障(包括硬件故障、臺風(fēng)、暴雨、地震、火災(zāi)等不可抗因素)等情況下,生產(chǎn)數(shù)據(jù)卷中數(shù)據(jù)物理上被破壞。
快照和快照視圖功能是傳統(tǒng)數(shù)據(jù)保護(hù)特性之一,也是應(yīng)對“軟災(zāi)難”的神器。通過快照和快照視圖功能,可以為每份數(shù)據(jù)提供2048個歷史時間點(diǎn)記錄,確保有可恢復(fù)的時間點(diǎn)數(shù)據(jù)。當(dāng)然,從節(jié)省空間維度考慮,快照技術(shù)是增量的,不是全量的。而克隆技術(shù)則為數(shù)據(jù)提供了一份全量的數(shù)據(jù)保護(hù)。也就是由生產(chǎn)卷和克隆卷構(gòu)成一個克隆對,克隆卷是生產(chǎn)卷某個時刻的映像。傳統(tǒng)克隆技術(shù)是單向的,只能從生產(chǎn)卷->克隆卷進(jìn)行數(shù)據(jù)同步。宏杉科技的克隆技術(shù)卻是雙向的,支持生產(chǎn)卷->克隆卷、克隆卷->生產(chǎn)卷兩種同步模式。換言之,生產(chǎn)卷、克隆卷兩者同等重要,需要哪個就從哪個恢復(fù)。
在應(yīng)對硬災(zāi)難方面,復(fù)制、鏡像、雙活是常用的數(shù)據(jù)保護(hù)技術(shù),基于功能都是在主備數(shù)據(jù)卷之間進(jìn)行數(shù)據(jù)同步。三者的差異在于:
復(fù)制:主備卷數(shù)據(jù)傳輸是異步進(jìn)行,數(shù)據(jù)有一定的差異量。
鏡像:主備卷數(shù)據(jù)傳輸是同步進(jìn)行,數(shù)據(jù)完全一致。但不能自動切換。
雙活:主備卷數(shù)據(jù)傳輸是同步進(jìn)行,數(shù)據(jù)完全一致,且能自動切換。
在此基礎(chǔ)上,針對災(zāi)難發(fā)生位置的不同,宏杉科技提供了兩個系列的方案。如果硬災(zāi)難發(fā)生在一套設(shè)備內(nèi)部,比如RAID失效等,通過本地復(fù)制、本地鏡像、克隆來應(yīng)對。如果整套設(shè)備甚至數(shù)據(jù)中心站點(diǎn)發(fā)生災(zāi)難,可通過復(fù)制、鏡像、雙活來應(yīng)對。
更重要的是,這些災(zāi)難應(yīng)對技術(shù)不是孤立的,而是可以組合使用的。比如采用雙活+復(fù)制+快照,可實(shí)現(xiàn)“二地三中心”的災(zāi)難應(yīng)對方案。基于ODSP的這些豐富的數(shù)據(jù)保護(hù)和災(zāi)備特性,可全面應(yīng)對各種軟硬災(zāi)難。
巡檢機(jī)器人和告警定制 給運(yùn)維方式來一個“私人定制”
用戶IT運(yùn)維人員面臨的最大挑戰(zhàn)是7*24小時不停機(jī),業(yè)務(wù)必須保證連續(xù)性等常見需求,運(yùn)維人員不得不時刻緊繃神經(jīng)惦記著IT系統(tǒng)運(yùn)行是否正常。
巡檢是常用的運(yùn)維方式,通過巡檢可提前排查并處理IT系統(tǒng)中是否存在隱患,以避免IT異常帶來不可控的影響。宏杉的巡檢機(jī)器人可以自動化執(zhí)行,自動巡檢,替代運(yùn)維人工操作。升級后的ODSP平臺能夠更好的兼容巡檢機(jī)器人,可巡檢的范圍更廣,可巡檢的科目更多了。
系統(tǒng)運(yùn)維的另外一個重要方式就是告警,當(dāng)IT系統(tǒng)運(yùn)行過程中出現(xiàn)異常時,通過告警可以讓運(yùn)維人員在第一時間接收到異常信息,以便盡快進(jìn)行處理,控制異常影響范圍。面對不同的告警需求,宏杉升級了ODSP軟件架構(gòu)中告警模塊。
ODSP針對存儲設(shè)備中所有模塊,包括SPU、DSU、電源模塊、風(fēng)扇模塊、電池模塊、磁盤模塊、RAID、LUN、快照、復(fù)制等,分別定義了完備的告警事件。告警事件多達(dá)數(shù)百個。告警方式有指示燈告警、蜂鳴器告警、管理界面告警、郵件告警、SNMP Trap告警、短信告警等6種。
如果所有的告警都通過所有的方式通報(bào)出去,那么告警管理將會是災(zāi)難性的。在ODSP升級后,告警方式可以按需定制了。針對每一個告警事件,運(yùn)維人員可按實(shí)際需求設(shè)置對應(yīng)的告警級別,并設(shè)置是否觸發(fā)各項(xiàng)告警功能的開關(guān)。這樣就使得管理員在選定的時刻可以及時了解到自己所關(guān)心和所需要的告警信息,而不會被其他告警信息所影響。這樣的告警方式,完全就是一個運(yùn)維的“私人訂制”。
ODSP全新升級,給存儲系統(tǒng)帶來了更多的安全、效率保障。正如本文開頭所說,宏杉科技作為一家專業(yè)的存儲系統(tǒng)及解決方案供應(yīng)商,在保障存儲系統(tǒng)安全性、提高系統(tǒng)效率的道路上永不停歇!
最后,還得報(bào)告一下,ODSP升級之后,操作界面已經(jīng)升級為B/S,而且看著還挺簡潔順眼的。入門級技術(shù)水平,基本看懂并上手操作,工程師大牛們用起來應(yīng)該更是得心應(yīng)手了。歡迎新老用戶升級體驗(yàn)。