因為 IBM 的內存鏡像技術對內存錯誤的糾正是通過內存控制器來完成的,所以不會增 加操作系統(tǒng)的工作量,也不需要操作系統(tǒng)來提供支持,完全與操作系統(tǒng)無關。另因為只需采 用標準的 ECC 168 線內存,所以也無需另外購買定制的內存,也就無需為這種保護增加另 外的開支。

標準的 ECC 內存雖然可以檢測出 2 位的數(shù)據(jù)錯誤,但它只能糾正一位錯誤。如果同時在內存上有多位出錯,僅采用 ECC技術的整塊內存讀取就失敗了,此時唯有使系統(tǒng)臨時掛起來,以盡量減少內存容量的需求,直到這個節(jié)點被更換。如果采用內存保護技術,那么就可以立即隔離這個失效的內存,重寫數(shù)據(jù)在空余的數(shù)據(jù)位。通過這種方法可以在每 4 對 168 線內存中修復 4 個 4 位連續(xù)的內存錯誤,是前面介紹的 Chipkill 內存技術保護能力的兩倍。 而且它還還無需添加另外的硬件、無需增加額外的費用,獨立操作系統(tǒng)工作,也不會給系統(tǒng) 增加任何額外負擔。當服務器下次重啟就會重新檢查內存的狀態(tài),如果是內存軟錯誤(臨時 的),系統(tǒng)重啟后內存的這些用于在線數(shù)據(jù)備份的數(shù)據(jù)位就重新釋放了,恢復空的狀態(tài)。如果是屬于硬故障,這些在線備份數(shù)據(jù)位還會繼續(xù)用來備份,直到更換為止。這種先進技術可 以使減少停機時間, 使服務器持續(xù)保持高效的計算平臺。 這對于大型的數(shù)據(jù)庫系統(tǒng)中尤其重要。

分享到

zhaohang

相關推薦