特大型高校書苑
浙江大學(xué)圖書館是我國歷史最長、規(guī)模最大的高校圖書館之一,其前身為建于1897年的求是書院藏書樓。今天的浙大圖書館由一個總館和分布在五個校區(qū)的五大分館構(gòu)成,整個圖書館的總建筑面積超過5.9萬平方米,總藏書量553萬余冊,在全國高校圖書館中名列前茅。
早在1999年,浙大圖書館便率先引進了先進的圖書館集成管理系統(tǒng)(Horizon),實現(xiàn)了總館與分館之間圖書的通借、通還服務(wù)。在電子資源方面,館方先后引進了52類、200多個數(shù)據(jù)庫,其中包含10多萬種電子圖書、9000多種中文電子期刊、8000多種外文電子期刊、10余萬篇論文以及一批事實數(shù)據(jù)庫。目前,浙大圖書館具有使用權(quán)的電子資源總量已接近國際著名高校圖書館的水平。
2003年,浙大圖書館與中國科學(xué)院研究生院共同牽頭承擔(dān)了“高等學(xué)校中英文圖書數(shù)字化國際合作計劃”(英文縮寫CADAL)建設(shè)項目。CADAL的目標是建設(shè)包含100萬冊圖書、并能夠接受世界范圍內(nèi)訪問的數(shù)字圖書館,它將與“中國高等教育文獻保障系統(tǒng)(CALIS)”共同構(gòu)成中國高教數(shù)字圖書館的總體框架。作為全國唯一一家牽頭組織CADAL項目的高校圖書館,浙大圖書館正在經(jīng)歷著建館以來規(guī)模最大的電子資源建設(shè)進程。
多樣化存儲需求
作為一家特大型高校圖書館,浙大圖書館面臨的電子資源存儲需求是非常復(fù)雜的;特別是隨著資源本身建設(shè)進程的加快,這種復(fù)雜性還在不斷增強,具體表現(xiàn)在:
一、存儲對象的分門別類
與一般高校的電子資源主要靠引進不同,浙大圖書館的電子資源中,自建的部分占相當(dāng)大的比重。這些“自建資源”包括館方自主創(chuàng)建的各類專業(yè)數(shù)據(jù)庫;以及為CADAL項目創(chuàng)建的大量電子資源。
與各類“引進資源”(包括購買的電子期刊、電子書)相比,自建資源具有兩大特點:一是它們的訪問頻率較高,特別是館方自建的專用數(shù)據(jù)庫(如館藏資源導(dǎo)航數(shù)據(jù)庫),由于它們專門面向本館用戶,因而訪問者特別多;二是它們的安全性要求高:“引進資源”一旦損壞或丟失,可以隨時從供應(yīng)商處得到補充;“自建資源”獨此一家,別無分號,因此一旦出問題,將造成無法彌補的損失。
鑒于自建資源與引進資源所需要的存儲環(huán)境不完全相同,館方希望能針對這兩種不同的資源,設(shè)計出最合理的組合式存儲方案,一方面,要引進先進的光纖存儲設(shè)施,為自建資源提供高性能架構(gòu)與高容災(zāi)能力,以確保這些核心數(shù)據(jù)的絕對安全,并支持對它們的高頻率訪問;另一方面,要充分考慮到性價比因素,充分運用各種存儲設(shè)施,對不同等級的需求提供不同等級的解決方案,妥善分類,分而儲之,以最少的投資,獲得最大化的效益。
二、資源總量的迅猛增長
無論是自建資源,還是引進資源,其總量都十分巨大。2002年CADAL項目啟動以前,浙大圖書館的電子資源總量已達到5TB的規(guī)模;項目啟動后,資源增長速度進一步加快;今后幾年中,各類電子資源的年均增量都將達到5TB以上,這種總量規(guī)模與增長速度在高校圖書館中都是十分罕見的。
長期以來,這些電子資源一直存儲在各系統(tǒng)自身所配載的硬盤之中,這種分散存儲狀態(tài)在存儲管理效率、數(shù)據(jù)安全性、系統(tǒng)穩(wěn)定性等許多方面均難以盡如人意。為了對已有資源的存儲環(huán)境加以整合,并考慮到增量資源的潛在存儲需求,浙大圖書館迫切需要建立一個不僅具有超大容量,而且具有良好擴展性的集中存儲架構(gòu)。
三、既有投資的保護與存儲技術(shù)的研究
一方面,浙大圖書館原有2套戴爾PV220S磁盤陣列和1套PV650光纖陣列,它們已經(jīng)支持著部分應(yīng)用。有鑒于此,館方要求在新的存儲方案設(shè)計中,要充分發(fā)揮PV220S陣列的作用,盡可能地保護既有投資。另一方面,浙大圖書館一直在進行著存儲應(yīng)用方面的研究,館方希望在新的存儲方案中合并采用SAN和DAS等不同的存儲方式,以測試其協(xié)同運作的效果。
多元化解決方案
為了應(yīng)對上述復(fù)雜的存儲需求,浙大圖書館與戴爾方面進行了多次探討;2003年10月,館方最終決定:全面應(yīng)用戴爾設(shè)備,建設(shè)一個包含SAN、DAS等兩種存儲方式的綜合解決方案。
該方案的設(shè)計思想如下:
該方案的具體內(nèi)容如下:
第一部分:以DELL|EMC CX600為中心的SAN集中存儲
SAN的前端為6臺戴爾PowerEdge服務(wù)器,其中,1臺為PE4600,4臺為PE2650, 1臺為PE6450。這些服務(wù)器的配置及功能如下:
SAN的后臺為1套DELL|EMC CX600光纖磁盤陣列,整個陣列配載了30塊146GB的10000轉(zhuǎn)光纖通道硬盤,分3個RAID組,均做RAID5,實際存儲容量為3.6TB。CX600承擔(dān)了上述各個系統(tǒng)的后臺數(shù)據(jù)存儲任務(wù),其中,自建資源的數(shù)據(jù)總量約有3TB。
在SAN內(nèi)部,前端與后臺之間通過2臺BROCADE 8口光纖交換機(DS8B2)實現(xiàn)連通;6臺服務(wù)器分別連接在不同的交換機上,其中5臺為單鏈路,只有1臺為雙冗余鏈路,其目的是測試兩種鏈路方式的穩(wěn)定性與效率差異。
第二部分:以戴爾PV220S為基礎(chǔ)的DAS補充存儲
DAS的前端為1臺戴爾PE2650服務(wù)器,它配備了2.4GHz雙英特爾®至強™處理器,1GB內(nèi)存,2塊73GB SCSI硬盤,負責(zé)支持“書生之家”電子圖書數(shù)據(jù)庫(C類資源)的運營服務(wù);DAS的后臺為2套PV220S磁盤陣列,存儲容量總計約3TB。
在DAS內(nèi)部,PV220S主要負責(zé)存儲“書生之家”電子書的全部數(shù)據(jù);此外,CADAL項目建設(shè)過程中所產(chǎn)生的大量臨時數(shù)據(jù),也通過LAN存入PV220S之中。目前,以上兩部分的數(shù)據(jù)規(guī)模已將近3TB。
多方面應(yīng)用效果
上述方案已于2003年底在浙大圖書館全面上線運行;近一年來的運行實踐表明,整個系統(tǒng)運行穩(wěn)定,對應(yīng)用需求的響應(yīng)效率也非常高。浙大圖書館數(shù)字資源建設(shè)中心主任黃晨先生認為,該方案的實施,達到了以下三個方面的效果:
首先,DELL|EMC CX600 SAN的引進,使浙大圖書館獲得了一個性能先進、長期穩(wěn)定的基本存儲架構(gòu)。對于這一點,黃先生解釋說:“DELL|EMC CX600既有頂級的存儲處理性能,又有強大的服務(wù)器支持性能,更有充裕的擴展空間,它的引進,不僅使我們的各類電子資源,尤其是其中珍貴的自建資源,實現(xiàn)了集中存儲,從而提高了存儲管理的綜合效率;更使我們的基本存儲架構(gòu)在相當(dāng)長的時期內(nèi)穩(wěn)定下來。有了穩(wěn)定的數(shù)據(jù)中心,我們就能在未來的幾年中徹底擺脫存儲瓶頸的束縛,把精力集中到自建資源和應(yīng)用的開發(fā)上來?!?BR>
其次,多元化的存儲布局,實現(xiàn)了最優(yōu)的性價比與最低的原始投入。黃先生說:“CX600 SAN是一種面向‘任務(wù)關(guān)鍵型’應(yīng)用的高端存儲方案,非常適合用來存儲關(guān)鍵性資源;而以PV220S為基礎(chǔ)的DAS存儲方案,則適合用來存儲總量大但重要性和訪問頻率都不太高的普通資源;兩種存儲手段的有機組合使不同的存儲對象真正實現(xiàn)了因‘需’制宜、各得其所,這樣做,不僅無損于應(yīng)用效果,而且極大地提高了系統(tǒng)的性能價格比。方案實施后,我們采用這兩種方式存儲的電子資源基本相當(dāng),整體核算下來,節(jié)省的投資極為可觀?!?BR>
最后,成功地實施了多項技術(shù)測試。黃先生介紹說:“在方案實施過程中,我們?nèi)婊诖鳡栐O(shè)備,對‘SAN和DAS的協(xié)同工作機制’,‘光纖通道與SCSI通道對不同數(shù)據(jù)類型的傳輸效果’,‘同一型號服務(wù)器在不同存儲環(huán)境中的工作性能變化’等許多課題進行了測試。測試結(jié)果不僅使我們對上述幾個問題有了更深入的把握,而且為我們?nèi)娼ㄔO(shè)浙大圖書館數(shù)據(jù)中心提供了重要的參考。與此同時,上述測試也使我們對戴爾的應(yīng)用與存儲方案充滿了信心?!?BR>
另據(jù)黃先生介紹:在剛剛過去的2004年10月,浙大圖書館完成了系統(tǒng)實施后的第一次擴容。此番擴容為CX600添加了一個陣列柜,柜中配載了15塊300GB的ATA硬盤,從而將存儲空間擴大了1倍多,使總存儲量達到了8個TB。擴容期間,數(shù)據(jù)在不同的存儲環(huán)境下,在光纖通道硬盤、SCSI硬盤、ATA硬盤之間頻繁地交換,而系統(tǒng)未發(fā)生任何故障。黃先生就此總結(jié)說:“此次擴容的成功,不僅證明了整個存儲方案的科學(xué)性,而且再次證明了戴爾設(shè)備,包括它的服務(wù)器與存儲設(shè)施,其質(zhì)量是可靠的。”