數(shù)字圖書館定義


    數(shù)字圖書館在本質(zhì)上就是一個(gè)集數(shù)據(jù)庫(kù)應(yīng)用平臺(tái)、信息資源電子商務(wù)平臺(tái)與資源數(shù)字化加工服務(wù)平臺(tái)于一體的巨大數(shù)據(jù)倉(cāng)庫(kù),以互聯(lián)網(wǎng)為平臺(tái),面向全球用戶提供基于內(nèi)容的服務(wù)。作為圖書館發(fā)展的方向,數(shù)字圖書館應(yīng)以統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范為基礎(chǔ)、以數(shù)字化的各種信息為底層、以分布式海量資源庫(kù)群為支撐、以智能檢索技術(shù)為手段、以電子商務(wù)為管理方式,以寬帶高速網(wǎng)絡(luò)為傳輸通道,將豐富多彩的多媒體信息傳遞到千家萬戶。但是,隨著數(shù)字圖書館事業(yè)的不斷進(jìn)展,由于理念和思路的不同,各家數(shù)字圖書館的模式也有很大的不同。


    Soul對(duì)數(shù)字化圖書館的定義為:


    在互聯(lián)網(wǎng)的支撐下,以內(nèi)容管理為核心,以海量信息處理、知識(shí)發(fā)現(xiàn)與加工交流為主要技術(shù)手段的智能知識(shí)服務(wù)基礎(chǔ)平臺(tái),是運(yùn)行在互聯(lián)網(wǎng)上的、超大規(guī)模的、便于使用的、沒有時(shí)空限制的知識(shí)中心。


    背景資料


    數(shù)字圖書館是采用現(xiàn)代高新技術(shù)所支持的數(shù)字信息資源系統(tǒng),是下一代因特網(wǎng)上信息資源的管理模式,將從根本上改變目前因特網(wǎng)上信息分散不便使用的現(xiàn)狀。通俗地說,數(shù)字圖書館是沒有時(shí)空限制的、便于使用的、超大規(guī)模的知識(shí)中心。


    作為知識(shí)經(jīng)濟(jì)的重要載體,數(shù)字圖書館是國(guó)家信息基礎(chǔ)設(shè)施重要組成部分,目前已成為評(píng)價(jià)一個(gè)國(guó)家信息基礎(chǔ)水平的重要標(biāo)志和本世紀(jì)各國(guó)文化科技競(jìng)爭(zhēng)的焦點(diǎn)之一。對(duì)于我國(guó)來說,數(shù)字圖書館的研發(fā)起步較晚,因此,建設(shè)數(shù)字圖書館更加具有必要性和緊迫性。其重要意義在于:


    首先,數(shù)字圖書館將改變以往信息存儲(chǔ)、加工、管理、使用的傳統(tǒng)方式,借助網(wǎng)絡(luò)環(huán)境和高性能計(jì)算機(jī)等實(shí)現(xiàn)信息資源的有效利用和共享。它的建設(shè)將使我國(guó)在綜合國(guó)力的競(jìng)爭(zhēng)中搶占先機(jī),掌握發(fā)展的主動(dòng)權(quán),實(shí)現(xiàn)跨越式發(fā)展。


    其次,數(shù)字圖書館建設(shè)的核心是以中文信息為主的各種信息資源,它將迅速扭轉(zhuǎn)互聯(lián)網(wǎng)上中文信息匱乏的狀況,形成中華文化在互聯(lián)網(wǎng)上的整體優(yōu)勢(shì)。我們要通過數(shù)字圖書館的建設(shè),將我國(guó)悠久的歷史、燦爛的文化,特別是當(dāng)代建設(shè)的成就通過互聯(lián)網(wǎng)向全世界展示,讓世界了解中國(guó),讓中國(guó)走向世界。


    第三,數(shù)字圖書館的建設(shè)將促進(jìn)我國(guó)信息技術(shù)的發(fā)展,同時(shí)帶動(dòng)與之相關(guān)的計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、通訊技術(shù)和多媒體技術(shù)等各項(xiàng)高新技術(shù)的迅速發(fā)展。這些高新技術(shù)迅速轉(zhuǎn)化為現(xiàn)實(shí)生產(chǎn)力, 將對(duì)我國(guó)知識(shí)創(chuàng)新體系的建立起到極大的促進(jìn)作用。


    第四,數(shù)字圖書館建設(shè)是”科教興國(guó)”戰(zhàn)略的源泉和動(dòng)力,也是實(shí)現(xiàn)公民終身教育的大課堂。數(shù)字圖書館以其對(duì)信息資源的整理加工和有序組織,為”科教興國(guó)”戰(zhàn)略提供了最為便捷、有效的發(fā)展環(huán)境。同時(shí),數(shù)字圖書館可以最大限度地突破時(shí)空限制,營(yíng)造出進(jìn)行全民終身教育的良好環(huán)境,對(duì)于我國(guó)國(guó)民素質(zhì)教育將起到巨大的提升作用。


    第五,數(shù)字圖書館將改變目前圖書館的工作方式和服務(wù)模式。數(shù)字圖書館可以更好地履行圖書館在倡導(dǎo)、組織和服務(wù)全民讀書中的重要職能。圖書館館員將成為捕捉和整理信息的專家,讀者可以在世界各地通過網(wǎng)絡(luò)閱覽數(shù)字圖書館中的豐富信息。圖書館的發(fā)展將進(jìn)入一個(gè)前所未有的新階段,發(fā)生根本性的變化。


    系統(tǒng)原理


    從系統(tǒng)結(jié)構(gòu)上看,數(shù)字圖書館是一個(gè)以數(shù)據(jù)存儲(chǔ)系統(tǒng)為核心和低層支持,配合業(yè)務(wù)應(yīng)用系統(tǒng)進(jìn)行多功能數(shù)據(jù)查詢服務(wù)的大型數(shù)據(jù)庫(kù)應(yīng)用解決方案。在數(shù)字圖書館中,數(shù)據(jù)的存儲(chǔ)和管理是整個(gè)系統(tǒng)的核心部件,一切的應(yīng)用服務(wù)全部由處于核心位置的數(shù)據(jù)存儲(chǔ)和管理系統(tǒng)來支撐。為了便于理解,我們將從兩個(gè)方面來分析數(shù)字圖書館的系統(tǒng)原理。


    數(shù)字圖書館的業(yè)務(wù)應(yīng)用體系


    從數(shù)字圖書館業(yè)務(wù)應(yīng)用的角度看,一個(gè)完整的數(shù)字圖書館應(yīng)該由三個(gè)層次組成:


    1. 元數(shù)據(jù)服務(wù)器和對(duì)象服務(wù)器;


    2. 圖書館應(yīng)用系統(tǒng)


    3. 具體應(yīng)用部件


    在數(shù)字圖書館中,數(shù)據(jù)庫(kù)的管理和操作是最核心的問題,所有的電子圖書、期刊和多媒體數(shù)據(jù)全部存放在元數(shù)據(jù)服務(wù)器中,它是整個(gè)數(shù)字圖書館的支撐點(diǎn)。這部分的服務(wù)主要分成三個(gè)部分:


    數(shù)據(jù)庫(kù)服務(wù)器


    數(shù)據(jù)庫(kù)服務(wù)器的作用是處理大量的數(shù)據(jù)存取、檢索和管理,它是支持支持整個(gè)圖書館的最底層服務(wù)器,由于數(shù)字圖書館的數(shù)據(jù)存數(shù)量很多,所以對(duì)于數(shù)據(jù)庫(kù)服務(wù)器的性能要求也相對(duì)比較高。一般需要使用服務(wù)器集群技術(shù)(Cluster),如使用聯(lián)想的NS集群系統(tǒng),由兩臺(tái)或者兩臺(tái)以上獨(dú)立的計(jì)算機(jī)系統(tǒng)互聯(lián),功能上是作為一個(gè)單一系統(tǒng),從而提高整個(gè)系統(tǒng)的可用性及性能。在數(shù)據(jù)庫(kù)的選擇方面,推薦使用一些大型的數(shù)據(jù)庫(kù)軟件,如Oracle、Sybase等。


    海量存儲(chǔ)設(shè)備


    數(shù)字圖書館的數(shù)據(jù)資料是非常龐大的。單單使用數(shù)據(jù)庫(kù)服務(wù)器本地硬盤根本不能滿足數(shù)據(jù)存儲(chǔ)的要求。另外,為了達(dá)到高數(shù)據(jù)處理能力的要求,現(xiàn)在的數(shù)據(jù)庫(kù)服務(wù)器一般使用集群(Cluster)技術(shù),多臺(tái)服務(wù)器協(xié)同工作。在這種情況下集中使用海量存儲(chǔ)設(shè)備可以提高集群的工作效率。


    隨著技術(shù)的發(fā)展現(xiàn)在的海量存儲(chǔ)設(shè)備主要產(chǎn)品是使用光纖通道技術(shù)(Fibre Channel)技術(shù)的存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)來實(shí)現(xiàn)。SAN是位于服務(wù)器后端,為連接服務(wù)器、磁盤陣列、帶庫(kù)等存儲(chǔ)設(shè)備而建立的高性能網(wǎng)絡(luò)。因此又稱為后端網(wǎng)絡(luò)。


    SAN提供了靈活的存儲(chǔ)連接,服務(wù)器可以訪問存儲(chǔ)區(qū)域網(wǎng)上的任何存儲(chǔ)設(shè)備,如帶庫(kù)、磁盤陣列;同時(shí)存儲(chǔ)設(shè)備之間、存儲(chǔ)設(shè)備同SAN交換機(jī)之間也可以進(jìn)行通信。


    SAN不是一種產(chǎn)品,而是一種獨(dú)立于服務(wù)器網(wǎng)絡(luò)的一種專門的網(wǎng)絡(luò),這種網(wǎng)絡(luò)通過采用光纖通道協(xié)議來傳輸數(shù)據(jù),在連接上可以使用光纖或銅纜。由于光纖通道協(xié)議具有極高的可靠性、很好的性能、超長(zhǎng)距離支持能力、良好的擴(kuò)展性,因此SAN使得將存儲(chǔ)同服務(wù)器分開成為現(xiàn)實(shí)。


    存儲(chǔ)區(qū)域網(wǎng)特別適合于服務(wù)器集群、大型數(shù)據(jù)存儲(chǔ)、災(zāi)難恢復(fù)等關(guān)鍵領(lǐng)域。


    對(duì)象服務(wù)器


    對(duì)象服務(wù)器是各種應(yīng)用系統(tǒng)的支撐服務(wù)器,所有的應(yīng)用服務(wù)系統(tǒng)都要運(yùn)行在對(duì)象服務(wù)器上。
元數(shù)據(jù)服務(wù)器和對(duì)象服務(wù)器為整個(gè)數(shù)字圖書館的系統(tǒng)服務(wù)提供了基礎(chǔ)的硬件設(shè)備,構(gòu)成了數(shù)字圖書館業(yè)務(wù)體系的底層托盤。


    數(shù)字圖書館的網(wǎng)絡(luò)結(jié)構(gòu)分析


    現(xiàn)代型的數(shù)字圖書館在網(wǎng)絡(luò)結(jié)構(gòu)上一般都是由數(shù)字圖書館系統(tǒng)管理服務(wù)器、數(shù)據(jù)庫(kù)服務(wù)器和各類應(yīng)用服務(wù)器組成局域網(wǎng)絡(luò),向外部提供各類的業(yè)務(wù)應(yīng)用服務(wù)。同時(shí)所有的服務(wù)器通過SAN共享海量存儲(chǔ)設(shè)備,在保證高可用性的前提下,盡量節(jié)約存儲(chǔ)冗余空間,使用集群技術(shù)提高系統(tǒng)的性能。
其具體的功能實(shí)現(xiàn)是:在一個(gè)局域網(wǎng)內(nèi)搭建業(yè)務(wù)支持平臺(tái),每個(gè)應(yīng)用服務(wù)模塊使用雙機(jī)或者多機(jī)集群技術(shù),提高模塊的性能,后端使用SAN存儲(chǔ),外部使用統(tǒng)一的網(wǎng)絡(luò)出口并使用硬件防火墻把內(nèi)部網(wǎng)絡(luò)和外部網(wǎng)絡(luò)進(jìn)行隔離,屏蔽外部的網(wǎng)絡(luò)信息,確保整體的安全性。


    傳統(tǒng)應(yīng)用方案分析


    目前,圖書館內(nèi)提供數(shù)字圖書服務(wù)的資源多種多樣,在傳統(tǒng)的方案中資源庫(kù)采用DAS的連接方式較多,這樣的存儲(chǔ)方式在集中存儲(chǔ),擴(kuò)容以及管理等方面都給校方帶來很大的不方便,下圖為這種方式的應(yīng)用:



    這種方案在SAN網(wǎng)絡(luò)構(gòu)架還不成熟的時(shí)候,是比較常用的圖書館系統(tǒng)方案解決辦法,其特點(diǎn)是結(jié)構(gòu)簡(jiǎn)單,直接通過一根SCSI線把磁盤陣列連接到服務(wù)器上實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)的擴(kuò)容,但是,這種方式存在著最大的弊端就是數(shù)據(jù)傳輸距離很短,SCSI連接線極限值只有25米,對(duì)于一個(gè)大型的計(jì)算機(jī)中心,如此長(zhǎng)的傳輸距離是遠(yuǎn)遠(yuǎn)不夠的。同時(shí),由于使用線纜而導(dǎo)致的干擾,會(huì)嚴(yán)重影響數(shù)據(jù)傳輸?shù)臏?zhǔn)確性和安全性,尤其是在大量服務(wù)器集中的機(jī)房中使用SCSI直連的方式是非常不科學(xué)的。這種存儲(chǔ)方式在實(shí)際應(yīng)用中已經(jīng)逐漸被淘汰。隨著光纖SAN存儲(chǔ)技術(shù)的成熟,使得集群共享后端海量存儲(chǔ)的方案成為可能,這一存儲(chǔ)形式的推出,淘汰了原有的傳輸速率低下、數(shù)據(jù)傳輸誤碼率高、無法實(shí)現(xiàn)數(shù)據(jù)大集中的DAS直連存儲(chǔ)方式。為圖書館的數(shù)字化發(fā)展提供了更為先進(jìn)的技術(shù)和更大的發(fā)展空間。下圖為其應(yīng)用方式:


分享到

多易

相關(guān)推薦