I n t e r n e t訂閱服務(wù)也會產(chǎn)生類似的結(jié)果, I n t e r n e t訂閱服務(wù)發(fā)送各種更新的信息,從股票價格、新聞到天氣預(yù)報,無所不包。信息驅(qū)動的結(jié)果之一是當(dāng)人們希望某條信息時,他們就訂閱它。訂閱服務(wù)系統(tǒng)每天都給辦公室工作人員發(fā)送許多則消息,這些消息都是他們認(rèn)為有用的、重要常困難。
軟件發(fā)布是另一個數(shù)據(jù)流的源。熟悉I n t e r n e t軟件發(fā)布的用戶經(jīng)常訂閱各種軟件服務(wù),這些軟件服務(wù)包括更新、發(fā)布軟件信息、預(yù)先發(fā)布軟件的測試版,甚至更嚴(yán)重的情況,這樣,一個軟件很快就有4、5個拷貝保存在磁盤上,大大消耗網(wǎng)絡(luò)服務(wù)器的存儲空間,同時,在這種環(huán)境下,計劃適合的存儲需求也十分困難。
2. 流體數(shù)據(jù)目標(biāo)的識別
一旦數(shù)據(jù)進(jìn)入一個機(jī)構(gòu),接下來的問題是:數(shù)據(jù)應(yīng)該存放在那里?結(jié)構(gòu)數(shù)據(jù)很容易跟蹤,因為它已經(jīng)編入了最初存放的地方。然而,事件驅(qū)動的應(yīng)用能夠?qū)?shù)據(jù)的內(nèi)容做出反應(yīng),并起動一個新的動作將數(shù)據(jù)傳到其他的系統(tǒng)。例如,特許零售商的銷售報告先通過電子的形式傳到總部,經(jīng)過正常的處理后,最后再把它傳到另一個系統(tǒng),以計算在銷售戰(zhàn)中所獲得的成果。
E R P系統(tǒng)的設(shè)計目的是把分散的全局?jǐn)?shù)據(jù)集成為單一的邏輯系統(tǒng),它的主要思想是以電子的方式連接所有的商業(yè)過程,這樣就能在整個組織范圍內(nèi)做出更好的決策。依照這種方法,一個部門中的活動可能成為同一公司中另一部門決策的部分信息。舉一個簡單的例子,假如一個部門庫存過剩,則可以把過剩的庫存送到另一部門去,以減輕該部門庫存壓力。
然而,結(jié)構(gòu)數(shù)據(jù)流的實際目的地不是它所發(fā)送的系統(tǒng),而是連接到這個系統(tǒng)的存儲設(shè)備。為了真正地了解這些系統(tǒng)的性能,理解從發(fā)送機(jī)器的設(shè)備到目的機(jī)器的設(shè)備的數(shù)據(jù)流是很重要的。盡管通常存儲成分理所當(dāng)然地存在,但正如我們在本書大部分章節(jié)中所探討的那樣,情況并不是這樣。非結(jié)構(gòu)數(shù)據(jù)流一般有許多種類各異的目標(biāo), e – m a i l消息及附件最終散布在各種不同的文件夾、本地磁盤和網(wǎng)絡(luò)服務(wù)器中。圖1 – 3顯示了一個e – m a i l被同時放在三個不同位置的例子。
出于自我保護(hù)的本能,許多用戶都堅持把一些文件的多余拷貝保存起來,以備將來萬一能用上。但是,當(dāng)對某一案件作判決時, e – m a i l消息卻經(jīng)常被理解為與政治有牽連,而招致麻煩。這些“可憐人”之所以采用如此的災(zāi)難保護(hù)辦法,是因為過去曾經(jīng)丟失過大量有價值的資料,因此被弄得焦頭爛額,苦不堪言。保存e – m a i l也可能引起麻煩,注意到這一點(diǎn)是饒有趣味的。例如,在1 9 8 7年,由于e – m a i l的摘錄,導(dǎo)致了對I r a n – C o n t r a一案審判受到影響。在最近的司法部反托拉斯訴訟案中,內(nèi)部的e – m a i l信息給微軟招致了很大的麻煩。
當(dāng)然,一旦某個信息被人堅持放入個人歸檔文件中時,刪除它的可能性是很小的。當(dāng)e – m a i l系統(tǒng)的存儲空間太緊張時,系統(tǒng)管理員可能發(fā)送e – m a i l給該系統(tǒng)的用戶,要求他們刪除不必要的信息,也可以通過限制每個用戶的存儲配額的辦法,迫使用戶刪除不必要的文件。這雖然減輕了e – m a i l系統(tǒng)的存儲壓力,但用戶可能把這些過期的e -m a i l轉(zhuǎn)存到其他地方,以便在必要的時候使用。事實上,差不多沒有人有時間重讀那些過時的e – m a i l,有些人甚至都來不及閱讀當(dāng)前的e -m a i l。是否保存過期的e – m a i l是一個人對緊缺資源的自律態(tài)度問題?,F(xiàn)在由于每G B硬盤容量價格的下降,用戶并不為節(jié)省存儲資源而感到煩惱。
I n t e r n e t文件與e – m a i l稍微有點(diǎn)不同,因為當(dāng)某人認(rèn)為某We b頁面有用或令人感興趣時,他才去獲得并瀏覽該頁面。從這個意義上說, I n t e r n e t文件是政治中性的,與e – m a i l相比,它的保存價值更小。但是它的吸引力在于它是純粹用來提供知識的,它能使人獲得更多的知識、更快的決策、發(fā)現(xiàn)問題和識別機(jī)會,總之,是能為人類帶來榮譽(yù)的知識。
I n t e r n e t的訂閱服務(wù)帶來相當(dāng)特殊的問題。在同一單位里可能有若干個人訂閱同一服務(wù)內(nèi)容的、導(dǎo)致存儲同樣數(shù)據(jù)的多份拷貝。圖1 – 4顯示了由e – m a i l和I n t e r n e t等引起的相同信息的多份拷貝問題,這使得對數(shù)據(jù)的管理變得相當(dāng)困難。
3. 結(jié)構(gòu)數(shù)據(jù)流和非結(jié)構(gòu)數(shù)據(jù)流的區(qū)別
除了結(jié)構(gòu)數(shù)據(jù)流定義了源和目標(biāo)以外,它還在多個方面不同于非結(jié)構(gòu)數(shù)據(jù),如表1 – 3所示。
4. 管理流體數(shù)據(jù)
知道結(jié)構(gòu)數(shù)據(jù)流的源、目標(biāo)及其支撐的網(wǎng)絡(luò)技術(shù)后,則可以對數(shù)據(jù)流實施監(jiān)控,并可以在問題發(fā)生之前預(yù)測它們。例如,知道平均的數(shù)據(jù)傳輸量、它的增長率及網(wǎng)絡(luò)連接的性能,就可以確定在所有其他因素不變的情況下,現(xiàn)存的網(wǎng)絡(luò)能維持運(yùn)行多長時間。
管理非結(jié)構(gòu)數(shù)據(jù)是一個更困難的任務(wù)。不知道數(shù)據(jù)的源和目標(biāo),可資利用的資源又不多。雖然網(wǎng)絡(luò)的瀏覽傳輸能夠用一些工具加以過濾和監(jiān)控,但是用戶認(rèn)為侵犯了他們的隱私,阻礙他們的工作效率。最好的辦法大概是建立一個I n t e r n e t內(nèi)容存儲策略,并使人們明白,為了確保有足夠的可用資源,這樣的責(zé)任機(jī)制有時是必須的。
如何將企業(yè)的數(shù)據(jù)組織成為I n t e r n e t內(nèi)容?一個簡單的辦法是為那些內(nèi)容建立部門或功能目錄,如圖1 – 5所示。在這樣的策略下,用戶可以養(yǎng)成把下載來的文件存儲在他們各自的目錄中的習(xí)慣。放在功能目錄中的文件甚至可以連接到企業(yè)We b頁面上,以供其他感興趣的人享用。用戶可以通過e – m a i l連接到共享的文檔上來交換文件,而不必發(fā)送這些文檔的整個拷貝。