圖1:數(shù)據(jù)保留的各項要求
上圖表明,1%的企業(yè)數(shù)據(jù)必須為了訴訟需求而保留下來,5%的數(shù)據(jù)必須受控以滿足合規(guī)性要求。另外還有25%的數(shù)據(jù)是具有商業(yè)價值的。 那意味著69%的數(shù)據(jù)其實是毫無價值的。
也許有人會對這些數(shù)據(jù)的準(zhǔn)確性提出質(zhì)疑,但是讓我們先來進(jìn)行一項合理的測試:在很大程度上,企業(yè)和它們的IT部門主要專注于當(dāng)前正在發(fā)生的事情(當(dāng)前的交易、電子郵件和分析等),而并不是數(shù)據(jù)積累的過程。
IT部門就向是數(shù)據(jù)的監(jiān)護(hù)人一樣,而且該部門同時承擔(dān)著存儲和管理數(shù)據(jù)的成本,但他們并不是那樣數(shù)據(jù)的所有者??赡軜I(yè)務(wù)部才是那些數(shù)據(jù)真正的所有者,對于個人員工來說,他們只是某些特定數(shù)據(jù)集的管理員。 但是如果員工帶著他們的電子郵件離開公司會怎么樣呢?那么剩下的數(shù)據(jù)是否就是再也不會被用到的數(shù)據(jù)碎片了呢? 誰知道呢?這又該誰來管理呢? 答案是:也許沒人來管理那些數(shù)據(jù)。
進(jìn)行數(shù)據(jù)處理的原因
現(xiàn)在我要提出一個問題了:清除掉無用的數(shù)據(jù)到底有多重要呢?
假如20%的IT預(yù)算是用于存儲領(lǐng)域,而且你們70%的數(shù)據(jù)對企業(yè)來說是毫無價值的。那就意味著14%左右的IT存儲預(yù)算被浪費掉了。 各位首席信息官們,這能夠引起你們的重視嗎? 現(xiàn)在,即便能夠通過一些技術(shù)將所有沒有用的數(shù)據(jù)都安全地清除掉,那也不一定能夠馬上在成本節(jié)約上看到成效。雖然可以省下大量的磁盤空間,但是企業(yè)并不能將已經(jīng)配置的陣列再賣掉。 坦白說,你能夠從中省下來的開支可能遠(yuǎn)比你以前花掉的開支要少得多(這就好比是舊車折舊的問題)。
釋放磁盤空間意味著以后的存儲設(shè)備采購計劃可以延期了,但那并不能馬上轉(zhuǎn)化為成本上的節(jié)約。但是尋求成本節(jié)約最終是為了提高生產(chǎn)力,比如現(xiàn)在資金投入不足但又迫切需要的IT改革,這也許就是解決這一問題最好的理由。
這個問題是一種永遠(yuǎn)無法徹底解決的問題。那意味著雖然你現(xiàn)在暫時還能容忍它,但是新數(shù)據(jù)的持續(xù)快速增長必然會令情況不斷惡化,讓這個問題越來越難以解決。
將業(yè)務(wù)轉(zhuǎn)到云并不能解決這個問題,但是它也許會迫使企業(yè)加大對這個問題的關(guān)注力度。云計算的其中一個目的是提供服務(wù)型IT,即讓用戶從一個自助服務(wù)目錄中選擇他們想要的服務(wù)。 然而,這種令人愉快的體驗是有代價的。各種資源被分配給用戶并被他們消費掉,這意味著必須使用chargeback(或者至少是showback)。 猜猜看, 一家擁有數(shù)據(jù)的企業(yè)是否愿意為具備3美元價值的數(shù)據(jù)支付10美元呢?
可能要花很長的時間才能說清數(shù)據(jù)處理面臨的各種難題。這不但是一件很困難的事,它可能是很難處理的,而且可能沒有一家科技公司能夠解決存儲的問題。 另外,還有一些邏輯上和技術(shù)上的問題需要解決。數(shù)據(jù)管理功能必須設(shè)定和建立政策。 必須找到一種方法論將優(yōu)質(zhì)數(shù)據(jù)與劣質(zhì)數(shù)據(jù)區(qū)分開來。 這個過程可能不能通過人工的方式完成,可能需要用到自動化處理軟件工具。
從現(xiàn)實的角度來說,也許必須用最小的投資來實現(xiàn)數(shù)據(jù)量的最大縮減。即使在最理想的環(huán)境下,你可能也不得不接受這樣一個事實,那就是你永遠(yuǎn)也不可能做到盡善盡美。 況且,你不但需要解決現(xiàn)在的海量數(shù)據(jù)問題,而且你還必須使用合適的工藝和程序來避免類似的情況再次發(fā)生。清理海量數(shù)據(jù)并不是一件容易的事,但是企業(yè)用戶們必須獲得合適的工具并制定合適的政策以實現(xiàn)那一目標(biāo)。
Mesabi沉思
存儲需求持續(xù)快速增長是當(dāng)前的一個熱門話題,大數(shù)據(jù)是其中最醒目的因素。海量數(shù)據(jù)的背后隱藏著什么樣的問題?雖然人們似乎還不太重視這方面的問題,但是卻又不得不面對數(shù)據(jù)清理的問題。
如果存儲在IT預(yù)算中占用的比例為20%,而且現(xiàn)在70%的數(shù)據(jù)是毫無價值的,那就等于每年14%的IT預(yù)算被浪費掉了。正視這一問題是企業(yè)用戶們需要做的第一件事。 找出解決這個問題的辦法需要時間、心理訓(xùn)練和努力,但是這些付出都是值得的。如何解決這個問題令所有人都受益呢?這是我下一篇文章將要討論的話題。