最近,我寫了很多關(guān)于信息技術(shù)和技術(shù)管理的博客文章,但是我還沒有說過我對核心存儲技術(shù)的未來發(fā)展的最根本的看法。


      首先,我預計這篇文章一定會引起業(yè)界代表不同意見的各方之間的激烈爭論。我想,值得一提的是,EMC作為一家以客戶為中心的公司不管是現(xiàn)在還是將來,都將根據(jù)市場的需求為客戶提供技術(shù)和解決方案。 不要因為我在這里發(fā)表一些預測性的話就想讓我們停止生產(chǎn)產(chǎn)品。我們的生產(chǎn)是建立在需求的基礎(chǔ)上,而不是預測的基礎(chǔ)上。


      但是,在我能夠討論存儲需求之前,我首先要讓大家明白我對數(shù)據(jù)與信息不斷增長的需求的看法。數(shù)據(jù)就是存儲設(shè)備的客戶,因此要想弄明白存儲設(shè)備要到哪里去,大家應該從數(shù)據(jù)入手。


      我相信數(shù)據(jù)世界將仍分裂成兩個不同的類型,之前通常被稱為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。但是由于各組織必須將越來越多的結(jié)構(gòu)添加到它們的非結(jié)構(gòu)化數(shù)據(jù)中以讓那些數(shù)據(jù)有用,因此事情將變得不再簡單。 因此,實際上所有的數(shù)據(jù)和信息都將變得更結(jié)構(gòu)化一些。 這些詞已經(jīng)不能很好地說明數(shù)據(jù)類型了。


      相反,我認為數(shù)據(jù)的區(qū)分將越來越以我所說的“單事件等待時間(single transaction latency)”為基礎(chǔ)。 如今,OLTP系統(tǒng)都有這方面的要求,處理事件的性能仍是聯(lián)合存儲系統(tǒng)中最重要的因素。由于大部分OLTP系統(tǒng)都是采用的單一關(guān)系數(shù)據(jù)庫(為了保證一致性),因此單事件等待時間這個因素就非常重要。 總帶寬和輸入輸出能力是排在等待時間之后的第二重要的因素。你可以將這個系統(tǒng)看作是一個只設(shè)了一個收費站的高速公路網(wǎng)絡,收費站的性能(即車輛進出收費站的等待時間)將極大地影響到整個系統(tǒng)的性能。


      相反,大多數(shù)的剩余信息(估計目前占70%以上,而到2010年時將增長到95%左右)將被歸為“其他種類”,我將把這類數(shù)據(jù)稱為“網(wǎng)絡”數(shù)據(jù)。正如我所說的,這類數(shù)據(jù)與上面的數(shù)據(jù)相比的決定性不同在于,單事件等待時間不是最重要的因素。 例如,讓我們以在網(wǎng)絡上進行搜索為例。你進行的任何搜索可能都要花0.5秒的時間。 如果它所花的時間變成0.45秒或者0.55秒,影響是否會很大呢? 我看影響不大。 因為許多人都可以同時進行搜索,這里需要注意的問題是累計性能。在高速公路上,你可以設(shè)置速度比較慢的收費站,但是在你最終忍受不了之前,它們并不會構(gòu)成高速公路系統(tǒng)上的瓶頸。


      我相信我們將看到非結(jié)構(gòu)化數(shù)據(jù)也需要變得更加結(jié)構(gòu)化一些。 顯然,使用傳統(tǒng)的關(guān)系數(shù)據(jù)庫是不行的。在數(shù)據(jù)庫應用程序中將網(wǎng)絡數(shù)據(jù)隔離開來也不是很好。 那些“結(jié)構(gòu)”將來自于標記、索引、元數(shù)據(jù)和帶有定義化本體的對象結(jié)構(gòu)。


      我們最近收購了一家名為XHive的公司,該公司開發(fā)的許多技術(shù)對我們很有幫助。XHive公司實際上開發(fā)的是XML數(shù)據(jù)庫技術(shù)。 這樣就可以用一種更相關(guān)的方法將數(shù)據(jù)結(jié)構(gòu)化,同時避免限制到使用帶所有權(quán)保護的數(shù)據(jù)庫結(jié)構(gòu)。由于數(shù)據(jù)和元數(shù)據(jù)都是XML格式的,沒有被鎖定到任何應用程序上。


      在這些數(shù)據(jù)類型之中,還有很多很多影響著存儲設(shè)備和信息生命周期管理需求的其他性能、可靠性和信息要求。那么我為什么要根據(jù)這一個因素來定義數(shù)據(jù)類型呢? 原因就是簡單,對于OLTP應用程序來說,處理事件的等待時間方面的需求會推動整個存儲結(jié)構(gòu)的優(yōu)化。對于網(wǎng)絡數(shù)據(jù),結(jié)構(gòu)將更多的受到累計系統(tǒng)要求的影響。


      雖然數(shù)據(jù)類型和要求的數(shù)量顯然達到了不可窮盡的地步,但是首要的前提是存儲結(jié)構(gòu)必須在不遠的將來解決數(shù)據(jù)的這兩個基本要求(過去,數(shù)據(jù)是以結(jié)構(gòu)化和非結(jié)構(gòu)化來區(qū)分的),我現(xiàn)在認為它們更適合被稱為OLTP數(shù)據(jù)和網(wǎng)絡數(shù)據(jù)。


      在下一篇博客文章中,我將討論核心存儲技術(shù)的使用和信息利用率的未來發(fā)展情況。

分享到

多易

相關(guān)推薦