日立數(shù)據(jù)系統(tǒng)公司(HDS)全球解決方案服務(wù)副總裁Hicham Abdesssamad
日立數(shù)據(jù)系統(tǒng)公司(HDS)全球解決方案服務(wù)副總裁Hicham Abdesssamad認(rèn)為,解決文件存儲(chǔ)平臺(tái)的應(yīng)用難題,完善企業(yè)數(shù)據(jù)歸檔的最重要的出發(fā)點(diǎn)是:One Platform for all data(為所有數(shù)據(jù)提供統(tǒng)一平臺(tái)),作為曾經(jīng)在業(yè)界多家知名公司擔(dān)任過(guò)服務(wù)部門重要職務(wù),擁有超過(guò)13年的IT行業(yè)從業(yè)經(jīng)驗(yàn)的年輕副總裁,Hicham覺得,HDS公司今年3月份推出的集成文件服務(wù)平臺(tái),能夠從存儲(chǔ)、安全、數(shù)據(jù)保護(hù)與搜索等多方面,解決企業(yè)面臨大量的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化、半結(jié)構(gòu)化文件所帶來(lái)的問(wèn)題,因?yàn)镠DS在做的,正是One Platform for all data。
5月14日,我們?cè)诒本┮姷搅薍icham Abdesssamad,就HDS推出的集成文件服務(wù)平臺(tái),以及這個(gè)平臺(tái)下所包含的各個(gè)功能套件,如Hitachi Data Discovery Suite(日立數(shù)據(jù)發(fā)現(xiàn)軟件套件)、Hitachi Essential NAS平臺(tái)、Hitachi High-performance NAS 平臺(tái)、Hitachi Content Archive 平臺(tái)進(jìn)行了一次有關(guān)"文件管理"的對(duì)話。
認(rèn)清問(wèn)題:"過(guò)去"的文件服務(wù)器
"現(xiàn)在我們的非結(jié)構(gòu)化數(shù)據(jù)是2272PB,但是到2010年,預(yù)計(jì)會(huì)達(dá)到20000PB。" Hicham用一個(gè)頗有些"可怕"的數(shù)字來(lái)警示我們非結(jié)構(gòu)化數(shù)據(jù)可能會(huì)給我們帶來(lái)的"大麻煩"。他表示,目前的情況是,只有4%的非結(jié)構(gòu)化數(shù)據(jù)已經(jīng)在內(nèi)容管理系統(tǒng)的掌握之下,而剩下的96%仍然沒有被有效的管理起來(lái),而且,就像Hicham所言,這些數(shù)據(jù)仍然在以10倍于結(jié)構(gòu)化數(shù)據(jù)的速度在遞增,但問(wèn)題是,這些數(shù)據(jù)都不能隨便的銷毀或是刪除–不僅僅是因?yàn)榉ㄒ?guī)遵從的壓力,更大的原因在于,這些數(shù)據(jù)中存儲(chǔ)著企業(yè)發(fā)展的重要信息。用Hicham的話說(shuō)就是"Content is King"。
他表示,對(duì)于企業(yè)來(lái)說(shuō),必須要明白,任何一個(gè)文件都有可能包含著具有價(jià)值的信息,即內(nèi)容為王,內(nèi)容的價(jià)值體現(xiàn)在多個(gè)方面,而如何了解文件的內(nèi)容,建立好的文件服務(wù)平臺(tái)是最基本的要求,比如說(shuō),只有在了解數(shù)據(jù)所在的文件屬性、內(nèi)容屬性以及諸多信息才能夠?qū)?shù)據(jù)進(jìn)行有效的分類,從而加以利用,但是,現(xiàn)在的情況卻并不樂(lè)觀,有很多的企業(yè)的文件服務(wù)平臺(tái)都處在"過(guò)去時(shí)"。
"根據(jù)IDC的調(diào)查《The Hidden Costs of Information Work》顯示,如果一個(gè)企業(yè)的人均年薪為6萬(wàn)美元,那么以目前平均的每年浪費(fèi)在的搜索文件和電子發(fā)現(xiàn)上的時(shí)間,每人價(jià)值5251美元,如果這個(gè)企業(yè)有1000人,那么一年下來(lái)企業(yè)將會(huì)浪費(fèi)價(jià)值500萬(wàn)美元的工作時(shí)間。"Hicham表示,現(xiàn)在的文件服務(wù)平臺(tái)以及內(nèi)容管理和歸檔方式,造成了極大的浪費(fèi),從文件存儲(chǔ)或者說(shuō)文件服務(wù)器的角度來(lái)看,目前NAS是應(yīng)用最多的文件存儲(chǔ)方式,但是,Hicham認(rèn)為,"過(guò)去時(shí)"的NAS存在很多問(wèn)題,首先,現(xiàn)在的NAS文件服務(wù)業(yè)務(wù)模式,在隨著文件的不斷增長(zhǎng)的同時(shí),成本在不斷上升,而且,在多個(gè)遠(yuǎn)程辦公室之間進(jìn)行復(fù)制、傳輸以及刪除等遠(yuǎn)程異地管理時(shí),仍然難以做到完全的高效和高可靠性,尤其是往往不能有效的對(duì)數(shù)據(jù)進(jìn)行分類的歸檔,因此,也很難基于內(nèi)容的價(jià)值對(duì)文件進(jìn)行分層存儲(chǔ),以達(dá)到最高的經(jīng)濟(jì)型。
與此同時(shí),目前的歸檔系統(tǒng)不僅種類繁多,如磁帶、光盤庫(kù)、NAS和普通的RAID陣列以及CAS歸檔系統(tǒng),而且最重要的是,這些數(shù)據(jù)都處在信息孤島上面,無(wú)論是電子郵件、文檔管理、Web應(yīng)用程序,都處在各自為政的情況之下,從而導(dǎo)致了目前的許多歸檔系統(tǒng)與文件服務(wù)平臺(tái)存在四個(gè)較大的問(wèn)題:
作為HDS全球解決方案服務(wù)副總裁,Hicham覺得,用戶現(xiàn)在有必要改變一下他們的系統(tǒng)了了,在面臨非結(jié)構(gòu)化數(shù)據(jù)的強(qiáng)大壓力的同時(shí),用戶必須將文件服務(wù)平臺(tái)與文件歸檔系統(tǒng)進(jìn)行有機(jī)的整合,從而完成對(duì)未來(lái)的文件爆發(fā)式成長(zhǎng)的最好應(yīng)對(duì)準(zhǔn)備。
統(tǒng)一平臺(tái):三者合一 各自取舍
今年3月5日,HDS發(fā)布了其首個(gè)集成文件服務(wù)平臺(tái),作為業(yè)界首個(gè)面向文件管理與歸檔,尤其是非結(jié)構(gòu)化數(shù)據(jù)的文件服務(wù)平臺(tái),當(dāng)時(shí)引起了不小的關(guān)注,這個(gè)服務(wù)平臺(tái),看起來(lái)更像是一個(gè)三位一體的解決方案,其中,包括了Hitachi Data Discovery Suite(日立數(shù)據(jù)發(fā)現(xiàn)軟件套件)、日立NAS存儲(chǔ)平臺(tái)(包括Hitachi Essential NAS平臺(tái)和Hitachi High-performance NAS 平臺(tái))、Hitachi Content Archive Platform平臺(tái)(HCAP),Hicham表示,HDS的文件和內(nèi)容解決方案是整體架構(gòu)在這三部分平臺(tái)上的,高端的High-performance NAS為高性能計(jì)算以及其它有高性能存儲(chǔ)要求的應(yīng)用提供具備高性能的文件存儲(chǔ)能力,而Essential NAS則針對(duì)一般企業(yè)的文件共享與文件存儲(chǔ)提供廉價(jià)的大容量的解決方案,而HCAP則提供了那些超過(guò)90天即不訪問(wèn)的數(shù)據(jù)的有效的歸檔能力,除此以外,日立數(shù)據(jù)發(fā)現(xiàn)軟件套件則肩負(fù)著提供內(nèi)容搜索和電子發(fā)現(xiàn)的任務(wù)–這樣一來(lái),無(wú)論是生產(chǎn)文件的存儲(chǔ)還是舊文件的歸檔,無(wú)論是存放文件還是搜索內(nèi)容,HDS的文件服務(wù)平臺(tái)都可以以整體解決方案的來(lái)解決問(wèn)題,與此同時(shí),這三者還擁有一個(gè)強(qiáng)有力的紐帶。
Hicham認(rèn)為,對(duì)于文件服務(wù)平臺(tái)來(lái)說(shuō),有一個(gè)非常重要的必須特性:Global Name Space,全域命名空間,通過(guò)Global Name Space,用戶在應(yīng)用文件服務(wù)平臺(tái)時(shí)可以發(fā)現(xiàn),HDS的兩個(gè)工具:管理文件和內(nèi)容的HiCommand以及搜索NAS平臺(tái)文件以及HCAP管理的歸檔數(shù)據(jù)的日立數(shù)據(jù)發(fā)現(xiàn)套件,可以很自由的進(jìn)行工作–如果一個(gè)系統(tǒng)基于全域命名空間,那么顯而易見的好處是,用戶可以完全不必操心系統(tǒng)內(nèi)有到底有多少的設(shè)備、平臺(tái),其所看見的,只是一個(gè)全局的文件管理設(shè)備,所有的文件都在一個(gè)文件存儲(chǔ)池中。
對(duì)于日立數(shù)據(jù)發(fā)現(xiàn)套件(HDDS)和日立內(nèi)容歸檔平臺(tái)(HCAP),Hicham特別指出,這個(gè)套件是一個(gè)無(wú)縫集成在NAS文件存儲(chǔ)平臺(tái)和HCAP文件歸檔平臺(tái)上的,除了支持自動(dòng)化的文件查找和跨平臺(tái)/設(shè)備的查找讀取功能之外,其可以通過(guò)與ISV的應(yīng)用環(huán)境相結(jié)合,ISV可以通過(guò)HDDS提供的文件搜索、電子發(fā)現(xiàn)、風(fēng)險(xiǎn)評(píng)估、文件分層等CLI和API進(jìn)行數(shù)據(jù)的交換與系統(tǒng)的集成,除此以外,他還談到了了HDS的文件服務(wù)平臺(tái)在ABM-AMRO荷蘭銀行的成功應(yīng)用,Hicham介紹到,荷蘭銀行應(yīng)用的是一款名為Cesar的文檔管理軟件,而HDS只用了兩天就將HACP與Cesar結(jié)合在了一起–這完全得益于HDS與全球許許多多的獨(dú)立軟件開放商(ISV)的充分合作。
在與Hicham的溝通中,他屢次提到了"內(nèi)容為王"的觀點(diǎn),對(duì)于這一點(diǎn),我們自然是非常贊同的,但問(wèn)題是,如何才能發(fā)揮出數(shù)據(jù)的價(jià)值,展現(xiàn)出"內(nèi)容為王"的真正含義呢?
如何發(fā)揮數(shù)據(jù)價(jià)值
搜索是Hicham想到的第一件事情,我們之前已經(jīng)提到過(guò),HDS的文件服務(wù)平臺(tái)是基于全域命名空間的,因此為搜索提供了一個(gè)絕好的基礎(chǔ),不過(guò)問(wèn)題依然存在,那就是對(duì)于企業(yè)來(lái)說(shuō),最大量的數(shù)據(jù)并不是在生產(chǎn)系統(tǒng)中,也不是在備份設(shè)備上,而是歸檔平臺(tái)之內(nèi)。由此,引發(fā)出了對(duì)于HCAP的一個(gè)要求:如何更好的滿足搜索需求?
"HCAP是跨平臺(tái)跨多系統(tǒng),它不但支持HDS自己的架構(gòu),也支持用戶現(xiàn)有的其它架構(gòu)。"Hicham表示,得益于HCAP是基于開放協(xié)議存儲(chǔ)架構(gòu)的,因此,HCAP的多平臺(tái)支持不僅僅限于HDS自己內(nèi)部的各種平臺(tái),也包括了許多競(jìng)爭(zhēng)友商的平臺(tái)系統(tǒng),同時(shí),在支持多平臺(tái)多系統(tǒng)的情況下,其仍然能保留原有文件的開放屬性,且能以TB級(jí)擴(kuò)展來(lái)滿足用戶對(duì)于單一平臺(tái)的搜索的需求,因此,HCAP具有極強(qiáng)的可搜索性,Hicham認(rèn)為,更強(qiáng)的搜索性與跨平臺(tái)性、開放性帶來(lái)了三大好處:一是讓企業(yè)更容易的掌握數(shù)據(jù);二是簡(jiǎn)化的數(shù)據(jù)存儲(chǔ)架構(gòu);第三是真真正正的幫助用戶降低了成本,并在提高數(shù)據(jù)系統(tǒng)穩(wěn)定性的同時(shí)滿足了企業(yè)對(duì)于自主選擇存儲(chǔ)系統(tǒng)的需求–如果沒有良好的跨平臺(tái)性和開放協(xié)議支持,用戶往往會(huì)被"鎖死"在一個(gè)固定的供應(yīng)商或是存儲(chǔ)系統(tǒng)之上,這顯然是不利于選擇更好更適合自己的設(shè)備的。
最后,我們提到,在電子發(fā)現(xiàn)領(lǐng)域,除了搜索、法規(guī)遵從和歸檔之外,用戶的數(shù)據(jù)能否進(jìn)行有效的分類,也是利用數(shù)據(jù)的關(guān)鍵,同時(shí),對(duì)于數(shù)據(jù)重要性的分類將能夠幫助用戶構(gòu)建更加綠色和低價(jià)的分層存儲(chǔ),因此,在電子發(fā)現(xiàn)和數(shù)據(jù)歸檔領(lǐng)域,數(shù)據(jù)的分類也是一件重要的事情,Hicham表示,目前HDS對(duì)數(shù)據(jù)的分類是在部署歸檔系統(tǒng)前進(jìn)行的,HDS通過(guò)工程師和服務(wù)人員與用戶的溝通,利用工具和顧問(wèn)模型去與用戶一起對(duì)數(shù)據(jù)根據(jù)其重要程度進(jìn)行劃分,然后才引進(jìn)HCAP歸檔平臺(tái)–"HDS對(duì)數(shù)據(jù)分類非常重視,因此,我們將其作為應(yīng)用HCAP平臺(tái)之前的工作。"Hicham談到。
在與Hicham的溝通之后,我們?yōu)镠DS的文件服務(wù)平臺(tái)歸納出了4個(gè)關(guān)鍵詞:統(tǒng)一、對(duì)癥、搜索與利用,雖然這幾個(gè)詞看起來(lái)并無(wú)太大的關(guān)系,但是我們覺得這四個(gè)關(guān)鍵詞仍可以用來(lái)概括HDS文件服務(wù)平臺(tái):"得益于統(tǒng)一的全域命名空間,以及有針對(duì)性的"對(duì)癥下藥"的存儲(chǔ)系統(tǒng),HDS文件服務(wù)平臺(tái)從而可以順利的完成用戶的搜索任務(wù),并進(jìn)一步的對(duì)數(shù)據(jù)加以利用。"
于是,對(duì)于Hicham來(lái)說(shuō),他所要做的,只剩下宣傳的工作了。