圖一:EMC副總裁、銷售部全球首席技術(shù)官Patricia Florissi博士。
Patricia Florissi博士認(rèn)為任何技術(shù)都需要有足夠條件和時間才能夠發(fā)揮作用:“如果海量數(shù)據(jù)出現(xiàn),我們沒有足夠的存儲能力,那我們只能將數(shù)據(jù)刪除掉;如果我們有足夠的存儲能力,但是沒有數(shù)據(jù)分析能力,那么數(shù)據(jù)并沒有什么價值,就猶如金礦石在眼前,卻沒有能力提煉成為金子;如果我們有了存儲和處理數(shù)據(jù)的能力,卻沒有解讀和分析數(shù)據(jù)的能力,那我們同樣需要再等一段時間才能迎接大數(shù)據(jù)時代的到來,好比過去印刷術(shù)的發(fā)明到真正商用經(jīng)歷了好幾代人的時間。如今大數(shù)據(jù)這三個條件都已經(jīng)成熟。”
Amazon和Google的大數(shù)據(jù)服務(wù)未必更好
在云計算概念剛剛出爐之時,關(guān)于公有云與私有云孰優(yōu)孰劣的爭論頗為熱鬧。我們也可以看到現(xiàn)在Amazon、Google以及Rackspace等提供的公有云服務(wù)被越來越多的用戶所采用。而在大數(shù)據(jù)時代下,Amazon與Google同樣推出了類似公有云的大數(shù)據(jù)分析服務(wù)。這讓用戶又一次面臨著云計算時代類似的問題:是自己構(gòu)建大數(shù)據(jù)分析環(huán)境,還是通過Amazon或者Google來獲取分析能力?對此,Patricia Florissi博士表示需要用戶在使用難易度、成本以及使用目的三個角度考慮選擇。
Patricia Florissi博士深入分析道:“首先,我們需要了解到Amazon或者Google提供的大數(shù)據(jù)服務(wù)在易用性如何,它與企業(yè)級環(huán)境相比有何區(qū)別。如果是一家中小型公司,使用Amazon的API把數(shù)據(jù)存儲在Amazon上會更加容易。EMC現(xiàn)在的一個趨勢就是向用戶提供他們以前在Amazon和Google那里獲得的同樣的易用性、可編程性以及易于操作的界面。在這個前提下,EMC來幫助企業(yè)級用戶使得他們的數(shù)據(jù)中心虛擬化,也就是通過軟件定義數(shù)據(jù)中心、軟件定義存儲讓用戶獲得像Amazon、Google同樣的易用性和可編程性;其次,使用Amazon或者Google提供的大數(shù)據(jù)服務(wù)也會有所得失,Amazon和Google的服務(wù)比較容易,易用性強(qiáng),不過使用它們意味著你將失去控制權(quán);而使用自己數(shù)據(jù)中心則能夠掌握控制權(quán),不過在易用性方面卻不足,EMC希望能夠在企業(yè)級環(huán)境讓用戶在易用性、可編程性和控制力方面達(dá)到一個平衡;最后從成本角度考慮,如果你對數(shù)據(jù)處理頻率進(jìn)行一個經(jīng)濟(jì)學(xué)評估的話,會發(fā)現(xiàn)如果數(shù)據(jù)處理頻率比較高,對數(shù)據(jù)處理能力和容量要求比較大的時候,也就是數(shù)據(jù)使用率超過50%的時候,就會出現(xiàn)一個經(jīng)濟(jì)學(xué)的臨界點(diǎn)和轉(zhuǎn)折點(diǎn),此時使用自己的數(shù)據(jù)中心就比Amazon或者Google便宜。當(dāng)然,Amazon和Google也在數(shù)據(jù)高峰和未預(yù)見問題的處理上比較容易操作。”
根據(jù)Patricia Florissi博士介紹,EMC II的核心是聚焦在大數(shù)據(jù)管理,Pivotal則是大數(shù)據(jù)分析方面。
數(shù)據(jù)學(xué)是一個團(tuán)隊的學(xué)科
隨著大數(shù)據(jù)的興起,一些與大數(shù)據(jù)相關(guān)的職業(yè)也開始熱門起來,這其中就包括首席數(shù)據(jù)官(CDO)以及各種大數(shù)據(jù)分析人才。EMC副總裁、銷售部全球首席技術(shù)官Patricia Florissi博士認(rèn)為大數(shù)據(jù)衍生出來數(shù)據(jù)學(xué)應(yīng)該是一個團(tuán)隊合作的學(xué)科。
Patricia Florissi博士表示:“數(shù)據(jù)學(xué)其實(shí)包括不同的專業(yè)人才,主要是大數(shù)據(jù)科學(xué)家,這類人才主要建立不同的數(shù)據(jù)模型,將抽象的數(shù)據(jù)視覺化,并且需要有能力將不同組變量之間的相互關(guān)系進(jìn)行分析;第二類就是業(yè)務(wù)科學(xué)家,這類人才對于所處的行業(yè)特點(diǎn)與業(yè)務(wù)環(huán)節(jié)非常了解;第三類就是計算機(jī)科學(xué)家,這類人才專門來設(shè)計基礎(chǔ)架構(gòu),在基礎(chǔ)架構(gòu)之上按照業(yè)務(wù)科學(xué)家的要求去管理和運(yùn)作大數(shù)據(jù)科學(xué)家設(shè)計出來的大數(shù)據(jù)模型。首席數(shù)據(jù)官CDO其實(shí)是建立和運(yùn)營數(shù)據(jù)分析這個部門,CDO其實(shí)是大數(shù)據(jù)專家和計算機(jī)專家一個界面,因?yàn)镃DO需要管理大數(shù)據(jù)專家,大數(shù)據(jù)專家需要不斷與計算機(jī)專家互動和合作,中間的配合工作則是由CDO來完成。”
軟件定義:瓦解傳統(tǒng)IT市場
軟件定義數(shù)據(jù)中心,被認(rèn)為是又一大影響IT發(fā)展的方向,從中衍生出來的軟件定義存儲、軟件定義網(wǎng)絡(luò)、軟件定義計算等都在逐漸影響著IT業(yè)界。這種趨勢其實(shí)也非常好理解,在IT硬件逐漸走向同質(zhì)化的今天,軟件才是差異化競爭的關(guān)鍵。
EMC副總裁、銷售部全球首席技術(shù)官Patricia Florissi博士就表示:“軟件定義數(shù)據(jù)中心將會瓦解現(xiàn)有數(shù)據(jù)中心的概念,包括存儲、網(wǎng)絡(luò)以及計算,這將是一個巨大的IT變革。其實(shí)軟件定義的本質(zhì)就是智能從硬件轉(zhuǎn)向了軟件,通過軟件來實(shí)現(xiàn)數(shù)據(jù)中心的不同需求,這意味著軟件定義使你擁有一種很靈活、靈動的方式管理你的硬件。在存儲領(lǐng)域,我們看到軟件定義的存儲會將控制和數(shù)據(jù)管理這兩塊分割開,在控制方面,硬件變得越來越不重要;在數(shù)據(jù)管理方面,因?yàn)閷I(yè)化的數(shù)據(jù)需要非??斓乃俣葋泶鎯?shù)據(jù),所以對硬件的專業(yè)化要求也將越來越高。”
當(dāng)前,隨著像Hadoop、Openstack、CloudStack等開源軟件項目的如火如荼,開源已經(jīng)成為軟件定義數(shù)據(jù)中心中不可或缺的一股力量。那么EMC對于開源軟件項目的態(tài)度又會如何呢?Patricia Florissi博士對此表示:“EMC完全支持和擁抱開源像Openstack、CloudStack這些開源技術(shù),而且會將所有開源技術(shù)與EMC產(chǎn)品集成。EMC所追求的是如果采用某項開源技術(shù),那么EMC平臺上的性能將會是最好的。”
當(dāng)然,Patricia Florissi博士仍然堅持企業(yè)級IT廠商非開源軟件平臺具有固有的優(yōu)勢,企業(yè)級IT廠商的非開源軟件平臺在功能和時間領(lǐng)先方面是其他開源平臺所不能比的。Patricia Florissi博士表示:“企業(yè)級廠商有一種責(zé)任就是要比Openstack更快的把創(chuàng)新和更新的版本推向市場,需要在功能強(qiáng)大和時間上領(lǐng)先開源項目。”
最后,Patricia Florissi博士用一個笑話來表明了她對開源的觀點(diǎn)和看法:“在非洲有一個老人和一個男孩,他們兩人都看見一個老虎,男孩趕緊穿他的跑鞋,這個老人說你為什么要穿跑鞋,你穿上跑鞋也跑不過老虎。但是這個男孩說,我不在乎我能不能跑過老虎,我只在乎我是不是能夠跑過你。”