大數(shù)據的“三要三不要”
CIO時代網 發(fā)表于:13年05月29日 13:21 [轉載] CIO時代
數(shù)據世界的快速演變使得大數(shù)據變得越來越重要,但大數(shù)據解價值如何實現(xiàn)仍需探索。在日前召開的英特爾大數(shù)據技術及行業(yè)應用論壇上,IDC企業(yè)系統(tǒng)與軟件研究組高級研究經理周震剛給出了實施大數(shù)據應當注意的幾個要點:包括投資回報率;數(shù)據分析的安全性、有效性和時效性;大數(shù)據和移動應用的關系;大數(shù)據和數(shù)據中心的設計關系;大數(shù)據在數(shù)據管理方面的重要性。
周震剛分享了大數(shù)據價值鏈的三個C即(Collect——收集、Consolidation——整合、Consumptions——消費)。他表示,我們的最終目標不是收集數(shù)據,而是為了能夠從大數(shù)據中挖掘出它的價值。收集內部和外部的數(shù)據之后,整合成可以分析的格式,再通過前端展現(xiàn)消費,才能產生最后的高價值。
如何避開一些陷阱,利用大數(shù)據解決方案實施上述步驟實現(xiàn)價值?周震剛總結了六個要點,簡稱“三要、三不要”。
首先要注意數(shù)據獲取和分析的經濟性。周震剛強調,不是所有的數(shù)據都要積累起來,因為有些數(shù)據積累起來,使我們的存儲和分析的成本變得更高,并不能為我們帶來更多的價值。利用Scale out架構可以有效地利用數(shù)據資產,更好地降低成本。但獲取成本過高的數(shù)據應當放出去。
其次,要注意數(shù)據的安全和管理。大數(shù)據和傳統(tǒng)數(shù)據一樣有安全要求,包括IT方面和業(yè)務方面的要求,什么人獲取到什么數(shù)據,仍然是大數(shù)據領域要考慮的問題。因為不同的數(shù)據在不同人眼里有不同的價值,給領導人和工作人員的數(shù)據視圖應當區(qū)分。
第三,要考慮數(shù)據的時效性。周震剛指出,大數(shù)據和傳統(tǒng)的高性能運算不同,高性能運算的目的是獲取終級答案,時間不是決定因素,比如RIS的大型粒子錐狀機,我們要拿到一個基本的粒子,有可能要十年。但對于大數(shù)據來說,時間就是價值,因為我們要把這個數(shù)據及時在企業(yè)應用之前投放到市場,分析的結果會影響企業(yè)下一步的決策,所以一定要考慮大數(shù)據分析的時效性。
“三不要”的第一條,千萬不要低估大數(shù)據在移動化中的作用,無論是對客戶還是員工。周震剛舉了高端品牌倩碧的案例。倩碧在美國是使用IT非常先進的企業(yè),它在iPad推出了以后很快的做了個基于皮膚分析的移動應用,它快速部署大概幾萬臺iPad到百貨商場,讓顧客可以在上面選擇怎么改善皮膚,我的皮膚信息是什么,是干性或油性等等,這些是顧客不愿意告訴銷售人員的。通過這種移動化的應用,倩碧銷售了很多的產品。業(yè)績提升了40%。
值得注意的是,后來倩碧希望通過這些信息分析顧客狀況的時候,卻發(fā)現(xiàn)他們讓顧客填的所有數(shù)據并沒有被留下來。客戶的信息沒有收集好,自然也無法進行分析。
第二個“不要”,我們的數(shù)據中心可能會被大數(shù)據所影響,千萬不要低估大數(shù)據的數(shù)據中心網絡和設計的影響。周震剛指出,很多的大數(shù)據解決方案設計了非常強的處理能力,卻沒有考慮對外網絡連接的狀況,使得網絡的瓶頸影響了整個大數(shù)據的解決方案。因此,在引入大數(shù)據解決方案的時候,一定要考慮到整個數(shù)據中心的設計。
第三,千萬不要低估數(shù)據管理的復雜性。美國有一個非常大的百貨連鎖公司,他們已經有100來年的歷史了,有上百年的客戶數(shù)據,收集得非常好,并且有這些客戶數(shù)據和銷售數(shù)據的分析。最近他們開始做一些媒體(包括社交媒體、報紙、電視臺)相關的信息來進行分析,這兩個方面都做得非常好,但是最后他們會發(fā)現(xiàn),這種市場上收集的數(shù)據和內部銷售數(shù)據,雙方的格式完全無法統(tǒng)一、無法整合。因此,一定要在開始的時候規(guī)劃好各個系統(tǒng),以便能夠統(tǒng)一應用大數(shù)據。