噜噜噜综合,又色又爽又高潮免费观看,综合无码一区二区三区四区五区,中文字幕无码人妻aaa片,四虎成人精品永久网站

如何避免失敗,像Google一樣玩轉(zhuǎn)大數(shù)據(jù)

Data Science Central 發(fā)表于:13年07月26日 17:38 [轉(zhuǎn)載] DOIT.com.cn

  • 分享:
[導(dǎo)讀]隨著生活的豐富,產(chǎn)生數(shù)據(jù)的設(shè)備也是愈來(lái)愈多,同樣需要處理的數(shù)據(jù)體積也是日益激增,各個(gè)機(jī)構(gòu)也紛紛把眼光投向“大數(shù)據(jù)”這個(gè)術(shù)語(yǔ)。
如何避免失敗,像Google一樣玩轉(zhuǎn)大數(shù)據(jù)

隨著生活的豐富,產(chǎn)生數(shù)據(jù)的設(shè)備也是愈來(lái)愈多,同樣需要處理的數(shù)據(jù)體積也是日益激增,各個(gè)機(jī)構(gòu)也紛紛把眼光投向“大數(shù)據(jù)”這個(gè)術(shù)語(yǔ)。在這場(chǎng)數(shù)據(jù)的淘金中許多公司滿(mǎn)載而歸,然而“大數(shù)據(jù)”投資失敗的公司也不可謂不多,所以就有了之前的一篇文章“ Why Big Data Projects Fail”。對(duì)此,商業(yè)智能工具研發(fā)總監(jiān)、esProc、esCalc高級(jí)顧問(wèn)Jim King否認(rèn)了這個(gè)看法,并以Google為例給大數(shù)據(jù)投資者提出了一些警示。

以下為譯文:

首先看一下大數(shù)據(jù)成功典范Google,看看他們是如何玩轉(zhuǎn)大數(shù)據(jù)的:

1. 收集數(shù)據(jù),捕捉每個(gè)網(wǎng)站、電子郵件、Cookie內(nèi)容,并提取關(guān)鍵信息。

2. 為信息創(chuàng)建復(fù)合索引。不用說(shuō),廣告相關(guān)索引是必不可少的。

3. 將目錄和內(nèi)容儲(chǔ)存在分布式服務(wù)器中。

4. 當(dāng)用戶(hù)瀏覽網(wǎng)站以及搜索或訪問(wèn)電子郵件時(shí),Google會(huì)對(duì)這些請(qǐng)求做復(fù)雜的轉(zhuǎn)換處理,同時(shí)幾個(gè)索引項(xiàng)會(huì)隨之確定。

5. 根據(jù)索引在服務(wù)器中查詢(xún)數(shù)據(jù),返回搜索結(jié)果或者廣告。

在這里不難發(fā)現(xiàn),與Hadoop有關(guān)的只有3和5,也就是數(shù)據(jù)儲(chǔ)存和查詢(xún)。而這兩項(xiàng)也是最容易實(shí)現(xiàn)的兩項(xiàng),比如Hadoop就是個(gè)具有良好擴(kuò)展性及低成本的解決方案。

那么實(shí)現(xiàn)3和5就可以像Google一樣發(fā)玩轉(zhuǎn)大數(shù)據(jù)了?很顯然不行,因?yàn)殛P(guān)鍵選項(xiàng)2和4并沒(méi)有實(shí)現(xiàn),而2和4就是所謂的業(yè)務(wù)分析算法。這些算法由業(yè)務(wù)專(zhuān)家根據(jù)數(shù)據(jù)、業(yè)務(wù)知識(shí)、市場(chǎng)趨勢(shì)精心打造,是許多企業(yè)商業(yè)策略制定的重要手段及核心。這才是4V理論中的“Value”。

這也是現(xiàn)下許多大數(shù)據(jù)投資失敗的原因,因?yàn)楫?dāng)下的大數(shù)據(jù)只提供了數(shù)據(jù)存儲(chǔ)和查詢(xún)的策略,缺乏了提高企業(yè)競(jìng)爭(zhēng)力的業(yè)務(wù)分析解決方案,而恰恰這才是最重要的。事實(shí)上,現(xiàn)在的大數(shù)據(jù)工具都是為IT專(zhuān)家打造的,他們可以通過(guò)C++或者Java實(shí)現(xiàn)MapReduce功能,但是卻無(wú)法提供有價(jià)值的商業(yè)算法。

因此大數(shù)據(jù)成功的關(guān)鍵不在于Hadoop是否部署成功,而在于對(duì)業(yè)務(wù)有幫助算法的制定,而在人才嚴(yán)重缺乏的當(dāng)下,不妨從數(shù)據(jù)工具入手。降低工具使用的門(mén)檻,讓業(yè)務(wù)專(zhuān)家可以參與其中,才能發(fā)揮大數(shù)據(jù)真正的作用,對(duì)業(yè)務(wù)起到立竿見(jiàn)影的改善。

總結(jié)

工具的部署誰(shuí)都可以,關(guān)鍵在于業(yè)務(wù)算法的制定,讓業(yè)務(wù)專(zhuān)家無(wú)縫的參與數(shù)據(jù)的分析才是成功之始。

[責(zé)任編輯:王雪楊]
近日,DOIT《云服務(wù)商生存法則》的第三期節(jié)目,小編采訪到了微軟中國(guó)Windows Azure事業(yè)部總經(jīng)理嚴(yán)治慶先生。專(zhuān)題已上線,歡迎網(wǎng)友們點(diǎn)擊收看。
官方微信
weixin
精彩專(zhuān)題更多
存儲(chǔ)風(fēng)云榜”是由DOIT傳媒主辦的年度大型活動(dòng);仡2014年,存儲(chǔ)作為IT系統(tǒng)架構(gòu)中最基礎(chǔ)的元素,已經(jīng)成為了推動(dòng)信息產(chǎn)業(yè)發(fā)展的核心動(dòng)力,存儲(chǔ)產(chǎn)業(yè)的發(fā)展邁向成熟,數(shù)據(jù)經(jīng)濟(jì)的概念順勢(shì)而為的提出。
華為OceanStor V3系列存儲(chǔ)系統(tǒng)是面向企業(yè)級(jí)應(yīng)用的新一代統(tǒng)一存儲(chǔ)產(chǎn)品。在功能、性能、效率、可靠性和易用性上都達(dá)到業(yè)界領(lǐng)先水平,很好的滿(mǎn)足了大型數(shù)據(jù)庫(kù)OLTP/OLAP、文件共享、云計(jì)算等各種應(yīng)用下的數(shù)據(jù)存儲(chǔ)需求。
聯(lián)想攜ThinkServer+System+七大行業(yè)解決方案驚艷第十六屆高交會(huì)
 

公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶(hù)寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心

Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.