據(jù)了解,在開始的階段,DataZoo也是為了解決易用性和兼容性的問(wèn)題,自己內(nèi)部使用的工具,用于支持公司的業(yè)務(wù)應(yīng)用。在使用中,這些工具得到了合作伙伴以及用戶的好評(píng),這也最終促使榮之聯(lián)下決心以大數(shù)據(jù)平臺(tái)產(chǎn)品的方式對(duì)外提供服務(wù)。

從技術(shù)上說(shuō),DataZoo具有Hadoop平臺(tái)結(jié)構(gòu)的能力,可以為分布式是數(shù)據(jù)分析服務(wù)提供支持。在這個(gè)基礎(chǔ)之上,提供了批處理、實(shí)時(shí)流處理、多維搜索、圖計(jì)算和數(shù)據(jù)挖掘等功能模塊。其中,不同的功能模塊解決不用的問(wèn)題,有的針對(duì)排序,有的針對(duì)流數(shù)據(jù)處理,總之,希望在易用性方面為行業(yè)用戶提供更多的支持。

以多維檢索為例,前面說(shuō)過(guò),有些用戶只熟悉SQL,要求系統(tǒng)能夠支持SQL方式查詢,另外就是多維檢索的性能問(wèn)題,目前DataZoo能夠支持億萬(wàn)數(shù)據(jù)規(guī)模秒級(jí)的響應(yīng)速度,在沒(méi)有緩存支持的情況下,80% 左右的查詢能夠在3秒返回,這樣的能力在業(yè)界首屈一指,處于領(lǐng)先的水平。

這些功能模塊透過(guò)和行業(yè)應(yīng)用結(jié)合,積累了豐富的行業(yè)應(yīng)用模型,如駕駛行為模型、碰撞分析模型、推薦模型、用戶畫像、文本分析分詞和情感分析模型,這些模型在實(shí)際行業(yè)應(yīng)用中積累了大量的知識(shí)點(diǎn),這些知識(shí)點(diǎn)最終將會(huì)成為最為寶貴的財(cái)富。

?小結(jié)

大數(shù)據(jù)和人們的預(yù)期還有很大的距離,這不完全是技術(shù)問(wèn)題,類似電腦在普及階段被作為打字機(jī)使用,但這是一個(gè)好的開端,隨著技術(shù)水平的提升,技術(shù)效果將逐步顯現(xiàn)出來(lái)。從另外一個(gè)角度看,冬天也意味著春天并不遙遠(yuǎn),可以預(yù)計(jì), 數(shù)據(jù)動(dòng)物園春天并不遙遠(yuǎn)。

分享到

songjy

相關(guān)推薦