同方股份有限公司物聯(lián)網(wǎng)應用產(chǎn)業(yè)本部大數(shù)據(jù)產(chǎn)業(yè)研發(fā)與工程中心數(shù)據(jù)資源工程事業(yè)部副總經(jīng)理郭子龍

建立數(shù)據(jù)的標準框架 收納大數(shù)據(jù)

大數(shù)據(jù)來了,你可以忽略你擁有的數(shù)據(jù),但絕對不能分析你沒有的數(shù)據(jù),要將數(shù)據(jù)當成一種“戰(zhàn)略資源”來看待,所以我們首先要想一想怎么把大數(shù)據(jù)收集起來,形象地說就是我們需要一個數(shù)據(jù)容器把這些大數(shù)據(jù)集中的存放起來。如何去構建大數(shù)據(jù)容器?怎么裝進去?郭子龍認為,建好數(shù)據(jù)容器的標準框架能夠更好地去收納大數(shù)據(jù),同方多年來都在和數(shù)據(jù)打交道,做的就是搭建數(shù)據(jù)框架這件事,稱之為“數(shù)據(jù)資源體系”。搭建數(shù)據(jù)的標準框架,就好比一個中藥鋪,可以將當歸、牛黃、熊膽、遠志等中草藥分門別類的存放,既整齊也方便尋找,這已經(jīng)很好了,但還不夠,還需要知道藥材的藥理、藥性,如何按不同劑量進行搭配,形成一張張藥方去救治不同的病癥。同方的數(shù)據(jù)資源體系能夠將大數(shù)據(jù)有條理的組織起來并建立起數(shù)據(jù)之間的關聯(lián)關系。在大數(shù)據(jù)環(huán)境中,數(shù)據(jù)之間的輕度相關性要遠遠多于直接因果關系,將這些輕度相關性累加起來就變得舉足輕重,這是大數(shù)據(jù)應用的一個根本特征。當然,大數(shù)據(jù)在信息化方面也有自己的特點,我們不必過多的去考慮容量問題,而是應該把重點放在如何更好地把數(shù)據(jù)裝起來,每當用到相應的數(shù)據(jù)時可以方便地進行數(shù)據(jù)調用。

另外,我們需要把每一份數(shù)據(jù)都描述清楚,可以從技術、業(yè)務等多個角度去描述,同方的做法是用元數(shù)據(jù)去描述數(shù)據(jù),元數(shù)據(jù)是技術術語,即描述數(shù)據(jù)的數(shù)據(jù),而元數(shù)據(jù)體系是以元數(shù)據(jù)的形式實現(xiàn)了規(guī)范化、體系化的數(shù)據(jù)描述標準,可以將每一筆數(shù)據(jù)都變得可讀。

按照數(shù)據(jù)的第一性原理做好數(shù)據(jù)集成

收納好大數(shù)據(jù),還需要做數(shù)據(jù)集成工作。之前信息化主要關注的是系統(tǒng)集成或業(yè)務集成,近幾年則更多關注數(shù)據(jù)集成。不論是系統(tǒng)還是業(yè)務,相對于數(shù)據(jù)都是處于應用或展現(xiàn)層面,而數(shù)據(jù)集成則是在最底層,更為趨近于事務本源,從這一方面理解數(shù)據(jù)集成更優(yōu)于系統(tǒng)集成和業(yè)務集成。

那么數(shù)據(jù)集成依托于什么來做集成呢?郭子龍表示,同方依托指標體系在做數(shù)據(jù)集成時,充分利用了頂層設計方法并遵循第一性原理,從核心目標開始自頂向下逐層分解,同時更重視事實,而不是根據(jù)經(jīng)驗做假設,從數(shù)據(jù)自身的根本和源頭去做集成,避免方向性迷失。數(shù)據(jù)一旦被集成存儲到數(shù)據(jù)庫中,就成為了一種可以被無限的重復利用的資源,使數(shù)據(jù)更能發(fā)揮它的價值。

強化數(shù)據(jù)應用 重點關注核心問題

收納大數(shù)據(jù)和數(shù)據(jù)集成都不是最終目的,大數(shù)據(jù)的重點是數(shù)據(jù)應用。數(shù)據(jù)應用有很多種,傳統(tǒng)的應用如數(shù)據(jù)挖掘、數(shù)據(jù)倉庫等,數(shù)據(jù)挖掘最讓人印象深刻的例子就是啤酒與尿布,卻很難想到更多典型案例。郭子龍認為,“數(shù)據(jù)挖掘往往會將我們引入一個歧途,更多的去注重發(fā)現(xiàn)隱藏的關系,也就是不確定性問題,反而忽略了更為重要的確定性問題或主要矛盾。我們應該把目光聚焦在核心問題上,而不是舍本逐末的僅僅關注一些邊緣化的問題,千萬不要丟了西瓜去撿芝麻。”換句話說,數(shù)據(jù)應用無處不在,我們應該充分考慮人與計算機在處理能力上的差異性,關注事物的主要矛盾,充分考慮在海量化的各類數(shù)據(jù)中,我們應該更關注哪些數(shù)據(jù)。

做好數(shù)據(jù)容器、數(shù)據(jù)集成和數(shù)據(jù)應用這三步,可以幫助政府和企業(yè)積極應對大數(shù)據(jù)浪潮。同方基于自身多年從事數(shù)據(jù)業(yè)務對數(shù)據(jù)的理解,以及大數(shù)據(jù)的自身特點,構建了一整套具有自主知識產(chǎn)權的數(shù)據(jù)資源體系,該體系獨立于行業(yè)、獨立于業(yè)務,把數(shù)據(jù)和我們的業(yè)務、系統(tǒng)及功能模塊分離開來,成為能夠無限發(fā)展的“數(shù)據(jù)極”,讓數(shù)據(jù)能夠更好的被使用,從而發(fā)揮數(shù)據(jù)的最大價值。

分享到

wangxueyang

相關推薦