以下為演講實錄:
大家好我演講的題目叫數(shù)據(jù)夢想與實踐。我們公司的孟子叫數(shù)夢工場,數(shù)是大數(shù)據(jù)的數(shù),數(shù)是現(xiàn)實世界運行的痕跡,既然是現(xiàn)實世界運行的痕跡提取出來,它的數(shù)據(jù)量就非常的大。因此數(shù)據(jù)技術(shù)的一個方向一定是以超級計算的云,超級計算的數(shù)據(jù)庫,大數(shù)據(jù)分析和云安全為基礎(chǔ)的。夢,因為數(shù)只是一個技術(shù)工具,不是終極目標(biāo),而它要實現(xiàn)的夢想是什么呢?回歸到我們中國就是中國夢,具體解讀就是用數(shù)據(jù)技術(shù)來助力青山綠水,民生幸福,政治安定和經(jīng)濟繁榮。工我們都是一些工程師,這幾個月我們有400人在一起,研發(fā)占比65%,我們要用數(shù)據(jù)技術(shù)來圓中國夢地開辟新的戰(zhàn)場。場是戰(zhàn)場,也可以是牧場,對內(nèi)是放養(yǎng),對外是戰(zhàn)場。我們公司具備一種能力就是以數(shù)據(jù)為核心的能力。
在過去十年當(dāng)中有很多新的技術(shù)名詞出現(xiàn)了,有云計算,它是一種超級計算是一種公共計算服務(wù),有大數(shù)據(jù),有移動互聯(lián)網(wǎng),還有很多模式方面的類似于向O2O,C2B,工業(yè)4.0,之前我跟阿里的王堅博士也有一個討論,他認(rèn)為之前有一個技術(shù)就要叫互聯(lián)網(wǎng)技術(shù),我們看到的所有技術(shù),云也好,大數(shù)據(jù)也好,都是互聯(lián)網(wǎng)在數(shù)據(jù)方面一個整體的某一個部分。以前可能是盲人摸象,只是摸到了互聯(lián)網(wǎng)某一個地方,類似于應(yīng)用能力和大數(shù)據(jù)能力,如果我們聚集到一個整體就是以數(shù)據(jù)為中心的能力,這種能力不是誕生于傳統(tǒng)的IT廠商,而是誕生于具體實踐的創(chuàng)新。這種能力可以無邊界的信息獲取方式可以提供百年的創(chuàng)新引擎,今年的“互聯(lián)網(wǎng)+”作為百行百業(yè)的基礎(chǔ)設(shè)施創(chuàng)新的承載工具。這個是互聯(lián)網(wǎng)向外輸出,也是“互聯(lián)網(wǎng)+”向百強的傳遞。
但是“互聯(lián)網(wǎng)+”有四個障礙,第一障礙是思維上的障礙,之前王堅之前反復(fù)提互聯(lián)網(wǎng)是一種數(shù)據(jù)能力和基礎(chǔ)設(shè)施,但是基礎(chǔ)設(shè)施這種事項在百行并沒有廣泛地理解,我曾經(jīng)到一個大學(xué)跟教授講,現(xiàn)在拿年薪百萬都沒有真正的實操經(jīng)驗的人,為什么?學(xué)校培養(yǎng)不出來,學(xué)校沒有云和科技基礎(chǔ)設(shè)施,如果政府都沒有,可能百度和阿里隨時都能調(diào)動百十萬臺服務(wù)器,但是可能要把國家經(jīng)濟運行情況進行運算,拿出50臺服務(wù)器的計算能力都沒有這種設(shè)施。有了它才能夠?qū)崿F(xiàn)B2B這樣一種跨界,所謂BAT就是以前能力無法實現(xiàn),所謂行業(yè)切割成條塊,把復(fù)雜的事情縮小去給它做應(yīng)用開發(fā),今天我們有了龐大的能力,我們可以把全國稅務(wù)數(shù)據(jù)集中到稅務(wù)局去計算,這個就消除以往的條塊邊界,可以做到洞察真相。
我們還有一個平臺選擇,之前15年一哄而上,又一一哄而下,商用平臺其實并不多。評價云廠商評價100個廠商這是一種笑話。我們現(xiàn)在缺乏一種保障,一個真正云數(shù)據(jù)平臺非常復(fù)雜,我們國家尤其是一線城市擁有這樣的人才并不多,真正的大數(shù)據(jù)應(yīng)用開發(fā)并不多,需要數(shù)據(jù)繁榮。因此整個“互聯(lián)網(wǎng)+”過程當(dāng)中推動過程當(dāng)中面臨四大障礙,但四大障礙也面臨四大機遇,拋棄傳統(tǒng)的局部決策定位來做一次全新的整合式創(chuàng)新。什么叫整合式創(chuàng)新呢?這一輪創(chuàng)新區(qū)別于以前不一樣的是以前是細分技術(shù)、細分場景細分品類的一次創(chuàng)新,天下大事合久必分,分久必合,以前是細分,細分縱向領(lǐng)域,現(xiàn)在是整個趨勢逆轉(zhuǎn)過來,要做橫向的場景化的細分。
如果有了云和大數(shù)據(jù)的平臺只是像一個桌子一樣具備一個基本能力,但是這個桌子上還要放上各種各樣的滿足于各行各業(yè)的菜,這個菜和桌子的應(yīng)用就是場景化的過程。它要面臨哪些場景創(chuàng)新?技術(shù)整合,是不是把中國移動中國聯(lián)通中國電信的環(huán)境作為一個基礎(chǔ)接入進來,是不是要把浪潮華為等應(yīng)用整合進來,是不是要把真正的云和大數(shù)據(jù)整合進來,是不是要把大數(shù)據(jù)之上的應(yīng)用開發(fā)整合進來?這是大數(shù)據(jù)開發(fā)整合過程。另外一個之前數(shù)據(jù)是分割的,數(shù)據(jù)對于機構(gòu)來講就是權(quán)利,整合數(shù)據(jù)就是整合權(quán)利,整合全力過程如果沒有清晰模式和價值導(dǎo)向是推不動的,很多時候是一把手才能夠推動的工程。
第三個是整合人才,所有的應(yīng)用區(qū)別于區(qū)域和行業(yè),它實際上要做不同場景細分,它需要不同的維護人才到上面全站式一直到邏輯分層是需要很多人才,最近我們發(fā)現(xiàn)我們最缺的是統(tǒng)計學(xué)能力人,還有相應(yīng)UI這樣的人。第四個還要做資金整合。因為基礎(chǔ)設(shè)施前期投入大,后期回報也大。這些所有能力不光是輸出出來,也要把整個四個能力方面要在具體場景中做大量工作,這就回到了我們認(rèn)識和愿景,用最簡單的文字,我們這個公司成立起來就是要用數(shù)據(jù)技術(shù)圓夢,要做一次“互聯(lián)網(wǎng)+”,它是+號是雙向的,就是BAT阿里核心內(nèi)容平臺,第二就是面向政企,也就是百行百應(yīng),第三就是場景開發(fā)服務(wù)。
4月份我們跟阿里簽署了使命級的戰(zhàn)略合作伙伴關(guān)系,頭一次這種詞冒出來,以前叫做戰(zhàn)略合作伙伴關(guān)系,加了一個使命,使命是拿互聯(lián)網(wǎng)創(chuàng)新能力輸出出去拿百行百應(yīng)的基礎(chǔ)設(shè)施做創(chuàng)新工具,我們拿阿里云云平臺作為我們合作,華為和浪潮硬件設(shè)備和軟件設(shè)備對象,已經(jīng)有人做了,別人干的我們不干,整合創(chuàng)新是我們做的事情。
所謂夢想必須要具體實踐,下面我開始舉例子,這個例子是浙江省的政務(wù)云,是個省級平臺,實現(xiàn)價值一共有三個及第一個價值是成本集約,一個省級平臺信息化投入軟硬件加在一起一年可能大概5、6個億,一個省一年大概有60、70個億,絕大多數(shù)設(shè)備都是閑著,關(guān)鍵時候頂不住,比如開學(xué)的時候千軍萬馬過來都支撐不開了。
大家知道基礎(chǔ)云是成本集約,集中起來建,可能原來一半都不到的投入就可以做需求的接入,財政把其他的砍掉,集中來建,這叫集約。還有一種是弱O,弱O不是去掉oracle,因為oracle在高頻交易方面不錯,但是很多地方不用oracle的,可以換其他的數(shù)據(jù)庫,尤其國產(chǎn)數(shù)據(jù)庫。省錢不是目的,最重要的中國夢要實現(xiàn)兩個轉(zhuǎn)型,一個是政務(wù)轉(zhuǎn)型,一個是經(jīng)濟轉(zhuǎn)型。政務(wù)轉(zhuǎn)型從管理型要走向服務(wù)型轉(zhuǎn)型,經(jīng)濟轉(zhuǎn)型從傳統(tǒng)經(jīng)濟到信息經(jīng)濟到智慧經(jīng)濟。實體經(jīng)濟加實體經(jīng)濟變成信息經(jīng)濟這樣一個路徑。
這張圖我們把整個過程列了一下,最下面我們要建一個云計算和大數(shù)據(jù)的基礎(chǔ)設(shè)施,今年5月1號正式上線,全部金魚飛天600臺服務(wù)器,300個TB,這可能是初始,5月23號我們?nèi)racle,之前是沉淀下來,不是云計算,說白了還是虛擬化,把傳統(tǒng)應(yīng)用虛擬化了一下。把數(shù)據(jù)用云計算構(gòu)建,這是真正的大數(shù)據(jù)?,F(xiàn)在我們每個禮拜去幾個。
第二個就是以前政府的所有數(shù)據(jù)是分散在各個部門的,這些部門實際上是貌合神離的狀態(tài),現(xiàn)在這些數(shù)據(jù)打通就形成很多的東西,比如每個區(qū)縣近十年的水平圖畫出來,所以大家可以通過鹽判斷長久的數(shù)據(jù)可以實現(xiàn),通過煙酒可以判斷消費,正常通過公安人口比對多圖層是可以看到區(qū)域狀況的。因此在這里要進行數(shù)據(jù)打通,數(shù)據(jù)打通之后要進行清理,安全可控數(shù)據(jù),還要可控提供一個初始化的互聯(lián)網(wǎng)環(huán)境。數(shù)據(jù)是最寶貴的數(shù)據(jù),在不涉及到安全情況下,比如交通數(shù)據(jù),氣象數(shù)據(jù)是給萬眾創(chuàng)新提供很好的數(shù)據(jù)平臺。
第三個我們要形成政府淘寶,什么叫政府?政府提供的就是納稅人納稅之后政府要作為一種公共服務(wù)產(chǎn)品,公共服務(wù)商品來交易出來。既然是一種公共服務(wù)產(chǎn)品,道理上它應(yīng)該跟淘寶所提供的服務(wù)應(yīng)該是一樣的,如果是跟淘寶的邏輯一樣的,能不能做政務(wù)淘寶呢?這個就是浙江省領(lǐng)導(dǎo)提出來的要做政務(wù)淘寶,把所有的政府服務(wù)抽象成具體的商品。比如一個政府到底有多少個權(quán)利。去年省領(lǐng)導(dǎo)就組織,查出來是16000多個權(quán)利,能不能刪并減改最后4600個權(quán)利,最后像網(wǎng)上商品一樣給大家提供服務(wù)呢,可以,所以現(xiàn)在都放到了云上。放到云上之后能不能讓所有百姓看到這個服務(wù)的流程,就像在淘寶買東西知道它在哪里了,我們知道事物來進行好評也可以差評,我們把阿里機構(gòu),使得政府4000多個變成淘寶4000多個機構(gòu)一樣,從管理型向服務(wù)型管理轉(zhuǎn)變。
在這里舉一個例子,如果辦準(zhǔn)生證是需要開單位證明,開戶口復(fù)印件拿著這個東西跑五六趟,可能蓋50個戳,這樣跑來跑去,可以是用數(shù)據(jù)跑路,而不應(yīng)該讓人跑路,服務(wù)應(yīng)該是一站式的,應(yīng)該是縮短辦理距離,如果這個完成它的功德是無量的。這是我們在政務(wù)云上要提供的東西。將來要逛淘寶一樣可以逛衙門,這不是我們提出來的,這實際上是浙江省政府領(lǐng)導(dǎo)他在建設(shè)政府云的目標(biāo)上所要時間的目的。
我們做了什么?這個詞就是后臺及服務(wù),我個人叫后備服務(wù),因為云是一個企業(yè)不是終極目的找技術(shù),而是把它到后面找數(shù)據(jù)。所有人要后臺關(guān)鍵的及時性服務(wù),能力要全站式,距離是零距離。第二個是沒必要的oracle的開銷我們可以把它可以去掉,整個去O的過程今年六一兒童節(jié)阿里云發(fā)了一個PG數(shù)據(jù)庫,它的數(shù)據(jù)是替代oracle的數(shù)據(jù)可以特別簡單,這整個過程跟大家分享一下。
(VCR播放)
這是一個簡單的過程,我跟阿里云王博士聊的時候他也跟我講,其實并不是為了去oracle而去oracle,而是當(dāng)它的商品庫最小容量要求,oracle最大的能力夠不到的時候才去。我們現(xiàn)在要做的是分久必合,這個合很恐怖,這個數(shù)據(jù)庫恐怕傳統(tǒng)的數(shù)據(jù)庫沒有辦法支撐,這是海量的分布式數(shù)據(jù)庫才能夠替代,這是我們的數(shù)據(jù)庫的原因。這不是貌合神離,而是真正的數(shù)據(jù)合在一起,完成大數(shù)據(jù)的過程。
我們大數(shù)據(jù)實現(xiàn)云和基礎(chǔ)平臺,這里面有公安數(shù)據(jù)、社保數(shù)據(jù)、工商數(shù)據(jù)、人口庫、法人地理信息數(shù)據(jù)庫,有半結(jié)構(gòu)化和結(jié)構(gòu)化的數(shù)據(jù),公安不可能把哪個數(shù)據(jù)都放到那里大家都可以用,這個過程中數(shù)據(jù)集中和數(shù)據(jù)安全性就進行一次博弈,如何能達到它的平衡?首先之前有數(shù)據(jù)地方搞交易一定是偽命題,因為之前資產(chǎn)產(chǎn)權(quán)都不規(guī)定,一般很難交易。
之前就是把數(shù)據(jù)變成公共的目錄,然后公安整合,社保還是在社保手里,不能因為社保的數(shù)據(jù)可以看到公安的數(shù)據(jù),這個是數(shù)據(jù)倉庫把垃圾清晰去掉,可以根據(jù)身份證信息進行系統(tǒng)計算,但是不能讓上層的開發(fā)者看到具體人的信息,分級的安全產(chǎn)品管控,最終數(shù)據(jù)可易用性就是數(shù)據(jù)不搬家,可用即可見,這就是數(shù)據(jù)集中安全的平衡。大數(shù)據(jù)真正的應(yīng)用,破除安全平衡點,最關(guān)鍵一點在于能不能做到列表級的用戶的管控,這是最主要的挑戰(zhàn)點。
在此我們再來提供分析工具,大量的數(shù)據(jù)商業(yè)分析等等,以及數(shù)據(jù)地圖等等需要大量的集成工具,這種工具我不建議到社區(qū)上找,最好是封裝好一個套裝在標(biāo)準(zhǔn)的平臺上來進行萬眾創(chuàng)新的數(shù)據(jù)環(huán)境。2009年美國也是從47個政府開始進行數(shù)據(jù)開放萬眾創(chuàng)新,慢慢地進入良性循環(huán),這是我們目前正在做的事情。
除了政務(wù)轉(zhuǎn)型之外,現(xiàn)在工業(yè)4.0,制造2025比較熱,我們現(xiàn)在在幾個具體的合作伙伴那里相應(yīng)實踐,這里面是基于云、大數(shù)據(jù)和機器人替代傳統(tǒng)的云,現(xiàn)在機器人最快速,現(xiàn)在機器人使用成本已經(jīng)遠遠低于了用人的成本,人的工資五險一金,再加上平攤費用現(xiàn)在已經(jīng)大于機器人。機器人盡可能把計算集中到云端和大數(shù)據(jù)云端,機器人做到機器車間,機器車間就是黑的,連燈都不亮,全部就是黑著做事情。但是這個車間一個車間一天產(chǎn)生的數(shù)據(jù)量是大于TB的,它海量信息都需要云計算的支撐。另外機器人代替C2B,起到營銷和管理手段。工業(yè)云我們很快在7月1號左右也會發(fā)布出來它的具體事跡。
圍繞云做一個小結(jié),我們以前割裂了云計算、大數(shù)據(jù)和數(shù)據(jù)庫的能力,這三個整合是閉環(huán)的能力,對于傳統(tǒng)云可以做到云開發(fā),在此之上可以做到應(yīng)用層在線,數(shù)據(jù)庫在線原始數(shù)據(jù)經(jīng)過提取合并再經(jīng)過相應(yīng)分析才能夠形成價值在線,價值在線提供更多的應(yīng)用在線和更多的價值,它是一個完整的閉環(huán)。之所以之前很多地方一哄而下,上面可以說是假云,假數(shù)據(jù)庫,假的大數(shù)據(jù),它完成不了這次閉環(huán)使得投入大量金錢而沒有效率。而把所有能力進行良性循環(huán),螺旋式上升的能力,這個過程中某一個廠商的能力不行,需要完整的開發(fā),場景開發(fā)。我們前面是概念期,后面是商用期,云和大數(shù)據(jù)沒有真正說自己是云和大數(shù)據(jù)專家,吹擂自己是專家基本上自己是屬于吹牛范疇。
在這個過程中商家實踐都進大量的前景,分成兩撥,一個是基于鮮有的系統(tǒng)在做,還有一部分是商用的,阿里巴巴、微軟云等等。到底什么叫商用云,這里面叫真云。可靠的、先進的,先進主要指可靠和性能。服務(wù)的,是可持續(xù)發(fā)展的,是TCO最優(yōu)的,免費的往往是最貴的。這里面往往舉一個例子,什么叫云?云不是切開成若干的單元,那個只是解決單機效率問題,今天要進行超大規(guī)模的計算整合能力,云計算需要用最普通的性價比最高的服務(wù)器,成千上萬的,我這里劃了兩個服務(wù)器,一個是P,一個是F,阿里是盤古,一個是福兮,是把成千上萬的這樣一種服務(wù)能力,把它通過分布式調(diào)度系統(tǒng)改造成數(shù)據(jù)庫變成一個計算能力把五千臺服務(wù)器計算能力變成一個計算服務(wù)能力,這叫先聚合,然后再切片,這才叫分布式計算系統(tǒng)。
就像我們?nèi)说拇竽X,腦細胞死了還是沒關(guān)系,還是整個大腦保持,所以一卡車數(shù)據(jù)中心拉到外面都沒關(guān)系。應(yīng)用是毫秒級應(yīng)用完成。并行計算,真正實現(xiàn)并行計算而不是簡單切片的規(guī)則。很技術(shù)的東西就跳過去了,這次在海關(guān)總署用到的大數(shù)據(jù),這里面用到了ADS,OPS和ADS,9000個在線的海關(guān)人員對它進行切片方式進行事前監(jiān)管事中監(jiān)控,事后管理的控制。最終我們形成全家福,在整個全家福下面是我們要整合的很多產(chǎn)品,中間我們要給它做整合式創(chuàng)新,就是整個管控POT整合相關(guān)的應(yīng)用來聚集具體的應(yīng)用場景。
今天在結(jié)束之前我再宣布兩個產(chǎn)品即將發(fā)布的,一個叫大數(shù)據(jù)一體機,這個大數(shù)據(jù)一體機可以擴容兩百臺,它的性能可以超群,每中處理4GB,可以達到4個9,這樣同時支持流域引擎和機器引擎。7月1號我會發(fā)布這個產(chǎn)品。第二個就是DIDIBASE,這個是可以做到數(shù)據(jù)庫,最大的148個節(jié)點,它可以和oracle有58%的兼容性,生成數(shù)據(jù)庫的時間是秒鐘級,連分鐘級都不用。這個數(shù)的工場,其實數(shù)是數(shù)的整合,平臺整合,資金整合。奧運會搭出來一個字,就是合,這個和才能到達復(fù)興。這個工是共建共享的生態(tài)環(huán)境。這個場是共贏的場,我們互補互信。今天我們到這里跟大家分享一下我們的事情,最終還是期望跟在應(yīng)用側(cè)的和服務(wù)側(cè)的合作伙伴共同打造數(shù)據(jù)的明天,共同去圓我們偉大的中國夢,謝謝大家!