8月29日,七牛D-Future大會上,CEO許式偉帶來主題為《數(shù)據(jù)啟動商業(yè)新常態(tài)》的開幕演講。他從互聯(lián)網(wǎng)對企業(yè)商業(yè)形態(tài)帶來的影響講起,強調了數(shù)據(jù)在其中所起到的重要作用,并直指非結構化數(shù)據(jù)和日志數(shù)據(jù)兩大數(shù)據(jù)“金礦”的價值,遠未被人們挖掘,主要由于技術本身確實存在的挑戰(zhàn),還有人們對數(shù)據(jù)的重視程度和認知程度不足。
他指出,七牛是全世界第一個提出用存儲、加速和數(shù)據(jù)處理這三個詞來描述云存儲服務的公司,這與其他云服務商僅將云存儲作為云主機附屬品的思路有很大不同。并且,為了更好地服務于平臺上的28萬企業(yè)用戶,七牛用KODO對象存儲服務、FUSION融合CDN管理平臺、DORA就近計算平臺、PILI直播云服務四大產品重新定義了云存儲,志在成為最開放、最完備的數(shù)據(jù)服務提供商。
以下為演講實錄,略有刪減。
感謝大家對于七牛的支持,今天能舉辦D-Future大會,從我個人而言,心里感慨萬千。七牛到今天已經有四年左右的歷史。應該說我們是非常年輕的一個公司。今天舉辦這樣一場大會,我覺得首先是這個時代給了我們一個這樣的機遇。在座的各位都是這個時代的弄潮兒,今天能跟大家談一談我們對數(shù)據(jù)、對互聯(lián)網(wǎng)的看法,是七牛的榮幸。我畢業(yè)的時候,剛好是互聯(lián)網(wǎng)這個新興的產業(yè)剛剛開始的階段,我覺得前面的十幾年很精彩,但今天無疑是一個更加精彩的時刻。互聯(lián)網(wǎng)剛剛開始的時候,它只是一個新興的產業(yè),今天大家都在說互聯(lián)網(wǎng)產業(yè)。但是不久的將來,互聯(lián)網(wǎng)不再是一個新興的產業(yè),它其實是一個新興的生產力,和所有的實體經濟和各行各業(yè)都息息相關。
我們認為,今天的互聯(lián)網(wǎng)蘊藏著更巨大的商業(yè)機會?;ヂ?lián)網(wǎng)之前是一個行業(yè),它的影響仍然只是非常小的一個人群。但是今天,每一個人都已經聯(lián)網(wǎng)了,中國超過半數(shù)的人群,已經隨時隨地都在網(wǎng)絡上。這給我們的影響是非常巨大的,我們的商業(yè)因為有了互聯(lián)網(wǎng)而重新洗牌。所以,今天所有的公司都有非常大的危機感,因為如果沒有變化,他們很可能會被淘汰。但同時我覺得這也是一個新的機會。誰能跟隨上這個時代的機遇,誰就可以成為所在行業(yè)的領頭羊。這也是為什么那么多人談互聯(lián)網(wǎng)轉型,為什么大家都會談創(chuàng)新,談顛覆。我們正面臨著一個前所未有的機遇,如果不變,一定會死。
今天我們的D-Future是一個以數(shù)據(jù)為主題的會議。因為,如果要用一個詞來概括這個互聯(lián)網(wǎng)時代,我認為就是兩個字,數(shù)據(jù)。實際上信息一直都存在,只是它以前存在于原子世界,有了計算機和互聯(lián)網(wǎng)之后,數(shù)據(jù)存在于虛擬的比特世界。并且這個新的世界正在以每三年翻一倍的速度在膨脹。為什么會有這樣的一個變化?大家去分析一下人的能力就會發(fā)現(xiàn),人本身的邏輯能力和計算能力是非常有限的,我們很難去很快地執(zhí)行一個對計算機來說非常簡單的任務,例如71×131等于多少。我相信多數(shù)人都不能很快地答出來,但計算機執(zhí)行這樣的計算,是納秒級的。計算機和互聯(lián)網(wǎng)擴展了人的邏輯能力,讓我們有了很強的分析和預測未來的能力。在這樣的數(shù)字化洪流下,我們的商業(yè)將受到非常巨大的影響。所以今天我們也想談談互聯(lián)網(wǎng)轉型后的商業(yè)新常態(tài)到底是什么樣的。
首先,我們來看一看業(yè)務本身?;ヂ?lián)網(wǎng)化最基礎的一個訴求就是業(yè)務上網(wǎng)。想象一下,或者我們對比一下傳統(tǒng)的商業(yè)和新興的商業(yè)形態(tài),最大的一個不同是什么?如果我們用一個詞去概括舊的商業(yè)形態(tài),我個人想到的一個詞是“一手交錢一手交貨”,這就是舊的商業(yè)形態(tài)最基本的特色。但是互聯(lián)網(wǎng)改變了這一切,互聯(lián)網(wǎng)讓遠程交易成為了可能。遠程交易產生一個服務對商業(yè)的影響是非常非常巨大的。我們的業(yè)務場景比以前開闊了很多,我們以前只能影響我們周圍非常小的一群人。最多我們的公司做大了之后,在不同的地方開不同的分部,但是影響的人群仍然只是公司能到達的范疇。
但是互聯(lián)網(wǎng)改變了這一切。我們來分析一下互聯(lián)網(wǎng)時代業(yè)務的特征。我也概括了一個詞,“非結構化數(shù)據(jù)是人類最自然的溝通方式”。什么叫非結構化數(shù)據(jù)呢?我們自然表達的語言文本以及圖片、音頻、視頻等媒介,都是非結構化數(shù)據(jù)。這些數(shù)據(jù)是人類非常容易理解的,但是計算機很難理解。計算機有非常強大的邏輯能力,但計算機在語義的理解上是非常原始的——可能連三歲嬰兒的水平都達不到。非結構化數(shù)據(jù)就是傳遞人的意愿。比如,我拿起電話說幾段語音,告訴對方我想要的東西?;蛘呤峭ㄟ^圖片,表達一個商品長什么樣,商品該怎么使用的。我們可以看到,非結構化數(shù)據(jù)自然而然會成為交互的一個中介。而這也是原子世界映射到比特世界一個根本原因,因為業(yè)務要上網(wǎng)。
第二,當業(yè)務上網(wǎng)之后,我們的運營會發(fā)生質變。舊的商業(yè)過程當中我們也會談運營。在舊的商業(yè)過程當中,大部分的企業(yè)會做調查問卷,會找一些樣本的客戶去問他們,對我們的服務有什么看法,希望我們做什么樣的新服務。但是今天我們會發(fā)現(xiàn),有了計算機、有了互聯(lián)網(wǎng)之后,這一切也發(fā)生了變化。首先業(yè)務上網(wǎng)之后,可以天然地記錄每一次的交易過程,能把所有用戶的行為都記錄下來。今天我們不是取樣數(shù)據(jù),而是全量的記錄用戶的行為。對于任何一個互聯(lián)網(wǎng)公司來說,每天都在產生上千萬上億的調查問卷,而這些調查問卷,如何去改進我們的商業(yè)模式,是一個非常重要的課題。也是我們今天為什么會談大數(shù)據(jù),會談精益運營的原因。
我們先看一看非結構化數(shù)據(jù)的挑戰(zhàn)。剛才講了,現(xiàn)在數(shù)據(jù)世界正以每三年翻一番的速度在膨脹,而這其中95%以上都是非結構化數(shù)據(jù),而且這個比例還在不斷的提升,而不是下降。也就是說我們會有越來越多的非結構化數(shù)據(jù)產生。如此驚人的數(shù)據(jù),應該如何收集,如何保存,如何進行分析和挖掘,這又是一個很重要的課題。非結構化數(shù)據(jù),主要的用途是用來做交互,但是今天計算機對于語義的理解是非常原始的。所以在交互上,我們發(fā)現(xiàn)它仍然有非常巨大的提升空間。我們知道有自然語言分析、NLP這樣的一些技術,但是它們今天仍然很原始。我們還有語音識別,有視頻或者圖片里面對于場景、對于動作的捕捉與識別等,但是這些新的分析方法都還非常的早期。這些新的分析方法如果能夠往前走的話,那么這個數(shù)據(jù)時代會有多大的想象空間。正因為我們的分析能力還很原始,所以今天幾乎所有的非結構化數(shù)據(jù)都沒有二次分析。用戶每一次溝通,每一次交互過程當中,都沉淀了大量的信息,這些信息如何挖掘,是很重要的課題。
接下來談一談用戶行為的記錄,我認為這個是遠未充分挖掘的金礦。因為今天很多企業(yè)沒有用戶行為記錄,他們大部分業(yè)務還沒有聯(lián)網(wǎng)。所以他們今天想得更多的是讓業(yè)務上網(wǎng)。但是其實哪怕是互聯(lián)網(wǎng)公司,今天日志的處理能力、分析方法,以及產生對經營有效指導的能力依然存在很多不足。大部分的公司停留在比如日活用戶的分析等基礎的階段。
第三點是,絕大部分企業(yè)日志會定期刪除,因為他們不能理解數(shù)據(jù)分析之后還能干什么。日志是計算機生成的,所以它天然可以很容易被計算機去理解,這個理解是全面的,不會損失什么信息。所以日志本身是一個更高含金量的金礦,但是大部分的企業(yè)其實并沒有意識到這一點。所以我認為,今天日志的使用量,還處于一個非常原生的狀態(tài)。
那么今天談這些對于我們來說有什么意義呢?這個就涉及到七牛對于自己的定位。如果用一句話來描述七牛對于自己的定位就是,七牛是最開放、最完備的數(shù)據(jù)服務提供商。最開放的含義是什么呢?我們希望不是七牛把所有的數(shù)據(jù)服務給提供了,而是希望搭建一個平臺。因為我們剛剛分析了非結構化數(shù)據(jù),分析了日志相關的一些挑戰(zhàn),這些挑戰(zhàn)絕不是七牛一家公司所能解決的,我們希望有志于去提升數(shù)據(jù)應用價值的企業(yè),都能夠和七牛一起共同開拓這個世界,而不是單獨一家去做這樣的事情。最完備的含義是,我們希望能夠分析數(shù)據(jù)的使用場景,去觸及它的方方面面,去構建一個完整的技術棧,構建一個全息的商業(yè)模型。這是七牛對一個數(shù)據(jù)服務商的定位。
今天七牛做了一些什么呢?大家都知道七?,F(xiàn)在叫七牛云存儲,其實在七牛出現(xiàn)之前已經有很多的云存儲供應商了,最典型的是亞馬遜。但是我們認為,我們重新定義了云存儲這個概念。為什么呢?因為在AWS上的S3,我們認為它是一個零件,什么零件呢?就是云主機的附屬品。S3主要的能力是一個數(shù)據(jù)倉庫,它可以放東西,可以取東西。但七牛認為云存儲不應該僅僅是一個數(shù)據(jù)存儲的空間。首先,它是一個數(shù)據(jù)存儲的空間,所以我們有數(shù)據(jù)存儲這樣一個基礎服務。作為基礎服務,它的核心價值很簡單,就是可靠,然后便宜,然后高可用,這個是它最基礎的幾個能力。第二個能力是加速。七牛可能是全球第一個提出用存儲、加速和處理這樣三個詞來描述云存儲這樣一個服務的公司。當然后面我們看到業(yè)界也逐漸地認同了這樣一個模式,幾乎所有的云存儲都在往這個方向走。
那么加速是什么呢?七牛的加速是用一個相對比較獨特的方式,因為大家聽到加速這個詞,都會想到CDN,而CDN是存在了十幾年的一個服務形態(tài)。七牛的加速到底和CDN有什么不同呢?這跟七牛的做事方式很有關系。我們認為市場上不差一個新的CDN公司。所以七牛對加速的定位是做一個CDN融合的公司。我們希望協(xié)助客戶管理CDN,讓這些CDN融合在一起,能夠提供更高品質的,或者是更高可用性的CDN。因為任何一家CDN,都可能會出現(xiàn)區(qū)域性的故障,這樣的情況下,我們可以協(xié)助自動地去解決問題。例如,有一些CDN可能在上??煲稽c,有的CDN在廣州快一點,我們可以融合,可以形成更高速的訪問。
然后是數(shù)據(jù)處理。數(shù)據(jù)處理這個詞比較抽象,如果展開來講,它會呼應我剛才講的那個非結構化數(shù)據(jù)的挑戰(zhàn)里面最重要的一點——計算機對于非結構化數(shù)據(jù)的理解其實是非常原始的。所以七牛成為一個真正開放的云存儲廠商,最重要的點在于我們的數(shù)據(jù)處理是一個開放平臺。七牛最近接入了非常多的數(shù)據(jù)處理服務,例如圖片鑒黃、廣告過濾服務和文檔轉換服務等,還有正在接入的人臉識別等。
還有什么呢?還有一點就是直播!因為視頻或者音頻,它是一個非常特殊的介質,因為它有一個在線溝通的需求,這是傳統(tǒng)的存儲所沒有的。當然因為視頻和音頻本身有流媒體的屬性,所以它天然有點播的需求。七牛的霹靂云是將直播和點播融合的平臺。我們可以在霹靂云上完成用戶的溝通,事后的點播,以及不同的網(wǎng)絡下不同碼率的轉換。
介紹了七牛當前云存儲的概念之后,我們來看看七牛的一些數(shù)據(jù)。今天七牛的注冊企業(yè)有28萬,直接覆蓋網(wǎng)民每月月活3.7億,平臺上產生了1600億的文件,每天有750億的請求。我們的數(shù)據(jù)處理本身可以被加速,也就是同一個文件,哪怕它多次訪問,它只會處理一次,所以它的量會相對少一點。今天七牛的平臺上每天有12億數(shù)據(jù)的處理量。
總結一下,七牛干了什么?我們認為我們重新定義了云存儲,重新定義數(shù)據(jù)如何服務商業(yè)。很多人會問七牛未來會做一些什么,七牛到底會往什么方向發(fā)展?我認為要符合這個時代的主題思想,就是創(chuàng)新和創(chuàng)造。今天和數(shù)據(jù)相關的幾個詞有云計算、有大數(shù)據(jù)。這些詞七牛是如何看待的,如何重新定義這些詞?我認為2016年可以期待。