楊?。?/strong>謝謝各位,今天非常的高興有機會和大家分享一下愛奇藝的一些工作,我的標題是新媒體時代的大數(shù)據(jù)應用,區(qū)別于傳統(tǒng)的媒體,大家來愛奇藝,更多的是認為網(wǎng)絡視頻,把原先在電視上播出的視頻搬到了互聯(lián)網(wǎng),其實遠遠不止如此。我會給大家介紹一下我們到底是干的什么。
我用非常短的時間介紹一下愛奇藝。然后說一下愛奇藝的大數(shù)據(jù)應用,最后展望一下未來。這是我們愛奇藝的企業(yè)愿景,讓人們平等便捷的獲得更多,更好的視頻,愛奇藝這么多的發(fā)展一直是在為了更多的用戶提供更多更好的視頻。
我們是在2010年的4月22日成立,這五年我們收獲了很多,我們現(xiàn)在在PC端,日均覆蓋都是第一,月度覆蓋也是第一。我們還有一個非常讓人驕傲的一個成績,是在移動端的安裝,已經(jīng)超過了10億,這個數(shù)字在整個互聯(lián)網(wǎng)是非常的令人贊嘆的。
還有一塊我們在TV端的,根據(jù)我們內(nèi)部后臺的數(shù)據(jù),我們在2月份的時候,我們的TV端的比重已經(jīng)是到了一千萬。我們看一下愛奇藝做的一些工作,愛奇藝有大量的數(shù)據(jù),對于愛奇藝來說,很多的業(yè)務也是依賴于存儲,最多的是視頻的內(nèi)容,愛奇藝存在這些內(nèi)容的時候,也有很多延伸的相關(guān)的服務,一方面是搜索,還有大量的用戶,同時還有電影票,愛奇藝的觀影數(shù)據(jù),還有一部分的社交。會做四個維度的分析,我們要采購內(nèi)容,有了內(nèi)部用戶才可以觀看這些重要的內(nèi)容。
內(nèi)容的選取對我們來說是非常的重要的,有了這些內(nèi)容,我們可以對用戶產(chǎn)生相關(guān)的分析,主要是為了給他們提供更好的服務,同時因為本身互聯(lián)網(wǎng)視頻的業(yè)務,相對也是要依賴于一部分的變現(xiàn),所以我們也會做廣告,維持和用戶的粘度。還有一部分是人群的定向,這些都是大數(shù)據(jù)業(yè)務的一些延伸的應用。
愛奇藝的大數(shù)據(jù)主要是來自這幾個維度,首先是多元化的服務,第一個維度是視頻的維度的,依賴于很多相關(guān)的產(chǎn)品,比如是搜索推薦,很多的時候會涉及到一些連接,用戶在什么終端上看,搜索一些什么關(guān)鍵字。還有一個維度,愛奇藝也會有一些現(xiàn)在其他的電商,包括電影票,還有游戲這一塊的業(yè)務,這些都是以內(nèi)容為核心的,所以相對來說的話,有這些業(yè)務也會對數(shù)據(jù)產(chǎn)生大大的補充。同時我們包括了PPC,我們有幾百萬的長視頻的內(nèi)容,相對的來說,這個量在整個視頻行業(yè)來說是非常的大的。
同時我們也有海量的用戶,每天到達愛奇藝的用戶接近二千億,在訪問愛奇藝服務的同時,給我們提供了大量交互的數(shù)據(jù),我們可以很好的探測到用戶是不是喜歡這個內(nèi)容,是不是不喜歡這個內(nèi)容,用戶到底喜歡怎么樣的內(nèi)容,喜歡在什么時間,什么終端上看怎么樣的內(nèi)容,這些都可以通過后臺分析出來。它的立體相對于Volue是最重要的,不管是什么方面的增長,都會帶來Volue的急速的增長。
愛奇藝本身在內(nèi)容生命周期這一塊做的工作,我這里畫了一個內(nèi)容的生命周期,每一個內(nèi)容愛奇藝決定采購的時候,都會經(jīng)歷這么一個生命的周期,我們要決策到底是不是應該買這個內(nèi)容,買了這個內(nèi)容以后,我們就決定應該怎么樣營銷這個內(nèi)容,營銷是為了讓用戶知道,讓品牌廣告主知道,我們有這個內(nèi)容,可以怎么樣變現(xiàn),同時吸引更多的用戶來看,真正的到了運營期的時候,會把內(nèi)容在終端上上線,讓用戶很好的享受生服務,然后會再次評估,說這個內(nèi)容是不是適合愛奇藝的用戶,到底是不是適合愛奇藝的平臺,我們是不是值得把這個內(nèi)容采買,總體我們采購這個版權(quán)的內(nèi)容都是有時間的限制的。再次的評估也是非常的重要的。
我們下面做了一些相對應的產(chǎn)品,這個在行業(yè)里面做的工作都是類似的,愛奇藝做的比較前面一點,我們主要是做了二塊的工作,一部分是VV的流程,VV是視頻網(wǎng)站區(qū)別于傳統(tǒng)的互聯(lián)網(wǎng)門戶不一樣的地方,因為傳統(tǒng)的互聯(lián)網(wǎng)的們很多是看PV,UV,但是本身不和觀影關(guān)聯(lián),這一塊不能代表互聯(lián)網(wǎng)的廣告價值,所以VV是更重要的指標,在內(nèi)容還沒有上線的時候,我們就要預測這一塊的內(nèi)容有怎么樣的表現(xiàn)。
還有一塊是電影,作為傳統(tǒng)的電視劇,電影,動漫,電影在這里面是非常的特殊的,電影也是一個非常龐大的產(chǎn)業(yè),很多的時候,電影相關(guān)的指數(shù)對我們的運營,采購非常的重要,對于運營營銷,我們主要是會做二塊,一塊是品牌的更新,哪一些品牌的廣告主會對這一塊的內(nèi)容感興趣,會和后續(xù)的品牌廣告主之間,做一些探討。同時會做一些目標受眾的分析,告訴廣告主,這些用戶的特征是什么,讓我們的變現(xiàn),讓我們的用戶的體驗會變的更好。
運營的層面這一方面的產(chǎn)品更多一點,我們推出了第一個針對用戶的產(chǎn)品綠鏡,傳統(tǒng)的媒體做食品播放的時候,是在固定的時間,固定的頻道放,并沒有任何的交互,同時終端的本身是單向的,不能貢獻任何的數(shù)據(jù),但是互聯(lián)網(wǎng)不一樣,用戶喜歡這個數(shù)據(jù),你就可以點開這個視頻,并且可以觀看,看到了喜歡的部分,一定會拉回去看,不喜歡的部分就會往前看,我們做了一些相關(guān)的分析,在統(tǒng)計的意義上,超過一定的預值的時候,這一部分的表現(xiàn)是非常的穩(wěn)定的,所以我們做了綠鏡這個產(chǎn)品,可以讓你在很短的時間里, 可以看到自己感興趣的東西,這個就是互聯(lián)網(wǎng)帶來的一些比較有意思的創(chuàng)新。
同時我們針對用戶在愛奇藝上的行為,做了愛奇藝指數(shù),還有一塊是新媒體時刻也是比較重要的,傳統(tǒng)的內(nèi)容發(fā)現(xiàn),很多的時候是用戶需要去記到底是什么時間,在什么電視臺播什么節(jié)目,對他們的檢索是非常的不方便的,新媒體的話,就非常的簡單了,一方面是視頻的推薦,推薦是對于很多的人來說,來了以后不知道要看什么,但是根據(jù)觀影的記錄,可以知道什么片子是比較類似的,可以帶來很好的點擊率,同時還可以發(fā)現(xiàn)和他類似的人看了一些什么相關(guān)的內(nèi)容,所以對于提升用戶的體驗,大大的降低了成本。
還有一個很多的人是知道自己想要什么,所以搜索是很好的入口,愛奇藝的搜索,除了傳統(tǒng)的可以更好的檢索,還做了一個很好的意圖識別,比如是可以輸入最近好看的韓劇,就會進行搜索了。愛奇藝也在做相關(guān)的工作,還有一塊的話,屬于我們目前視頻網(wǎng)站最大的特色,傳統(tǒng)的做大數(shù)據(jù)的時候,都是依賴于做文本,或者是節(jié)奏化相關(guān)的挖掘,或者是文本里面做相關(guān)的挖掘,視頻網(wǎng)站來說,擁有海量的數(shù)據(jù)并不是結(jié)構(gòu)化的數(shù)據(jù),也不是文本的數(shù)據(jù),而是大量的視頻。感謝計算技術(shù)的發(fā)展,計算機技術(shù)飛速的發(fā)展,利用這些新的技術(shù),可以做一些以前不能做的事情,我們可以理解視頻里面存在一些什么物體,我們可以做各種有意思的創(chuàng)新性的產(chǎn)品。
同時我們還可以識別里面的人,關(guān)于內(nèi)容評估這一塊,我們會對很多的維度的內(nèi)容做全方面的分析,分析到底帶來了多少的廣告的價值,帶來了多少的會員的價值,可以很好的評估這一部分的價值。下面介紹一下VV預測這一塊,本身VV預測這一塊并不是每一個公司都可以做,也是二年以前和谷歌發(fā)布的文章有關(guān)。在愛奇藝成立之初就非常的重視對數(shù)據(jù)的投入,這個也是我們CEO的一個夢想。
二年以前我們把這個系統(tǒng)做好了。主要的就是憑借著愛奇藝多年的運營數(shù)據(jù),因為愛奇藝運營到現(xiàn)在的時間也比較久了,有大量的運營的數(shù)據(jù),在運營的過程中,也產(chǎn)生了大量的關(guān)于視頻的數(shù)據(jù),同時我們對內(nèi)容和用戶做了相關(guān)的剖析。還有一個非常重要的,我們做了很多在控制條件下的實驗,對我們的平臺有怎么樣的內(nèi)容會更準確。
第一個是2014年非?;鸬娜詹。梢钥吹竭@這個結(jié)果里面體現(xiàn)了二個不一樣的東西,一個是日播劇的分布,后面二個是周播劇的分布,可以看到預測和實際的情況非常的不同。第二個是去年春節(jié)的時候非常火的《來自星星的你》,預測和真實的情況會發(fā)生很大的偏差,主要是因為發(fā)生了韓國的沉船的事件,那同時的話,愛奇藝這里本身的運營上的一些側(cè)重點的改變,做了這個數(shù)據(jù)的下降。這個也給了我們很好的啟示,我們可以分析一下到底我們的運營好不好,根據(jù)這些預測要求我們的運營,到底應該怎么樣的運營,應該怎么樣推這樣子的事情,以達到更好的效果。
這一塊是前面說到的我們目前來說非常的有特色的兩個產(chǎn)品,一個是閃植,很多的傳統(tǒng)是把拍攝放到內(nèi)容中,到底好不好,植入方也不知道,我們的這個技術(shù)彌補了傳統(tǒng)的植入,在拍攝的初期就要介入的弊端,同時還可以規(guī)避視頻不叫座,植入花了很多的錢,目前在我們愛奇藝也有很好的表現(xiàn)。
還有一塊是隨時購,通過我們的后臺本身對視頻做很多的識別,我們會識別視頻里面存在相關(guān)的商品,把這些商品在播放的時候,同時就在旁邊展現(xiàn)出來,根據(jù)我們的實驗,這個效果是非常高的比一般的高二三倍。這個是愛奇藝的fiigure-Out,可以識別視頻里的演員,首先是會做人臉的檢測,做人臉的定位,然后做特征的提取,提取好了以后,就會到后臺的數(shù)據(jù)庫和明星進行定位,在用真正的播放的時候,就會展現(xiàn)和明星相關(guān)的品牌的廣告,從這個角度來說,可以更好的促成變現(xiàn)。
這一塊是內(nèi)部和內(nèi)容相關(guān)的,其實愛奇藝目前做的很多的事情,在用戶體驗和商業(yè)的價值之間做權(quán)衡,所以需要盡量的多為用戶考慮,我們在今年的年初上線了第一個全中文個性化的影院,機遇GBDT個性化的預測,有大量的主題,從效果來看,CTR提高了100%的效果。適合18-25歲的人觀看,但是要機器組合成這樣子的主題,相對來說還是比較困難的。
還有一塊是競爭廣告。這一塊的話有三個有意思的產(chǎn)品,一個是一搜索百映,依賴于我們和百度的合作,群英薈也是觀看時候的一些位置的信息,同時根據(jù)性別的定向眾里尋TA。
愛奇藝在大數(shù)據(jù)重構(gòu)新媒體的未來。怎么樣用好大數(shù)據(jù),怎么樣更好的發(fā)展我們的大數(shù)據(jù),我們也相信大數(shù)據(jù)正在重構(gòu)新媒體的未來,同時今天也非常的高興,今天能夠在這里和大家聊一下,愛奇藝非常希望和業(yè)界的同仁一起合作,希望可以把愛奇藝做的更好,謝謝大家!