盧億雷:大家上午好,非常的容幸在七牛做分享,我的題目主要是講大數(shù)據(jù)營(yíng)銷(xiāo)帶來(lái)技術(shù)的一些洞察力的分析。
 
        首先我們看一下大數(shù)據(jù)技術(shù)到底有多少的高深,前面的都是大咖,我就不多介紹了,對(duì)于大數(shù)據(jù)來(lái)說(shuō),我的想法把大數(shù)據(jù)做出來(lái)的時(shí)候,其實(shí)我覺(jué)得這才是第一步,很小的一步,最重要的是怎么樣運(yùn)營(yíng)好,所以這里有7個(gè)運(yùn)營(yíng)的特性。BAT公司,他們的產(chǎn)品做出來(lái)的話(huà),最最關(guān)鍵的不是產(chǎn)品做的多么多么的好,而是保證24小時(shí)服務(wù)不停。所以有高可靠性,高可用性和高擴(kuò)展性是大數(shù)據(jù)提供的一個(gè)方式。
 
        高安全和易監(jiān)控維護(hù)為什么會(huì)重點(diǎn)的提出來(lái)呢,對(duì)于安全來(lái)說(shuō),因?yàn)榇髷?shù)據(jù)的話(huà),人在大數(shù)據(jù)前面就沒(méi)有隱私可言了,所以對(duì)于大公司來(lái)說(shuō),安全也是非常的重要的。象一些物理的隔離,最后一點(diǎn)是硬件維護(hù),我們最最關(guān)心的是怎么樣在第一時(shí)間里發(fā)現(xiàn)問(wèn)題,并解決問(wèn)題,這個(gè)是最最重視的部分,所以AdMaster公司除了做系統(tǒng)監(jiān)控,還做應(yīng)用的監(jiān)控。保證了我們的數(shù)據(jù)可靠性。接下來(lái)我們看一下整個(gè)數(shù)據(jù)平臺(tái)的架構(gòu)。也是比較通用的,這里我只是說(shuō)了二個(gè)點(diǎn)。一個(gè)是做搜索的分布式系統(tǒng),這個(gè)大家可以搜索一下,我只說(shuō)幾個(gè)最關(guān)鍵的點(diǎn)。
 
        關(guān)于Flink,叫增量迭代,買(mǎi)一次計(jì)算,把數(shù)據(jù)內(nèi)存拿過(guò)來(lái)做計(jì)算,可以保證把中間數(shù)據(jù)迭代的結(jié)果保存在內(nèi)存里面,這樣子的性能可以更高一些。這個(gè)技術(shù)我們看下來(lái),數(shù)據(jù)營(yíng)銷(xiāo)的分類(lèi)有一些什么特點(diǎn),上午劉老師會(huì)詳細(xì)的介紹。我這里簡(jiǎn)單的介紹一下,第一點(diǎn),數(shù)據(jù)營(yíng)銷(xiāo)分了二大類(lèi),一類(lèi)是叫全流程營(yíng)銷(xiāo)。比如是做一個(gè)活動(dòng)的頁(yè)面,你可以做一些推廣,整個(gè)的廣告會(huì)流起來(lái)了。
 
        第二個(gè)是實(shí)時(shí)競(jìng)價(jià)營(yíng)銷(xiāo),就是我們做的交易系統(tǒng),AD,DSH,SSP和DMP,這個(gè)我就不詳細(xì)的展開(kāi)了。這個(gè)是流程圖,我們AdMaster公司,做所有的數(shù)據(jù)投放的,我們是做DMP是做一個(gè)數(shù)據(jù)管理的平臺(tái),不光是把廣告交易的數(shù)據(jù),包括一些搜索的數(shù)據(jù),包括微信微博,還有新聞,還有一些門(mén)店的數(shù)據(jù),把整個(gè)做一個(gè)大融合給廣告主提供服務(wù)的。
 
        這里的一個(gè)非常的基本的投放的原則,我們做廣告營(yíng)銷(xiāo)或者是數(shù)字營(yíng)銷(xiāo),無(wú)非是你怎么樣在合適的時(shí)間,在合適的地點(diǎn),把適合的商品推給最適合的人,所以廣告都是非常的精準(zhǔn)。這里有一個(gè)最最重要的就是時(shí)間,因?yàn)榇蠹抑?,特別是政府的數(shù)據(jù),要把我們所有的信息公開(kāi),但是不知道時(shí)間,比如是今天上午,我們做一些什么,這個(gè)時(shí)間的話(huà),分了行業(yè)的。
 
        接下來(lái)我們看一下核心的技術(shù),這個(gè)是我把它總結(jié)了一下,整個(gè)大數(shù)據(jù)平臺(tái)的傳統(tǒng)的架構(gòu),因?yàn)榇髷?shù)據(jù)里面,你怎么樣把這個(gè)數(shù)據(jù)存儲(chǔ)做分析,最基本的是怎么樣把硬件更好的結(jié)合起來(lái),大家知道現(xiàn)在的硬件是越來(lái)越便宜了,那怎么樣把最好的硬件用到最適合的系統(tǒng)里面,第一個(gè)是是普通的硬盤(pán),  發(fā)現(xiàn)如果是你想提高性能的話(huà),調(diào)很多的參數(shù)的話(huà),可以解決90%多的問(wèn)題,也可以節(jié)省時(shí)間。
 
        還有一塊如果是你對(duì)時(shí)效性的要求很高的話(huà),百度他們的機(jī)器可以達(dá)到秒級(jí)甚至是毫秒級(jí)。Redis這個(gè)就不用多解釋了,我們看一下數(shù)字營(yíng)銷(xiāo)的核心的算法,有SVM,聚類(lèi),分類(lèi),這一點(diǎn)的話(huà),其實(shí)做一點(diǎn)算法的同學(xué),他們很多都是原來(lái)的模型來(lái)做的,舉一個(gè)例子來(lái)說(shuō)的話(huà),一個(gè)人他的屬性是在變化的。我們聽(tīng)了分享之后,你回到了家里,可能會(huì)轉(zhuǎn)變角色,可能你是爸爸媽媽?zhuān)蛘呤切值芙忝?,你在投放廣告的時(shí)候,一定是要根據(jù)不同的時(shí)間來(lái)做變化,這樣子可以達(dá)到很好的效果。
 
        然后第一大類(lèi)就是離線(xiàn)數(shù)據(jù)分析,第二個(gè)是在線(xiàn)數(shù)據(jù)分析,我們先看一下離線(xiàn)數(shù)據(jù)分析,最特別的地方,用戶(hù)自己的需求,一定是要轉(zhuǎn)換到最后的計(jì)算,做一個(gè)切分。用戶(hù)的需求提出來(lái)的時(shí)候,你肯定不能馬上的解決,Rabbitmq,然后還有Redis,還有FIesever,你把結(jié)果計(jì)算完了以后,很多的用戶(hù),或者是客戶(hù),他們以前的是老系統(tǒng),沒(méi)有新系統(tǒng),你拿大眾的系統(tǒng),才能滿(mǎn)足他們的需求。
 
        第二個(gè)是計(jì)算模型,我們用的很多,包括Pig,streaming,cascading,你要滿(mǎn)足用戶(hù)的需求,所有的模型都是不一樣的接下來(lái)是我們通過(guò)平臺(tái),,每天新增5TB級(jí)的數(shù)據(jù),每天對(duì)千億條數(shù)據(jù)進(jìn)行幾千種維度的計(jì)算。我們會(huì)對(duì)上千億條的數(shù)據(jù)進(jìn)行計(jì)算,這一點(diǎn)的話(huà),大家也可以看到,我們對(duì)一天五千到一萬(wàn)的維度進(jìn)行計(jì)算。除了硬件,你怎么樣可以解決問(wèn)題,這一點(diǎn)和百度,阿里做了很多的溝通和交流,很有挑戰(zhàn)性的,五簽到一萬(wàn)例的話(huà),你加的條件可能是隨意的條件,有很多可以做的地方。
 
        在線(xiàn)數(shù)據(jù)分析,這個(gè)是非常經(jīng)典的模型,因?yàn)槲覀兠刻齑蟾攀怯谐^(guò)一百億的請(qǐng)求接受,包括了新聞,BBS,各種各類(lèi)的數(shù)據(jù),然后就是一個(gè)調(diào)節(jié)器的系統(tǒng)??梢园褦?shù)據(jù)源通過(guò)統(tǒng)計(jì)的平臺(tái)進(jìn)來(lái),把數(shù)據(jù)進(jìn)行一個(gè)處理。
 
        接下來(lái)是一個(gè)Stom,我們這里用的一個(gè)最最關(guān)鍵的地方,一個(gè)是時(shí)效性,第二個(gè)是有一個(gè)時(shí)間序列的概念,我們認(rèn)為必須是嚴(yán)格意義上的時(shí)間序列,原來(lái)是12345,計(jì)算的結(jié)果也應(yīng)該是12345。通過(guò)一些算法模型,這地方我想說(shuō)一下,在我們這里,我們不叫知識(shí)庫(kù),叫做社交圖庫(kù),這個(gè)人一定是和社交有關(guān)系的,傳統(tǒng)的數(shù)據(jù)庫(kù)很難把數(shù)據(jù)表現(xiàn)出來(lái),我們最近在做這一方面的研究,我們應(yīng)該很快就可以上線(xiàn)了,還是不錯(cuò)的一個(gè)公司。
 
        另外的話(huà),大家知道,對(duì)于情感分析,一般就是正面負(fù)面,但是對(duì)于一句話(huà)來(lái)說(shuō),可以解釋不同的類(lèi)型,比如說(shuō)A說(shuō)B是好的,對(duì)于B肯定是正面的,對(duì)于A(yíng)來(lái)說(shuō),可能是真心的,也可能是負(fù)面的。接下來(lái)我們會(huì)把一些數(shù)據(jù)的結(jié)果放到里面,象微博,微信。我們會(huì)處理各種不同的報(bào)表,對(duì)于數(shù)字營(yíng)銷(xiāo)最最痛點(diǎn)的分析,對(duì)于隱私來(lái)說(shuō),大家都是非常的關(guān)心的。所以這里我們提到的解決方案,既然是A公司和B公司,大家都不愿意把數(shù)據(jù)源貢獻(xiàn)給對(duì)方,就是找一個(gè)可信的服務(wù)廠(chǎng)商做這個(gè)事。把數(shù)字加密,保證數(shù)據(jù)不會(huì)流失?;蛘呤遣粫?huì)被人竊取。
 
        我們看一些非常經(jīng)典的實(shí)例,如果是A公司和B公司的IT不在一起也是很難做的,所以可以通過(guò)共有云的解決方案,自然是可以解決剛才的問(wèn)題,所以我們找到了一個(gè)可信的云服務(wù)商,包括阿里,包括七牛,都是很好的合作伙伴,將來(lái)的話(huà),就可以在七牛的服務(wù)器上做計(jì)算,計(jì)算完了以后,把報(bào)告倒出給客戶(hù)最后把所有的數(shù)據(jù)都銷(xiāo)毀。這樣子了話(huà),就可以做一個(gè)非常非常彈性的計(jì)算模型,包括把數(shù)據(jù)做的安全可靠。
 
        另外一點(diǎn),這個(gè)是我上半年做的一個(gè)研究,到底大數(shù)據(jù),或者是數(shù)據(jù)是一個(gè)怎么樣的意思,我這里說(shuō)的數(shù)據(jù)流,對(duì)數(shù)據(jù)是不是越穩(wěn)定越好的,比如說(shuō)我們每一個(gè)人都可以拿到用戶(hù)的身份號(hào)碼,包括銀行的卡號(hào),是不是一個(gè)合適的方式呢,我說(shuō)是No,第一點(diǎn),整個(gè)的數(shù)據(jù)是有生命周期的,數(shù)據(jù)必須是活的。只要是這個(gè)數(shù)據(jù)流動(dòng)起來(lái),它就沒(méi)有價(jià)值。
 
        就好象是貨幣只有流通起來(lái),才有價(jià)值,如果是不流動(dòng)的話(huà),是沒(méi)有任何的價(jià)值。這是第一點(diǎn)。第二點(diǎn)一定是有壽命的。這個(gè)我說(shuō)是整個(gè)行業(yè)的發(fā)展,比如說(shuō)我們和某一個(gè)公司做了一個(gè)交易,把公司的安裝ID買(mǎi)過(guò)來(lái)了以后,如果是IE一直沒(méi)有變化的話(huà),他們二個(gè)以后再也不會(huì)做交易了,因?yàn)閿?shù)據(jù)我都已經(jīng)有了,以后再也不會(huì)合作了,這樣子會(huì)導(dǎo)致整個(gè)生態(tài)圈這是一條線(xiàn)。所以我們這里提了一點(diǎn),第一點(diǎn)就是這個(gè)數(shù)據(jù)必須是有生命周期。大家都希望雙方公司的合作是一直合作下去的,而不是我買(mǎi)了數(shù)據(jù)以后,下次就不用合作了。對(duì)于移動(dòng)端的設(shè)備,包括現(xiàn)在的蘋(píng)果的APP,里面的ADFA是蘋(píng)果做的一個(gè)官方的SID,基本上會(huì)在三個(gè)月左右做一次更新,這樣子可以保證整個(gè)的數(shù)據(jù)不停的被更新,而不是一成不變的。保證了數(shù)據(jù)源可以持續(xù)的合作。
 
        接下來(lái)我給大家分享幾個(gè)案例,這幾個(gè)案例我認(rèn)為還是非常的經(jīng)典的。第一個(gè)是象AdMaster主要是做的DA系統(tǒng),這是一個(gè)廣告的交易平臺(tái),里面最最關(guān)鍵的地方,不光是把交易里面的數(shù)據(jù)做出分析,還有它怎么樣把搜索的數(shù)據(jù)加入進(jìn)來(lái),這時(shí)候最大的特點(diǎn)是什么呢?因?yàn)槊恳粋€(gè)人,每一個(gè)用戶(hù)買(mǎi)了東西以后,現(xiàn)在的微博微信發(fā)展的很快,買(mǎi)完了以后,一定會(huì)去朋友圈,微博,論壇會(huì)抱怨一下這個(gè)產(chǎn)品到底是好還是壞,對(duì)于廣告主來(lái)說(shuō)的話(huà),他的品牌出現(xiàn)了任何的品牌,都可以實(shí)時(shí)第一手拿到材料。
 
        最后我給大家舉一個(gè)非常的有意思的例子,這個(gè)例子很火,我想問(wèn)大家一個(gè)問(wèn)題,大家都不喜歡看廣告,特別是看電視和視頻的時(shí)候,但是我想問(wèn)一下大家,大家對(duì)于微信的朋友圈的廣告,它是通過(guò)數(shù)據(jù)流通,你看到最近投的寶馬,還有Mini的廣告,大家認(rèn)為喜歡這個(gè)廣告的有多少,50%,40%?還有沒(méi)有?我們有72%是喜歡這個(gè)微信廣告的。為什么會(huì)喜歡微信朋友圈的廣告,不僅僅是把廣告推給你,最重要的是互動(dòng)。每次出了廣告以后,你們都會(huì)點(diǎn)一個(gè)贊,不光是廣告主在打廣告,其實(shí)用戶(hù)也是在參與的過(guò)程中,這樣子的話(huà),不是很反感這個(gè)廣告。
 
        第二點(diǎn),因?yàn)槲⑿诺陌l(fā)展很快,他們都說(shuō)這次寶馬推了廣告給我,我本來(lái)是一個(gè)屌絲,推給了我,我感覺(jué)自己成了高富帥了,對(duì)于廣告營(yíng)銷(xiāo)來(lái)說(shuō),不僅僅是一個(gè)數(shù)據(jù)分析,如果是把社會(huì)心理學(xué)加進(jìn)去以后,可以把廣告做的更好,比如我明明是一個(gè)屌絲,但是推給了我寶馬的廣告,這個(gè)廣告可以達(dá)到很多次的口口相傳,這個(gè)也是一個(gè)很重要的原因。
 
        做廣告的時(shí)候,首先是要做預(yù)測(cè),不管是傳統(tǒng)的視頻,或者是電視,或者是大屏幕,電線(xiàn)桿之類(lèi)的。首先是要做預(yù)算,預(yù)算完了以后做評(píng)估,然后會(huì)再做分析,怎么樣做跨屏的廣告的投放,這里是非常重要的,因?yàn)槲覀冊(cè)诳戳藦V告以后,對(duì)于廣告主來(lái)說(shuō),希望的是怎么樣的把廣告投放給更多的人看,所以怎么樣做跨屏的分析。
 
        接下來(lái)作弊識(shí)別模型,其實(shí)我和大家說(shuō)一下,廣告作弊的還是挺多的,包括地域,包括IT,包括頁(yè)面,包括用戶(hù)的一些分析,有很多的的手段來(lái)判斷它是不是作弊的。所以我們?cè)诮酉聛?lái)12月份,會(huì)有一個(gè)防作弊大賽,告訴用戶(hù)怎么樣的是作弊的,所以的人都可以來(lái)參加這個(gè)作弊的模型。
 
        這個(gè)是全流量的分析,你看過(guò)的一個(gè)廣告過(guò)來(lái)以后,最后到了官網(wǎng),到了它的首頁(yè),到產(chǎn)品的頁(yè)面,到注冊(cè)的頁(yè)面,最后到成功的購(gòu)買(mǎi)。這個(gè)有一點(diǎn)類(lèi)似百度統(tǒng)計(jì)看到的信息,這里面還是有很多點(diǎn)的。第一點(diǎn)是怎么樣把你的活動(dòng)的效果,包括流量的分析。
 
        這個(gè)是移動(dòng)端的消費(fèi)分析,移動(dòng)端的發(fā)展很快,每一個(gè)人通過(guò)最后的一跳把APP下載,其實(shí)有可能最后安裝這一跳的不是你花錢(qián)最多的地方,有可能是用戶(hù)看了A廣告以后,然后才通過(guò)APP搜索,作為廣告主來(lái)說(shuō),不希望把這個(gè)錢(qián)直接花在安裝上,他是希望在廣告效果最好的地方出現(xiàn)。所以我們會(huì)分析ABC媒體,怎么樣做轉(zhuǎn)換的分析,發(fā)現(xiàn)A的效果是最好的。
 
        最一個(gè)案例是在2013年的時(shí)候,可口可樂(lè)的昵稱(chēng)瓶的案例,可口可樂(lè)公司當(dāng)時(shí)做的時(shí)候,怎么樣可以提高它的銷(xiāo)售,通過(guò)我們的搜索分析,就發(fā)現(xiàn)了包括用戶(hù),特別是80后,90后,對(duì)白富美,高富帥這種詞是非常的有興趣了,那是不是可以生產(chǎn)一些有昵稱(chēng)的瓶子作為銷(xiāo)售,最后發(fā)現(xiàn)通過(guò)這種方式,銷(xiāo)售額提高了10%以上,大家知道快銷(xiāo)行業(yè),可以提出5%個(gè)趨勢(shì),10%是一個(gè)很大的數(shù)字了。大家覺(jué)得不是說(shuō)一次性的把這個(gè)詞給可口可樂(lè)公司去生產(chǎn),而是是一個(gè)迭代式的方式。第一次我們看到的是白富美,高富帥,第二次的時(shí)候,可以多一些其他的。這樣子可以節(jié)省成本。通過(guò)一些生量,互動(dòng)性,發(fā)貼率,做了很多的分析。
 
        因?yàn)闀r(shí)間的關(guān)系,我就分析到這里,謝謝大家。

分享到

zhoub

相關(guān)推薦