1、?一人多機(jī)檢測

極光大數(shù)據(jù)通過自有業(yè)務(wù)海量調(diào)用日志分析,對于用戶設(shè)備及app建立了多維度的唯一性識別標(biāo)識,通過設(shè)備的多維度識別交叉定位,發(fā)掘設(shè)備關(guān)聯(lián)關(guān)系。

2、?用戶行為相似性

極光大數(shù)據(jù)通過移動設(shè)備的用戶行為相似性來衡量用戶在移動設(shè)備上的使用行為相關(guān)程度,主要從2個方面來度量:

??app安裝特征相似度:

基于極光大數(shù)據(jù)平臺的海量數(shù)據(jù)挖掘,構(gòu)造用戶app安裝行為特征矩陣,使用廣義Jaccard相關(guān)系數(shù),計算用戶app安裝特征相似度。對于用戶app安裝特征,不同的app能夠反映用戶相似度的程度有很大差異,根據(jù)app的滲透率加權(quán)得到修正后的app安裝特征相似度。

??3.png

??WiFi特征關(guān)聯(lián)度:

基于極光大數(shù)據(jù)平臺的海量數(shù)據(jù),根據(jù)時間、空間、無線WiFi屬性等信息進(jìn)行清洗加工,建立用戶WiFi使用特征矩陣;基于用戶WiFi特征矩陣,對于不同時段設(shè)備間的WiFi特征,采用余弦相似度計算兩兩用戶間的工作日WiFi使用特征關(guān)聯(lián)度和周末WiFi使用特征關(guān)聯(lián)度。

??4.png

3、?空間軌跡相似度

空間軌跡相似度(spatial trajectory similarity)算法的基本思想就是通過降維的手段將多維空間向量分解到同一維度上求解,通過解決平面問題來達(dá)到最終解決空間模型的目的。

??5.png

兩個軌跡間的相似度可以定義為:Sim(A,B) = (POIA∩POIB)/ (POIA∪POIB);

向量空間余弦相似度(Cosine Similarity):余弦相似度用向量空間中兩個向量夾角的余弦值作為衡量兩個個體間差異的大小。余弦值越接近1,就表明夾角越接近0度,也就是兩個向量越相似。

提取一段時間內(nèi)的用戶報點信息,按照時間序列處理,采用STS算法,計算兩兩設(shè)備間的空間軌跡相似度。

實證效果

1、?app安裝特征相似度:

對于某用戶換機(jī)前后的兩個設(shè)備,計算app安裝特征相似度,使用app滲透率加權(quán),兩個移動設(shè)備的app安裝特征相似度為:0.913,app安裝特征相似性非常高。

兩個設(shè)備安裝app數(shù)量為120個以上,app安裝重合度為72.8%,同時安裝了滲透率低于5%的app應(yīng)用有22個,滲透率低于1%的app有7個。由此可見,app的安裝情況能在一定程度上反應(yīng)設(shè)備之間的相似性。

2、?WiFi使用特征關(guān)聯(lián)度:

基于兩個設(shè)備的WiFi使用偏好情況,計算WiFi特征關(guān)聯(lián)度,計算得出工作日WiFi使用特征關(guān)聯(lián)度為0.35,周末WiFi使用特征關(guān)聯(lián)度為0;

經(jīng)過極光大量數(shù)據(jù)驗證,工作日WiFi特征關(guān)聯(lián)度大于0.25,為工作日關(guān)系較為密切的用戶,比如同事關(guān)系;周末WiFi特征關(guān)聯(lián)度大于50%,為周末關(guān)系較為密切的用戶,比如親人。

3、?空間軌跡相似度

從極光大數(shù)據(jù)數(shù)據(jù)庫中挑選3個空間軌跡較為相似的設(shè)備,其中設(shè)備A和設(shè)備C為同一用戶的兩個設(shè)備,設(shè)備A和設(shè)備B的位置軌跡比較相近,以設(shè)備A為基準(zhǔn),分別計算設(shè)備A和設(shè)備B、設(shè)備A和設(shè)備C的空間軌跡相似度。

??6.png

上表中都是解析出的各軌跡對應(yīng)的POI坐標(biāo)值,按時間維度將三維空間軌跡解析到平面中,分別取各POI點的經(jīng)度(id,lat)和維度(id,lng)計算軌跡間的余弦相似度。二者的平面軌跡圖如下(紅線表示設(shè)備A,藍(lán)實線表示設(shè)備B,虛線表示設(shè)備C):

??7.png

??8.png

可以計算出COSlat(A,B)=0.708,COSlng(A,B)=0.784;?COSlat(A,C)=0.746,?COSlng(A,C)= 0.819;

那么可以得到該設(shè)備A與設(shè)備B的相似度為0.746,與設(shè)備C的相似度為0.783。顯然設(shè)備A和設(shè)備C的空間相似度較高。

總結(jié)

目前各個行業(yè)的大數(shù)據(jù)的應(yīng)用越來越頻繁,大數(shù)據(jù)精準(zhǔn)營銷、大數(shù)據(jù)運營、智能推薦等應(yīng)用均取得顯著的效果,而這些領(lǐng)域都要求企業(yè)對用戶要有充分的了解,才能精準(zhǔn)的定位目標(biāo)人群。如何有效高質(zhì)量的擴(kuò)充目標(biāo)群體用戶,基于現(xiàn)有用戶標(biāo)簽的基礎(chǔ)上,用戶相似性也是一個非常重要的信息。極光大數(shù)據(jù)基于設(shè)備的用戶相似性能夠在精準(zhǔn)營銷、智能推薦中發(fā)現(xiàn)很多的關(guān)聯(lián)用戶,能夠一定程度上擴(kuò)充關(guān)聯(lián)目標(biāo)人群,提升企業(yè)的營銷效率和質(zhì)量。

分享到

songjy

相關(guān)推薦