Trident團隊斬獲大賽冠軍
京東作為中國最大的自營式電商,擁有中國電商領域最完整、最精準、價值鏈最長的數據,這為大數據、算法等新技術提供了大量的實際應用場景。本次大賽賽題也是基于京東的真實數據和真實場景設計賽題,體現(xiàn)了大賽的專業(yè)性和獨特性。京東希望攜手廣大參賽者一起,用技術的力量為實際應用落地提供創(chuàng)新思路,為更多的消費者提供極致用戶體驗。
“京東一直致力于成為一家真正的技術和創(chuàng)新驅動的企業(yè),利用技術使零售效率更高,成本更低,用戶體驗更好?!本〇|集團高級副總裁馬松表示,中國大數據算法大賽京東賽區(qū)——京東JDATA算法大賽正是希望借助這一舞臺,激發(fā)算法創(chuàng)新、釋放數據價值,引爆新生代的技術力量,為實際業(yè)務落地提供更多創(chuàng)新、卓越的算法模型和思路,也為中國零售行業(yè)變革挖掘更多優(yōu)秀的技術人才和中堅力量。
激發(fā)算法創(chuàng)新
本次大賽的賽題也是緊貼實際場景,讓算法為實際業(yè)務帶來價值?!叭缙诙痢笔墙衲甑馁愵},參賽選手要判斷出消費者大概率會再次購買的商品,通過京東用戶在線一年以上的購買數據來預測未來一個月是否會購買相同產品,甚至預測哪天進行購買。
賽題對于電子商務和京東而言,都是具有深遠意義和幫助。通過大數據分析可以在用戶正需要復購商品時給予提醒,提高京東商城的用戶體驗,帶來用戶粘性和用戶購買的價值增長。
今年的賽題和去年賽題在語言描述上頗為相似,但從解題思路和結構上都有很大差異,如果用去年的思路來解題會出現(xiàn)一些偏差。京東交易平臺高級算法工程師李凱東表示,去年的賽題更看重購買決策前一段時間的用戶行為,以至于進行決策購買,而今年的賽題更看重買了再買,也就是復購,其實是兩個完全不同的題目。
我們知道一個智能算法模型并不能解決所有的問題,上一屆的賽題更適合3C產品,這一屆更適合消費品,兩者擁有完全不同的特性,所以針對不同的品類做用戶感知需要使用完全不同的算法模型。
京東基礎架構部首席研究員鄭志彤認為,針對每一個品類進行的數據探索,最終的目的都是整體的推薦系統(tǒng),推薦系統(tǒng)是一個整體的模型,對交易行為進行探索最后納入整體推薦系統(tǒng)。
到目前為止,京東已經使用了大量的算法模型,所以單純從算法的角度所做的優(yōu)化并不是很多,但從運營角度還有很多優(yōu)化空間。因為算法和傳統(tǒng)功能是不同的,其是一個無限不斷趨近于一的過程。
釋放數據價值
復購是針對某一消費品,預測用戶多長時間會再次購買,用戶則希望電商網站把最需要的商品展示在最希望看到的位置,這也是賽題設計的初衷,讓用戶在京東的購物體驗會更加自然和流暢,不是強迫而是需要。
最終用戶在京東App上看到的都是他希望購買的商品,甚至可以讓用戶養(yǎng)成習慣,打開App就能了解我現(xiàn)在有哪些商品需要進行復購,當然除了App還有短信等方式觸達到消費者。例如京東App提醒您您家的醋還有兩天就要用完,應該進行采購。
對于京東而言,在復購上已經有了一套完善的算法,本次大賽京東更希望看到一些不同思維方式。李凱東指出,復購是一個多元化的思維方式,并不能說只有一個模型能做到最好,所以我們要做的是把好的思路融合和吸收到現(xiàn)有模型中。
當然一旦產生優(yōu)秀的算法京東通過優(yōu)化后也將使用到現(xiàn)實的生產環(huán)境中,因為復購的場景是多元化的,App之外也有很多渠道可以讓用戶去感知。本身京東內部的算法迭代速度很快,以李凱東所在的團隊為例,根據實際情況一、兩周就會進行模型的迭代。
未來京東也將以中國電商領域最完整、最精準、價值鏈最長的數據,持續(xù)為大數據、算法等新技術提供大量的實際應用場景,通過算法的迭代優(yōu)化,讓數據更有價值,實現(xiàn)消費者購物體驗的提升。同時以成熟落地的技術應用為行業(yè)、為合作伙伴賦能,讓更多消費者感受到大數據算法帶來的便利。
培養(yǎng)數據人才
中國大數據算法大賽也是一個選手和企業(yè)交流溝通的橋梁,所以在比賽之初京東就建立了兩個QQ討論群,同選手進行深入的溝通和交流。通過不定時收集問題,進行部分問題的解答,同時京東的算法大牛也進行了兩期視頻直播幫助參賽選手理解賽題。
不同于其他比賽的一點在于,中國大數據算法大賽是一個綜合能力展現(xiàn)的比賽。所有數據并不能直接在模型中跑出結果,需要經過數據的探索對業(yè)務進行結合,這也增加了比賽的復雜度和變化,選手可以通過多種方式解題,進一步考驗了選手的思考能力,以及對數據模型的把握。
冠軍隊伍Trident選手龔畢經雖然沒有參與過相關比賽,但他經常觀看國際比賽,對于大賽中的分享他尤為關注。他認為,中國大數據算法大賽京東賽區(qū)是國內比賽中非常重視分享學習的平臺,最開始團隊也并沒有太多的經驗和想法,但通過兩次直播輔導反復理解賽題,也讓他們獲得了此次大賽的冠軍。
“今年的賽題非常有意思,是一次不同的體賽體驗?!眮嗆婈犖槎淅斶x手吳遠皓說,大賽給出的是原始數據,需要去做一些探索才能得到解題的數據,之后還要做特殊工程,整個鏈條會比普通比賽長。而且賽題還與企業(yè)的具體業(yè)務結合,讓我們可以真實的體會電商的業(yè)務場景。
季軍隊伍DANT選手王昊天非常興奮可以通過中國大數據算法大賽理解真實的電商數據,這也是平時不曾接觸的領域,從實際場景出發(fā)對數據進行分析,然后實現(xiàn)自己的想法。
未來京東還將持續(xù)舉辦算法大賽,實現(xiàn)比賽和業(yè)務、人才引進之間的有效聯(lián)動,JDATA智匯平臺將成為京東未來持續(xù)對外輸出算法能力,賦能行業(yè)與算法愛好者,打造技術影響力的重要渠道。京東將與合作伙伴一道,利用JDATA智匯平臺,引入更多高水平算法比賽,為中國大數據、算法、人工智能領域挖掘出更多更好的優(yōu)秀人才。
同時為客戶提升消費體驗是京東甚至所有電商企業(yè)在不斷追求的,這就要求不斷對算法的迭代優(yōu)化,體現(xiàn)數據真正的價值,并且將這些成熟的技術落地,為行業(yè)持續(xù)賦能,為更多消費者帶來更多便利。