點(diǎn)擊產(chǎn)看中國大數(shù)據(jù)創(chuàng)新峰會(huì)
在下午的分論壇中,Websense網(wǎng)絡(luò)安全技術(shù)研發(fā)中國區(qū)技術(shù)總監(jiān)陳綱先生為大家坐了《大數(shù)據(jù)時(shí)代下的數(shù)據(jù)安全管理》的主題演講。在會(huì)中,他講道:
我們會(huì)覆蓋在大數(shù)據(jù)相關(guān)的價(jià)值體現(xiàn)以后的相關(guān)數(shù)據(jù)安全文化,這應(yīng)該說是我們前段時(shí)間在跟一些企業(yè)老總聊的時(shí)候非常重要的一個(gè)話題。后續(xù)的結(jié)果應(yīng)該如何保護(hù)?如何防止在各個(gè)行業(yè)之間、各個(gè)部門之間甚至相關(guān)的重要崗位之間的交互使用過程中防止泄露,這是很多老總們得到大數(shù)據(jù)價(jià)值后容易思考的問題。
在各式各樣的類型中我們會(huì)看到各式各樣的信息,包括他的交易習(xí)慣、關(guān)注點(diǎn)是什么,隨著這些結(jié)果出來以后,無疑可以幫助我們的企業(yè)經(jīng)營決策,在這個(gè)過程中,越來越的主管就會(huì)開始想象,我的分析結(jié)果如果給我相關(guān)的合作伙伴里又會(huì)帶來怎么樣的商業(yè)價(jià)值?或者說給我企業(yè)本身的競爭會(huì)帶來什么樣的影響?這真的是我們特別擔(dān)心的問題。
在大數(shù)據(jù)的高價(jià)值分析結(jié)果體現(xiàn)的時(shí)候,我們不得不關(guān)注數(shù)據(jù)安全的管理項(xiàng)目,當(dāng)我們呈現(xiàn)大量數(shù)據(jù)的時(shí)候,誠心出大量有價(jià)值的報(bào)表、成果、預(yù)測的模型的時(shí)候我們?nèi)绾巫龊帽Wo(hù)?當(dāng)看到大數(shù)據(jù)的時(shí)候很多人都覺得它非常龐大,我們很難在非常短的時(shí)間內(nèi)把所有的數(shù)據(jù)保護(hù)起來,然而大數(shù)據(jù)本身也會(huì)給大家?guī)硪粋€(gè)疑惑,就是大數(shù)據(jù)是不是都有價(jià)值值得讓我們?nèi)勘Wo(hù)。
更多的用戶會(huì)側(cè)重于把熱點(diǎn)營銷的分析數(shù)據(jù)進(jìn)行重點(diǎn)的保護(hù),簡單說就是化整為零,我們對(duì)原數(shù)據(jù)的看待和分析結(jié)果的看待是分開看的,圍繞重點(diǎn)分析、重點(diǎn)業(yè)務(wù)在一些特別重要的城市、特別重要的崗位得到的一些價(jià)值體現(xiàn),它的分析成果是真正值得我們有效監(jiān)管、有效保護(hù)和有效分析的,那么由此而來我們會(huì)發(fā)現(xiàn)我們保護(hù)的重點(diǎn)會(huì)從大的面上直接跳到企業(yè)現(xiàn)階段對(duì)他的商業(yè)價(jià)值最重要的核心數(shù)據(jù)上,這就真正幫我們體現(xiàn)出能夠在大數(shù)據(jù)中間抓住最核心的信息。
這里不能不談到一個(gè)概念就是數(shù)據(jù)泄露的防護(hù),這個(gè)概念在國內(nèi)外都已經(jīng)非?;鹆耍谶^去的2年內(nèi),Websense和中國,尤其是金融行業(yè)很多客戶都有大量的合作,現(xiàn)如今很多互聯(lián)網(wǎng)公司是大數(shù)據(jù)的代表,開始不斷涌現(xiàn)出新的與數(shù)據(jù)保護(hù)相關(guān)的想法。
我們一直講這些大數(shù)據(jù)體現(xiàn)價(jià)值的時(shí)候需要不斷的深入挖掘,不斷的分析從而得到我們想要的信息,然而在這里數(shù)據(jù)泄露防護(hù)上同樣有著相似的做法,就是如何在海量的數(shù)據(jù)中快速定位出那些高價(jià)值數(shù)據(jù),這里面離不開深層內(nèi)容分析的技術(shù),從而幫助我們對(duì)多種數(shù)據(jù)存在的形態(tài)進(jìn)行分析。對(duì)一個(gè)企業(yè)來講,你不得不看我如何對(duì)這些高價(jià)值數(shù)據(jù)進(jìn)行有效的識(shí)別和檢測,就像我們每天處理的數(shù)據(jù)、訪問的數(shù)據(jù)、編輯的數(shù)據(jù),或者是網(wǎng)絡(luò)中傳輸?shù)南嚓P(guān)信息,甚至包括我們從用戶端收集上來的信息,這些交互信息你如何快速定位出來?這里我們有三個(gè)簡單的方式讓大家快速理解。
第一,描述,描述通常會(huì)對(duì)大數(shù)據(jù)的很多源數(shù)據(jù)進(jìn)行有效判斷,利用運(yùn)營商特別關(guān)注通話的詳單,對(duì)于很多互聯(lián)網(wǎng)公司會(huì)在意用戶的交互數(shù)據(jù),這樣的信息量非常巨大,單條的記錄根本體現(xiàn)不出它的價(jià)值在這樣的情況下我們會(huì)通過描述的方式告訴系統(tǒng)什么是此類數(shù)據(jù),從而快速定位到它。
第二,登記,可以幫助我們把企業(yè)里最重要的信息錄入進(jìn)去,這里不得不談到,很多高價(jià)值的報(bào)表、財(cái)務(wù)分析的結(jié)果甚至大數(shù)據(jù)的輸出可以利用類似登記的方式讓系統(tǒng)了解它相應(yīng)的衍生產(chǎn)品是什么樣的。
第三,學(xué)習(xí),很多時(shí)候我們都說這個(gè)數(shù)據(jù)應(yīng)該怎么保護(hù)或者應(yīng)該如何識(shí)別,這是人用自己的經(jīng)驗(yàn)判斷的,那有沒有更好的方法呢?你不妨把這個(gè)信息交給數(shù)據(jù)保護(hù)系統(tǒng),讓它自己學(xué)習(xí)去判斷這些數(shù)據(jù)的共同性是什么,從而使它可以更簡單的對(duì)它進(jìn)行判斷。
數(shù)據(jù)描述,大量的交易數(shù)據(jù)、通話詳單甚至傳統(tǒng)行業(yè)會(huì)用到的地理坐標(biāo),這些信息大批量出現(xiàn)的時(shí)候我們可以利用數(shù)據(jù)描述的方式告訴它什么樣的情況下被稱 為是交易記錄,以這樣的描述方式讓我們以很自然的方式得到這個(gè)信息,從而讓系統(tǒng)知道當(dāng)這樣的信息大范圍傳輸?shù)臅r(shí)候值得我們關(guān)注。
同樣可以看 到數(shù)據(jù)登記的方法,我們叫它做指紋,你所留下來的不是指紋的圖,而是它們之間的不同特點(diǎn),在數(shù)據(jù)登記如果用指紋方式學(xué)習(xí)的時(shí)候,概念很類似,當(dāng)我們?cè)诖髷?shù) 據(jù)整個(gè)群集中不斷提煉結(jié)果的時(shí)候,分析成果、樣式、報(bào)表甚至整個(gè)數(shù)據(jù)挖掘的設(shè)計(jì)是如何來完成整個(gè)過程的設(shè)計(jì)文檔,你都可以利用類似登記的方式讓它有效地了 解到這類數(shù)據(jù)的特點(diǎn)是什么,我的典型客戶行為是什么樣的,往往很多類似的結(jié)果最后的輸出會(huì)又回到這樣的數(shù)據(jù)系統(tǒng),或者回到某些特定的業(yè)務(wù)系統(tǒng),或者回到非 結(jié)構(gòu)化的文檔上,在這樣的情況下利用類似數(shù)據(jù)登記的方式讓我們對(duì)這些摘要信息進(jìn)行有效的學(xué)習(xí),他就會(huì)很清楚的知道有人拷貝了這段設(shè)計(jì)內(nèi)容,這些東西都是來 自于某一個(gè)分析成果的某個(gè)部分,幫助我們訓(xùn)練定位到這方面的某些問題。當(dāng)然,不僅如此,它同樣可以對(duì)企業(yè)自己認(rèn)為自己價(jià)值最大的信息進(jìn)行保護(hù)。
其 實(shí)剛才百度也談到,對(duì)于互聯(lián)網(wǎng)公司最大的價(jià)值是他的人,現(xiàn)在越來越多的公司跟Websense合作的人都說,我所保護(hù)的數(shù)據(jù)甚至包括人員信息、我員工的資 料都是重點(diǎn),我們?cè)?jīng)在08年做過一個(gè)項(xiàng)目,當(dāng)時(shí)制造業(yè)的項(xiàng)目甚至說,我有一些重點(diǎn)的國家項(xiàng)目,他的整個(gè)項(xiàng)目組的人員資料都是非常、非常重要的,不能隨便 泄露出去。
機(jī)器學(xué)習(xí),我們不斷的希望機(jī)器能夠取代人在某方面做更多的事情,學(xué)習(xí)也是一種,你不妨交給機(jī)器讓它知道相關(guān)成果的特點(diǎn)是什么,在 這里我們經(jīng)常會(huì)講到很多企業(yè)都會(huì)有類似于生產(chǎn)的月報(bào)、周報(bào)、季報(bào)等,很多財(cái)務(wù)數(shù)據(jù)也會(huì)通過這樣的數(shù)據(jù)得到自己的分析,這張報(bào)表除了整個(gè)表格的形式以外,幾 乎沒有的數(shù)字之間是有關(guān)聯(lián)關(guān)系的,這就不得不使我們要看看有什么樣的方式對(duì)這類信息進(jìn)行有效的監(jiān)管,機(jī)器學(xué)習(xí)可以由它來進(jìn)行相似度的檢測,包括會(huì)議紀(jì)要, 在這樣一些相關(guān)的會(huì)議紀(jì)要的時(shí)候,我們給系統(tǒng),系統(tǒng)學(xué)習(xí)完之后就會(huì)知道這種格式呈現(xiàn)的時(shí)候就是會(huì)議紀(jì)要,甚至可以知道這是高層的會(huì)議紀(jì)要,從而幫助我們更 準(zhǔn)確地對(duì)這些類似的分析報(bào)告進(jìn)行有效的監(jiān)管。
OCR,語音識(shí)別現(xiàn)在已經(jīng)火熱到無法阻擋的地步,然而ORC技術(shù)開始讓人慢慢有點(diǎn)被人忘掉了,很多年以前大家都會(huì)看到說我們有很好的方式可以把印刷 的方式變成文字,很高興我們現(xiàn)在把它應(yīng)用到泄露信息防護(hù)到,因?yàn)楹芏鄡?nèi)部資料的外發(fā)往往是截圖、拍照,面對(duì)這樣的狀態(tài)的時(shí)候我們?nèi)绾芜M(jìn)行保護(hù)?之所以會(huì)發(fā) 生這樣的狀況很重要的因素是因?yàn)?,圖這個(gè)東西很少有技術(shù)會(huì)分析,Websense的數(shù)據(jù)安全當(dāng)進(jìn)行企業(yè)數(shù)據(jù)保護(hù)的時(shí)候,真的會(huì)看報(bào)表里的文字是什么,當(dāng)它 符合一定的價(jià)值的時(shí)候,會(huì)根據(jù)數(shù)據(jù)安全的要求進(jìn)行匹配,挑出某些圖片里的信息是否有問題,尤其在郵件的通道上的泄露,類似的ORC可以非常有效地幫助我們 發(fā)現(xiàn)這個(gè)問題。
點(diǎn)滴泄露,這個(gè)詞來源于什么?我們有一個(gè)客戶跟我們說,我們有的客服天天在處理一些信息,每時(shí)每刻都在把這些信息向外發(fā)送,我如何知道它的惡意是什 么?包括一些木馬,然而你無法發(fā)現(xiàn),因?yàn)樗看蔚牧刻?,于是有人說你能不能幫我檢測一段時(shí)間內(nèi)發(fā)生的少量但是多次的泄露場景,這樣就可以有效的發(fā)現(xiàn)一些 惡意的行為。
當(dāng)我們不斷關(guān)注數(shù)據(jù)中心、關(guān)注數(shù)據(jù)存儲(chǔ)的核心區(qū)域的時(shí)候,我們不得不看到數(shù)據(jù)最終的交互點(diǎn)在哪里。從數(shù)據(jù)泄露途徑每年的統(tǒng)計(jì)、分析來講,無論是四大 所做的分析還是其它行業(yè)分析機(jī)構(gòu)得到的統(tǒng)計(jì),我們都會(huì)看到網(wǎng)絡(luò)、終端最終都是最容易導(dǎo)致數(shù)據(jù)泄露的邊緣區(qū)域,于是我們想到可不可以在企業(yè)的網(wǎng)絡(luò)通道上,尤 其是業(yè)務(wù)最需要用到的通訊渠道,利用Web、郵件,甚至我們的加密通道傳輸,看看這里面有沒有敏感信息的泄露,這都是我們講的從你的網(wǎng)絡(luò)覆蓋面應(yīng)該如何看 待的問題,當(dāng)然最重要的是我們?nèi)绾伟堰@些問題捕獲到、防止它離開你的企業(yè),這才能真正幫助我們解決相應(yīng)的問題。
很多人每天都在處理你的數(shù)據(jù),無論是客服人員還是數(shù)據(jù)分析人員,又或者很多企業(yè)的高管,他們都在接觸這些數(shù)據(jù),這樣一些數(shù)據(jù)出現(xiàn)和使用的過程中,如 何從終端層面防止它的泄露?防止它成為你泄露的渠道?這些問題都是很多企業(yè)在做出呈現(xiàn)以后不知道如何保護(hù)的,這恰恰是Websense不斷希望能夠給我們 客戶帶來新的思考點(diǎn),讓我們?nèi)ジ玫乜创@些問題,看如何進(jìn)行相關(guān)的保護(hù)。
在大數(shù)據(jù)數(shù)據(jù)中間我們不斷談數(shù)據(jù)挖掘,說從相應(yīng)的問題里如何發(fā)現(xiàn)最具價(jià)值的信息,從數(shù)據(jù)泄露防護(hù)的角度上講也是一樣,你的泄露事件的管理同樣無異于 一種深度的信息挖掘,那如何在這中間挑到你感興趣的?我們不妨給客戶呈現(xiàn)出更具價(jià)值的統(tǒng)計(jì)報(bào)表,例如基于地理位置,經(jīng)常聽到人談到說我們有很多用戶的信息 會(huì)通過采集地理位置、地理信息來得到信息,數(shù)據(jù)泄露也是一樣,如果我們能夠呈現(xiàn)出你的機(jī)密數(shù)據(jù)曾經(jīng)被送到互聯(lián)網(wǎng)上或者整個(gè)企業(yè)外部某個(gè)國家特定的服務(wù)器上 的時(shí)候,企業(yè)高管可以看看我們公司在這個(gè)地區(qū)有沒有相應(yīng)的業(yè)務(wù),沒有的話那數(shù)據(jù)怎么去那里了?這可以幫助他發(fā)現(xiàn)有些數(shù)據(jù)的泄露是不是我們企業(yè)所擔(dān)心的。通 過這樣的方式可以快速地讓我們定位出我們感興趣的泄露問題,從而幫助企業(yè)的經(jīng)營決策決定是否應(yīng)對(duì)此類行為進(jìn)行有效的阻擋和限制。
工作流,這是現(xiàn)在越來越多的企業(yè)關(guān)注的,很多企業(yè)都在談到這個(gè)狀況,一個(gè)企業(yè)在如何應(yīng)用這些技術(shù)的同時(shí)把流程做好,數(shù)據(jù)防護(hù)也是如此,要真正讓這樣 的技術(shù)跟你的企業(yè)日常運(yùn)維結(jié)合在一起,這才是最重要的。我們發(fā)現(xiàn)這樣的工作流可以使得我們所有的工作人員不需要每天面對(duì)我的計(jì)算機(jī),我甚至只需要通過郵件 的方式對(duì)相應(yīng)的泄露場景、泄露事件進(jìn)行有效的處理,無論是審批釋放、反饋領(lǐng)導(dǎo)或者別的,我都可以這樣做。
面對(duì)泄露的威脅,很多企業(yè)都想到,我們最需要擔(dān)心的往往是黑客的行為,或者是很多惡意的行為,然而在很多企業(yè)根據(jù)真正自己敏感數(shù)據(jù)外發(fā)進(jìn)行羅列的時(shí)候,你會(huì)發(fā)現(xiàn)很多偶發(fā)事件占了企業(yè)70%的比例,原因就是很多員工是無意識(shí)的把這些信息泄露出去了。
就 比如說云,很多人會(huì)把工作的內(nèi)容上傳到云里,但他并沒有意識(shí)說這些信息有沒有技術(shù)共享,包括我們?nèi)ヒ患一ヂ?lián)網(wǎng)公司,他們的CIO親自跟我說,他現(xiàn)在很擔(dān) 心,原因是微博竟然成為一個(gè)公司內(nèi)部運(yùn)用的平臺(tái),機(jī)器出問題了他們會(huì)直接在微博上發(fā)出去,這是很不可思議的。我們這個(gè)系統(tǒng)就可以很好的監(jiān)管,當(dāng)你要往外發(fā) 的時(shí)候,你就可以警告他這樣的信息是不能往外發(fā)的,包括惡意的一些行為,無論是黑客進(jìn)來以后做一些竊取的動(dòng)作還是企業(yè)內(nèi)部做的一些數(shù)字的便利,可能都會(huì)存 在這樣的問題。這里恰恰是類似通過數(shù)據(jù)泄露防護(hù)的方式幫助我們?yōu)槠髽I(yè)高管們提供敏感數(shù)據(jù)的可視性,讓你知道你的分析成果到底傳到了什么地方去,從而可以更 好地幫助我們?cè)谶@方面進(jìn)行有效的控制。
Websense其實(shí)是一家上市公司,美國的一家上市公司,他做的很多方案越來越多的都是針對(duì)企業(yè)的敏感數(shù)據(jù)和企業(yè)的核心數(shù)據(jù)所展開 Websense專門設(shè)計(jì)了Trito的統(tǒng)一安全平臺(tái),圍繞企業(yè)經(jīng)常發(fā)現(xiàn)的各種安全問題,在郵件、敏感數(shù)據(jù)等方面進(jìn)行有效的統(tǒng)一內(nèi)容分析,幫助我們發(fā)現(xiàn)他 相應(yīng)的問題。通過整合的一種分析技術(shù),幫助我們把它濃縮為ACE這樣的分析引擎,對(duì)一些客戶的數(shù)據(jù)使用行為進(jìn)行判斷,從而有效地進(jìn)行阻擋。
Websense在北京的安全實(shí)驗(yàn)室可以很好地為大家提供這方面的技術(shù)支撐,我們希望給客戶帶來的是希望在大數(shù)據(jù)的時(shí)代下,當(dāng)你們獲得他的高價(jià)值信息的同時(shí),要注意如何在你的Web、郵件、敏感信息進(jìn)行有效的防范,甚至你應(yīng)該把安全方案逐步擴(kuò)展到云以及移動(dòng)終端上。
?