動態(tài)脫敏一般是對數(shù)據(jù)進行實時脫敏,常用于對外提供訪問接口的時候,外部可以訪問我們的數(shù)據(jù),實時獲取數(shù)據(jù)的場景。有的數(shù)據(jù)有很大的流量,但是單個脫敏的時候,數(shù)據(jù)量都是比較小的,它的技術(shù)實現(xiàn)一般是通過透明網(wǎng)關(guān)等中間件技術(shù),使得脫敏方案在用戶無感知的情況下給用戶返回脫敏后的數(shù)據(jù),另外還有改寫數(shù)據(jù)請求的這種方式。

     數(shù)據(jù)脫敏技術(shù)的主要目標就是通過對敏感數(shù)據(jù)按照相應(yīng)特定脫敏算法進行變形轉(zhuǎn)換,以降低數(shù)據(jù)的敏感程度,擴大數(shù)據(jù)可共享和被使用的范圍。一般脫敏算法有加解密、掩碼、替換和模糊等等。數(shù)據(jù)脫敏不僅要執(zhí)行數(shù)據(jù)漂白,抹去數(shù)據(jù)中的敏感內(nèi)容,同時也需要保持原有的數(shù)據(jù)特征、業(yè)務(wù)規(guī)則和數(shù)據(jù)關(guān)聯(lián)性,保證開發(fā)、測試、培訓(xùn)以及大數(shù)據(jù)類業(yè)務(wù)不會受到脫敏的影響,達成脫敏前后的數(shù)據(jù)一致性、有效性:

     一是保持原有數(shù)據(jù)特征。數(shù)據(jù)脫敏前后必須保證數(shù)據(jù)特征的保持,例如:身份證號碼由十七位數(shù)字本體碼和一位校驗碼組成,分別為區(qū)域地址碼(6 位)、出生日期(8 位)、順序碼(3 位)和校驗碼(1 位)。那么身份證號碼的脫敏規(guī)就需要保證脫敏后依舊保持這些特征信息。

     二是保持數(shù)據(jù)之間的一致性。在不同業(yè)務(wù)中,數(shù)據(jù)和數(shù)據(jù)之間具有一定的關(guān)聯(lián)性。例如:出生年月或年齡和出生日期之間的關(guān)系。同樣,身份證信息脫敏后仍需要保證出生年月字段和身份證中包含的出生日期之間的一致性。

     三是保持業(yè)務(wù)規(guī)則的關(guān)聯(lián)性。保持數(shù)據(jù)業(yè)務(wù)規(guī)則的關(guān)聯(lián)性是指數(shù)據(jù)脫敏時數(shù)據(jù)關(guān)聯(lián)性以及業(yè)務(wù)語義等保持不變,其中數(shù)據(jù)關(guān)聯(lián)性包括:主、外鍵關(guān)聯(lián)性、關(guān)聯(lián)字段的業(yè)務(wù)語義關(guān)聯(lián)性等。特別是高度敏感的賬戶類主體數(shù)據(jù)往往會貫穿主體的所有關(guān)系和行為信息,因此需要特別注意保證所有相關(guān)主體信息的一致性。

     四是多次脫敏之間的數(shù)據(jù)一致性。相同的數(shù)據(jù)進行多次脫敏,或者在不同的測試系統(tǒng)進行脫敏,需要確保每次脫敏的數(shù)據(jù)始終保持一致性,只有這樣才能保障業(yè)務(wù)系統(tǒng)數(shù)據(jù)變更的持續(xù)一致性以及廣義業(yè)務(wù)的持續(xù)一致性。

為什么要做數(shù)據(jù)脫敏?

     數(shù)據(jù)脫敏通過對數(shù)據(jù)進行脫敏,在保證數(shù)據(jù)可用性的同時,也在一定范圍內(nèi)保證惡意攻擊者無法將數(shù)據(jù)與具體用戶關(guān)聯(lián)到一起,從而保證用戶數(shù)據(jù)的隱私性。數(shù)據(jù)脫敏方案作為大數(shù)據(jù)平臺整體數(shù)據(jù)安全解決方案的重要組成部分,是構(gòu)建安全可靠的大數(shù)據(jù)平臺必不可少的功能特性。

     大數(shù)據(jù)平臺通過將所有數(shù)據(jù)整合起來,充分分析與挖掘數(shù)據(jù)的內(nèi)在價值,為業(yè)務(wù)部門提供數(shù)據(jù)平臺,數(shù)據(jù)產(chǎn)品與數(shù)據(jù)服務(wù)。大數(shù)據(jù)平臺接入的數(shù)據(jù)中可能包括很多用戶的隱私和敏感信息,如用戶在酒店的入住紀錄、用戶支付信息等,這些數(shù)據(jù)存在可能泄漏的風險。

     大數(shù)據(jù)平臺一般通過用戶認證、權(quán)限管理以及數(shù)據(jù)加密等技術(shù)保證數(shù)據(jù)的安全,但是這并不能完全從技術(shù)上保證數(shù)據(jù)的安全。嚴格的來說,任何有權(quán)限訪問用戶數(shù)據(jù)的人員,如ETL工程師或是數(shù)據(jù)分析人員等,均有可能導(dǎo)致數(shù)據(jù)泄漏的風險。

     另一方面,沒有訪問用戶數(shù)據(jù)權(quán)限的人員,也可能有對該數(shù)據(jù)進行分析挖掘的需求,數(shù)據(jù)的訪問約束大大限制的充分挖掘數(shù)據(jù)價值的范圍。

如何進行數(shù)據(jù)脫敏?

     最早數(shù)據(jù)脫敏的主要是針對數(shù)值和文本這種很基本的數(shù)據(jù)類型,現(xiàn)在對于圖片、對音頻、視頻都有脫敏的需要。值得一提的是,各行各業(yè)在實施數(shù)據(jù)脫敏及追求數(shù)據(jù)應(yīng)用價值時,對數(shù)據(jù)脫敏業(yè)務(wù)合規(guī)性及高可用性,敏感數(shù)據(jù)的分布與管理,脫敏數(shù)據(jù)可用性,數(shù)據(jù)審計技術(shù)手段,業(yè)務(wù)操作便捷性以及項目實施周期極為關(guān)注。

     針對以上訴求,國聯(lián)易安通過研發(fā)推出的數(shù)據(jù)庫安全脫敏系統(tǒng)是一款高性能、高擴展性的數(shù)據(jù)屏蔽和脫敏產(chǎn)品,既保護敏感數(shù)據(jù),又滿足監(jiān)管合規(guī)的要求,可謂兩全其美。系統(tǒng)尤其實現(xiàn)了自動識別敏感數(shù)據(jù)和管理敏感數(shù)據(jù),提供靈活的策略和脫敏方案配置,具備高效可并行的脫敏能力,可以幫助客戶快速實施敏感數(shù)據(jù)脫敏處理。系統(tǒng)同時可以保證數(shù)據(jù)的有效性和可用性,使脫敏后的數(shù)據(jù)能夠安全的應(yīng)用于測試、開發(fā)、分析和第三方使用環(huán)境。

     隨著信息時代的發(fā)展,我們對數(shù)據(jù)信息的安全要求越來越重視,比如對非生產(chǎn)環(huán)境下的敏感數(shù)據(jù)的脫敏保護。在金融、運營商、政府、能源等部門,非生產(chǎn)環(huán)境下數(shù)據(jù)脫敏已列入監(jiān)管部門的法規(guī)要求。非生產(chǎn)環(huán)境數(shù)據(jù)多用于開發(fā)、測試、培訓(xùn)以及第三方數(shù)據(jù)分析、挖掘,如果不能有效實施敏感數(shù)據(jù)保護,極易造成敏感數(shù)據(jù)的泄露。所以,保證非生產(chǎn)數(shù)據(jù)的安全已經(jīng)成為一個重要的課題,要求我們能夠通過對敏感信息進行脫敏、變形,實現(xiàn)有效的數(shù)據(jù)保護。

     國聯(lián)易安自主研發(fā)的數(shù)據(jù)庫安全脫敏系統(tǒng),采用獨創(chuàng)的脫敏算法對敏感數(shù)據(jù)進行變形、屏蔽、替換、隨機化、加密等措施,將敏感數(shù)據(jù)轉(zhuǎn)化為仿真數(shù)據(jù),脫敏后的數(shù)據(jù)保留原有數(shù)據(jù)的特征和分布,無需改變相應(yīng)的業(yè)務(wù)系統(tǒng)邏輯而受到業(yè)界的認可和信賴。

參考文獻:

李呈祥,CSDN網(wǎng),《大數(shù)據(jù)與數(shù)據(jù)脫敏》

Jacky,乾學院,《數(shù)據(jù)脫敏的處理方法及查詢》

王卓 ,安全內(nèi)參網(wǎng),《信通院專家:數(shù)據(jù)脫敏為什么如此重要》

分享到

xiesc

相關(guān)推薦