『壹』 如何確保數據安全
1.數據脫敏
數據脫敏是保證數據安全的最基本的手段,脫敏方法有很多,最常用的就是使用可逆加密演算法,對入倉每一個敏感欄位都需要加密。比如手機號,郵箱,身份證號,銀行卡號等信息
2.數據許可權控制
需要開發一套完善的數據許可權控制體系,最好是能做到欄位級別,有些表無關人員是不需要查詢的,所以不需要任何許可權,有些表部分人需要查詢,除數據工程師外,其他人均需要通過OA流程進行許可權審批,需要查看哪些表的哪些欄位,為什麼需要這個許可權等信息都需要審批存檔。
3.程序檢查
有些欄位明顯是敏感數據,比如身份證號,手機號等信息,但是業務庫並沒有加密,而且從欄位名來看,也很難看出是敏感信息,所以抽取到數據倉庫後需要使用程序去統一檢測是否有敏感數據,然後根據檢測結果讓對應負責人去確認是否真的是敏感欄位,是否需要加密等。
4.流程化操作
流程化主要是體現在公司內部取數或者外部項目數據同步,取數的時候如果數據量很大或者包含了敏感信息,是需要提OA 審批流程的,讓大家知道誰要取這些數據,取這些數據的意義在哪,出了問題可以回溯,快速定位到責任人。開發外部項目的時候,不同公司之間的數據同步,是需要由甲方出具同意書的,否則的話風險太大。
5.敏感SQL實時審查及操作日誌分析
及時發現敏感sql的執行並詢問責任人,事後分析操作日誌,查出有問題的操作。
6.部門重視數據安全
把數據安全當做一項KPI去考核,讓大家積極的參與到數據安全管理當中去。
『貳』 數據脫敏的處理方法
背景:
需要在非生產環境下對敏感信息進行數據脫敏,實現敏感隱私數據的可靠保護。
脫敏數據特徵:
1.保持原有數據特徵:例如身份證由17位數字本體碼和1位檢驗碼組成。
2.保持數據之間一致性:出生年月和出生日期之間的關系。
3.保持業務規則的關聯性。
4.多次脫敏之間的數據一致性。
脫敏的方法:
1.數據替換
要求:用設置的固定虛構值替換真值。例如將手機號碼統一替換為 13800013800
2.無效化
要求:通過對數據值得截斷、加密、隱藏等方式使敏感數據脫敏,使其不再具有利用價值,例如將地址以 ****** 代替真值。數據無效化與數據替換所達成的效果基本類似。
3.隨機化
要求:用隨機數據代替真值,保持替換值的隨機性以模擬樣本的真實性。例如用隨機生成的姓和名代替真值。
【注意】這個例子中我們針對數據脫敏引入了外部字典表,實際情況中可以根據數據脫敏要求,隨時引入任意外部字典表,通過數據的隨機化組合,實現替換真值數據的脫敏處理。
4.偏移和取整
要求:通過隨機移位改變數字數據,例如日期 2018-01-02 8:12:25 變為 2018-01-02 8:00:00,偏移取整在保持了數據的安全性的同時保證了范圍的大致真實性,此項功能在大數據利用環境中具有重大價值。
5.掩碼屏蔽
要求:掩碼屏蔽是針對賬戶類數據的部分信息進行脫敏時的有力工具,比如銀行卡號或是身份證號的脫敏。將身份證號的出生日期進行掩碼屏蔽脫敏。使用left()函數截取身份證號的左邊 6 位 + 字元串 ********+right()函數截取身份證號右邊 4 位替換源身份證字元串。
6.靈活編碼
要求:在需要特殊脫敏規則時,可執行靈活編碼以滿足各種可能的脫敏規則。比如用固定字母和固定位數的數字替代合同編號真值。將合同編號進行自定義編碼脫敏。自定義編碼規則:4 位固定碼 + 當前年份 + 源目標字元串 4 位號碼 +9 位數值組成。
脫敏相關文章參考:https://www.jianshu.com/p/43d9882ed24a