脱敏数据怎么定义?
脱敏数据定义三原则
-
去标识化:删除姓名、工号、客户名等直接识别信息
- 例:用“员工A”替代“张三”,“客户X”替代“华为”
-
范围模糊:精确数值改为区间或百分比
- 例:加班费“3800元”改为“3000-4000元”或“占总预算12%”
-
逻辑隔离:切断数据间的关联路径
- 例:不展示“部门+项目+金额”组合,只给“部门+金额”或“项目+金额”
实操检查清单:
- 可逆吗?(是否能反推出个人/客户)
- 能联表吗?(两份数据合起来能否识别身份)
- 有意义吗?(脱敏后仍能分析问题,如“高投诉率区域集中在华东区”)