数据屏蔽是指公司创建其组织数据的虚假版本。目标是让这个版本看起来很现实,以保护敏感信息,并为用户培训、销售演示和软件测试等情况提供实际数据的替代方案。在这些情况下,数据不必是真实的以服务于预期目的。
数据屏蔽会在保持实际格式的同时更改各种细节的值。这反映了真实版本,但不能被攻击者逆向工程或破译。组织经常求助于数据屏蔽软件,通过用随机字符伪装关键信息来保护它,因此组织仍然可以使用它,但危险的外部力量无法使用它。
什么是数据屏蔽?
数据屏蔽类型
数据屏蔽的类型取决于原始值和加密值的组织方式。主要类型包括:
- 静态:通过更改所有敏感信息创建一个经过清理的数据库版本。生产中的数据库备份被创建并移动到不同的位置。删除不必要的数据后,其余信息在静止时被屏蔽。一旦完成,就可以安全地分发新副本。
- 确定性:映射两个数据集,使它们具有相同类型的数据,每个值始终被相应的值替换。例如,“马鞭草”一词总是会被“阿米娜”代替。这种方法可能很方便,但不是最安全的。
- On-the-fly:在开发环境中很有用,这种类型在保存之前从生产系统传输到开发系统时会屏蔽数据。无需创建备份,而是自动屏蔽数据,同时不断地从生产环境流式传输到所需的目的地。
- 动态:虽然动态将信息存储在开发环境中的辅助数据存储中,但动态数据屏蔽将这些详细信息直接从生产环境流式传输到开发环境。
数据屏蔽的好处
数据屏蔽是一个使敏感信息远离窥探的过程。使用此策略的组织会获得以下安全优势:
- 主动安全措施:帮助组织避免关键威胁,如数据丢失、泄露、帐户泄露、不安全的接口和内部威胁。
- 更安全的云采用:由于潜在的安全风险,一些组织可能不愿在云中运营。掩蔽通过消除这些问题解决了这个问题。
- 可用的低风险数据:虽然对任何安全风险无用,但屏蔽数据仍然可供组织内部使用。
- 安全共享:敏感细节可以与测试人员和开发人员共享,而不会泄露生产信息。
- 数据清理:虽然基本文件删除会在存储介质中留下数据痕迹,但可以使用掩码将实际值替换为虚假值,从而进一步防止已删除的信息被黑客入侵或窃取。
数据屏蔽技术
组织可以从各种掩蔽技术中进行选择,每种技术都因方法和安全级别而异。最常见的技术包括:
- 加密:除非查看者拥有加密密钥,否则使数据无用。这种技术是最安全的,因为它使用一种算法来完全屏蔽数据。它也是最复杂的,因为它依赖于加密软件等技术来执行持续的安全措施。
- 加扰:以随机顺序重新排列字符。这种方法简单,不如加密安全。
- Nulling:在某些用户查看时将 特定值显示为缺失 ( null )。
- 值方差:通过提供函数来隐藏原始值,例如系列中最高值和最低值之间的差异。
- 替代:价值被看似真实的虚假细节所取代。例如,名称可能会被随机选择的其他名称替换。
- 洗牌:不是用虚假的替代品替换数据值,而是对集合中的实际值进行洗牌以表示现有记录,同时保护敏感信息。
- 假名化:该术语由欧盟通用数据保护条例 (GDPR) 引入,涵盖删除任何可能充当个人标识符的信息。
数据屏蔽最佳实践
可以采取某些措施来确保数据屏蔽过程是有效的。为获得最佳效果,应遵守以下安全预防措施:
- 提前计划:组织应在开始屏蔽过程之前识别需要保护的信息。需要收集的其他信息包括有权查看特定详细信息的人员、存储位置以及涉及的应用程序。
- 优先考虑参照完整性:应使用一种标准算法屏蔽所有信息类型。虽然相同的屏蔽工具可能不适用于大型企业,但所有屏蔽工具都应同步,以便跨部门共享数据而不会出现问题。
- 保护算法:必须保护算法、替代数据集和密钥,以防止未经授权的用户对敏感信息进行逆向工程。