与预定义DLP数据类型一起工作

本文解释了如何使用预定义的数据类型识别敏感数据以防止数据泄露。

概述

Cato的DLP服务使用预定义的数据类型识别流量中的敏感数据。您可以将数据类型添加到现有的DLP内容配置文件或创建一个新文件。

预定义的数据类型有：

数据目录：包含数百个针对特定国家的不同静态数据点
机器学习（ML）分类器：能够适应变化的数据模式，并准确识别各种敏感数据或图像，而无需持续的人工更新。

除了预定义的数据类型之外，您还可以创建自定义数据类型。有关更多信息，请参阅处理自定义数据类型。

了解数据目录

数据目录包含针对国家的数据类型，分为以下数据类别：

文档分类
金融数据
HIPAA - 仅在美国适用
医疗保健
项目标识符 - 如邮政编码和许可证密钥 -
支付卡行业数据安全标准（PCI DSS） - 信用卡数据
个人身份信息 - PII
英国国家医疗服务

了解机器学习分类器

ML分类器经过训练以识别敏感文档或图像。使用高级数据科学相似性模型，ML分类器在检测敏感数据时提供更好的适应性和准确性，因为它们可以随着数据模式的变化动态学习和发展。例如，您可以使用记录ML分类器来检测所有医学记录，而无需每次医学表单更新时更新自定义数据类型。 ML分类器提供全面的检测，涵盖类别如医学记录、纳税申报单、专利文件、简历、移民表格等。

有两个ML分类器：

预定义 ML 分类器：识别敏感数据，例如，在百余种语言中的恢复
图像ML分类器：识别敏感图像，例如工程图或截图

已知限制

OCR图像扫描不支持ML分类器数据类型

验证数据类型

为确保您的环境中的数据匹配预定义的数据类型，您可以验证您的数据并通过导出提取的文本确保正确识别。

要验证数据类型：

在导航菜单中选择安全性 > 数据类型 & 档案,，然后点击数据类型标签。
点击数据类型行末的三个点，然后点击验证。
上传测试文件或图像。

查看数据类型

数据类型页面显示所有可以添加到档案的数据类型。这让您可以研究和了解更多关于您组织中使用的特定数据类型。目录还显示了每个数据类型的阈值，指示激活数据类型所需的最小出现次数。有关数据类型阈值的更多信息，请参见与DLP自定义数据类型一起工作。

显示数据类型：

在导航菜单中选择安全性 > 数据类型 & 档案,，然后点击数据类型标签。