创建内容配置文件

本文解释如何为 Cato 的 DLP 服务创建内容配置文件。 此数据丢失防护配置文件包括一个或多个数据丢失防护数据类型,您可以用于应用程序控制策略或 SaaS 安全 API 数据保护策略。

概览

Cato 的数据丢失预防 (DLP) 服务帮助您监控和控制网络中的敏感信息。 您可以将 DLP 内容配置文件添加到数据控制规则中,以检测或阻止敏感数据并预防潜在的数据泄露。 DLP 可以扫描基于文本的内容, 使用 OCR 基于检查扫描嵌入图像的数据, 和文件中嵌入的文档。

内容配置文件可以包括预定义的数据类型或自定义的数据类型,包括用户定义的数据类型和敏感度标签。 有关数据类型的更多信息,请参阅以下文章:

数据丢失防护 内容配置文件 是 Cato 管理应用程序的一个全局对象,其中包括一个或多个数据类型。

用于内容配置文件的OCR图像扫描

您可以配置一个内容配置文件, 使 DLP 引擎在内容匹配中包括图像文件和文件中嵌入的图像。 引擎使用 OCR 提取图像文件中出现的文本,并发送提取的文本以进行内容匹配。 配置内容配置文件时出现 OCR 扫描选项。 OCR图像扫描包括: 

  • 低分辨率和模糊的移动图像

  • 弯曲、旋转或褶皱的图像

  • 包含两种语言文字的图像 

OCR 扫描的语言支持

数据丢失防护服务支持为您的账户最多五种语言进行 OCR 扫描,默认情况下,只配置了英语。 配置需要扫描的语言时,DLP 引擎将扫描所有配置的语言的图像文件内容。 支持所有Unicode字符,除阿拉伯语、希伯来语、泰语、韩语和泰米尔语之外。 引擎扫描语言的顺序遵循您配置语言时设置的优先级。 DLP 引擎一旦检测到一种语言中包含敏感数据的匹配,扫描将结束,图像不会为其他语言再次扫描。

将语言设置为高优先级意味着引擎会先扫描这种语言,相比低优先级的语言,内容更有可能被准确检测到。 例如,如果日语设置为第二语言,韩语设置为第三语言,OCR 扫描将首先尝试检测日语文本,更有可能准确检测到日语。

有关定义 OCR 扫描语言的更多信息,请参见以下配置 OCR 扫描语言

创建内容配置文件

使用DLP配置页面创建和编辑内容配置文件。 在向个人资料添加数据类型时,您可以根据特定国家或通用(所有国家)过滤类型。 此外,您可以根据类别或名称,或根据国家按升序或降序字母顺序排序数据类型。

当您向配置文件添加多个数据类型时,选择它们之间的关系:

  • 任何 (或) - 仅匹配配置文件中的一个数据类型
  • 全部 (与) - 匹配配置文件中的所有数据类型(否则,将忽略此配置文件的规则)

数据控制规则可以包含最多 20 个数据类型,跨所有内容配置文件。

配置内容配置文件时,可选启用 OCR 扫描

DLP_Configuration.png

创建 DLP 内容配置文件:

  1. 从导航菜单中,选择安全性 > 数据类型 & 配置文件,然后在DLP配置文件选项卡中选择内容配置文件
  2. 点击新建

    添加内容配置文件面板打开。

  3. 创建配置文件并添加数据类型。
  4. 可选的,选择启用 OCR 扫描用于此配置文件。
  5. 点击应用,然后点击保存

查看数据类型

数据类型页面显示您可以添加到配置文件的所有数据类型。 这允许您研究和了解更多关于在您的组织中使用的特定数据类型的信息。 目录还显示每个数据类型的阈值,指示激活数据类型所需的最小发生次数。 有关数据类型阈值的更多信息,请参见与DLP自定义数据类型一起使用

Data_Types6.png

显示数据类型:

  • 从导航菜单中,选择安全性 > 数据类型 & 配置文件,,然后点击数据类型选项卡。

配置OCR扫描语言

在DLP配置页面的设置选项卡中,定义扫描图像文件的语言。 选择最多5种语言并设置优先级顺序。 默认情况下,仅配置了英语。

OCR_Languages.png

配置OCR扫描的语言:

  1. 从导航菜单中,选择安全性 > 数据类型 & 配置文件,然后在设置选项卡中选择常规
  2. OCR 语言部分选择最多5种语言。
  3. 拖放列表中的语言以定义扫描优先级。
  4. 点击保存。 OCR语言设置已为账户配置。

DLP 文件要求

支持的文件大小不超过 50 MB。 下面列出了支持的文件类型 (音频, 视频和二进制文件不支持)。

文档文件

  • CSV 文件:.csv
  • Excel 模板:.xlt, .xltx
  • Excel 工作空间:.xlw
  • Microsoft Access 数据库:.mdb
  • Microsoft Excel:.xls, .xlsx, .xlsm, .xlam, .xlsb, .slk, .xltm
  • Microsoft PowerPoint:.ppt, .pps, .pot, .pptx, .ppsx, .pptm, .ppsm, .potx, .potm
  • Microsoft Word:.doc, .docx, .docm, .dotx
  • MS Access 项目:.ade
  • ODF 文档:.odt, .ods, .odp
  • ODF 演示模板:.otp
  • ODF 电子表格模板:.ots
  • ODF 文本模板:.ott
  • Outlook 表单模板:.oft
  • 便携式文档格式:.pdf
  • 富文本格式:.rtf
  • SQL 文件:.sql
  • 文本文件:.txt
  • XPS 文件:.xps
  • XML 文件:.xml

嵌入文档

扫描这些文件类型中嵌入的文档。 每个文件中最多扫描 5 个嵌入文件, 如果一个文件包含超过 5 个嵌入文件, 只有最大的 5 个文件被扫描。

  • Microsoft Excel:.xls, .xlsx
  • Microsoft PowerPoint:.ppt, .pptx
  • Microsoft Word:.doc, .docx

档案文件

  • 7-Zip:.7z
  • ARJ:.arj
  • Bzip2:.bz, .bz2
  • Cab 档案:.cab
  • GZIP:.gzip, .gz
  • LHA:.lha, .lzh
  • RAR:.rar
  • RPM:.rpm
  • Tar:.tgz, .gtar, .tar
  • Unix 档案:.cpio, .shar
  • UUE:.uue
  • WAR:.war
  • XAR:.xar
  • ZIP:.zip

图像文件

对于PNG和JPEG文件,仅支持扫描上传操作

  • 位图:.bmp
  • BMP 未压缩:.bmp-uncompressed
  • JFIF 文件:.jfif
  • JPEG 文件:.jpeg, .jpg
  • PBM 文件:.pbm
  • PGM 文件:.pgm
  • PNG 文件:.png
  • PNM 文件:.pnm
  • PPM 文件:.ppm
  • 渐进 JPEG:.pjpeg, .pjp
  • TIFF 文件:.tiff, .tif
  • WebP 文件:.webp

嵌入图像

扫描这些文件类型中嵌入的图像。 每个文件最多扫描 5 个图像, 如果一个文件包含超过 5 个图像, 只有最大的 5 个图像被扫描。

  • Microsoft Excel:.xls, .xlsx
  • Microsoft PowerPoint:.ppt, .pptx
  • Microsoft Word:.doc, .docx
  • 便携式文档格式:.pdf

电子邮件和消息文件

  • Base64 编码:.base64
  • Microsoft Outlook 数据文件:.pst
  • Microsoft Outlook 消息:.msg, .eml
  • MIME:.mime
  • Outlook Express:.dbx
  • TNEF / winmail.dat:.dat
  • Unix mbox:.mbox
  • UTF-16:.utf-16

源码和脚本文件

  • Bash 脚本:.sh
  • 基本源代码:.bas
  • 批处理文件:.cmd, .bat
  • C、C++和C#来源文件:.c、.h、.cc、.hh、.cs、.cpp、.hpp
  • Go文件:.go
  • HTML文件:.html
  • 包含文件:.inc
  • Java文件:.java、.jav、.j
  • JavaScript文件:.js
  • Make文件:.mak、.mk、.pmk
  • Matlab文件:.mat
  • Perl文件:.pl、.pm、.plf
  • Python文件:.py、.pyi、.pyc、.pyd、.pyo、.pyw、.pyz
  • Ruby文件:.rb
  • 脚本/配置文件:.ini、.json

其他支持文件

  • HTTP表单数据:.http
  • 互联网注册文件:.isp、.ins
  • PCAP文件:.pcap
  • TrueType字体文件:.ttf

这篇文章有帮助吗?

2 人中有 2 人觉得有帮助

0 条评论