Создание Профилей Контента DLP

Эта статья объясняет, как создать Профиль контента для сервиса DLP компании Cato. Этот профиль включает один или несколько Типов данных DLP, которые можно использовать в политике Контроля приложений или в политике Защиты данных API безопасности SaaS.

Обзор

Сервис Предотвращения утечки данных (DLP) компании Cato помогает вам отслеживать и контролировать конфиденциальную информацию в вашей сети. Вы можете добавить профили контента DLP в правило Контроля данных для обнаружения или блокировки конфиденциальных данных и предотвращения потенциальной эксфильтрации. DLP может сканировать текстовый контент, включая данные, встроенные в изображения, с помощью проверки на основе OCR, и документы, встроенные в файлы.

Профили контента могут включать предопределенные типы данных или пользовательские типы данных, включая Пользовательские типы данных и Метки конфиденциальности. Для получения дополнительной информации о типах данных, смотрите следующие статьи:

Профиль контента DLP является глобальным объектом Приложения управления Cato, который включает один или несколько Типов данных.

Сканирование изображений OCR для профилей контента

Вы можете настроить профиль контента так, чтобы движок DLP включал файлы изображений и изображения, встроенные в файлы, для соответствия контенту в профиле. Движок использует OCR для извлечения текста, который появляется в файлах изображений, и отправляет извлеченный текст для сопоставления контента. Опция сканирования OCR появляется при настройке Профиля контента. Сканирование изображений OCR включает: 

  • Изображения с низким разрешением и размытые мобильные изображения

  • Искаженные, повернутые или скомканные изображения

  • Изображения, содержащие текст на двух языках 

Поддержка языков для сканирования OCR

Услуга DLP поддерживает сканирование OCR для до 5 языков для вашей учетной записи, по умолчанию настроен только английский. Когда вы настраиваете языки для сканирования, движок DLP будет сканировать файлы изображений для контента на всех настройных языках. Поддерживаются все символы Unicode, за исключением арабского, иврита, тайского, корейского и тамильского. Порядок, в котором движок сканирует языки, следует приоритету, который вы задаете при настройке языков. Как только движок DLP обнаруживает совпадение для конфиденциальных данных на одном языке, сканирование завершается, и изображение не сканируется для других языков.

Установка языка с высоким приоритетом означает, что движок сначала будет сканировать этот язык, перед языками с более низким приоритетом, и есть большая вероятность, что контент на этом языке будет точно обнаружен. Например, если японский язык установлен как второй язык, а корейский как третий, сканирование OCR сначала попробует обнаружить текст на японском языке, и это более вероятно, что японский язык будет точно обнаружен.

Для получения дополнительной информации о определении языков для сканирования OCR, см. ниже Настройка языков для сканирования OCR.

Создание Профиля Контента

Используйте страницу Конфигурация DLP для создания и редактирования Профилей контента. При добавлении Типов данных в профиль вы можете фильтровать типы по конкретной стране или Универсальный (для всех стран). Кроме того, можно сортировать Типы данных в алфавитном порядке по возрастанию или убыванию согласно категории или имени, или по стране.

При добавлении нескольких Типов данных в профиль выберите отношение между ними:

  • Любой (ИЛИ) - Соответствие только одному из Типов данных в профиле
  • Все (И) - Соответствие всем Типам данных в профиле (в противном случае правило с этим профилем игнорируется)

Правило Контроля данных может содержать до 20 Типов данных во всех Профилях контента.

При настройке Профиля контента можно опционально включить сканирование OCR для профиля.

DLP_Configuration.png

Для создания Профиля контента DLP:

  1. В меню навигации выберите Безопасность > Типы данных & Профили, а затем на вкладке Профили DLP выберите Профиль контента.
  2. Нажмите Новый.

    Открывается панель Добавить Профиль Контента.

  3. Создайте профиль и добавьте Типы данных.
  4. Опционально выберите Сканирование OCR включено для профиля.
  5. Нажмите Применить, затем нажмите Сохранить.

Просмотр Типов данных

Страница Типы данных показывает все Типы данных, которые можно добавить в профиль. Это позволяет исследовать и понять больше о специфических Типах данных, которые вы используете в своей организации. Каталог также показывает Пороговое значение для каждого типа данных, указанное минимальное количество случаев для активации типа данных. Для получения дополнительной информации о пороговых значениях типов данных, см. Работа с пользовательскими типами данных для DLP.

Data_Types6.png

Чтобы показать Типы данных:

  • В меню навигации выберите Безопасность > Типы данных & Профили,, а на вкладке Типы данных выберите вкладку.

Настройка Языков для сканирования OCR

Используйте вкладку Настройки на странице Конфигурация DLP для определения языков, сканируемых для файлов изображений. Выберите до 5 языков и задайте порядок приоритета. По умолчанию настроен только английский.

OCR_Languages.png

Чтобы настроить языки для сканирования OCR:

  1. В меню навигации выберите Безопасность > Типы данных & Профили,, а на вкладке Настройки выберите Общие.
  2. В разделе Языки OCR выберите до 5 языков.
  3. Перетащите языки в списке, чтобы определить приоритет сканирования.
  4. Нажмите Сохранить. Настройки языков OCR настроены для учетной записи.

Требования к файлам DLP

Поддерживаются файлы до 50 МБ. Ниже перечислены поддерживаемые типы файлов (аудио, видео и двоичные файлы не поддерживаются).

Файлы документов

  • Файлы CSV: .csv
  • Шаблон Excel: .xlt, .xltx
  • Рабочая книга Excel: .xlw
  • База данных Microsoft Access: .mdb
  • Microsoft Excel: .xls, .xlsx, .xlsm, .xlam, .xlsb, .slk, .xltm
  • Microsoft PowerPoint: .ppt, .pps, .pot, .pptx, .ppsx, .pptm, .ppsm, .potx, .potm
  • Microsoft Word: .doc, .docx, .docm, .dotx
  • Проект MS Access: .ade
  • Документы ODF: .odt, .ods, .odp
  • Шаблон презентации ODF: .otp
  • Шаблон электронных таблиц ODF: .ots
  • Шаблон текста ODF: .ott
  • Шаблон формата Outlook: .oft
  • Формат переносимого документа: .pdf
  • Формат текста с расширенной разметкой: .rtf
  • Файлы SQL: .sql
  • Текстовые файлы: .txt
  • Файлы XPS: .xps
  • Файлы XML: .xml

Встроенные документы

Документы, встроенные в эти типы файлов, сканируются. До 5 встроенных файлов на файл, если файл содержит более 5 встроенных файлов, сканируются только 5 самых больших файлов.

  • Microsoft Excel: .xls, .xlsx
  • Microsoft PowerPoint: .ppt, .pptx
  • Microsoft Word: .doc, .docx

Архивные файлы

  • 7-Zip: .7z
  • ARJ: .arj
  • Bzip2: .bz, .bz2
  • Архив Cab: .cab
  • GZIP: .gzip, .gz
  • LHA: .lha, .lzh
  • RAR: .rar
  • RPM: .rpm
  • Tar: .tgz, .gtar, .tar
  • Архив Unix: .cpio, .shar
  • UUE: .uue
  • WAR: .war
  • XAR: .xar
  • ZIP: .zip

Файлы изображений

Для файлов PNG и JPEG сканирование поддерживается только для действия Загрузка

  • Bitmap: .bmp
  • Несжатый BMP: .bmp-uncompressed
  • Файлы JFIF: .jfif
  • Файлы JPEG: .jpeg, .jpg
  • Файлы PBM: .pbm
  • Файлы PGM: .pgm
  • Файлы PNG: .png
  • Файлы PNM: .pnm
  • Файлы PPM: .ppm
  • Прогрессивные JPEG: .pjpeg, .pjp
  • Файлы TIFF: .tiff, .tif
  • Файлы WebP: .webp

Встроенные изображения

Изображения, встроенные в эти типы файлов, сканируются. Изображения (до 5) сканируются на файл, если файл содержит более 5 изображений, сканируются только 5 самых больших изображений.

  • Microsoft Excel: .xls, .xlsx
  • Microsoft PowerPoint: .ppt, .pptx
  • Microsoft Word: .doc, .docx
  • Формат переносимого документа: .pdf

Файлы электронной почты и сообщений

  • Кодирование Base64: .base64
  • Файл данных Microsoft Outlook: .pst
  • Сообщение Microsoft Outlook: .msg, .eml
  • MIME: .mime
  • Outlook Express: .dbx
  • TNEF / winmail.dat: .dat
  • Уникальная почта Unix: .mbox
  • UTF-16: .utf-16

Файлы исходного кода и скриптов

  • Скрипты Bash: .sh
  • Основной исходный код: .bas
  • Пакетные файлы: .cmd, .bat
  • C, C++ и C# исходные файлы: .c, .h, .cc, .hh, .cs, .cpp, .hpp
  • Go файлы: .go
  • HTML файлы: .html
  • Включить файлы: .inc
  • Java файлы: .java, .jav, .j
  • JavaScript файлы: .js
  • Make файлы: .mak, .mk, .pmk
  • Matlab файлы: .mat
  • Perl файлы: .pl, .pm, .plf
  • Python файлы: .py, .pyi, .pyc, .pyd, .pyo, .pyw, .pyz
  • Ruby файлы: .rb
  • Скрипты / конфигурационные файлы: .ini, .json

Другие поддерживаемые файлы

  • HTTP данные формы: .http
  • Файлы регистрации в Интернете: .isp, .ins
  • PCAP файлы: .pcap
  • Файлы шрифтов TrueType: .ttf

Была ли эта статья полезной?

Пользователи, считающие этот материал полезным: 2 из 2

0 комментариев