Эта статья объясняет, как создать Профиль контента для сервиса DLP компании Cato. Этот профиль включает один или несколько Типов данных DLP, которые можно использовать в политике Контроля приложений или в политике Защиты данных API безопасности SaaS.
Сервис Предотвращения утечки данных (DLP) компании Cato помогает вам отслеживать и контролировать конфиденциальную информацию в вашей сети. Вы можете добавить профили контента DLP в правило Контроля данных для обнаружения или блокировки конфиденциальных данных и предотвращения потенциальной эксфильтрации. DLP может сканировать текстовый контент, включая данные, встроенные в изображения, с помощью проверки на основе OCR, и документы, встроенные в файлы.
Профили контента могут включать предопределенные типы данных или пользовательские типы данных, включая Пользовательские типы данных и Метки конфиденциальности. Для получения дополнительной информации о типах данных, смотрите следующие статьи:
Профиль контента DLP является глобальным объектом Приложения управления Cato, который включает один или несколько Типов данных.
Вы можете настроить профиль контента так, чтобы движок DLP включал файлы изображений и изображения, встроенные в файлы, для соответствия контенту в профиле. Движок использует OCR для извлечения текста, который появляется в файлах изображений, и отправляет извлеченный текст для сопоставления контента. Опция сканирования OCR появляется при настройке Профиля контента. Сканирование изображений OCR включает:
Изображения с низким разрешением и размытые мобильные изображения
Искаженные, повернутые или скомканные изображения
Изображения, содержащие текст на двух языках
Услуга DLP поддерживает сканирование OCR для до 5 языков для вашей учетной записи, по умолчанию настроен только английский. Когда вы настраиваете языки для сканирования, движок DLP будет сканировать файлы изображений для контента на всех настройных языках. Поддерживаются все символы Unicode, за исключением арабского, иврита, тайского, корейского и тамильского. Порядок, в котором движок сканирует языки, следует приоритету, который вы задаете при настройке языков. Как только движок DLP обнаруживает совпадение для конфиденциальных данных на одном языке, сканирование завершается, и изображение не сканируется для других языков.
Установка языка с высоким приоритетом означает, что движок сначала будет сканировать этот язык, перед языками с более низким приоритетом, и есть большая вероятность, что контент на этом языке будет точно обнаружен. Например, если японский язык установлен как второй язык, а корейский как третий, сканирование OCR сначала попробует обнаружить текст на японском языке, и это более вероятно, что японский язык будет точно обнаружен.
Для получения дополнительной информации о определении языков для сканирования OCR, см. ниже Настройка языков для сканирования OCR.
Используйте страницу Конфигурация DLP для создания и редактирования Профилей контента. При добавлении Типов данных в профиль вы можете фильтровать типы по конкретной стране или Универсальный (для всех стран). Кроме того, можно сортировать Типы данных в алфавитном порядке по возрастанию или убыванию согласно категории или имени, или по стране.
При добавлении нескольких Типов данных в профиль выберите отношение между ними:
- Любой (ИЛИ) - Соответствие только одному из Типов данных в профиле
- Все (И) - Соответствие всем Типам данных в профиле (в противном случае правило с этим профилем игнорируется)
Правило Контроля данных может содержать до 20 Типов данных во всех Профилях контента.
При настройке Профиля контента можно опционально включить сканирование OCR для профиля.
Для создания Профиля контента DLP:
- В меню навигации выберите Безопасность > Типы данных & Профили, а затем на вкладке Профили DLP выберите Профиль контента.
-
Нажмите Новый.
Открывается панель Добавить Профиль Контента.
- Создайте профиль и добавьте Типы данных.
- Опционально выберите Сканирование OCR включено для профиля.
- Нажмите Применить, затем нажмите Сохранить.
Страница Типы данных показывает все Типы данных, которые можно добавить в профиль. Это позволяет исследовать и понять больше о специфических Типах данных, которые вы используете в своей организации. Каталог также показывает Пороговое значение для каждого типа данных, указанное минимальное количество случаев для активации типа данных. Для получения дополнительной информации о пороговых значениях типов данных, см. Работа с пользовательскими типами данных для DLP.
Используйте вкладку Настройки на странице Конфигурация DLP для определения языков, сканируемых для файлов изображений. Выберите до 5 языков и задайте порядок приоритета. По умолчанию настроен только английский.
Чтобы настроить языки для сканирования OCR:
- В меню навигации выберите Безопасность > Типы данных & Профили,, а на вкладке Настройки выберите Общие.
- В разделе Языки OCR выберите до 5 языков.
- Перетащите языки в списке, чтобы определить приоритет сканирования.
- Нажмите Сохранить. Настройки языков OCR настроены для учетной записи.
Поддерживаются файлы до 50 МБ. Ниже перечислены поддерживаемые типы файлов (аудио, видео и двоичные файлы не поддерживаются).
- Файлы CSV:
.csv - Шаблон Excel:
.xlt, .xltx - Рабочая книга Excel:
.xlw - База данных Microsoft Access:
.mdb - Microsoft Excel:
.xls, .xlsx, .xlsm, .xlam, .xlsb, .slk, .xltm - Microsoft PowerPoint:
.ppt, .pps, .pot, .pptx, .ppsx, .pptm, .ppsm, .potx, .potm - Microsoft Word:
.doc, .docx, .docm, .dotx - Проект MS Access:
.ade - Документы ODF:
.odt, .ods, .odp - Шаблон презентации ODF:
.otp - Шаблон электронных таблиц ODF:
.ots - Шаблон текста ODF:
.ott - Шаблон формата Outlook:
.oft - Формат переносимого документа:
.pdf - Формат текста с расширенной разметкой:
.rtf - Файлы SQL:
.sql - Текстовые файлы:
.txt - Файлы XPS:
.xps - Файлы XML:
.xml
Для файлов PNG и JPEG сканирование поддерживается только для действия Загрузка
- Bitmap:
.bmp - Несжатый BMP:
.bmp-uncompressed - Файлы JFIF:
.jfif - Файлы JPEG:
.jpeg, .jpg - Файлы PBM:
.pbm - Файлы PGM:
.pgm - Файлы PNG:
.png - Файлы PNM:
.pnm - Файлы PPM:
.ppm - Прогрессивные JPEG:
.pjpeg, .pjp - Файлы TIFF:
.tiff, .tif - Файлы WebP:
.webp
Изображения, встроенные в эти типы файлов, сканируются. Изображения (до 5) сканируются на файл, если файл содержит более 5 изображений, сканируются только 5 самых больших изображений.
- Microsoft Excel:
.xls, .xlsx - Microsoft PowerPoint:
.ppt, .pptx - Microsoft Word:
.doc, .docx - Формат переносимого документа:
.pdf
- Скрипты Bash:
.sh - Основной исходный код:
.bas - Пакетные файлы:
.cmd, .bat - C, C++ и C# исходные файлы:
.c, .h, .cc, .hh, .cs, .cpp, .hpp - Go файлы:
.go - HTML файлы:
.html - Включить файлы:
.inc - Java файлы:
.java, .jav, .j - JavaScript файлы:
.js - Make файлы:
.mak, .mk, .pmk - Matlab файлы:
.mat - Perl файлы:
.pl, .pm, .plf - Python файлы:
.py, .pyi, .pyc, .pyd, .pyo, .pyw, .pyz - Ruby файлы:
.rb - Скрипты / конфигурационные файлы:
.ini, .json
0 комментариев
Войдите в службу, чтобы оставить комментарий.