Работа с предопределенными типами данных для DLP

В этой статье объясняется, как использовать предопределенные типы данных для определения конфиденциальных данных с целью предотвращения эксфильтрации данных.

Обзор

Сервис DLP от Cato использует предопределенные типы данных для определения конфиденциальных данных в потоке трафика. Вы можете добавить типы данных в существующий профиль контента DLP или создать новый.

Предопределенные типы данных:

Каталог данных: Содержит сотни различных статических данных, адаптированных для конкретных стран
Классификаторы машинного обучения (ML): Они адаптируются к изменяющимся паттернам данных и точно определяют широкий спектр конфиденциальных данных или изображений без необходимости постоянных ручных обновлений.

В дополнение к предопределенным типам данных, вы также можете создавать пользовательские типы данных. Для получения более подробной информации смотрите Работа с пользовательскими типами данных для DLP.

Понимание каталогов данных

Каталог данных содержит специфические для страны типы данных, которые классифицируются в следующие категории данных:

Классификация документов
Финансовые данные
HIPAA - релевантно только для США
Здравоохранение
Идентификаторы элементов - такие как почтовые коды и лицензионные ключи -
Стандарт безопасности данных индустрии платёжных карт (PCI DSS) - данные кредитной карты
Персональная идентифицируемая информация - PII
Национальная служба здравоохранения Великобритании

Понимание классификаторов машинного обучения

Классификаторы ML обучены для идентификации конфиденциальных документов или изображений. Используя продвинутую модель сходства данных, классификаторы ML предлагают лучшую адаптивность и точность в обнаружении конфиденциальных данных, так как они могут динамически обучаться и развиваться с изменяющимися паттернами данных. Например, вместо необходимости обновлять пользовательский тип данных всякий раз, когда медицинская форма обновляется, вы можете использовать классификатор ML Records для обнаружения всех медицинских записей. Классификаторы ML обеспечивают всестороннее обнаружение для таких категорий, как медицинские записи, налоговые формы, патентные документы, резюме, формы иммиграции и более.

Существуют два классификатора ML:

Предопределенные ML-классификаторы: Определяет чувствительные данные, например, резюме, на более чем ста языках
Классификаторы изображений ML: Определяет конфиденциальные изображения, например, инженерные диаграммы или скриншоты

Известные ограничения

OCR-сканирование изображений не поддерживается для типов данных классификаторов ML

Проверка типов данных

Для обеспечения соответствия данных в вашей среде предопределенному типу данных вы можете проверить свои данные и убедиться в правильной идентификации, экспортировав извлеченный текст.

Для проверки типов данных:

Из меню навигации выберите Безопасность > Типы данных и профили, и нажмите вкладку Типы данных.
Нажмите на три точки в конце строки с типом данных, который вы хотите проверить, и нажмите Проверить.
Загрузите тестовый файл или изображение.

Просмотр типов данных

Страница Типы данных показывает все типы данных, которые вы можете добавить в профиль. Это позволит вам исследовать и лучше понять специфику типов данных, которые вы используете в своей организации. Каталог также показывает пороговое значение для каждого типа данных, указывая минимальное количество случаев для активации типа данных. Чтобы узнать больше о пороговых значениях типов данных, смотрите Работа с пользовательскими типами данных для DLP.

Чтобы показать типы данных:

Из меню навигации выберите Безопасность > Типы данных и профили, и нажмите вкладку Типы данных.