Creando Perfiles de Contenido DLP

Este artículo explica cómo crear un Perfil de Contenido para el servicio DLP de Cato. Este perfil incluye uno o más de los Tipos de Datos DLP, que puede usar en una política de Control de Aplicaciones o en una política de Protección de Datos API de Seguridad SaaS.

Visión general

El servicio DLP de Cato utiliza cientos de diferentes Tipos de Datos predefinidos para identificar datos sensibles y contenido dentro de un flujo de tráfico. Existen diferentes categorías de Tipos de Datos predefinidos y la mayoría de las categorías son para países específicos. Esto le permite crear una política granular que solo se aplica a los datos sensibles pertinentes.

El servicio DLP también admite tipos de datos personalizados, incluidos los Tipos de Datos Definidos por el Usuario y las Etiquetas de Sensibilidad. Para más información sobre tipos de datos personalizados, consulte los siguientes artículos:

El Perfil de Contenido DLP es un objeto global para la Aplicación de Gestión Cato, que incluye uno o más Tipos de Datos.

Resumen de Categorías de Datos Predefinidas

Esta sección resume las diferentes categorías de Tipos de Datos predefinidos que puede agregar a un perfil en la Aplicación de Gestión Cato.

Comprendiendo el Catálogo de Datos

El Catálogo de Datos contiene tipos de datos específicos de cada país que se clasifican en las siguientes categorías de datos:

  • Clasificación de documentos

  • Datos financieros

  • HIPAA - solo relevante para los EE.UU.

  • Atención médica

  • Identificadores de elementos - como códigos postales y claves de licencia -

  • Estándar de Seguridad de Datos para la Industria de Tarjetas de Pago (PCI DSS) - datos de tarjetas de crédito

  • Información de Identificación Personal - PII

  • Servicio Nacional de Salud del Reino Unido

Comprendiendo los Clasificadores de Aprendizaje Automático

Los tipos de datos predefinidos en el servicio DLP incluyen clasificadores de datos basados en aprendizaje automático (ML) entrenados para identificar diferentes tipos de documentos sensibles. Usando un modelo de similitud de ciencia de datos avanzado, los Clasificadores ML ofrecen mejor adaptabilidad y precisión en la detección de datos sensibles, ya que pueden aprender y evolucionar dinámicamente con patrones de datos cambiantes. Por ejemplo, en lugar de necesitar actualizar un tipo de dato personalizado cada vez que se actualiza un formulario médico, puede usar el Clasificador ML de Registros para detectar todos los registros médicos. Los Clasificadores ML proporcionan una detección integral para categorías como registros médicos, formularios fiscales, documentos de patentes, currículums, formularios de inmigración y más. Para más información sobre los Clasificadores ML, vea abajo.

  • Los tipos de datos de Clasificadores ML admiten documentos en inglés

  • El escaneo de imágenes OCR no es compatible para tipos de datos de Clasificadores ML

Nota

Nota: Por favor, contacte a SaaSecAPI@catonetworks.com o a su distribuidor oficial de Cato para más información sobre el uso de Clasificadores ML para DLP.

Escaneo de Imágenes OCR para Perfiles de Contenido

Puede configurar un Perfil de Contenido para que el motor DLP incluya archivos de imagen en la coincidencia de contenido para el perfil. El motor utiliza OCR para extraer texto que aparece en los archivos de imagen y envía el texto extraído para la coincidencia de contenido. La opción de escaneo OCR aparece al configurar un Perfil de Contenido.

Soporte de Idiomas para el Escaneo OCR

El servicio DLP admite el escaneo OCR para hasta 5 idiomas para su cuenta, por defecto, solo está configurado el inglés. Cuando configure los idiomas que desea escanear, el motor DLP escaneará archivos de imagen para contenido en todos los idiomas configurados. El orden en el cual el motor escanea los idiomas sigue la prioridad que establezca al configurar los idiomas. Una vez que el motor DLP detecta una coincidencia para datos sensibles en un idioma, el escaneo termina, y la imagen no se escanea para los otros idiomas.

Establecer un idioma con alta prioridad significa que el motor escaneará primero ese idioma antes que los idiomas de menor prioridad, y hay una mayor probabilidad de que el contenido en ese idioma se detecte con precisión. Por ejemplo, si el japonés está configurado como segundo idioma y el coreano como tercer idioma, el escaneo OCR primero intentará detectar texto en japonés y es más probable que se detecte de forma precisa.

Para más información sobre la definición de idiomas para escaneos OCR, vea abajo Configurando Idiomas para el Escaneo OCR.

Requisitos de Archivos para el Escaneo OCR

  • El tamaño de archivo de imagen compatible para el escaneo OCR está entre 10KB y 20 MB

  • Los tipos de archivo compatibles incluyen: PNG, JPEG, TIFF, BMP, PNM, WEBP, JPEG2000

  • Las acciones compatibles incluyen la carga y descarga

    • Para archivos PNG y JPEG, el escaneo solo es compatible para la acción de carga

Creando un Perfil de Contenido

Use la página de Configuración DLP para crear y editar Perfiles de Contenido. Cuando esté agregando Tipos de Datos a un perfil, puede filtrar los tipos según un país específico o Universal (para todos los países). Además, puede ordenar los Tipos de Datos en orden alfabético ascendente o descendente según la categoría o nombre, o según el país.

Cuando añade múltiples Tipos de Datos a un perfil, seleccione la relación entre ellos:

  • Cualquiera (OR) - Coincide con solo uno de los Tipos de Datos en el perfil

  • Todos (AND) - Coincide con todos los Tipos de Datos en el perfil (de lo contrario, se ignora la regla con este perfil)

Una regla de Control de Datos puede contener hasta 20 Tipos de Datos en todos los Perfiles de Contenido.

Cuando configure un Perfil de Contenido, habilite opcionalmente el escaneo OCR para el perfil.

DLP_Configuration.png

Para crear un Perfil de Contenido DLP:

  1. Desde el menú de navegación, seleccione Seguridad > Tipos de Datos & Perfiles, y en la pestaña Perfiles de prevención de pérdida de datos seleccione Perfil de contenido.

  2. Haga clic en Nuevo.

    Se abre el panel Agregar Perfil de Contenido.

  3. Cree el perfil y agregue los Tipos de Datos.

  4. Opcionalmente, seleccione Escaneo OCR Habilitado para el perfil.

  5. Haz clic en aplicar y, a continuación, haz clic en Guardar.

Mostrando el Catálogo de Datos

La página del Catálogo de Datos muestra todos los Tipos de Datos que puede agregar a un perfil y le permite ordenar los tipos según las columnas de la página. Esto le permite investigar y comprender más sobre tipos de datos específicos que está utilizando en su organización. El catálogo también muestra el Umbral para cada tipo de dato, indicando el número mínimo de ocurrencias para activar el tipo de dato. Para más información sobre los umbrales de tipo de datos, vea Trabajando con Tipos de Datos Personalizados para DLP.

Para mostrar el Catálogo de Datos:

  • Desde el menú de navegación, seleccione Seguridad > Tipos de Datos & Perfiles, y en la pestaña Tipos de Datos seleccione Catálogo de Datos.

Mostrando los Clasificadores ML

La página de Clasificadores ML muestra todos los Clasificadores ML que puede agregar a un perfil. La página muestra los clasificadores según categorías y proporciona una descripción para cada clasificador.

Para mostrar los Clasificadores ML:

  • Desde el menú de navegación, seleccione Seguridad > Tipos de Datos & Perfiles, y en la pestaña Tipos de Datos seleccione Clasificadores ML.

Configurando Idiomas para el Escaneo OCR

Use la pestaña Configuración en la página de Configuración DLP para definir los idiomas escaneados para archivos de imagen. Seleccione hasta 5 idiomas y establezca el orden de prioridad. Por defecto, solo el inglés está configurado.

OCR_Languages.png

Para configurar idiomas para el escaneo OCR:

  1. Desde el menú de navegación, seleccione Seguridad > Tipos de Datos & Perfiles, y en la pestaña Configuraciones seleccione Configuración general.

  2. En la sección Idiomas OCR, seleccione hasta 5 idiomas.

  3. Arrastre y suelte los idiomas en la lista para definir la prioridad de escaneo.

  4. Haz clic en Guardar. Los ajustes de idioma de OCR están configurados para la cuenta.

¿Fue útil este artículo?

Usuarios a los que les pareció útil: 0 de 0

0 comentarios