Trabajando con Tipos de Datos Predefinidos para DLP

Este artículo explica cómo usar tipos de datos predefinidos para identificar datos sensibles y prevenir la exfiltración de datos.

Visión general

El servicio DLP de Cato utiliza Tipos de Datos Predefinidos para identificar datos sensibles dentro de un flujo de tráfico. Puede agregar los Tipos de Datos a un perfil de contenido de DLP existente o crear uno nuevo.

Los Tipos de Datos predefinidos son:

El Catálogo de Datos: Este contiene cientos de diferentes puntos de datos estáticos adaptados a países específicos
Clasificadores de Machine Learning (ML): Estos se adaptan a patrones de datos cambiantes y identifican con precisión una amplia gama de datos o imágenes sensibles sin requerir actualizaciones manuales continuas.

Además de los Tipos de Datos predefinidos, también puede crear Tipos de Datos personalizados. Para más información, vea Trabajar con Tipos de Datos Personalizados para DLP.

Comprender el Catálogo de Datos

El Catálogo de Datos contiene tipos de datos específicos por país que se categorizan en las siguientes categorías de datos:

Clasificación de documentos
Datos financieros
HIPAA - solo relevante para EEUU
Cuidado de la salud
Identificadores de artículos - como códigos postales y claves de licencia -
Estándar de Seguridad de Datos de la Industria de Tarjetas de Pago (PCI DSS) - datos de tarjetas de crédito
Información Personalmente Identificable - PII
Servicio Nacional de Salud del Reino Unido

Comprender los Clasificadores de Machine Learning

Los Clasificadores ML están entrenados para identificar documentos o imágenes sensibles. Utilizando un modelo avanzado de ciencia de datos de similitud, los Clasificadores ML ofrecen mejor adaptabilidad y precisión en la detección de datos sensibles, ya que pueden aprender y evolucionar dinámicamente con patrones de datos cambiantes. Por ejemplo, en lugar de necesitar actualizar un tipo de datos personalizado cada vez que se actualiza un formulario médico, puede usar el Clasificador de Registros ML para detectar todos los registros médicos. Los Clasificadores ML proporcionan detección integral para categorías tales como registros médicos, formularios fiscales, documentos de patentes, currículums, formularios de inmigración y más.

Hay dos Clasificadores ML:

Clasificadores ML predefinidos: Identifica datos sensibles, por ejemplo, reanudar, en más de cien idiomas
Clasificadores ML de Imágenes: Identifica imágenes sensibles, por ejemplo, diagramas de ingeniería o capturas de pantalla

Limitaciones conocidas

La escaneo de imágenes OCR no está soportada para tipos de datos de Clasificador ML

Validar Tipos de Datos

Para asegurarse de que los datos en su entorno coinciden con un tipo de datos predefinido, puede validar sus datos y asegurarse de que se identifican correctamente exportando el texto extraído.

Para validar tipos de datos:

Desde el menú de navegación, seleccione Seguridad > Tipos de Datos & Perfiles, y haga clic en la pestaña Tipos de Datos.
Haga clic en los tres puntos al final de la fila del tipo de datos que desea validar, y haga clic en Validar.
Suba el archivo de prueba o la imagen.

Viendo los Tipos de Datos

La página Tipos de Datos muestra todos los Tipos de Datos que puede agregar a un perfil. Esto le permite investigar y comprender más sobre los Tipos de Datos específicos que está usando en su organización. El catálogo también muestra el Umbral para cada tipo de datos, indicando el número mínimo de ocurrencias para activar el tipo de datos. Para más información sobre los umbrales de tipo de datos, vea Trabajar con Tipos de Datos Personalizados para DLP.

Para mostrar los Tipos de Datos:

Desde el menú de navegación, seleccione Seguridad > Tipos de Datos & Perfiles, y haga clic en la pestaña Tipos de Datos.