Créer des Profils de contenu DLP

Cet article explique comment créer un Profil de contenu pour le Service DLP de Cato. Ce profil inclut un ou plusieurs Types de données DLP que vous pouvez utiliser dans une Politique de contrôle d'application ou une Politique de Protection des données API de sécurité SaaS.

Vue d'ensemble

Le service de Prévention de perte de données (DLP) de Cato vous aide à surveiller et contrôler les informations sensibles sur votre Réseau. Vous pouvez ajouter des Profils de contenu DLP à une Règle de contrôle des données pour détecter ou bloquer des données sensibles et prévenir une exfiltration potentielle. DLP peut analyser le contenu textuel, inclure les données intégrées dans les images en utilisant une vérification basée sur l'OCR, et les documents intégrés dans les fichiers.

Les Profils de contenu peuvent inclure des types de données prédéfinis ou des types de données personnalisés, y compris les Types de données définis par l'utilisateur et les Étiquettes de sensibilité. Pour plus d'informations sur les types de données, consultez les articles suivants :

Le Profil de contenu DLP est un objet global pour l'Application de gestion Cato qui inclut un ou plusieurs Types de données.

Numérisation des images OCR pour les profils de contenu

Vous pouvez configurer un profil de contenu afin que le moteur DLP inclue des fichiers image et des images intégrées dans les fichiers dans la correspondance de contenu pour le profil. Le moteur utilise l'OCR pour extraire le texte qui apparaît dans les fichiers d'images et envoie le texte extrait pour la correspondance de contenu. L'option d'analyse OCR apparaît lors de la configuration d'un Profil de contenu. La numérisation des images OCR inclut : 

  • Images mobiles basse résolution et floues

  • Images déformées, tournées ou froissées

  • Images contenant du texte en deux langues 

Support de langue pour la numérisation OCR

Le service DLP prend en charge l'analyse OCR pour jusqu'à 5 langues pour votre compte, par défaut, seule l'anglais est configuré. Lorsque vous configurez les langues que vous souhaitez analyser, le moteur DLP analysera les fichiers d'images pour le contenu dans toutes les langues configurées. Tous les caractères Unicode sont pris en charge, sauf l'arabe, l'hébreu, le thaï, le coréen, et le tamoul. L'ordre dans lequel le moteur analyse pour les langues suit la priorité que vous définissez lors de la configuration des langues. Une fois que le moteur DLP détecte une correspondance pour des données sensibles dans une langue, l'analyse se termine et l'image n'est pas analysée pour les autres langues.

Définir une langue avec une haute priorité signifie que le moteur analysera cette langue avant les langues de priorité inférieure, et il y a une probabilité plus élevée que le contenu dans cette langue soit détecté avec précision. Par exemple, si le japonais est défini comme la deuxième langue et le coréen comme la troisième langue, l'analyse OCR essaiera d'abord de détecter le texte japonais et il est plus probable que le japonais soit détecté avec précision.

Pour plus d'informations sur la définition des langues pour les analyses OCR, voir ci-dessous Configurer les langues pour l'analyse OCR.

Créer un Profil de contenu

Utilisez la page de Configuration DLP pour créer et Modifier le jeton d'accès des Profils de contenu. Lorsque vous ajoutez des Types de données à un profil, vous pouvez filtrer les types selon un pays spécifique ou Universel (pour tous les pays). De plus, vous pouvez trier les Types de données par ordre alphabétique croissant ou décroissant selon la catégorie ou le nom, ou selon le pays.

Lorsque vous ajoutez plusieurs Types de données à un profil, sélectionnez la relation entre eux :

  • N'importe lequel (OU) - Correspondance uniquement avec l'un des Types de données dans le profil
  • Tous (ET) - Correspondance avec tous les Types de données dans le profil (sinon, la règle avec ce profil est ignorée)

Une Règle de contrôle des données peut contenir jusqu'à 20 Types de données dans tous les Profils de contenu.

Lorsque vous configurez un Profil de contenu, activez optionnellement l'analyse OCR pour le profil.

DLP_Configuration.png

Pour créer un Profil de contenu DLP :

  1. Dans le menu de navigation, sélectionnez Sécurité > Types de données & Profils, et dans l'onglet Profils DLP sélectionnez Profil de contenu.
  2. Cliquez sur Nouveau.

    Le panneau Ajouter un profil de contenu s'ouvre.

  3. Créez le profil et ajoutez les Types de données.
  4. Sélectionnez optionnellement Analyse OCR activée pour le profil.
  5. Cliquez sur Appliquer puis cliquez sur Enregistrer.

Visualiser les Types de données

La page Types de données montre tous les Types de données que vous pouvez ajouter à un profil. Cela vous permet de rechercher et de comprendre mieux les Types de données spécifiques que vous utilisez dans votre organisation. Le catalogue montre également le Seuil pour chaque type de données, indiquant le nombre minimum d'occurrences pour activer le type de données. Pour plus d'informations sur les seuils de types de données, voir Travailler avec des types de données personnalisés pour DLP.

Data_Types6.png

Pour afficher les Types de données :

  • Dans le menu de navigation, sélectionnez Sécurité > Types de données & Profils,, et cliquez sur l'onglet Types de données.

Configurer les Langues pour l'analyse OCR

Utilisez l'onglet Paramètres dans la page de Configuration de la DLP pour définir les langues analysées pour les fichiers d'images. Sélectionnez jusqu'à 5 langues et définissez l'ordre de priorité. Par défaut, seule l'anglais est configuré.

OCR_Languages.png

Pour configurer les langues pour l'analyse OCR :

  1. Dans le menu de navigation, sélectionnez Sécurité > Types de données & Profils,, et dans l'onglet Paramètres sélectionnez Général.
  2. Dans la section Langues OCR, sélectionnez jusqu'à 5 langues.
  3. Faites glisser et déposez les langues dans la liste pour définir la priorité d'analyse.
  4. Cliquez sur Enregistrer. Les paramètres de langue OCR sont configurés pour le Compte.

Conditions de fichier DLP

Fichiers jusqu'à 50 Mo sont pris en charge. Les types de fichiers pris en charge sont listés ci-dessous (Les fichiers audio, vidéo et binaires ne sont pas pris en charge).

Fichiers de document

  • Fichiers CSV : .csv
  • Modèle Excel : .xlt, .xltx
  • Espace de travail Excel : .xlw
  • Base de données Microsoft Access : .mdb
  • Microsoft Excel : .xls, .xlsx, .xlsm, .xlam, .xlsb, .slk, .xltm
  • Microsoft PowerPoint : .ppt, .pps, .pot, .pptx, .ppsx, .pptm, .ppsm, .potx, .potm
  • Microsoft Word : .doc, .docx, .docm, .dotx
  • Projet MS Access : .ade
  • Documents ODF : .odt, .ods, .odp
  • Modèle de présentation ODF : .otp
  • Modèle de feuille de calcul ODF : .ots
  • Modèle de texte ODF : .ott
  • Modèle de formulaire Outlook : .oft
  • Format de document portable : .pdf
  • Format de texte enrichi : .rtf
  • Fichiers SQL : .sql
  • Fichiers texte : .txt
  • Fichiers XPS : .xps
  • Fichiers XML : .xml

Documents intégrés

Les documents intégrés dans ces types de fichiers sont analysés. Jusqu'à 5 fichiers intégrés par fichier, si un fichier contient plus de 5 fichiers intégrés, seuls les 5 fichiers les plus volumineux sont analysés.

  • Microsoft Excel : .xls, .xlsx
  • Microsoft PowerPoint : .ppt, .pptx
  • Microsoft Word : .doc, .docx

Fichiers d'archive

  • 7-Zip : .7z
  • ARJ : .arj
  • Bzip2 : .bz, .bz2
  • Archive Cab : .cab
  • GZIP : .gzip, .gz
  • LHA : .lha, .lzh
  • RAR : .rar
  • RPM : .rpm
  • Tar : .tgz, .gtar, .tar
  • Archive Unix : .cpio, .shar
  • UUE : .uue
  • WAR : .war
  • XAR : .xar
  • ZIP : .zip

Fichiers image

Pour les fichiers PNG et JPEG, l'analyse n'est prise en charge que pour l'action de Téléversement

  • Bitmap : .bmp
  • BMP non compressé : .bmp-uncompressed
  • Fichiers JFIF : .jfif
  • Fichiers JPEG : .jpeg, .jpg
  • Fichiers PBM : .pbm
  • Fichiers PGM : .pgm
  • Fichiers PNG : .png
  • Fichiers PNM : .pnm
  • Fichiers PPM : .ppm
  • JPEG progressif : .pjpeg, .pjp
  • Fichiers TIFF : .tiff, .tif
  • Fichiers WebP : .webp

Images intégrées

Les images intégrées dans ces types de fichiers sont analysées. Jusqu'à 5 images sont analysées par fichier, si un fichier contient plus de 5 images, seules les 5 images les plus volumineuses sont analysées.

  • Microsoft Excel : .xls, .xlsx
  • Microsoft PowerPoint : .ppt, .pptx
  • Microsoft Word : .doc, .docx
  • Format de document portable : .pdf

Fichiers email et messages

  • Encodé en Base64 : .base64
  • Fichier de données Microsoft Outlook : .pst
  • Message Microsoft Outlook : .msg, .eml
  • MIME : .mime
  • Outlook Express : .dbx
  • TNEF / winmail.dat : .dat
  • Boîte aux lettres Unix : .mbox
  • UTF-16 : .utf-16

Fichiers de code source et script

  • Scripts Bash : .sh
  • Code source Basic : .bas
  • Fichiers batch : .cmd, .bat
  • Fichiers source C, C++ et C#: .c, .h, .cc, .hh, .cs, .cpp, .hpp
  • Fichiers Go: .go
  • Fichiers HTML: .html
  • Inclure les fichiers : .inc
  • Fichiers Java: .java, .jav, .j
  • Fichiers JavaScript: .js
  • Fichiers Make: .mak, .mk, .pmk
  • Fichiers Matlab: .mat
  • Fichiers Perl: .pl, .pm, .plf
  • Fichiers Python: .py, .pyi, .pyc, .pyd, .pyo, .pyw, .pyz
  • Fichiers Ruby: .rb
  • Fichiers Scripts / config: .ini, .json

Autres Fichiers Supportés

  • Données formulaire HTTP: .http
  • Fichiers inscription Internet: .isp, .ins
  • Fichiers PCAP: .pcap
  • Fichiers de police TrueType: .ttf

Cet article vous a-t-il été utile ?

Utilisateurs qui ont trouvé cela utile : 2 sur 2

0 commentaire