DLPのための定義済みデータ型を扱う

この記事では、データエクスフィルトレーションを防ぐために、定義済みデータ型を使用して機密データを識別する方法を説明します。

概要

CatoのDLPサービスは、トラフィックフロー内の機密データを識別するために、定義済みデータの種類を使用します。 DLPコンテントプロファイルの既存のプロファイルにデータの種類を追加するか、新しいプロファイルを作成することができます。

定義済みデータ型は次の通りです:

データカタログ：これは、特定の国に合わせた何百もの異なる静的データポイントを含んでいます
機械学習(ML)分類器：これらは変化するデータパターンに適応し、広範囲の機密データや画像を正確に識別します。継続的な手動更新は必要ありません。

定義済みデータの種類に加えて、カスタムデータの種類を作成することもできます。詳細については、DLPのカスタムデータの種類を使用するを参照してください。

データカタログの理解

データカタログには、以下のデータカテゴリに分類された国別のデータの種類が含まれています:

文書分類
金融データ
HIPAA - 米国のみ関連
ヘルスケア
アイテム識別子 - 郵便番号やライセンスキーなど -
Payment Card Industry Data Security Standard (PCI DSS) - クレジットカードデータ
個人を特定できる情報 - PII
英国国民健康サービス

機械学習分類器の理解

ML分類器は、機密文書や画像を識別するように訓練されています。高度なデータサイエンス類似モデルを使用して、ML分類器は機密データの検出における適応性と精度を向上させ、変化するデータパターンに基づいて動的に学習し進化することができます。例えば、医療フォームが更新されるたびにカスタムデータの種類を更新する代わりに、記録ML分類器を使用してすべての医療記録を検出できます。 ML分類器は、医療記録、税務書類、特許文書、履歴書、移民書類などのカテゴリに対する包括的な検出を提供します。

ML分類器は2種類あります:

事前定義済み ML 分類子: データ再開、例: 履歴書、百以上の言語での機密データを識別
画像ML分類器：例えば、エンジニアリング図やスクリーンショットなどの機密画像を識別します

既知の制限

ML分類器データの種類にはOCR画像スキャンはサポートされていません。

データタイプの検証

環境内のデータが定義済みデータ型と一致することを確認するために、データを検証して抽出されたテキストをエクスポートすることで正しく識別されたことを確認できます。

データの種類を検証するには:

ナビゲーションメニューから、セキュリティ > データの種類 & プロファイル、を選択し、データの種類タブをクリックします。
検証したいデータ型の行の最後にある3点をクリックし、検証をクリックします。
テストファイルまたは画像をアップロードします。

データの種類の表示

データの種類ページには、プロファイルに追加できるすべてのデータの種類が表示されます。これにより、組織で使用している特定のデータの種類についてもっと調査し理解することができます。カタログには、データの種類を有効化するための最小発生数を示す各データ型のしきい値も表示されています。データの種類のしきい値について詳しくは、DLPのカスタムデータの種類を使用するを参照してください。

データの種類を表示するには:

ナビゲーションメニューから、セキュリティ > データの種類 & プロファイル、を選択し、データの種類タブをクリックします。