DLPのための定義済みデータ型を扱う

この記事では、データエクスフィルトレーションを防ぐために、定義済みデータ型を使用して機密データを識別する方法を説明します。

概要

CatoのDLPサービスは、トラフィックフロー内の機密データを識別するために、定義済みデータの種類を使用します。 DLPコンテントプロファイルの既存のプロファイルにデータの種類を追加するか、新しいプロファイルを作成することができます。

定義済みデータ型は次の通りです:

  • データカタログ: これは、特定の国に合わせた何百もの異なる静的データポイントを含んでいます
  • 機械学習(ML)分類器:これらは変化するデータパターンに適応し、広範囲の機密データや画像を正確に識別します。継続的な手動更新は必要ありません。

定義済みデータの種類に加えて、カスタムデータの種類を作成することもできます。 詳細については、DLPのカスタムデータの種類を使用するを参照してください。

データカタログの理解

データカタログには、以下のデータカテゴリに分類された国別のデータの種類が含まれています:

  • 文書分類
  • 金融データ
  • HIPAA - 米国のみ関連
  • ヘルスケア
  • アイテム識別子 - 郵便番号やライセンスキーなど -
  • Payment Card Industry Data Security Standard (PCI DSS) - クレジットカードデータ
  • 個人を特定できる情報 - PII
  • 英国国民健康サービス

機械学習分類器の理解

ML分類器は、機密文書や画像を識別するように訓練されています。 高度なデータサイエンス類似モデルを使用して、ML分類器は機密データの検出における適応性と精度を向上させ、変化するデータパターンに基づいて動的に学習し進化することができます。 例えば、医療フォームが更新されるたびにカスタムデータの種類を更新する代わりに、記録ML分類器を使用してすべての医療記録を検出できます。 ML分類器は、医療記録、税務書類、特許文書、履歴書、移民書類などのカテゴリに対する包括的な検出を提供します。

ML分類器は2種類あります:

  • 事前定義済み ML 分類子: データ再開、例: 履歴書、百以上の言語での機密データを識別 
  • 画像ML分類器:例えば、エンジニアリング図やスクリーンショットなどの機密画像を識別します

既知の制限

  • ML分類器データの種類にはOCR画像スキャンはサポートされていません。

データタイプの検証

環境内のデータが定義済みデータ型と一致することを確認するために、データを検証して抽出されたテキストをエクスポートすることで正しく識別されたことを確認できます。

データの種類を検証するには:

  1. ナビゲーションメニューから、セキュリティ > データの種類 & プロファイルを選択し、データの種類タブをクリックします。
  2. 検証したいデータ型の行の最後にある3点をクリックし、検証をクリックします。
  3. テストファイルまたは画像をアップロードします。

データの種類の表示

データの種類ページには、プロファイルに追加できるすべてのデータの種類が表示されます。 これにより、組織で使用している特定のデータの種類についてもっと調査し理解することができます。 カタログには、データの種類を有効化するための最小発生数を示す各データ型のしきい値も表示されています。 データの種類のしきい値について詳しくは、DLPのカスタムデータの種類を使用するを参照してください。

Image_class.png

データの種類を表示するには:

  • ナビゲーションメニューから、セキュリティ > データの種類 & プロファイルを選択し、データの種類タブをクリックします。

この記事は役に立ちましたか?

1人中1人がこの記事が役に立ったと言っています

0件のコメント