この記事では、データエクスフィルトレーションを防ぐために、定義済みデータ型を使用して機密データを識別する方法を説明します。
CatoのDLPサービスは、トラフィックフロー内の機密データを識別するために、定義済みデータの種類を使用します。 DLPコンテントプロファイルの既存のプロファイルにデータの種類を追加するか、新しいプロファイルを作成することができます。
定義済みデータ型は次の通りです:
- データカタログ: これは、特定の国に合わせた何百もの異なる静的データポイントを含んでいます
- 機械学習(ML)分類器:これらは変化するデータパターンに適応し、広範囲の機密データや画像を正確に識別します。継続的な手動更新は必要ありません。
定義済みデータの種類に加えて、カスタムデータの種類を作成することもできます。 詳細については、DLPのカスタムデータの種類を使用するを参照してください。
データカタログには、以下のデータカテゴリに分類された国別のデータの種類が含まれています:
- 文書分類
- 金融データ
- HIPAA - 米国のみ関連
- ヘルスケア
- アイテム識別子 - 郵便番号やライセンスキーなど -
- Payment Card Industry Data Security Standard (PCI DSS) - クレジットカードデータ
- 個人を特定できる情報 - PII
- 英国国民健康サービス
ML分類器は、機密文書や画像を識別するように訓練されています。 高度なデータサイエンス類似モデルを使用して、ML分類器は機密データの検出における適応性と精度を向上させ、変化するデータパターンに基づいて動的に学習し進化することができます。 例えば、医療フォームが更新されるたびにカスタムデータの種類を更新する代わりに、記録ML分類器を使用してすべての医療記録を検出できます。 ML分類器は、医療記録、税務書類、特許文書、履歴書、移民書類などのカテゴリに対する包括的な検出を提供します。
ML分類器は2種類あります:
- 事前定義済み ML 分類子: データ再開、例: 履歴書、百以上の言語での機密データを識別
- 画像ML分類器:例えば、エンジニアリング図やスクリーンショットなどの機密画像を識別します
環境内のデータが定義済みデータ型と一致することを確認するために、データを検証して抽出されたテキストをエクスポートすることで正しく識別されたことを確認できます。
データの種類ページには、プロファイルに追加できるすべてのデータの種類が表示されます。 これにより、組織で使用している特定のデータの種類についてもっと調査し理解することができます。 カタログには、データの種類を有効化するための最小発生数を示す各データ型のしきい値も表示されています。 データの種類のしきい値について詳しくは、DLPのカスタムデータの種類を使用するを参照してください。
0件のコメント
記事コメントは受け付けていません。