DLPコンテンツプロファイルの作成

この記事では、CatoのDLPサービスのためにコンテンツプロファイルを作成する方法を説明します。 このプロフィールには、アプリケーション制御ポリシーまたはSaaSセキュリティAPIデータ保護ポリシーで使用可能な1つ以上のDLPデータ型が含まれています。

概要

Catoのデータ損失防止(DLP)サービスは、ネットワーク全体で機密情報を監視および管理するのに役立ちます。 DLPコンテンツプロファイルをデータ制御ルールに追加して、機密データを検出またはブロックし、潜在的なエクスフィルトレーションを防止することができます。 DLPは、OCRを使用した分析により、画像に埋め込まれたデータを含むテキストベースのコンテンツとファイルに含まれる文書をスキャンできます。

コンテンツプロファイルには、定義済みデータ型またはカスタムデータ型、ユーザー定義データ型および機密ラベルを含めることができます。 データの種類について詳しくは、以下の記事をご覧ください。

DLPコンテンツプロファイルは、Cato管理アプリケーションのグローバルオブジェクトであり、1つ以上のデータの種類を含みます。

コンテンツプロファイルのためのOCR画像スキャン

DLPエンジンが、イメージファイル及びファイルに埋め込まれたイメージをプロファイルの内容一致に含めるようにコンテンツプロファイルを設定できます。 エンジンは画像ファイルに表示されるテキストをOCRで抽出し、コンテンツマッチングのために抽出したテキストを送信します。 コンテンツプロファイルを設定する際にOCRスキャンオプションが表示されます。 OCR画像スキャンには以下が含まれます: 

  • 低解像度およびぼかしのモバイル画像

  • 歪んだ、回転した、または皺がある画像

  • 2つの言語のテキストを含む画像 

OCRスキャンの言語サポート

DLPサービスはアカウントにつき最大5言語のOCRスキャニングをサポートします。デフォルトでは英語のみが設定されています。 スキャンしたい言語を設定すると、DLPエンジンはすべての設定された言語のコンテンツを画像ファイルでスキャンします。 すべてのUnicode文字がサポートされますが、アラビア語、ヘブライ語、タイ語、韓国語、およびタミル語は除外されます。 エンジンが言語をスキャンする順序は、設定した優先順位に従います。 DLPエンジンがある言語の機密データの一致を検出すると、スキャンは終了し、その画像は他の言語ではスキャンされません。

言語に高い優先順位を設定すると、エンジンが低い優先順位の言語よりも先にその言語をスキャンし、その言語のコンテンツが正確に検出される可能性が高くなります。 例として、日本語を2番目の言語に、韓国語を3番目の言語に設定した場合、OCRスキャンはまず日本語のテキストを検出しようとし、日本語が正確に検出される可能性が高くなります。

OCRスキャンのための言語の定義についての詳細は、以下のOCRスキャニングのための言語設定を参照してください。

コンテンツプロファイルの作成

DLP設定ページを使用して、コンテンツプロファイルを作成および編集します。 プロフィールにデータ型を追加する際には、特定の国またはユニバーサル(すべての国)に従って種類をフィルタリングすることができます。 さらに、データ型を昇順または降順のアルファベット順に並べ替えたり、カテゴリまたは名前、あるいは国に従って並べ替えることができます。

複数のデータ型をプロファイルに追加する際には、それらの間の関係を選択してください。

  • いずれか(OR) - プロファイル内のデータ型の中の1つだけに一致
  • すべて(AND) - プロファイル内のすべてのデータ型に一致(それ以外の場合、このプロファイルを使用したルールは無視されます)

データ制御ルールは、すべてのコンテンツプロファイルで最大20のデータ型を含むことができます。

コンテンツプロファイルを設定するとき、オプションでOCRスキャンをプロファイルに対して有効化します。

DLP_Configuration.png

DLPコンテンツプロファイルを作成するには:

  1. ナビゲーションメニューからセキュリティ > データの種類 & プロファイルを選択し、DLPプロファイルタブでコンテンツプロファイルを選択します。
  2. 新規をクリックします。

    コンテンツプロファイルの追加パネルが開きます。

  3. プロファイルを作成し、データ型を追加します。
  4. オプションで、プロファイルのOCRスキャンを有効化を選択します。
  5. 適用をクリックし、その後保存をクリックします。

データの種類の表示

データの種類ページには、プロファイルに追加できるすべてのデータの種類が表示されます。 これにより、組織で使用している特定のデータの種類についてさらに調査し、理解することができます。 カタログには、各データ型に対するしきい値も表示され、データ型をアクティベートするための最小発生数を示しています。 データ型のしきい値についてさらに詳しくは、DLPのカスタムデータ型の操作を参照してください。

Data_Types6.png

データの種類を表示するには:

  • ナビゲーションメニューからセキュリティ > データの種類 & プロファイル,を選択し、データの種類タブをクリックします。

OCRスキャニングのための言語設定

DLP設定ページの設定タブを使用して、画像ファイルでスキャンする言語を定義します。 最大5つの言語を選択し、優先順位の順序を設定します。 デフォルトでは英語のみが設定されています。

OCR_Languages.png

OCRスキャンのための言語を設定するには:

  1. ナビゲーションメニューからセキュリティ > データの種類 & プロファイル,を選択し、設定タブで一般を選択します。
  2. OCR言語セクションでは、最大5つの言語を選択します。
  3. スキャンの優先順位を定義するために、リスト内の言語をドラッグアンドドロップします。
  4. 保存をクリックしてください。 OCR言語設定がアカウントに対して構成されます。

DLPファイル要件

50 MBまでのファイルがサポートされます。 サポートされるファイルタイプは以下にリストされています(音声、動画、およびバイナリファイルはサポートされません)。

文書ファイル

  • CSVファイル: .csv
  • Excelテンプレート: .xlt, .xltx
  • Excelワークスペース: .xlw
  • Microsoft Accessデータベース: .mdb
  • Microsoft Excel: .xls, .xlsx, .xlsm, .xlam, .xlsb, .slk, .xltm
  • Microsoft PowerPoint: .ppt, .pps, .pot, .pptx, .ppsx, .pptm, .ppsm, .potx, .potm
  • Microsoft Word: .doc, .docx, .docm, .dotx
  • MS Accessプロジェクト: .ade
  • ODFドキュメント: .odt, .ods, .odp
  • ODFプレゼンテーションテンプレート: .otp
  • ODFスプレッドシートテンプレート: .ots
  • ODFテキストテンプレート: .ott
  • Outlookフォームテンプレート: .oft
  • ポータブル文書フォーマット: .pdf
  • リッチテキストフォーマット: .rtf
  • SQLファイル: .sql
  • テキストファイル: .txt
  • XPSファイル: .xps
  • XMLファイル: .xml

埋め込み文書

これらのファイルタイプに埋め込まれた文書はスキャンされます。 1つのファイルに5つまでの埋め込みファイルがスキャンされます。もしファイルに5つ以上の埋め込みファイルがある場合、最大5つの大きいファイルのみがスキャンされます。

  • Microsoft Excel: .xls, .xlsx
  • Microsoft PowerPoint: .ppt, .pptx
  • Microsoft Word: .doc, .docx

アーカイブファイル

  • 7-Zip: .7z
  • ARJ: .arj
  • Bzip2: .bz, .bz2
  • Cabアーカイブ: .cab
  • GZIP: .gzip, .gz
  • LHA: .lha, .lzh
  • RAR: .rar
  • RPM: .rpm
  • Tar: .tgz, .gtar, .tar
  • Unixアーカイブ: .cpio, .shar
  • UUE: .uue
  • WAR: .war
  • XAR: .xar
  • ZIP: .zip

画像ファイル

PNGおよびJPEGファイルの場合、スキャンはアップロードアクションのみサポートされます。

  • ビットマップ: .bmp
  • BMP未圧縮: .bmp-uncompressed
  • JFIFファイル: .jfif
  • JPEGファイル: .jpeg, .jpg
  • PBMファイル: .pbm
  • PGMファイル: .pgm
  • PNGファイル: .png
  • PNMファイル: .pnm
  • PPMファイル: .ppm
  • プログレッシブJPEG: .pjpeg, .pjp
  • TIFFファイル: .tiff, .tif
  • WebPファイル: .webp

埋め込み画像

これらのファイルタイプに埋め込まれた画像はスキャンされます。 1つのファイルに5つまでの画像がスキャンされます。もしファイルに5つ以上の画像がある場合、最大5つの大きい画像のみがスキャンされます。

  • Microsoft Excel: .xls, .xlsx
  • Microsoft PowerPoint: .ppt, .pptx
  • Microsoft Word: .doc, .docx
  • ポータブル文書フォーマット: .pdf

電子メールとメッセージファイル

  • Base64エンコード: .base64
  • Microsoft Outlookデータファイル: .pst
  • Microsoft Outlookメッセージ: .msg, .eml
  • MIME: .mime
  • Outlook Express: .dbx
  • TNEF / winmail.dat: .dat
  • Unix mbox: .mbox
  • UTF-16: .utf-16

ソースコードとスクリプトファイル

  • Bashスクリプト: .sh
  • BASICソースコード: .bas
  • バッチファイル: .cmd, .bat
  • C、C++、およびC#ソースファイル: .c, .h, .cc, .hh, .cs, .cpp, .hpp
  • Goファイル: .go
  • HTMLファイル: .html
  • ファイルを含める: .inc
  • Javaファイル: .java, .jav, .j
  • JavaScriptファイル: .js
  • Makeファイル: .mak, .mk, .pmk
  • Matlabファイル: .mat
  • Perlファイル: .pl, .pm, .plf
  • Pythonファイル: .py, .pyi, .pyc, .pyd, .pyo, .pyw, .pyz
  • Rubyファイル: .rb
  • スクリプト/設定ファイル: .ini, .json

その他のサポートされるファイル

  • HTTPデータ: .http
  • インターネットサインアップファイル: .isp, .ins
  • PCAPファイル: .pcap
  • TrueTypeフォントファイル: .ttf

この記事は役に立ちましたか?

2人中2人がこの記事が役に立ったと言っています

0件のコメント