التعامل مع أنواع البيانات المخصصة لـ DLP

توضح هذه المقالة كيفية إنشاء أنواع بيانات مخصصة لتحديد البيانات الحساسة في مؤسستك من أجل سياسة DLP.

نظرة عامة على أنواع بيانات DLP المخصصة في كاتو

توفر كاتو مئات من أنواع البيانات والتصنيفات المعرفة مسبقًا لكل سيناريوهات سياسات DLP النموذجية. ومع ذلك، تحتاج المؤسسات أحيانًا إلى القدرة على إنشاء أنواع بيانات معرفة مخصصة لتتناسب مع فحص بيانات محدد لم يتم تغطيته بواسطة النوع المعرفة مسبقًا.

يمكنك تعريف أنواع البيانات المخصصة التالية لتخصيص فحص المحتوى لسياسات DLP الخاصة بك:

استخدم تسميات الحساسية من إطار الحماية المعلوماتية لمايكروسوفت (MIP) في سياسة DLP الخاصة بكاتو
أنواع بيانات المعرفة للمستخدم متضمنة:
- استخدم الكلمات الرئيسية لتعريف العناصر التي تحتوي على كلمة واحدة أو عبارة واحدة يبحث عنها محرك DLP
- القواميس هي حاويات تحتوي على ما يصل إلى 50 كلمة أو عبارة، ويبحث محرك DLP لمطابقة أي عنصر واحد في القاموس
- تسمح لك أنواع بيانات Regex بإدخال تعبيرات منتظمة تحدد المحتوى الذي يبحث عنه محرك DLP
مصنفات تعلم الآلة المخصصة
تسمح لك ملفات تعريف المطابقة التامة للبيانات (EDM) بتعريف بيانات محددة لمطابقة المحتوى بدلاً من الأنماط العامة للبيانات. للمزيد حول ملفات تعريف EDM، انظر العمل مع التطابق التام للبيانات (EDM) لحماية ضد فقدان البيانات.

بعد إنشاء نوع بيانات المعرفة للمستخدم أو وصف العلامة الحساسة، يمكنك إضافتها إلى ملفات تعريف المحتوى للحماية ضد فقدان البيانات أو إنشاء جديدة.

إنشاء تسميات الحساسية يدويًا في DLP كاتو

يمكنك تعريف البيانات الحساسة باستخدام تسميات MIP، ثم استخدام تسميات MIP كأنواع بيانات في سياسة DLP الخاصة بكاتو.

اقرأ المزيد

بعد أن تنشئ تسميات الحساسية في تطبيق إدارة كاتو، يمكنك إضافتها إلى ملفات تعريف المحتوى. يمكنك بعد ذلك إنشاء قواعد DLP لإدارة الوصول إلى المحتوى لمستخدمين ومجموعات مختلفة وفقًا لتسميات MIP.

على سبيل المثال، إذا كانت لديك ملفات بتسمية MIP مصنفة، فأنشئ التسمية في سياسة DLP الخاصة بكاتو وأضفها إلى ملفات تعريف المحتوى للمستندات المقيدة. ثم حدد قاعدة DLP تقوم بحظر الوصول لمجموعات من المستخدمين الذين ليس لديهم تفويض أمني كافٍ.

يقوم محرك DLP بفحص التسميات المعرفة في بيانات الملف وليس في المحتوى الفعلي، مما يساعد في تقليل النتائج الإيجابية الخاطئة. يفرض المحرك العلامة الحساسة وفقًا لـ معرف العلامة الذي تكوّنه، وليس وفقًا لـ الاسم. تأكد من أن معرف العلامة لـ العلامة الحساسة يطابق تمامًا معرف العلامة MIP. لمزيد من المعلومات حول العثور على معرفات تسميات MIP لحساب مؤسستك، انظر إلى وثائق Microsoft.

ملاحظة

ملاحظة: يجب أن تكون الملفات موسومة بـ MIP ليتم إدارتها بواسطة نوع البيانات هذا. للتحقق مما إذا كان الملف موسوم بشكل صحيح، استخدم أداة مدقق DLP

لإنشاء علامة حساسية:

من قائمة التنقل، اختر الأمان > أنواع البيانات & الملفات الشخصية، واختر تبويب أنواع البيانات.
في تسميات الحساسية، انقر على جديد. يتم فتح لوحة إضافة تسميات الحساسية.
أدخل الاسم والوصف للتسمية.
أدخل نفس معرف العلامة الخاص بمعرف العلامة MIP.
انقر على تطبيق.

إنشاء أنواع بيانات المعرفة للمستخدم

يمكن أن تكون أنواع البيانات المعرفة للمستخدم إما كلمة مفتاحية أو قاموس أو تعبير regex.

اقرأ المزيد

إنشاء أنواع بيانات القاموس والكلمات المفتاحية الجديدة

أنشئ كلمة مفتاحية مخصصة أو قاموس للمحتوى الحساس المخصص الذي يبحث عنه محرك DLP. بالنسبة للقواميس، يمكنك الحفاظ على الإدخالات في ملف CSV، ثم لصقها كقيم لذلك القاموس.

يقوم محرك DLP بالبحث عن تطابق تام لكل كلمة مفتاحية أو إدخال قاموسي
يجب أن تحتوي الكلمة المفتاحية على ما لا يقل عن 8 أحرف (إما بايت فردي أو متعدد البايت)
لا يوجد حد أعلى لعدد الكلمات أو الأحرف في الكلمة المفتاحية
الكلمات المفتاحية والقواميس ليست حساسة لحالة الأحرف
الإدخالات في القاموس لها علاقة أو بين بعضها البعض
يجب أن تكون العبارات تطابقًا تامًا لكل كلمة، على سبيل المثال العبارة الرعاية الصحية لا تطابق الرعايةالصحية

لذلك بالنسبة للقاموس، ستقوم بإنشاء القيم الثلاث التالية لتطابق الكلمات أعلاه: الصحة، الرعاية، الرعايةالصحية
يتم تحديد الكلمات والعبارات وفقًا لحدود الكلمات القياسية، على سبيل المثال المسافة بعد الكلمة. يجب أن تكون هناك حدود قبل الكلمة وبعدها ليتم اكتشافها. للحصول على قائمة كاملة بحدود الكلمات المدعومة، انظر أدناه حدود الكلمات لأنواع بيانات الكلمات المفتاحية والقواميس
- لاكتشاف الكلمات متعددة البايتات، نوصي باستخدام نوع بيانات Regex، لأنه عادةً لا توجد حدود قبل وبعد

التعامل مع العتبات

يمكنك تحديد العتبة لكل نوع بيانات المعرفة للمستخدم، عدد المرات التي تطابق فيها الكلمة الرئيسية أو القاموس في الملف. عندما يتطابق أو يتجاوز العتبة، فإن الملف يطابق قاعدة التحكم في البيانات (في صفحة الأمان > التحكم في التطبيقات).

الكلمات المفتاحية - يبحث العتبة عن تكرار حالات تتطابق تمامًا مع تلك الكلمة أو العبارة.
- على سبيل المثال، للكلمة الرئيسية apple مع عتبة 3. إذا احتوى الملف على 3 حالات من كلمة apple، فيتم حظر هذا الملف.
القاموس - يبحث العتبة عن تكرار الحالات لأي قيمة في هذا القاموس.
- على سبيل المثال، إذا كان القاموس يحتوي على إدخالات apple وorange بنحو عتبة 3. إذا احتوى الملف على حالتين من كلمة apple وحالة واحدة من كلمة orange، يتم حظر الملف.
  
  أيضًا، إذا احتوى الملف على 3 حالات من كلمة apple وصفر حالة من كلمة orange، يتم حظر الملف.

لإنشاء نوع بيانات المعرفة للمستخدم:

من قائمة التنقل، اختر الأمان > أنواع البيانات & الملفات الشخصية، واختر تبويب أنواع البيانات.
في المعرفة للمستخدم، انقر على جديد ثم اختر كلمة مفتاحية جديدة أو قاموس جديد.
لإنشاء كلمة مفتاحية جديدة:
1. أدخل الاسم والوصف للكلمة المفتاحية.
2. اختر العتبة، وهو الحد الأدنى لعدد المرات التي تظهر فيها الكلمة المفتاحية في الملف.
3. أدخل الكلمة المفتاحية/العبارة.
4. انقر على تطبيق.
لإنشاء قاموس جديد:
1. أدخل الاسم والوصف للقاموس.
2. اختر العتبة، وهو الحد الأدنى لعدد المرات التي يظهر فيها أحد إدخالات القاموس في الملف.
3. أضف (أو الصق) قيمة واحدة أو أكثر للقاموس. يجب فصل القيم المتعددة بواسطة فاصلات.
4. انقر على تطبيق.

حدود الكلمة لأنواع بيانات الكلمات المفتاحية والقواميس

لمطابقة كلمة مفتاحية أو عبارة، يستخدم محرك DLP حدود الكلمات القياسية لتحديد نهاية كل كلمة. هذه هي الأحرف التي يتعرف عليها المحرك كحدود للكلمات:

([\s,.:;“‘]|^)

إنشاء أنواع بيانات تعبير نمطي جديد

استخدم التعابير النمطية لتحديد نوع المحتوى الذي يطابق نوع البيانات. على سبيل المثال، تتيح لك صيغ التعبير النمطي مطابقة رقم تعريفي مخصص للجهة مع عدد معين من الأرقام بسهولة. يدعم كل نوع بيانات تعبير نمطي تعبير نمطي واحد، لذا إذا كنت بحاجة لاستخدام تعبيرات نمطية متعددة، فقم بإنشاء نوع بيانات منفصل لكل تعبير.

استخدم حدود الكلمات في التعبير لتعريف المحتوى المطابق لنوع البيانات بشكل صحيح.

يعتمد محرك التعبير النمطي على UTF-8 ويدعم الأحرف للمحتوى غير الإنجليزي.

عتبات التعبير النمطي

يمكنك تحديد العتبة للتعبير، وعدد مرات ظهور المحتوى في الملف. عند مطابقة العتبة أو تجاوزها العتبة، فإن الملف يطابق قاعدة التحكم في البيانات.

على سبيل المثال، إذا قمت بإنشاء تعبير لمعرف مع عتبة من 5، فسيتم حظر الملفات التي تحتوي على المعرف خمس مرات أو أكثر فقط.

التحقق من التعبيرات النمطية

يمكنك استخدام حقل التحقق من التعبير لاختبار التعبير والتأكد من مطابقته للمحتوى بشكل صحيح. عند النقر على اختبار، يتحقق خدمة DLP مما إذا كان المحتوى يطابق التعبير النمطي. هذه هي نفس الخدمة التي تعمل في سحابة كاتو، لذا فإن نتائج الاختبار هي نفس السلوك الذي ستراه في حسابك.

يتضمن التحقق من التعبير أيضًا العتبة لنوع البيانات. لذا عندما تكون العتبة أكثر من 1، يجب أن يظهر القيمة على الأقل هذا العدد من المرات من أجل نجاح الاختبار.

لإنشاء نوع بيانات تعبير نمطي محدد من قبل المستخدم:

من قائمة التنقل، حدد الأمان > أنواع البيانات والملفات الشخصية، وحدد علامة تبويب أنواع البيانات.
انقر على جديد ثم اختر تعبير نمطي جديد.
أدخل الاسم و الوصف للكلمة المفتاحية.
حدد العتبة، العدد الأدنى من المرات التي يظهر فيها النص المطابق لـالتعبير النمطي في الملف.
في التعبير النمطي، أدخل التعبير النمطي لهذا النوع من البيانات.
(اختياري) قم بتوسيع التحقق من التعبير النمطي، أدخل النص وانقر على اختبار.
انقر على تطبيق.

المشغلون والمحددات المدعومة

هذه هي مشغلات التعبير النمطي والمحددات التي تدعمها أنواع بيانات التعبير النمطي المحددة من قبل المستخدم:

المشغلون	النمط المطابق
\	إدراج الحرف التالي كحرف مميز
^	مطابقة بداية السطر
$	مطابقة نهاية السطر
.	مطابق لأي حرف مفرد
\|	التناوب
()	لا تدعم مجموعات الالتقاط. يمكن استخدام الأقواس لتحديد الحدود الفرعية للتعبيرات.
[xy]	مطابقة أي حرف واحد من تلك التي تم ذكرها بين الأقواس
[x-z]	نطاق الأحرف بين x وz
[^z]	أي حرف عدا z

المحددات	النمط المطابق
*	مطابقة 0 أو أكثر مرات (انظر الملاحظة أدناه)
+	مطابقة 1 أو أكثر مرات (انظر الملاحظة أدناه)
?	مطابقة 0 أو 1 مرة
{n}	مطابقة بالضبط n مرات
{n,}	مطابقة على الأقل n مرات
{n,m}	مطابقة على الأقل n مرات، ولكن لا تتجاوز m

ملاحظة

ملاحظة: استخدام محددات الشره الغير مقيدة من الأحرف العشوائية مثل، .* أو .+ غير مسموح. إذا كنت تحاول تضمين الأحرف في فئة أو مجموعة، فقم بعكسها. على سبيل المثال، *.

بدلًا من استخدام هذه المحددات الجشعة، يمكنك استخدام .{1,50} الذي يدعم حتى 50 حرفًا لكل كلمة مفتاحية أو نمط لنوع بيانات التعبير النمطي

إنشاء مصنفات ML محددة من قبل المستخدم

لزيادة حماية المستندات المتخصصة ذات الصلة بمجالك أو شركتك، يمكنك إنشاء المصنف الخاص بك باستخدام تعلم الآلة (ML) المحدد من قبل المستخدم.

اقرأ المزيد

تقلل مصنفات ML المحددة من قبل المستخدم بشكل كبير من الإيجابيات الكاذبة وتحسن من الكفاءة والدقة العامة لمحرك DLP. باستخدام نموذج التشابه المتقدم في علم البيانات، تقدم مصنفات ML قابلية تكيف أفضل ودقة في اكتشاف البيانات الحساسة، حيث يمكنها التعلم والتطور بشكل ديناميكي مع أنماط البيانات المتغيرة.

تدريب مصنفات ML المحددة من قبل المستخدم

عند تحميل ملفات نصية كمثال على المستندات التي تريد حمايتها، يمكنك تدريب نموذج تعلم آلي يمكنه التعرف على المستندات المشابهة في الوقت الفعلي، مما يمنع استخراج البيانات غير المصرح بها. يعتمد نموذج تعلم الآلة على النص داخل الملف، ويتم تجاهل الصور أو مقاطع الفيديو.

متطلبات الملفات لمصنفات ML

يتم استخدام المحتوى باللغة الإنجليزية فقط لتدريب نموذج ML
أنواع الملفات المدعومة: DOC، XLS، CSV، TXT، و PDF
يمكن تحميل ما يصل إلى 10 ملفات كحد أقصى
يحتوي الملف على حد أدنى من 100 كلمة

تحميل الملفات لإنشاء مصنف ML محدد من قبل المستخدم

قم بتحميل ملفات العينة إلى CMA لتدريب نموذج ML لنوع البيانات المحدد من قبل المستخدم. نوصي بتحميل 5 ملفات على الأقل لتدريب نموذج تعلم الآلة بدقة لحماية مستنداتك.

لتحميل المستندات للمصنف الخاص بالذكاء الاصطناعي:

من قائمة التنقل، حدد الأمان > أنواع البيانات والملفات التعريفية.
في علامة التبويب أنواع البيانات، انقر فوق المصنفات المعرفة من قبل المستخدم.
انقر على جديد.
أدخل اسمًا ووصفًا للمصنف ثم انقر على حفظ ومتابعة.
أضف الملفات التي تريد تدريب النموذج باستخدامها.
(اختياري) تحقق من صحة النموذج عن طريق تحميل ملف أمثلة وانقر على تحقق.
انقر على حفظ.

التحقق من أنواع البيانات والممارسات المثلى

لكل نوع بيانات DLP، يمكنك التحقق من أن محرك DLP يتعرف على ويطابق البيانات الحساسة في ملف اختبار. خاصية التحقق مضمنة في الملفات التعريفية المحددة مسبقًا، والمعروفة من قبل المستخدم، وملصقات الحساسية الواقعة في صفحة أنواع البيانات والملفات التعريفية. سواء كان لديك كلمة مفتاحية جديدة أو موجودة، قاموس، أو سلسلة REGEX، يمكنك تحميل مستند لاختبار إعداداتك قبل نشر نوع البيانات الجديد. يمكنك أيضًا التحقق من صحة أنواع البيانات المعرفة مسبقاً وملصقات الحساسية.

أحد الاستخدامات الرئيسية لأداة التحقق من DLP هو التحقق من إعدادات DLP الخاصة بك للتأكد من أن الكلمات المفتاحية وسلاسل المعلومات (عبر regex) يتم اكتشافها بشكل صحيح باستخدام البيانات المدخلة لمجموعة البيانات المعينة هذه. حالة استخدام رئيسية أخرى هي أنه يمكنك تحميل مستندات نموذجية إلى القاعدة لمعرفة ما إذا كان نوع الملف والتنسيق سيتم فحصهما بشكل صحيح للكشف عن البيانات المحددة لأنواع البيانات.

لأغراض التحري عن الخلل والدعم في الحالات التي لا يتطابق فيها الملف مع نوع البيانات، يمكنك تنزيل ملف نصي تم تحليله للمحتوى على النحو المستخرج من قبل محرك DLP.

فيما يلي مثال على إجراء للتحقق من نوع البيانات الخاص بالقاموس:

للتحقق من نوع بيانات قاموس باستخدام ملف اختبار:

من قائمة التنقل، حدد الأمان > أنواع البيانات والملفات التعريفية، ثم حدد علامة التبويب أنواع البيانات.
قم بتحريك الماوس في الصف الخاص بنوع بيانات القاموس وانقر على رمز التحرير. تفتح لوحة تحرير.
انقر على التحقق من القاموس. تفتح لوحة التحقق من القاموس.
حمل ملف اختبار، وانقر على فحص الملف. تُعرض نتائج الفحص.
لتنزيل ملف نصي للمحتوى المستخرج بواسطة محرك DLP، انقر فوق تصدير النص المستخرج.

أفضل الممارسات لأنواع البيانات المعرفة من قبل المستخدم

عند تطبيق السياسة، أو إضافة تطبيق جديد مع إجراء الحظر:
- استخدم إجراء المراقبة للقاعدة.
- راجع الأحداث التي تولدها القاعدة وتأكد من عدم وجود أحداث لحركة المرور التي تريد السماح بها (حركة مرور إيجابية خاطئة).
- إذا كانت هناك حركة مرور إيجابية خاطئة، يمكنك إجراء هذه التغييرات:
  - تحسين نطاق القاعدة لاستبعاد حركة المرور الإيجابية الخاطئة
  - قم بإنشاء قاعدة سماح جديدة قبل قاعدة الحظر، ونطاق القاعدة الجديدة فقط لحركة المرور الإيجابية الخاطئة
  - قم بتحسين التعبير النظامي وتأكد من أنك تتحقق منه بمثال دقيق للمحتوى الذي تقوم بفحصه
تذكر أن سياسة تحكم التطبيقات هي سياسة مرتبة، والقاعدة الضمنية النهائية هي قبول الكل مع الكل. أضف قواعد إلى السياسة لحظر حركة المرور ذات الصلة بالتطبيق والأنشطة والمعايير.

القيود المعروفة

لمعرفة متطلبات الملفات، انظر ما هي خدمة Cato DLP؟
- بالنسبة لبعض التنزيلات المضغوطة بتنسيق gzip، يتم حساب حجم الملف لـ DLP بناءً على الملف المضغوط. إذا كان حجم الملف المضغوط أقل من 1 كيلوبايت فلن يتم فحصه.
هناك حد أقصى يبلغ 256 حرفًا للتعبير النظامي.
لا يتم دعم الملفات المشفرة بنظام Base64، ولا يمكن لمحرك DLP فحص المحتوى في هذه الملفات.

التعامل مع أنواع البيانات المخصصة لـ DLP

نظرة عامة على أنواع بيانات DLP المخصصة في كاتو

إنشاء تسميات الحساسية يدويًا في DLP كاتو

اقرأ المزيد

ملاحظة

إنشاء أنواع بيانات المعرفة للمستخدم

اقرأ المزيد

إنشاء أنواع بيانات القاموس والكلمات المفتاحية الجديدة

حدود الكلمة لأنواع بيانات الكلمات المفتاحية والقواميس

إنشاء أنواع بيانات تعبير نمطي جديد

المشغلون والمحددات المدعومة

ملاحظة

إنشاء مصنفات ML محددة من قبل المستخدم

اقرأ المزيد

تدريب مصنفات ML المحددة من قبل المستخدم

متطلبات الملفات لمصنفات ML

تحميل الملفات لإنشاء مصنف ML محدد من قبل المستخدم

التحقق من أنواع البيانات والممارسات المثلى

أفضل الممارسات لأنواع البيانات المعرفة من قبل المستخدم

القيود المعروفة

هل كان هذا المقال مفيداً؟

لا توجد تعليقات