कस्टम डेटा प्रकारों के साथ काम करना DLP के लिए

यह लेख आपके संगठन में संवेदनशील डेटा की पहचान के लिए कस्टम डेटा प्रकार बनाने की प्रक्रिया को समझाता है DLP नीति के लिए।

Cato कस्टम DLP डेटा प्रकारों का अवलोकन

Cato सैकड़ों पूर्व-परिभाषित बॉक्स से तैयार डेटा प्रकार और श्रेणियाँ प्रदान करता है DLP नीतियों के सामान्य परिदृश्यों के लिए। हालाँकि, कभी-कभी संगठनों को विशिष्ट डेटा निरीक्षण के लिए कस्टम परिभाषित डेटा प्रकार बनाने की आवश्यकता होती है, जो पूर्व-परिभाषित प्रकार द्वारा कवर नहीं होता है।

आप अपनी DLP नीतियों के लिए सामग्री निरीक्षण को अनुकूलित करने के लिए निम्नलिखित कस्टम डेटा प्रकार परिभाषित कर सकते हैं:

अपने Cato DLP नीति में Microsoft सूचना सुरक्षा (MIP) ढाँचा से Microsoft संवेदनशीलता लेबल का उपयोग करें
उपयोगकर्ता परिभाषित डेटा प्रकार शामिल हैं:
- उन वस्तुओं को परिभाषित करने के लिए कीवर्ड का उपयोग करें जिनमें एक शब्द या वाक्यांश शामिल है जिसे DLP इंजन खोजता है
- शब्दकोश ऐसे कंटेनर होते हैं जिनमें 50 शब्द या वाक्यांश शामिल होते हैं, और DLP इंजन शब्दकोश में किसी भी एकल वस्तु के मिलान की खोज करता है
- Regex डेटा प्रकार आपको नियमित अभिव्यक्तियों को दर्ज करने की अनुमति देते हैं जो उस सामग्री को परिभाषित करते हैं जिसे DLP इंजन खोजता है
कस्टम मशीन लर्निंग वर्गीकरणकारक
सटीक डेटा मिलान (EDM) प्रोफ़ाइल आपको सामग्री मिलान के लिए विशिष्ट डेटा परिभाषित करने देता है, सामान्य डेटा पैटर्न के बजाय। ईडीएम प्रोफ़ाइल के बारे में और अधिक जानकारी के लिए, देखें Working with Exact Data Matching (EDM) for DLP.

उपयोगकर्ता परिभाषित डेटा प्रकार या संवेदनशीलता लेबल बनाने के बाद, आप उन्हें मौजूदा DLP सामग्री प्रोफ़ाइल में जोड़ सकते हैं या नए बना सकते हैं।

Cato DLP में मैन्युअली संवेदनशीलता लेबल बनाना

आप MIP लेबल के साथ संवेदनशील डेटा परिभाषित कर सकते हैं, और फिर आपके Cato DLP नीति में डेटा प्रकार के रूप में MIP लेबल का उपयोग कर सकते हैं।

नोट

नोट: फाइलों को इस डेटा प्रकार द्वारा प्रबंधित करने के लिए MIP लेबल किया जाना चाहिए। यह जाँचने के लिए कि एक फाइल को सही लेबलिंग किया गया है या नहीं, DLP वैलिडेटर टूल का उपयोग करें।

संवेदनशीलता लेबल बनाने के लिए:

नेविगेशन मेनू से, सुरक्षा > डेटा प्रकार & प्रोफ़ाइल चुनें, और डेटा प्रकार टैब चुनें।
संवेदनशीलता लेबल में, नया पर क्लिक करें। संवेदनशीलता लेबल जोड़ें पैनल खुलता है।
लेबल के लिए नाम और विवरण दर्ज करें।
MIP लेबल ID के जैसा ही लेबल ID दर्ज करें।
लागू करें पर क्लिक करें।

उपयोगकर्ता परिभाषित डेटा प्रकार बनाना

उपयोगकर्ता परिभाषित डेटा प्रकार कीवर्ड, शब्दकोश, या regex अभिव्यक्ति हो सकते हैं।

और पढ़ें

नए कीवर्ड और शब्दकोश डेटा प्रकार बनाना

कस्टम संवेदनशील सामग्री के लिए एक कस्टम कीवर्ड या शब्दकोश बनाएं जिसे DLP इंजन खोज रहा है। शब्दकोश के लिए, आप प्रविष्टियों को CSV फ़ाइल में बनाए रख सकते हैं, और फिर उन्हें उस शब्दकोश के मानों के रूप में चिपकाएँ।

DLP इंजन प्रत्येक कीवर्ड या शब्दकोश प्रविष्टि के सटीक मिलान की खोज करता है
एक कीवर्ड में कम से कम 8 अक्षर (या तो एकल बाइट या मल्टीबाइट) होने चाहिए
एक कीवर्ड में शब्दों या अक्षरों की संख्या के लिए कोई ऊपरी सीमा नहीं है
कीवर्ड और शब्दकोश केस संवेदनशील नहीं हैं
एक शब्दकोश में प्रविष्टियों के बीच OR संबंध होता है
वाक्यांशों को प्रत्येक शब्द के सटीक मिलान की आवश्यकता होती है, उदाहरण के लिए वाक्यांश स्वास्थ्य देखभाल का मिलान स्वास्थ्य से नहीं होता।

तो एक शब्दकोश के लिए, आप उपरोक्त शब्दों के मिलान के लिए निम्नलिखित तीन मान बनाते हैं: स्वास्थ्य, देखभाल, स्वास्थ्य देखभाल
शब्द और वाक्यांश मानक शब्द सीमाओं के अनुसार पहचाने जाते हैं, उदाहरण के लिए एक शब्द के बाद एक स्थान। विकल्प में शब्द के पहले और बाद में सीमाएँ होनी चाहिए ताकि उसे पहचाना जा सके। समर्थित शब्द सीमाओं की पूरी सूची के लिए, नीचे देखें कीवर्ड और शब्दकोश डेटा प्रकार के लिए शब्द सीमाएँ
- मल्टीबाइट शब्दों का पता लगाने के लिए, हम Regex डेटा प्रकार का उपयोग करने की अनुशंसा करते हैं, क्योंकि आम तौर पर इससे पहले और बाद में कोई सीमा नहीं होती।

सीमाओं के साथ काम करना

आप प्रत्येक उपयोगकर्ता परिभाषित डेटा प्रकार के सीमा को परिभाषित कर सकते हैं, फाइल में कीवर्ड या शब्दकोश के जितने मिलान होते हैं। जब यह सीमा से मेल खाता है या उसे पार करता है, तब फाइल सुरक्षा > एप्लिकेशन नियंत्रण पृष्ठ में डेटा नियंत्रण नियम से मेल खाती है।

कुंजी शब्द - कीवर्ड के लिए सीमा उस शब्द या वाक्यांश के सटीक मिलान के लिए पुनरावृत्ति की तलाश करता है।
- उदाहरण के लिए, कीवर्ड सेब के लिए 3 की सीमा के साथ। यदि एक फाइल में सेब शब्द की 3 घटनाएँ होती हैं, तो वह फाइल अवरुद्ध होती है।
शब्दकोश - शब्दकोशों की सीमा उस शब्दकोश में किसी भी मान की पुनरावृत्ति की जाँच करती है।
- उदाहरण के लिए, यदि शब्दकोश में सेब और संतरा प्रविष्टियाँ हैं, और 3 की सीमा है। यदि एक फाइल में सेब शब्द की 2 घटनाएँ और संतरा शब्द की 1 घटना होती है, तो फाइल अवरुद्ध होती है।
  
  साथ ही, यदि एक फाइल में सेब शब्द की 3 घटनाएँ और संतरा शब्द की 0 घटनाएँ होती हैं, तो फाइल अवरुद्ध होती है।

उपयोगकर्ता परिभाषित डेटा प्रकार बनाने के लिए:

नेविगेशन मेनू से, सुरक्षा > डेटा प्रकार & प्रोफ़ाइल चुनें, और डेटा प्रकार टैब चुनें।
उपयोगकर्ता परिभाषित में, नया पर क्लिक करें और फिर नया कीवर्ड या नया शब्दकोश चुनें।
नया कीवर्ड बनाने के लिए:
1. कीवर्ड के लिए नाम और विवरण दर्ज करें।
2. सीमा चुनें, वह न्यूनतम संख्या दर्ज करें, जिस बार कीवर्ड फाइल में होता है।
3. कीवर्ड/वाक्यांश दर्ज करें।
4. लागू करें पर क्लिक करें।
नया शब्दकोश बनाने के लिए:
1. शब्दकोश के लिए नाम और विवरण दर्ज करें।
2. सीमा चुनें, ताकि शब्दकोश प्रविष्टियों में से एक फाइल में दिखाई दे।
3. शब्दकोश के लिए एक या अधिक मान जोड़ें (या चिपकाएँ)। एक से अधिक मान कोमा द्वारा अलग किए जाने चाहिए।
4. लागू करें पर क्लिक करें।

कीवर्ड और शब्दकोश डेटा प्रकारों के लिए शब्द सीमाएँ

किसी कीवर्ड या वाक्यांश का मिलान करने के लिए, DLP इंजन प्रत्येक शब्द के अंत की पहचान के लिए मानक शब्द सीमाओं का उपयोग करता है। यहाँ वे वर्ण हैं जिन्हें इंजन शब्द सीमाओं के रूप में पहचानता है:

([\s,.:;"‘]|^)

नए रेगेक्स डेटा प्रकार बनाना

डेटा प्रकार से मेल खाने वाली सामग्री के प्रकार को परिभाषित करने के लिए नियमित अभिव्यक्तियों का उपयोग करें। उदाहरण के लिए, रेगेक्स सूत्र आपको विशेष संख्या के अंकों के साथ एक अनुकूलित कॉर्पोरेट आईडी को आसानी से मिलाने देते हैं। प्रत्येक रेगेक्स डेटा प्रकार एक ही नियमित अभिव्यक्ति का समर्थन करता है, इसलिए यदि आपको कई नियमित अभिव्यक्तियों का उपयोग करना है, तो प्रत्येक अभिव्यक्ति के लिए एक अलग डेटा प्रकार बनाएं।

अभिव्यक्ति में शब्द सीमाओं का उपयोग करें ताकि डेटा प्रकार से मेल खाने वाली सामग्री को सही तरीके से परिभाषित किया जा सके।

रेगेक्स इंजन UTF-8 पर आधारित है और गैर-अंग्रेज़ी सामग्री के लिए वर्णों का समर्थन करता है।

रेगेक्स सीमा मान

आप अभिव्यक्ति, एक फाइल में सामग्री कितनी बार दिखाई देती है, के लिए सीमा परिभाषित कर सकते हैं। जब यह सीमा से मेल खाता है या उसे पार कर जाता है, तो फाइल डेटा नियंत्रण नियम से मेल खाती है।

उदाहरण के लिए, अगर आपने एक आईडी के लिए सीमा 5 का अभिव्यक्ति बनाई है, तो केवल वही फाइलें जो आईडी को पांच या अधिक बार शामिल करती हैं, अवरुद्ध होंगी।

नियमित अभिव्यक्तियों का मान्यकरण

आप अभिव्यक्ति का मान्यता परीक्षण फ़ील्ड का उपयोग करके अभिव्यक्ति का परीक्षण कर सकते हैं और सुनिश्चित कर सकते हैं कि यह सामग्री से सही मेल खाती है। जब आप परीक्षण करें पर क्लिक करते हैं, तो DLP सेवा यह जांच करती है कि सामग्री नियमित अभिव्यक्ति से मेल खाती है। यह वही सेवा है जो Cato क्लाउड में चलती है, इसलिए परीक्षण परिणाम वही व्यवहार हैं जो आप अपने खाते में देखेंगे।

अभिव्यक्ति का मान्यकरण डेटा प्रकार के लिए सीमा भी शामिल करता है। तो जब सीमा 1 से अधिक हो, तो परीक्षण सफल होने के लिए मान को कम से कम उतनी बार प्रकट होना चाहिए।

उपयोगकर्ता परिभाषित रेगेक्स डेटा प्रकार बनाने के लिए:

नेविगेशन मेनू से, सुरक्षा > डेटा प्रकार & प्रोफ़ाइल चुनें, और डेटा प्रकार टैब चुनें।
नया पर क्लिक करें और फिर नया रेगेक्स चुनें।
कीवर्ड के लिए नाम और विवरण दर्ज करें।
सीमा चुनें, वह न्यूनतम बार जब अभिव्यक्ति के साथ मेल खाने वाला पाठ फाइल में दिखाई देता है।
अभिव्यक्ति में, इस डेटा प्रकार के लिए नियमित अभिव्यक्ति दर्ज करें।
(वैकल्पिक) अभिव्यक्ति का मान्यता परीक्षण विस्तारित करें, पाठ दर्ज करें और परीक्षण करें पर क्लिक करें।
लागू करें पर क्लिक करें।

समर्थित ऑपरेटर और क्वांटिफ़ायर

ये हैं नियमित अभिव्यक्ति ऑपरेटर और क्वांटिफायर जो उपयोगकर्ता परिभाषित रेगेक्स डेटा प्रकारों के लिए समर्थित हैं:

ऑपरेटर	मिलान पैटर्न
\	अगले मेटा-कैरेक्टर का उद्धरण
^	एक पंक्ति की शुरुआत से मेल खाते हैं
$	एक पंक्ति के अंत से मेल खाते हैं
.	कोई भी एकल वर्ण से मेल खाते हैं
\|	वैकल्पिक
()	कैप्चर समूह समर्थित नहीं हैं। उप-वाक्यांशों की सीमा के लिए कोष्ठक का उपयोग किया जा सकता है।
[xy]	ब्रैकेट के बीच दी गई एकल वर्ण से मेल खाते हैं
[x-z]	x और z के बीच के वर्णों की रेंज
[^z]	z को छोड़कर कोई भी वर्ण

क्वांटिफायर	मिलान पैटर्न
*	0 या अधिक बार मेल खाते हैं (नीचे नोट देखें)
+	1 या अधिक बार मेल खाते हैं (नीचे नोट देखें)
?	0 या 1 बार मिलान
{n}	ठीक n बार मिलान करें
{n,}	कम से कम n बार मिलान करें
{n,m}	कम से कम n बार मिलान करें, लेकिन m से अधिक नहीं

नोट

नोट: मनमानी वर्णों के अप्रतिबंधित लालची क्वांटिफायर का उपयोग, जैसे .* या .+, अनुमति नहीं है। यदि आप किसी वर्ग या सेट में वर्णों को शामिल करने का प्रयास कर रहे हैं, तो उन्हें उल्टा करें। उदाहरण के लिए, *.

इन लालची क्वांटिफायरों का उपयोग करने के बजाय, आप .{1,50} का उपयोग कर सकते हैं जो प्रत्येक कुंजी शब्द या पैटर्न के लिए अधिकतम 50 वर्णों का समर्थन करता है।

उपयोगकर्ता परिभाषित ML वर्गीकारक बनाना

अपने उद्योग या कंपनी से संबंधित विशेष दस्तावेजों की सुरक्षा बढ़ाने के लिए, आप अपना खुद का उपयोगकर्ता परिभाषित मशीन लर्निंग (ML) वर्गीकारक बना सकते हैं।

डेटा प्रकार और सर्वोत्तम प्रथाओं का सत्यापन

प्रत्येक DLP डेटा प्रकार के लिए, आप सत्यापित कर सकते हैं कि DLP इंजन एक परीक्षण फ़ाइल में संवेदनशील डेटा को पहचानता और मेल खाता है। विद्यमान फीचरों में पूर्वनिर्धारित, उपयोगकर्ता परिभाषित, और संवेदनशीलता लेबल प्रोफाइल शामिल हैं, जो कि डेटा प्रकार और प्रोफाइल्स पृष्ठ में स्थित हैं। एक नए या मौजूदा कीवर्ड, शब्दकोश, या REGEX स्ट्रिंग के साथ, आप एक दस्तावेज़ अपलोड कर सकते हैं जो आपके नई डेटा प्रकार को लागू करने से पहले आपकी सेटिंग्स का परीक्षण करेगा। आप पूर्वनिर्धारित डेटा प्रकार और संवेदनशीलता लेबल को भी सत्यापित कर सकते हैं।

DLP सत्यापन उपकरण के प्रमुख उपयोगों में से एक आपके DLP सेटिंग्स को सत्यापित करना है, यह सुनिश्चित करने के लिए कि कीवर्ड और जानकारी के स्ट्रिंग्स (regex के माध्यम से) डाले गए डेटा का उपयोग करके सही ढंग से पहचाने जा रहे हैं। एक अन्य प्रमुख उपयोग मामला यह है कि आप नियम पर उदाहरण दस्तावेज़ अपलोड करके देख सकते हैं कि फाइल प्रकार और फ़ॉर्मेटिंग डेटा प्रकार के लिए निर्दिष्ट डेटा का सही स्कैन कर रहे हैं या नहीं।

समस्या निवारण और सहायता के लिए ऐसे मामलों में जहां फाइल डेटा प्रकार से मेल नहीं खाती, आप DLP इंजन द्वारा निष्कर्षित सामग्री का एक पार्स किया गया टेक्स्ट फाइल डाउनलोड कर सकते हैं।

शब्दकोश डेटा प्रकार का सत्यापन करने की उदाहरण प्रक्रिया निम्नलिखित है:

परीक्षण फ़ाइल के साथ शब्दकोश डेटा प्रकार को मान्य करने के लिए:

नेविगेशन मेनू से, सुरक्षा > डेटा प्रकार और प्रोफाइल्स चुनें, और डेटा प्रकार टैब चुनें।
माउस को शब्दकोश डेटा प्रकार की पंक्ति पर ले जाएं और संपादित आइकन पर क्लिक करें। संपादित करें पैनल खुलता है।
शब्दकोश मान्य करें पर क्लिक करें। शब्दकोश मान्य करें पैनल खुलता है।
एक परीक्षण फ़ाइल अपलोड करें, और फ़ाइल स्कैन करें पर क्लिक करें। स्कैन परिणाम दिखाए गए हैं।
DLP इंजन द्वारा निकाले गए सामग्री के टेक्स्ट फ़ाइल को डाउनलोड करने के लिए, निष्कर्षित टेक्स्ट निर्यात करें पर क्लिक करें।

उपयोगकर्ता परिभाषित डेटा प्रकारों के लिए सर्वोत्तम प्रथाएं

जब आप नीति को लागू करते हैं, या नए एप्लिकेशन के साथ ब्लॉक कार्रवाई जोड़ते हैं:
- नियम के लिए निगरानी कार्रवाई का उपयोग करें।
- नियम जो घटनाएँ उत्पन्न करता है उसे पुनरावलोकन करें और सुनिश्चित करें कि कोई घटना ऐसा ट्रैफ़िक नहीं है जिसे आप अनुमति देना चाहते हैं (गलत सकारात्मक ट्रैफ़िक)।
- यदि कोई गलत सकारात्मक ट्रैफ़िक है, तो आप ये परिवर्तन कर सकते हैं:
  - गलत सकारात्मक ट्रैफ़िक को छोड़कर नियम के स्कोप को परिशोधित करें
  - ब्लॉक नियम से पहले एक नया अनुमति नियम बनाएं, और नए नियम का स्कोप केवल गलत सकारात्मक ट्रैफ़िक के लिए है
  - रेगुलर एक्सप्रेशन को परिशोधित करें और सुनिश्चित करें कि आप उसे उस सामग्री के सटीक उदाहरण के साथ मान्य कर रहे हैं जिसे आप स्कैन कर रहे हैं
याद रखें कि एप्लिकेशन नियंत्रण नीति एक क्रमादेशित नीति है, और अंतिम अव्यक्त नियम ANY ANY स्वीकार है। नीति में नियम जोड़ें ताकि संबंधित एप्लिकेशन ट्रैफ़िक, गतिविधियों और मानदंडों को अवरुद्ध किया जा सके।

ज्ञात कमिया

फाइल आवश्यकताओं पर जानकारी के लिए, देखें What is the Cato DLP Service?
- कुछ डाउनलोड के लिए जो gzip प्रारूप में संकुचित होते हैं, DLP के लिए फ़ाइल आकार संकुचित फ़ाइल के आधार पर गणना किया जाता है। यदि संकुचित फ़ाइल का आकार 1kb से कम है, तो इसे स्कैन नहीं किया जाएगा।
एक रेगुलर एक्सप्रेशन के लिए अधिकतम सीमा 256 वर्णों की होती है।
Base64 कोडित फ़ाइलें समर्थित नहीं हैं, और DLP इंजन इन फ़ाइलों की सामग्री की जांच नहीं कर सकता।

कस्टम डेटा प्रकारों के साथ काम करना DLP के लिए

Cato कस्टम DLP डेटा प्रकारों का अवलोकन

Cato DLP में मैन्युअली संवेदनशीलता लेबल बनाना

और पढ़ें

नोट

उपयोगकर्ता परिभाषित डेटा प्रकार बनाना

और पढ़ें

नए कीवर्ड और शब्दकोश डेटा प्रकार बनाना

कीवर्ड और शब्दकोश डेटा प्रकारों के लिए शब्द सीमाएँ

नए रेगेक्स डेटा प्रकार बनाना

समर्थित ऑपरेटर और क्वांटिफ़ायर

नोट

उपयोगकर्ता परिभाषित ML वर्गीकारक बनाना

और पढ़ें

उपयोगकर्ता परिभाषित ML वर्गीकारक का प्रशिक्षण

ML वर्गीकारक के लिए फ़ाइल आवश्यकताएँ

उपयोगकर्ता परिभाषित एमएल क्लासिफायर बनाने के लिए फाइलें अपलोड करना

डेटा प्रकार और सर्वोत्तम प्रथाओं का सत्यापन

उपयोगकर्ता परिभाषित डेटा प्रकारों के लिए सर्वोत्तम प्रथाएं

ज्ञात कमिया

क्या यह लेख उपयोगी था?

0 टिप्पणियां