यह लेख आपके संगठन में संवेदनशील डेटा की पहचान के लिए कस्टम डेटा प्रकार बनाने की प्रक्रिया को समझाता है DLP नीति के लिए।
Cato सैकड़ों पूर्व-परिभाषित बॉक्स से तैयार डेटा प्रकार और श्रेणियाँ प्रदान करता है DLP नीतियों के सामान्य परिदृश्यों के लिए। हालाँकि, कभी-कभी संगठनों को विशिष्ट डेटा निरीक्षण के लिए कस्टम परिभाषित डेटा प्रकार बनाने की आवश्यकता होती है, जो पूर्व-परिभाषित प्रकार द्वारा कवर नहीं होता है।
आप अपनी DLP नीतियों के लिए सामग्री निरीक्षण को अनुकूलित करने के लिए निम्नलिखित कस्टम डेटा प्रकार परिभाषित कर सकते हैं:
-
अपने Cato DLP नीति में Microsoft सूचना सुरक्षा (MIP) ढाँचा से Microsoft संवेदनशीलता लेबल का उपयोग करें
-
उपयोगकर्ता परिभाषित डेटा प्रकार शामिल हैं:
-
उन वस्तुओं को परिभाषित करने के लिए कीवर्ड का उपयोग करें जिनमें एक शब्द या वाक्यांश शामिल है जिसे DLP इंजन खोजता है
-
शब्दकोश ऐसे कंटेनर होते हैं जिनमें 50 शब्द या वाक्यांश शामिल होते हैं, और DLP इंजन शब्दकोश में किसी भी एकल वस्तु के मिलान की खोज करता है
-
Regex डेटा प्रकार आपको नियमित अभिव्यक्तियों को दर्ज करने की अनुमति देते हैं जो उस सामग्री को परिभाषित करते हैं जिसे DLP इंजन खोजता है
-
-
कस्टम मशीन लर्निंग वर्गीकरणकारक
-
सटीक डेटा मिलान (EDM) प्रोफ़ाइल आपको सामग्री मिलान के लिए विशिष्ट डेटा परिभाषित करने देता है, सामान्य डेटा पैटर्न के बजाय। ईडीएम प्रोफ़ाइल के बारे में और अधिक जानकारी के लिए, देखें Working with Exact Data Matching (EDM) for DLP.
उपयोगकर्ता परिभाषित डेटा प्रकार या संवेदनशीलता लेबल बनाने के बाद, आप उन्हें मौजूदा DLP सामग्री प्रोफ़ाइल में जोड़ सकते हैं या नए बना सकते हैं।
आप MIP लेबल के साथ संवेदनशील डेटा परिभाषित कर सकते हैं, और फिर आपके Cato DLP नीति में डेटा प्रकार के रूप में MIP लेबल का उपयोग कर सकते हैं।
Cato प्रबंधन अनुप्रयोग में संवेदनशीलता लेबल बनाने के बाद, आप उन्हें सामग्री प्रोफ़ाइल में जोड़ सकते हैं। तब आप अपने DLP नियम बना सकते हैं ताकि उपयोगकर्ताओं और समूहों के लिए सामग्री तक पहुँच का प्रबंधन कर सकें MIP लेबल के अनुसार।
उदाहरण के लिए, यदि आपके पास वर्गीकृत MIP लेबल के साथ फाइलें हैं, तो अपनी Cato DLP नीति में लेबल बनाएं और इसे प्रतिबंधित दस्तावेज़ सामग्री प्रोफ़ाइल में जोड़ें। फिर समूहों के उपयोगकर्ताओं के लिए जिनके पास पर्याप्त सुरक्षा मंजूरी नहीं है, तक पहुँच को अवरुद्ध करने के लिए DLP नियम परिभाषित करें।
DLP इंजन फ़ाइल मेटाडेटा में परिभाषित लेबल की जाँच करता है और वास्तविक सामग्री में नहीं, जो कि गलत सकारात्मक परिणामों को कम करने में मदद करता है। इंजन आपके द्वारा कॉन्फ़िगर किए गए लेबल ID के अनुसार संवेदनशीलता लेबल लागू करता है, न कि नाम के अनुसार। सुनिश्चित करें कि संवेदनशीलता लेबल का लेबल ID बिल्कुल MIP लेबल ID के बराबर है। यदि आपके संगठन के खाते के लिए MIP लेबल आईडी खोजने की अधिक जानकारी चाहिए, तो Microsoft दस्तावेज़ देखें।
नोट
नोट: फाइलों को इस डेटा प्रकार द्वारा प्रबंधित करने के लिए MIP लेबल किया जाना चाहिए। यह जाँचने के लिए कि एक फाइल को सही लेबलिंग किया गया है या नहीं, DLP वैलिडेटर टूल का उपयोग करें।
उपयोगकर्ता परिभाषित डेटा प्रकार कीवर्ड, शब्दकोश, या regex अभिव्यक्ति हो सकते हैं।
कस्टम संवेदनशील सामग्री के लिए एक कस्टम कीवर्ड या शब्दकोश बनाएं जिसे DLP इंजन खोज रहा है। शब्दकोश के लिए, आप प्रविष्टियों को CSV फ़ाइल में बनाए रख सकते हैं, और फिर उन्हें उस शब्दकोश के मानों के रूप में चिपकाएँ।
-
DLP इंजन प्रत्येक कीवर्ड या शब्दकोश प्रविष्टि के सटीक मिलान की खोज करता है
-
एक कीवर्ड में कम से कम 8 अक्षर (या तो एकल बाइट या मल्टीबाइट) होने चाहिए
-
एक कीवर्ड में शब्दों या अक्षरों की संख्या के लिए कोई ऊपरी सीमा नहीं है
-
कीवर्ड और शब्दकोश केस संवेदनशील नहीं हैं
-
एक शब्दकोश में प्रविष्टियों के बीच OR संबंध होता है
-
वाक्यांशों को प्रत्येक शब्द के सटीक मिलान की आवश्यकता होती है, उदाहरण के लिए वाक्यांश स्वास्थ्य देखभाल का मिलान स्वास्थ्य से नहीं होता।
तो एक शब्दकोश के लिए, आप उपरोक्त शब्दों के मिलान के लिए निम्नलिखित तीन मान बनाते हैं: स्वास्थ्य, देखभाल, स्वास्थ्य देखभाल
-
शब्द और वाक्यांश मानक शब्द सीमाओं के अनुसार पहचाने जाते हैं, उदाहरण के लिए एक शब्द के बाद एक स्थान। विकल्प में शब्द के पहले और बाद में सीमाएँ होनी चाहिए ताकि उसे पहचाना जा सके। समर्थित शब्द सीमाओं की पूरी सूची के लिए, नीचे देखें कीवर्ड और शब्दकोश डेटा प्रकार के लिए शब्द सीमाएँ
-
मल्टीबाइट शब्दों का पता लगाने के लिए, हम Regex डेटा प्रकार का उपयोग करने की अनुशंसा करते हैं, क्योंकि आम तौर पर इससे पहले और बाद में कोई सीमा नहीं होती।
-
सीमाओं के साथ काम करना
आप प्रत्येक उपयोगकर्ता परिभाषित डेटा प्रकार के सीमा को परिभाषित कर सकते हैं, फाइल में कीवर्ड या शब्दकोश के जितने मिलान होते हैं। जब यह सीमा से मेल खाता है या उसे पार करता है, तब फाइल सुरक्षा > एप्लिकेशन नियंत्रण पृष्ठ में डेटा नियंत्रण नियम से मेल खाती है।
-
कुंजी शब्द - कीवर्ड के लिए सीमा उस शब्द या वाक्यांश के सटीक मिलान के लिए पुनरावृत्ति की तलाश करता है।
-
उदाहरण के लिए, कीवर्ड सेब के लिए 3 की सीमा के साथ। यदि एक फाइल में सेब शब्द की 3 घटनाएँ होती हैं, तो वह फाइल अवरुद्ध होती है।
-
-
शब्दकोश - शब्दकोशों की सीमा उस शब्दकोश में किसी भी मान की पुनरावृत्ति की जाँच करती है।
-
उदाहरण के लिए, यदि शब्दकोश में सेब और संतरा प्रविष्टियाँ हैं, और 3 की सीमा है। यदि एक फाइल में सेब शब्द की 2 घटनाएँ और संतरा शब्द की 1 घटना होती है, तो फाइल अवरुद्ध होती है।
साथ ही, यदि एक फाइल में सेब शब्द की 3 घटनाएँ और संतरा शब्द की 0 घटनाएँ होती हैं, तो फाइल अवरुद्ध होती है।
-
उपयोगकर्ता परिभाषित डेटा प्रकार बनाने के लिए:
-
नेविगेशन मेनू से, सुरक्षा > डेटा प्रकार & प्रोफ़ाइल चुनें, और डेटा प्रकार टैब चुनें।
-
उपयोगकर्ता परिभाषित में, नया पर क्लिक करें और फिर नया कीवर्ड या नया शब्दकोश चुनें।
-
नया कीवर्ड बनाने के लिए:
-
कीवर्ड के लिए नाम और विवरण दर्ज करें।
-
सीमा चुनें, वह न्यूनतम संख्या दर्ज करें, जिस बार कीवर्ड फाइल में होता है।
-
कीवर्ड/वाक्यांश दर्ज करें।
-
लागू करें पर क्लिक करें।
-
-
नया शब्दकोश बनाने के लिए:
डेटा प्रकार से मेल खाने वाली सामग्री के प्रकार को परिभाषित करने के लिए नियमित अभिव्यक्तियों का उपयोग करें। उदाहरण के लिए, रेगेक्स सूत्र आपको विशेष संख्या के अंकों के साथ एक अनुकूलित कॉर्पोरेट आईडी को आसानी से मिलाने देते हैं। प्रत्येक रेगेक्स डेटा प्रकार एक ही नियमित अभिव्यक्ति का समर्थन करता है, इसलिए यदि आपको कई नियमित अभिव्यक्तियों का उपयोग करना है, तो प्रत्येक अभिव्यक्ति के लिए एक अलग डेटा प्रकार बनाएं।
अभिव्यक्ति में शब्द सीमाओं का उपयोग करें ताकि डेटा प्रकार से मेल खाने वाली सामग्री को सही तरीके से परिभाषित किया जा सके।
रेगेक्स इंजन UTF-8 पर आधारित है और गैर-अंग्रेज़ी सामग्री के लिए वर्णों का समर्थन करता है।
रेगेक्स सीमा मान
आप अभिव्यक्ति, एक फाइल में सामग्री कितनी बार दिखाई देती है, के लिए सीमा परिभाषित कर सकते हैं। जब यह सीमा से मेल खाता है या उसे पार कर जाता है, तो फाइल डेटा नियंत्रण नियम से मेल खाती है।
उदाहरण के लिए, अगर आपने एक आईडी के लिए सीमा 5 का अभिव्यक्ति बनाई है, तो केवल वही फाइलें जो आईडी को पांच या अधिक बार शामिल करती हैं, अवरुद्ध होंगी।
नियमित अभिव्यक्तियों का मान्यकरण
आप अभिव्यक्ति का मान्यता परीक्षण फ़ील्ड का उपयोग करके अभिव्यक्ति का परीक्षण कर सकते हैं और सुनिश्चित कर सकते हैं कि यह सामग्री से सही मेल खाती है। जब आप परीक्षण करें पर क्लिक करते हैं, तो DLP सेवा यह जांच करती है कि सामग्री नियमित अभिव्यक्ति से मेल खाती है। यह वही सेवा है जो Cato क्लाउड में चलती है, इसलिए परीक्षण परिणाम वही व्यवहार हैं जो आप अपने खाते में देखेंगे।
अभिव्यक्ति का मान्यकरण डेटा प्रकार के लिए सीमा भी शामिल करता है। तो जब सीमा 1 से अधिक हो, तो परीक्षण सफल होने के लिए मान को कम से कम उतनी बार प्रकट होना चाहिए।
उपयोगकर्ता परिभाषित रेगेक्स डेटा प्रकार बनाने के लिए:
-
नेविगेशन मेनू से, सुरक्षा > डेटा प्रकार & प्रोफ़ाइल चुनें, और डेटा प्रकार टैब चुनें।
-
कीवर्ड के लिए नाम और विवरण दर्ज करें।
-
सीमा चुनें, वह न्यूनतम बार जब अभिव्यक्ति के साथ मेल खाने वाला पाठ फाइल में दिखाई देता है।
-
अभिव्यक्ति में, इस डेटा प्रकार के लिए नियमित अभिव्यक्ति दर्ज करें।
-
(वैकल्पिक) अभिव्यक्ति का मान्यता परीक्षण विस्तारित करें, पाठ दर्ज करें और परीक्षण करें पर क्लिक करें।
-
लागू करें पर क्लिक करें।
ये हैं नियमित अभिव्यक्ति ऑपरेटर और क्वांटिफायर जो उपयोगकर्ता परिभाषित रेगेक्स डेटा प्रकारों के लिए समर्थित हैं:
|
ऑपरेटर |
मिलान पैटर्न |
|---|---|
|
\ |
अगले मेटा-कैरेक्टर का उद्धरण |
|
^ |
एक पंक्ति की शुरुआत से मेल खाते हैं |
|
$ |
एक पंक्ति के अंत से मेल खाते हैं |
|
. |
कोई भी एकल वर्ण से मेल खाते हैं |
|
| |
वैकल्पिक |
|
() |
कैप्चर समूह समर्थित नहीं हैं। उप-वाक्यांशों की सीमा के लिए कोष्ठक का उपयोग किया जा सकता है। |
|
[xy] |
ब्रैकेट के बीच दी गई एकल वर्ण से मेल खाते हैं |
|
[x-z] |
x और z के बीच के वर्णों की रेंज |
|
[^z] |
z को छोड़कर कोई भी वर्ण |
|
क्वांटिफायर |
मिलान पैटर्न |
|---|---|
|
* |
0 या अधिक बार मेल खाते हैं (नीचे नोट देखें) |
|
+ |
1 या अधिक बार मेल खाते हैं (नीचे नोट देखें) |
|
? |
0 या 1 बार मिलान |
|
{n} |
ठीक n बार मिलान करें |
|
{n,} |
कम से कम n बार मिलान करें |
|
{n,m} |
कम से कम n बार मिलान करें, लेकिन m से अधिक नहीं |
नोट
नोट: मनमानी वर्णों के अप्रतिबंधित लालची क्वांटिफायर का उपयोग, जैसे .* या .+, अनुमति नहीं है। यदि आप किसी वर्ग या सेट में वर्णों को शामिल करने का प्रयास कर रहे हैं, तो उन्हें उल्टा करें। उदाहरण के लिए, *.
इन लालची क्वांटिफायरों का उपयोग करने के बजाय, आप .{1,50} का उपयोग कर सकते हैं जो प्रत्येक कुंजी शब्द या पैटर्न के लिए अधिकतम 50 वर्णों का समर्थन करता है।
अपने उद्योग या कंपनी से संबंधित विशेष दस्तावेजों की सुरक्षा बढ़ाने के लिए, आप अपना खुद का उपयोगकर्ता परिभाषित मशीन लर्निंग (ML) वर्गीकारक बना सकते हैं।
उपयोगकर्ता परिभाषित ML वर्गीकारक झूठे सकारात्मक को काफी कम करते हैं और DLP इंजन की समग्र प्रभावशीलता और सटीकता में सुधार करते हैं। एक उन्नत डेटा विज्ञान समानता मॉडल का उपयोग करते हुए, एमएल वर्गीकरणकर्ता संवेदनशील डेटा की पहचान में बेहतर अनुकूलनशीलता और सटीकता प्रदान करते हैं, क्योंकि वे बदलते डेटा पैटर्न के आधार पर गतिशील रूप से सीख सकते हैं और विकसित हो सकते हैं।
उन दस्तावेज़ों के नमूनों के रूप में पाठ फ़ाइलें अपलोड करके जिन्हें आप सुरक्षा प्रदान करना चाहते हैं, आप एक मशीन लर्निंग मॉडल को प्रशिक्षित कर सकते हैं जो समान दस्तावेज़ों की वास्तविक समय में पहचान कर सकता है, अनधिकृत डेटा निकासी को रोक सकता है। मशीन लर्निंग मॉडल एक फाइल के भीतर के पाठ पर आधारित है, छवियों या वीडियो को नजरअंदाज किया जाता है।
सीएमए पर नमूना फाइलें अपलोड करें ताकि आपके उपयोगकर्ता परिभाषित डेटा प्रकार के लिए एमएल मॉडल को प्रशिक्षित किया जा सके। हम सिफारिश करते हैं कि अपने दस्तावेज़ों की सुरक्षा के लिए मशीन लर्निंग मॉडल को सटीक रूप से प्रशिक्षित करने के लिए कम से कम 5 फाइलें अपलोड करें।
ML क्लासिफायर के लिए दस्तावेज़ अपलोड करने के लिए:
-
नेविगेशन मेनू से, सुरक्षा > डेटा प्रकार और प्रोफाइल्स चुनें।
-
डेटा प्रकार टैब पर, उपयोगकर्ता परिभाषित ML क्लासिफायर पर क्लिक करें।
-
नया पर क्लिक करें।
-
वर्गीकारक के लिए एक नाम और विवरण दर्ज करें और सहेजें और जारी रखें पर क्लिक करें।
-
मॉडल को प्रशिक्षित करने के लिए आप जिन फ़ाइलों को जोड़ना चाहते हैं उन्हें जोड़ें।
-
(वैकल्पिक) एक उदाहरण फ़ाइल अपलोड करके मॉडल को मान्य करें और मान्य करें पर क्लिक करें।
-
सहेजें पर क्लिक करें।
प्रत्येक DLP डेटा प्रकार के लिए, आप सत्यापित कर सकते हैं कि DLP इंजन एक परीक्षण फ़ाइल में संवेदनशील डेटा को पहचानता और मेल खाता है। विद्यमान फीचरों में पूर्वनिर्धारित, उपयोगकर्ता परिभाषित, और संवेदनशीलता लेबल प्रोफाइल शामिल हैं, जो कि डेटा प्रकार और प्रोफाइल्स पृष्ठ में स्थित हैं। एक नए या मौजूदा कीवर्ड, शब्दकोश, या REGEX स्ट्रिंग के साथ, आप एक दस्तावेज़ अपलोड कर सकते हैं जो आपके नई डेटा प्रकार को लागू करने से पहले आपकी सेटिंग्स का परीक्षण करेगा। आप पूर्वनिर्धारित डेटा प्रकार और संवेदनशीलता लेबल को भी सत्यापित कर सकते हैं।
DLP सत्यापन उपकरण के प्रमुख उपयोगों में से एक आपके DLP सेटिंग्स को सत्यापित करना है, यह सुनिश्चित करने के लिए कि कीवर्ड और जानकारी के स्ट्रिंग्स (regex के माध्यम से) डाले गए डेटा का उपयोग करके सही ढंग से पहचाने जा रहे हैं। एक अन्य प्रमुख उपयोग मामला यह है कि आप नियम पर उदाहरण दस्तावेज़ अपलोड करके देख सकते हैं कि फाइल प्रकार और फ़ॉर्मेटिंग डेटा प्रकार के लिए निर्दिष्ट डेटा का सही स्कैन कर रहे हैं या नहीं।
समस्या निवारण और सहायता के लिए ऐसे मामलों में जहां फाइल डेटा प्रकार से मेल नहीं खाती, आप DLP इंजन द्वारा निष्कर्षित सामग्री का एक पार्स किया गया टेक्स्ट फाइल डाउनलोड कर सकते हैं।
शब्दकोश डेटा प्रकार का सत्यापन करने की उदाहरण प्रक्रिया निम्नलिखित है:
परीक्षण फ़ाइल के साथ शब्दकोश डेटा प्रकार को मान्य करने के लिए:
-
नेविगेशन मेनू से, सुरक्षा > डेटा प्रकार और प्रोफाइल्स चुनें, और डेटा प्रकार टैब चुनें।
-
माउस को शब्दकोश डेटा प्रकार की पंक्ति पर ले जाएं और संपादित आइकन पर क्लिक करें। संपादित करें पैनल खुलता है।
-
शब्दकोश मान्य करें पर क्लिक करें। शब्दकोश मान्य करें पैनल खुलता है।
-
एक परीक्षण फ़ाइल अपलोड करें, और फ़ाइल स्कैन करें पर क्लिक करें। स्कैन परिणाम दिखाए गए हैं।
-
DLP इंजन द्वारा निकाले गए सामग्री के टेक्स्ट फ़ाइल को डाउनलोड करने के लिए, निष्कर्षित टेक्स्ट निर्यात करें पर क्लिक करें।
-
जब आप नीति को लागू करते हैं, या नए एप्लिकेशन के साथ ब्लॉक कार्रवाई जोड़ते हैं:
-
नियम के लिए निगरानी कार्रवाई का उपयोग करें।
-
नियम जो घटनाएँ उत्पन्न करता है उसे पुनरावलोकन करें और सुनिश्चित करें कि कोई घटना ऐसा ट्रैफ़िक नहीं है जिसे आप अनुमति देना चाहते हैं (गलत सकारात्मक ट्रैफ़िक)।
-
यदि कोई गलत सकारात्मक ट्रैफ़िक है, तो आप ये परिवर्तन कर सकते हैं:
-
गलत सकारात्मक ट्रैफ़िक को छोड़कर नियम के स्कोप को परिशोधित करें
-
ब्लॉक नियम से पहले एक नया अनुमति नियम बनाएं, और नए नियम का स्कोप केवल गलत सकारात्मक ट्रैफ़िक के लिए है
-
रेगुलर एक्सप्रेशन को परिशोधित करें और सुनिश्चित करें कि आप उसे उस सामग्री के सटीक उदाहरण के साथ मान्य कर रहे हैं जिसे आप स्कैन कर रहे हैं
-
-
-
याद रखें कि एप्लिकेशन नियंत्रण नीति एक क्रमादेशित नीति है, और अंतिम अव्यक्त नियम ANY ANY स्वीकार है। नीति में नियम जोड़ें ताकि संबंधित एप्लिकेशन ट्रैफ़िक, गतिविधियों और मानदंडों को अवरुद्ध किया जा सके।
-
फाइल आवश्यकताओं पर जानकारी के लिए, देखें What is the Cato DLP Service?
-
कुछ डाउनलोड के लिए जो gzip प्रारूप में संकुचित होते हैं, DLP के लिए फ़ाइल आकार संकुचित फ़ाइल के आधार पर गणना किया जाता है। यदि संकुचित फ़ाइल का आकार 1kb से कम है, तो इसे स्कैन नहीं किया जाएगा।
-
-
एक रेगुलर एक्सप्रेशन के लिए अधिकतम सीमा 256 वर्णों की होती है।
-
Base64 कोडित फ़ाइलें समर्थित नहीं हैं, और DLP इंजन इन फ़ाइलों की सामग्री की जांच नहीं कर सकता।
0 टिप्पणियां
कृपया टिप्पणी करने के लिए साइन इन करें करें.