डाटा माइनिंग क्या है? मूल बातें और इसकी तकनीक।

चौथी औद्योगिक क्रांति की नींव काफी हद तक डेटा(Data) और कनेक्टिविटी(Connectivity) पर निर्भर करेगी । डेटा माइनिंग सॉल्यूशंस को विकसित करने या बनाने में सक्षम एनालिसिस सर्विसेज(Analysis Services) इस संबंध में महत्वपूर्ण भूमिका निभाएंगी। यह संभावित खरीदारों को लक्षित करने के लिए ग्राहक खरीद व्यवहार के परिणामों का विश्लेषण और भविष्यवाणी करने में सहायता कर सकता है। डेटा(Data) एक नया प्राकृतिक संसाधन बन जाएगा और इस अनसोल्ड डेटा से प्रासंगिक जानकारी निकालने की प्रक्रिया अत्यधिक महत्वपूर्ण हो जाएगी। इस प्रकार, शब्द - डेटा माइनिंग(Data Mining) , इसकी प्रक्रियाओं और अनुप्रयोग की उचित समझ हमें इस चर्चा के लिए एक समग्र दृष्टिकोण विकसित करने में मदद कर सकती है।

डेटा माइनिंग मूल बातें(Data Mining Basics) और इसकी तकनीकें

डेटा माइनिंग

डेटा माइनिंग, जिसे नॉलेज डिस्कवरी इन डेटा(Knowledge Discovery in Data) ( केडीडी(KDD) ) के रूप में भी जाना जाता है, डेटा के बड़े स्टोर की खोज करने के बारे में है जो कि सरल विश्लेषण से परे पैटर्न और प्रवृत्तियों को उजागर करता है। हालाँकि, यह एकल-चरणीय समाधान नहीं है, बल्कि एक बहु-चरणीय प्रक्रिया है और इसे विभिन्न चरणों में पूरा किया जाता है। इसमे शामिल है:

1] डेटा एकत्र करना और तैयारी

यह डेटा संग्रह और उसके उचित संगठन के साथ शुरू होता है। यह डेटा माइनिंग के माध्यम से खोजी जा सकने वाली जानकारी को खोजने की संभावनाओं को बेहतर बनाने में मदद करता है

2] मॉडल निर्माण और मूल्यांकन

डेटा माइनिंग प्रक्रिया में दूसरा चरण विभिन्न मॉडलिंग तकनीकों का अनुप्रयोग है। इनका उपयोग मापदंडों को इष्टतम मूल्यों पर जांचने के लिए किया जाता है। नियोजित तकनीक काफी हद तक संगठनात्मक जरूरतों के एक सरगम ​​​​को संबोधित करने और एक निर्णय पर पहुंचने के लिए आवश्यक विश्लेषणात्मक क्षमताओं पर निर्भर करती है।

आइए संक्षेप में कुछ डेटा माइनिंग तकनीकों की जाँच करें। यह पाया गया है कि अधिकांश संगठन दो या दो से अधिक डेटा माइनिंग तकनीकों को एक साथ जोड़कर एक उपयुक्त प्रक्रिया बनाते हैं जो उनकी व्यावसायिक आवश्यकताओं को पूरा करती है।

पढ़ें(Read) : बिग डेटा क्या है?(What is Big Data?)

डाटा माइनिंग तकनीक

  1. एसोसिएशन -  (Association – )एसोसिएशन(Association) व्यापक रूप से ज्ञात डेटा माइनिंग तकनीकों में से एक है। इसके तहत एक ही लेनदेन में वस्तुओं के बीच संबंध के आधार पर एक पैटर्न को डिक्रिप्ट किया जाता है। इसलिए(Hence) , इसे संबंध तकनीक के रूप में भी जाना जाता है। बड़े ब्रांड के खुदरा विक्रेता ग्राहक की खरीदारी की आदतों/प्राथमिकताओं पर शोध करने के लिए इस तकनीक पर भरोसा करते हैं। उदाहरण के लिए, लोगों की खरीदारी की आदतों को ट्रैक करते समय, खुदरा विक्रेता यह पहचान सकते हैं कि कोई ग्राहक चॉकलेट खरीदते समय हमेशा क्रीम खरीदता है, और इसलिए यह सुझाव देता है कि अगली बार जब वे चॉकलेट खरीदेंगे तो वे भी क्रीम खरीदना चाहेंगे।
  2. वर्गीकरण(Classification) - यह डेटा माइनिंग तकनीक ऊपर से इस तरह से भिन्न है कि यह मशीन लर्निंग पर आधारित है और गणितीय तकनीकों जैसे लीनियर(Linear) प्रोग्रामिंग, डिसीजन(Decision) ट्री, न्यूरल का उपयोग करती है।(Neural)नेटवर्क। वर्गीकरण में, कंपनियां सॉफ्टवेयर बनाने की कोशिश करती हैं जो सीख सकती हैं कि डेटा आइटम को समूहों में कैसे वर्गीकृत किया जाए। उदाहरण के लिए, एक कंपनी आवेदन में एक वर्गीकरण को परिभाषित कर सकती है कि "कंपनी से इस्तीफा देने की पेशकश करने वाले कर्मचारियों के सभी रिकॉर्ड दिए गए, भविष्य में कंपनी से इस्तीफा देने वाले व्यक्तियों की संख्या की भविष्यवाणी करें।" ऐसे परिदृश्य में, कंपनी कर्मचारियों के रिकॉर्ड को दो समूहों में वर्गीकृत कर सकती है, अर्थात् "छोड़ना" और "रहना"। इसके बाद यह अपने डेटा माइनिंग सॉफ़्टवेयर का उपयोग कर्मचारियों को पहले बनाए गए अलग-अलग समूहों में वर्गीकृत करने के लिए कर सकता है।
  3. क्लस्टरिंग(Clustering) - अलग(Different)समान विशेषताओं को प्रदर्शित करने वाली वस्तुओं को स्वचालन के माध्यम से एक ही क्लस्टर में एक साथ समूहीकृत किया जाता है। इस तरह के कई क्लस्टर वर्गों के रूप में बनाए जाते हैं और वस्तुओं (समान विशेषताओं के साथ) को उसी के अनुसार उसमें रखा जाता है। इसे बेहतर ढंग से समझने के लिए, आइए पुस्तकालय में पुस्तक प्रबंधन के एक उदाहरण पर विचार करें। एक पुस्तकालय में, पुस्तकों का विशाल संग्रह पूरी तरह से सूचीबद्ध होता है। एक ही प्रकार के आइटम एक साथ सूचीबद्ध हैं। इससे हमें अपनी रुचि की पुस्तक खोजने में आसानी होती है। इसी तरह, क्लस्टरिंग तकनीक का उपयोग करके, हम उन पुस्तकों को एक क्लस्टर में रख सकते हैं जिनमें कुछ प्रकार की समानताएं होती हैं और इसे एक उपयुक्त नाम देते हैं। इसलिए, यदि कोई पाठक अपनी रुचि के लिए प्रासंगिक पुस्तक लेना चाहता है, तो उसे पूरे पुस्तकालय को खोजने के बजाय केवल उस शेल्फ पर जाना होगा। इस प्रकार, क्लस्टरिंग तकनीक कक्षाओं को परिभाषित करती है और प्रत्येक वर्ग में वस्तुओं को रखती है,
  4. भविष्यवाणी(Prediction) - भविष्यवाणी एक डेटा माइनिंग तकनीक है जिसका उपयोग अक्सर अन्य डेटा माइनिंग तकनीकों के संयोजन में किया जाता है। इसमें प्रवृत्तियों, वर्गीकरण, पैटर्न मिलान और संबंध का विश्लेषण करना शामिल है। पिछली घटनाओं या उदाहरणों का उचित क्रम में विश्लेषण करके भविष्य की घटना का सुरक्षित रूप से अनुमान लगाया जा सकता है। उदाहरण के लिए, भविष्यवाणी विश्लेषण तकनीक का उपयोग बिक्री में भविष्य के लाभ की भविष्यवाणी करने के लिए किया जा सकता है यदि बिक्री को एक स्वतंत्र चर के रूप में चुना जाता है और लाभ को बिक्री पर निर्भर चर के रूप में चुना जाता है। फिर, ऐतिहासिक बिक्री और लाभ के आंकड़ों के आधार पर, कोई एक फिट प्रतिगमन वक्र बना सकता है जिसका उपयोग लाभ की भविष्यवाणी के लिए किया जाता है।
  5. निर्णय वृक्ष(Decision trees) - निर्णय वृक्ष के भीतर, हम एक साधारण प्रश्न से शुरू करते हैं जिसके कई उत्तर होते हैं। प्रत्येक उत्तर डेटा को वर्गीकृत करने या पहचानने में मदद करने के लिए एक और प्रश्न की ओर ले जाता है ताकि इसे वर्गीकृत किया जा सके, या ताकि प्रत्येक उत्तर के आधार पर भविष्यवाणी की जा सके। उदाहरण के लिए, हम यह निर्धारित करने के लिए निम्नलिखित निर्णय वृक्ष का उपयोग करते हैं कि क्रिकेट ओडीआई(ODI) खेलना है या नहीं : डेटा माइनिंग निर्णय वृक्ष(Data Mining Decision Tree) : रूट नोड से शुरू होने पर, यदि मौसम पूर्वानुमान बारिश की भविष्यवाणी करता है, तो हमें दिन के मैच से बचना चाहिए। वैकल्पिक रूप से, यदि मौसम का पूर्वानुमान स्पष्ट है, तो हमें मैच खेलना चाहिए।

डेटा माइनिंग(Data Mining) विभिन्न उद्योगों और संचार, बीमा(Insurance) , शिक्षा(Education) , विनिर्माण(Manufacturing) , बैंकिंग(Banking) और खुदरा(Retail) और अधिक जैसे विषयों में विश्लेषिकी प्रयासों के केंद्र में है। इसलिए, विभिन्न तकनीकों को लागू करने से पहले इसके बारे में सही जानकारी होना आवश्यक है।



About the author

मैं एक सॉफ्टवेयर इंजीनियर और एक्सप्लोरर हूं। मुझे Microsoft Xbox 360 और Google Explorer दोनों का अनुभव है। मैं कुछ सॉफ़्टवेयर विकास टूल के लिए विशेषज्ञ अनुशंसाएं प्रदान करने में सक्षम हूं, साथ ही सामान्य एक्सप्लोरर त्रुटियों का निवारण करने में लोगों की सहायता करता हूं।



Related posts