Excel Data Analysis Kya Hai

डेटा विश्लेषण उपयोगी जानकारी की खोज निष्कर्ष का सुझाव देने और निर्णय लेने का समर्थन करने के लक्ष्य के साथ डेटा का निरीक्षण, सफाई, रूपांतरण और मॉडलिंग की एक प्रक्रिया है.

Types of Data Analysis

कई डेटा विश्लेषण तकनीकों में विभिन्न डोमेन जैसे व्यवसाय, विज्ञान, सामाजिक विज्ञान आदि शामिल हैं जिनमें कई नाम हैं. प्रमुख डेटा विश्लेषण दृष्टिकोण हैं -

  1. Data Mining

  2. Business Intelligence

  3. Statistical Analysis

  4. Predictive Analytics

  5. Text Analytics

Data Mining

डेटा माइनिंग पहले अज्ञात डेटा के दिलचस्प पैटर्न, असामान्य डेटा और निर्भरताओं को निकालने के लिए बड़ी मात्रा में डेटा का विश्लेषण है. ध्यान दें कि लक्ष्य बड़ी मात्रा में डेटा से पैटर्न और ज्ञान का निष्कर्षण है न कि स्वयं डेटा का निष्कर्षण.

डाटा माइनिंग एनालिसिस में आर्टिफिशियल इंटेलिजेंस, मशीन लर्निंग, स्टैटिस्टिक्स और डेटाबेस सिस्टम के चौराहे पर कंप्यूटर साइंस के तरीके शामिल हैं.

डेटा माइनिंग से प्राप्त पैटर्न को इनपुट डेटा के सारांश के रूप में माना जा सकता है जिसका उपयोग आगे के विश्लेषण में किया जा सकता है या निर्णय समर्थन प्रणाली द्वारा अधिक सटीक भविष्यवाणी परिणाम प्राप्त करने के लिए किया जा सकता है.

Business Intelligence

बिजनेस इंटेलिजेंस तकनीक और उपकरण नए रणनीतिक व्यावसायिक अवसरों की पहचान करने विकसित करने और बनाने में मदद करने के लिए बड़ी मात्रा में असंरचित व्यावसायिक डेटा के अधिग्रहण और परिवर्तन के लिए हैं.

व्यापार खुफिया का लक्ष्य नए अवसरों की पहचान करने के लिए बड़ी मात्रा में डेटा की आसान व्याख्या की अनुमति देना है. यह अंतर्दृष्टि के आधार पर एक प्रभावी रणनीति को लागू करने में मदद करता है जो प्रतिस्पर्धी बाजार-लाभ और दीर्घकालिक स्थिरता के साथ व्यापार प्रदान कर सकता है.

Statistical Analysis

सांख्यिकी डेटा के संग्रह, विश्लेषण, व्याख्या, प्रस्तुति और संगठन का अध्ययन है. डेटा विश्लेषण में दो मुख्य सांख्यिकीय पद्धतियों का उपयोग किया जाता है -

  1. Descriptive statistics - वर्णनात्मक आंकड़ों में, संपूर्ण जनसंख्या या नमूने के डेटा को संख्यात्मक विवरणों के साथ संक्षेपित किया जाता है जैसे मीन, कंटीन्यूअस डेटा के लिए स्टैंडर्ड डिविएशन और आवृत्ति, श्रेणीबद्ध डेटा के लिए प्रतिशत.

  2. Inferential statistics - यह नमूना डेटा में पैटर्न का उपयोग प्रतिनिधित्व की आबादी या यादृच्छिकता के लिए लेखांकन के बारे में निष्कर्ष निकालने के लिए करता है. ये निष्कर्ष हो सकते हैं -

    डेटा परिकल्पना परीक्षण के बारे में हाँ कोई सवाल नहीं जवाब.

    आंकिक आंकलन की संख्यात्मक विशेषताओं का अनुमान लगाना.

    डेटा सहसंबंध के भीतर संघों का वर्णन करना.

Predictive Analytics

भविष्य कहनेवाला विश्लेषण भविष्य या अन्यथा अज्ञात घटनाओं के बारे में भविष्यवाणियों के पूर्वानुमान के लिए वर्तमान और ऐतिहासिक डेटा का विश्लेषण करने के लिए सांख्यिकीय मॉडल का उपयोग करता है. व्यवसाय में भविष्य कहनेवाला विश्लेषण का उपयोग जोखिमों और अवसरों की पहचान करने के लिए किया जाता है जो निर्णय लेने में सहायता करते है.

Text Analytics

टेक्स्ट एनालिटिक्स जिसे टेक्स्ट माइनिंग या टेक्स्ट डेटा माइनिंग के रूप में भी जाना जाता है पाठ से उच्च-गुणवत्ता की जानकारी प्राप्त करने की प्रक्रिया है. टेक्स्ट माइनिंग में आमतौर पर इनपुट पाठ को संरचित करने की प्रक्रिया शामिल होती है जो संरचित डेटा के भीतर प्रतिमानों को व्युत्पन्न करती है जैसे सांख्यिकीय प्रतिरूप सीखने और अंत में आउटपुट का मूल्यांकन और व्याख्या.

Data Analysis Process

डेटा विश्लेषण को 1961 में सांख्यिकीविद् जॉन टुके द्वारा डेटा का विश्लेषण करने की प्रक्रिया ऐसी प्रक्रियाओं के परिणामों की व्याख्या करने की प्रक्रिया अपने विश्लेषण को आसान अधिक सटीक या अधिक सटीक बनाने के लिए डेटा के एकत्रीकरण की योजना के तरीके और सभी मशीनरी द्वारा परिभाषित किया गया है और गणितीय आँकड़ों के परिणाम जो डेटा के विश्लेषण पर लागू होते हैं.

इस प्रकार डेटा विश्लेषण विभिन्न स्रोतों से बड़े असंरचित डेटा प्राप्त करने और इसे उन सूचनाओं में परिवर्तित करने के लिए एक प्रक्रिया है जो इसके लिए उपयोगी है.

  1. Answering Questions

  2. Test Hypotheses

  3. Decision Making

  4. Disproving Theories

Data Analysis with Excel

Microsoft Excel डेटा का विश्लेषण और व्याख्या करने के लिए कई साधन और तरीके प्रदान करता है. डेटा विभिन्न स्रोतों से हो सकता है. डेटा को कई तरीकों से परिवर्तित और स्वरूपित किया जा सकता है. इसका विश्लेषण प्रासंगिक एक्सेल कमांड, फ़ंक्शंस और टूल के साथ किया जा सकता है जिसमें सशर्त स्वरूपण, रेंज, टेबल्स, टेक्स्ट फ़ंक्शंस, दिनांक फ़ंक्शंस, समय फ़ंक्शंस, वित्तीय फ़ंक्शंस, सबटोटल्स, क्विक एनालिसिस, फॉर्मूला ऑडिटिंग, पूछताछ उपकरण, व्हाट-इफ़ेक्ट सॉल्वर , डेटा मॉडल, पॉवरपॉइंट, पॉवर व्यू, पॉवरपाइप इत्यादि.

आप एक्सेल के साथ इन डेटा विश्लेषण तकनीकों को दो भागों के हिस्से के रूप में सीख रहे होंगे -

  1. Data Analysis with Excel and

  2. Advanced Data Analysis with Excel

Data Analysis Process

डेटा विश्लेषण आवश्यक जानकारी की खोज के लक्ष्य के साथ डेटा एकत्र करने, बदलने, सफाई और मॉडलिंग करने की एक प्रक्रिया है. प्राप्त परिणामों को संप्रेषित किया जाता है निष्कर्ष का सुझाव दिया जाता है और निर्णय लेने का समर्थन किया जाता है. डेटा विज़ुअलाइज़ेशन कई बार डेटा में उपयोगी पैटर्न की खोज में आसानी के लिए डेटा को चित्रित करने के लिए उपयोग किया जाता है. डेटा मॉडलिंग और डेटा विश्लेषण का अर्थ समान है.

डेटा विश्लेषण प्रक्रिया में निम्नलिखित चरण होते हैं जो प्रकृति में पुनरावृत्त होते हैं -

  1. Data Requirements Specification

  2. Data Collection

  3. Data Processing

  4. Data Cleaning

  5. Data Analysis

  6. Communication

Data Requirements Specification

विश्लेषण के लिए आवश्यक डेटा एक प्रश्न या एक प्रयोग पर आधारित है. विश्लेषण को निर्देशित करने वालों की आवश्यकताओं के आधार पर विश्लेषण के इनपुट के रूप में आवश्यक डेटा को लोगों की जनसंख्या की पहचान की जाती है. जनसंख्या के बारे में विशिष्ट चर जैसे आयु और आय को निर्दिष्ट और प्राप्त किया जा सकता है. डेटा संख्यात्मक या श्रेणीबद्ध हो सकता है.

Data Collection

डेटा संग्रह डेटा आवश्यकताओं के रूप में पहचाने गए लक्षित चर पर जानकारी एकत्र करने की प्रक्रिया है. डेटा का सही और ईमानदार संग्रह सुनिश्चित करने पर जोर दिया गया है. डेटा संग्रह यह सुनिश्चित करता है कि एकत्र किया गया डेटा सही हो ताकि संबंधित निर्णय मान्य हों. डेटा संग्रह दोनों को मापने के लिए एक आधार रेखा और सुधार करने के लिए एक लक्ष्य प्रदान करता है.

वेब पेज में संगठनात्मक डेटाबेस से लेकर जानकारी तक विभिन्न स्रोतों से डेटा एकत्र किया जाता है. इस प्रकार प्राप्त किया गया डेटा संरचित नहीं हो सकता है और इसमें अप्रासंगिक जानकारी हो सकती है. इसलिए एकत्रित डेटा को डाटा प्रोसेसिंग और डेटा क्लीनिंग के अधीन किया जाना आवश्यक है.

Data Processing

एकत्र किए गए डेटा को विश्लेषण के लिए संसाधित या व्यवस्थित किया जाना चाहिए. इसमें प्रासंगिक विश्लेषण उपकरण के लिए आवश्यक रूप से डेटा को संरचित करना शामिल है. उदाहरण के लिए डेटा को स्प्रेडशीट या सांख्यिकीय अनुप्रयोग के भीतर एक तालिका में पंक्तियों और स्तंभों में रखा जा सकता है. डेटा मॉडल बनाना पड़ सकता है.

Data Cleaning

संसाधित और संगठित डेटा अपूर्ण हो सकता है डुप्लिकेट हो सकते हैं या त्रुटियां हो सकती हैं. डेटा क्लीनिंग इन त्रुटियों को रोकने और ठीक करने की प्रक्रिया है.. कई प्रकार के डेटा क्लीनिंग हैं जो डेटा के प्रकार पर निर्भर करते हैं. उदाहरण के लिए वित्तीय डेटा की सफाई करते समय कुछ योगों की तुलना विश्वसनीय प्रकाशित संख्या या परिभाषित थ्रेसहोल्ड के खिलाफ की जा सकती है. इसी तरह मात्रात्मक डेटा विधियों का उपयोग बाहरी पहचान के लिए किया जा सकता है जिसे बाद में विश्लेषण में बाहर रखा जाएगा.

Data Analysis

डेटा जो संसाधित, व्यवस्थित और साफ किया गया है विश्लेषण के लिए तैयार होगा. आवश्यकताओं के आधार पर विभिन्न डेटा विश्लेषण तकनीकें समझने व्याख्या करने और निष्कर्ष निकालने के लिए उपलब्ध हैं. डेटा विज़ुअलाइज़ेशन का उपयोग डेटा के भीतर संदेशों के संबंध में अतिरिक्त जानकारी प्राप्त करने के लिए ग्राफ़िकल प्रारूप में डेटा की जांच करने के लिए भी किया जा सकता है.

सांख्यिकीय डेटा मॉडल जैसे कि सहसंबंध प्रतिगमन विश्लेषण का उपयोग डेटा चर के बीच संबंधों की पहचान करने के लिए किया जा सकता है. ये मॉडल जो डेटा के वर्णनात्मक होते हैं विश्लेषण और संचार परिणामों को सरल बनाने में सहायक होते हैं.

इस प्रक्रिया के लिए अतिरिक्त डेटा सफाई या अतिरिक्त डेटा संग्रह की आवश्यकता हो सकती है और इसलिए ये गतिविधियाँ प्रकृति में पुनरावृत्त होती हैं.

Communication

डेटा विश्लेषण के परिणामों को उपयोगकर्ताओं द्वारा उनके निर्णयों और आगे की कार्रवाई का समर्थन करने के लिए एक प्रारूप में रिपोर्ट किया जाना चाहिए. उपयोगकर्ताओं की प्रतिक्रिया से अतिरिक्त विश्लेषण हो सकता है.

डेटा विश्लेषक डेटा विज़ुअलाइज़ेशन तकनीकों का चयन कर सकते हैं जैसे टेबल और चार्ट, जो उपयोगकर्ताओं को स्पष्ट रूप से और कुशलता से संदेश को संप्रेषित करने में मदद करते हैं. विश्लेषण उपकरण रंग कोड और चार्ट और चार्ट में प्रारूपण के साथ आवश्यक जानकारी को उजागर करने की सुविधा प्रदान करते हैं.