पियर्सन का सहसंबंध परीक्षण एक पैरामीट्रिक सांख्यिकी पद्धति है जो आपको दो मात्रात्मक संकेतकों के बीच एक रैखिक संबंध की उपस्थिति या अनुपस्थिति को निर्धारित करने के साथ-साथ इसकी निकटता और सांख्यिकीय महत्व का मूल्यांकन करने की अनुमति देती है। दूसरे शब्दों में, पियर्सन सहसंबंध परीक्षण आपको यह निर्धारित करने की अनुमति देता है कि क्या दो चर के मूल्यों में परिवर्तन के बीच एक रैखिक संबंध है। सांख्यिकीय गणनाओं और अनुमानों में, सहसंबंध गुणांक को आमतौर पर इस रूप में निरूपित किया जाता है rxyया Rxy.

1. सहसंबंध मानदंड के विकास का इतिहास

पियर्सन सहसंबंध परीक्षण का नेतृत्व ब्रिटिश वैज्ञानिकों की एक टीम ने किया था कार्ल पियर्सन(1857-1936) 19वीं सदी के 90 के दशक में, दो यादृच्छिक चरों के सहप्रसरण के विश्लेषण को आसान बनाने के लिए। कार्ल पियर्सन के अतिरिक्त पियर्सन के सहसंबंध परीक्षण पर भी कार्य किया गया फ्रांसिस एडगेवर्थऔर राफेल वेल्डन.

2. पियर्सन का सहसंबंध परीक्षण किसके लिए प्रयोग किया जाता है?

पियर्सन सहसंबंध मानदंड आपको यह निर्धारित करने की अनुमति देता है कि मात्रात्मक पैमाने पर मापे गए दो संकेतकों के बीच सहसंबंध की निकटता (या शक्ति) क्या है। अतिरिक्त गणनाओं की सहायता से, आप यह भी निर्धारित कर सकते हैं कि पहचाना गया संबंध सांख्यिकीय रूप से कितना महत्वपूर्ण है।

उदाहरण के लिए, पियर्सन सहसंबंध मानदंड का उपयोग करते हुए, कोई इस सवाल का जवाब दे सकता है कि क्या शरीर के तापमान और तीव्र श्वसन संक्रमण में रक्त में ल्यूकोसाइट्स की सामग्री, रोगी की ऊंचाई और वजन के बीच, फ्लोराइड की सामग्री के बीच कोई संबंध है पीने के पानी में और आबादी में क्षय की घटना।

3. पियर्सन के ची-स्क्वायर परीक्षण के उपयोग पर शर्तें और प्रतिबंध

  1. तुलनीय संकेतकों में मापा जाना चाहिए मात्रात्मक पैमाना(उदाहरण के लिए, हृदय गति, शरीर का तापमान, ल्यूकोसाइट गिनती प्रति 1 मिली रक्त, सिस्टोलिक रक्तचाप)।
  2. पियर्सन सहसंबंध मानदंड के माध्यम से, यह केवल निर्धारित करना संभव है एक रैखिक संबंध की उपस्थिति और ताकतमात्राओं के बीच। कनेक्शन की अन्य विशेषताएं, जिसमें दिशा (प्रत्यक्ष या विपरीत), परिवर्तनों की प्रकृति (रेक्टिलाइनियर या कर्विलिनियर) शामिल हैं, साथ ही एक चर की दूसरे पर निर्भरता, प्रतिगमन विश्लेषण का उपयोग करके निर्धारित की जाती है।
  3. तुलना किए जाने वाले मानों की संख्या दो के बराबर होनी चाहिए। तीन या अधिक मापदंडों के संबंध का विश्लेषण करने के मामले में, आपको विधि का उपयोग करना चाहिए कारक विश्लेषण.
  4. पियर्सन का सहसंबंध मानदंड है पैरामीट्रिकजिसके संबंध में इसके आवेदन की शर्त है सामान्य वितरणमिलान किए गए चर। यदि संकेतकों का सहसंबंध विश्लेषण करना आवश्यक है, जिनका वितरण सामान्य से भिन्न होता है, जिसमें क्रमसूचक पैमाने पर मापे गए संकेतक भी शामिल हैं, तो स्पीयरमैन के रैंक सहसंबंध गुणांक का उपयोग किया जाना चाहिए।
  5. निर्भरता और सहसंबंध की अवधारणाओं के बीच स्पष्ट रूप से अंतर करना आवश्यक है। मूल्यों की निर्भरता उनके बीच एक सहसंबंध की उपस्थिति निर्धारित करती है, लेकिन इसके विपरीत नहीं।

उदाहरण के लिए, एक बच्चे की वृद्धि उसकी उम्र पर निर्भर करती है, अर्थात बच्चा जितना बड़ा होता है, वह उतना ही लंबा होता है। यदि हम अलग-अलग उम्र के दो बच्चों को लेते हैं, तो उच्च स्तर की संभावना के साथ बड़े बच्चे की वृद्धि छोटे की तुलना में अधिक होगी। इस घटना को कहा जाता है लत, संकेतकों के बीच एक कारण संबंध को लागू करना। बेशक, भी हैं सह - संबंध, जिसका अर्थ है कि एक संकेतक में परिवर्तन दूसरे संकेतक में परिवर्तन के साथ होता है।

दूसरी स्थिति में, बच्चे के विकास और हृदय गति (एचआर) के बीच संबंध पर विचार करें। जैसा कि आप जानते हैं, ये दोनों मूल्य सीधे उम्र पर निर्भर हैं, इसलिए, ज्यादातर मामलों में, बड़े कद के बच्चों (और इसलिए, बड़े वाले) की हृदय गति कम होगी। वह है, सह - संबंधमनाया जाएगा और पर्याप्त रूप से उच्च जकड़न हो सकती है। हालाँकि, अगर हम बच्चों को लेते हैं समान आयु, लेकिन अलग ऊंचाई, तब, सबसे अधिक संभावना है, उनकी हृदय गति नगण्य रूप से भिन्न होगी, जिसके संबंध में हम यह निष्कर्ष निकाल सकते हैं आजादीवृद्धि से हृदय गति।

उपरोक्त उदाहरण से पता चलता है कि आँकड़ों में मौलिक अवधारणाओं के बीच अंतर करना कितना महत्वपूर्ण है सम्बन्धऔर निर्भरतासही निष्कर्ष निकालने के लिए संकेतक।

4. पियर्सन सहसंबंध गुणांक की गणना कैसे करें?

पियर्सन के सहसंबंध गुणांक की गणना निम्न सूत्र का उपयोग करके की जाती है:

5. पियर्सन सहसंबंध गुणांक के मान की व्याख्या कैसे करें?

पियर्सन सहसंबंध गुणांक के मूल्यों की व्याख्या इसके निरपेक्ष मूल्यों के आधार पर की जाती है। सहसंबंध गुणांक के संभावित मान 0 से ± 1 तक भिन्न होते हैं। r xy का निरपेक्ष मान जितना अधिक होगा, दो राशियों के बीच संबंध की निकटता उतनी ही अधिक होगी। r xy = 0 संबंध के पूर्ण अभाव को इंगित करता है। आर एक्सई = 1 - एक पूर्ण (कार्यात्मक) कनेक्शन की उपस्थिति को इंगित करता है। यदि पियर्सन सहसंबंध मानदंड का मान 1 से अधिक या -1 से कम निकला, तो गणना में त्रुटि हुई।

सहसंबंध की निकटता, या शक्ति का आकलन करने के लिए, आम तौर पर स्वीकृत मानदंडों का उपयोग किया जाता है, जिसके अनुसार r xy के पूर्ण मान< 0.3 свидетельствуют о कमज़ोरकनेक्शन, r xy मान 0.3 से 0.7 तक - कनेक्शन के बारे में मध्यजकड़न, r xy मान > 0.7 - o मज़बूतसम्बन्ध।

उपयोग करके सहसंबंध की ताकत का अधिक सटीक अनुमान प्राप्त किया जा सकता है चाडॉक टेबल:

श्रेणी आंकड़ों की महत्तासहसंबंध गुणांक r xy निम्न सूत्र द्वारा परिकलित t-परीक्षण का उपयोग करके किया जाता है:

प्राप्त मूल्य t r की तुलना महत्व के एक निश्चित स्तर पर महत्वपूर्ण मूल्य और स्वतंत्रता की डिग्री n-2 की संख्या से की जाती है। यदि t r t crit से अधिक है, तो पहचाने गए सहसंबंध के सांख्यिकीय महत्व के बारे में एक निष्कर्ष निकाला जाता है।

6. पियर्सन सहसंबंध गुणांक की गणना का एक उदाहरण

अध्ययन का उद्देश्य दो मात्रात्मक संकेतकों के बीच संबंध की जकड़न और सांख्यिकीय महत्व की पहचान करना था: रक्त में टेस्टोस्टेरोन का स्तर (X) और शरीर में मांसपेशियों का प्रतिशत (Y)। 5 विषयों (n = 5) के नमूने के लिए प्रारंभिक डेटा तालिका में संक्षेपित हैं।

वैज्ञानिक अनुसंधान में, परिणामी और कारक चर (फसल की उपज और वर्षा की मात्रा, लिंग और आयु, नाड़ी दर और शरीर के तापमान द्वारा सजातीय समूहों में किसी व्यक्ति की ऊंचाई और वजन) के बीच संबंध खोजना अक्सर आवश्यक हो जाता है। , वगैरह।)।

दूसरे वे संकेत हैं जो उनसे जुड़े लोगों (पहले) के परिवर्तन में योगदान करते हैं।

सहसंबंध विश्लेषण की अवधारणा

उपरोक्त के आधार पर हम कह सकते हैं कि सहसंबंध विश्लेषण दो या दो से अधिक चरों के सांख्यिकीय महत्व की परिकल्पना का परीक्षण करने के लिए उपयोग की जाने वाली एक विधि है, यदि शोधकर्ता उन्हें माप सकता है, लेकिन उन्हें बदल नहीं सकता है।

विचाराधीन अवधारणा की अन्य परिभाषाएँ हैं। सहसंबंध विश्लेषण एक प्रसंस्करण विधि है जो चर के बीच सहसंबंध गुणांक की जांच करती है। इस मामले में, एक जोड़ी या सुविधाओं के कई जोड़े के बीच सहसंबंध गुणांक की तुलना उनके बीच सांख्यिकीय संबंध स्थापित करने के लिए की जाती है। सहसंबंध विश्लेषण एक सख्त कार्यात्मक प्रकृति की वैकल्पिक उपस्थिति के साथ यादृच्छिक चर के बीच सांख्यिकीय निर्भरता का अध्ययन करने की एक विधि है, जिसमें एक यादृच्छिक चर की गतिशीलता दूसरे की गणितीय अपेक्षा की गतिशीलता की ओर ले जाती है।

झूठे सहसंबंध की अवधारणा

सहसंबंध विश्लेषण करते समय, यह ध्यान में रखा जाना चाहिए कि यह सुविधाओं के किसी भी सेट के संबंध में किया जा सकता है, जो अक्सर एक दूसरे के संबंध में बेतुका होता है। कभी-कभी उनका आपस में कोई कारणात्मक संबंध नहीं होता।

इस मामले में, एक नकली सहसंबंध की बात करता है।

सहसंबंध विश्लेषण की समस्याएं

उपरोक्त परिभाषाओं के आधार पर, हम वर्णित विधि के निम्नलिखित कार्यों को तैयार कर सकते हैं: दूसरे का उपयोग करके वांछित चरों में से एक के बारे में जानकारी प्राप्त करें; अध्ययन के तहत चर के बीच संबंध की निकटता का निर्धारण करें।

सहसंबंध विश्लेषण में अध्ययन की गई विशेषताओं के बीच संबंध का निर्धारण करना शामिल है, और इसलिए सहसंबंध विश्लेषण के कार्यों को निम्नलिखित के साथ पूरक किया जा सकता है:

  • परिणामी संकेत पर सबसे अधिक प्रभाव डालने वाले कारकों की पहचान;
  • संबंधों के पहले अज्ञात कारणों की पहचान;
  • इसके पैरामीट्रिक विश्लेषण के साथ एक सहसंबंध मॉडल का निर्माण;
  • संचार मापदंडों के महत्व और उनके अंतराल के अनुमान का अध्ययन।

प्रतिगमन के साथ सहसंबंध विश्लेषण का कनेक्शन

सहसंबंध विश्लेषण की विधि अक्सर अध्ययन की गई मात्राओं के बीच संबंध की निकटता का पता लगाने तक सीमित नहीं होती है। कभी-कभी इसे प्रतिगमन समीकरणों के संकलन द्वारा पूरक किया जाता है, जो एक ही नाम के विश्लेषण का उपयोग करके प्राप्त किए जाते हैं, और जो परिणामी और भाज्य (तथ्यात्मक) विशेषता(ओं) के बीच संबंध का विवरण हैं। यह विधि, विचाराधीन विश्लेषण के साथ मिलकर विधि का गठन करती है

विधि का उपयोग करने की शर्तें

परिणाम कारक एक या अधिक कारकों पर निर्भर करते हैं। प्रभावी और कारक संकेतकों (कारकों) के मूल्य पर बड़ी संख्या में अवलोकन होने पर सहसंबंध विश्लेषण की विधि का उपयोग किया जा सकता है, जबकि अध्ययन किए गए कारक मात्रात्मक और विशिष्ट स्रोतों में परिलक्षित होने चाहिए। पहला सामान्य कानून द्वारा निर्धारित किया जा सकता है - इस मामले में, पियर्सन सहसंबंध गुणांक सहसंबंध विश्लेषण का परिणाम है, या, यदि संकेत इस कानून का पालन नहीं करते हैं, तो स्पीयरमैन रैंक सहसंबंध गुणांक का उपयोग किया जाता है।

सहसंबंध विश्लेषण के कारकों के चयन के नियम

इस पद्धति को लागू करते समय, प्रदर्शन संकेतकों को प्रभावित करने वाले कारकों को निर्धारित करना आवश्यक है। उन्हें इस तथ्य को ध्यान में रखते हुए चुना गया है कि संकेतकों के बीच कारण संबंध होना चाहिए। एक बहुघटकीय सहसंबंध मॉडल बनाने के मामले में, जिनके परिणामी संकेतक पर महत्वपूर्ण प्रभाव पड़ता है, उनका चयन किया जाता है, जबकि सहसंबंध मॉडल में 0.85 से अधिक की जोड़ी सहसंबंध गुणांक के साथ अन्योन्याश्रित कारकों को शामिल नहीं करना बेहतर होता है, साथ ही उन जिसके लिए परिणामी पैरामीटर के साथ संबंध अप्रत्यक्ष या कार्यात्मक है।

परिणाम प्रदर्शित

सहसंबंध विश्लेषण के परिणाम पाठ और ग्राफिक रूपों में प्रस्तुत किए जा सकते हैं। पहले मामले में, उन्हें एक सहसंबंध गुणांक के रूप में प्रस्तुत किया जाता है, दूसरे में, स्कैटरप्लॉट के रूप में।

यदि मापदंडों के बीच कोई संबंध नहीं है, तो आरेख पर बिंदु यादृच्छिक रूप से स्थित होते हैं, कनेक्शन की औसत डिग्री को अधिक से अधिक क्रम की विशेषता होती है और माध्यिका से चिह्नित चिह्नों की अधिक या कम समान दूरी की विशेषता होती है। एक मजबूत कनेक्शन एक सीधी रेखा की ओर जाता है और r=1 पर स्कैटर प्लॉट एक सपाट रेखा है। एक व्युत्क्रम सहसंबंध को ऊपरी बाएँ से निचले दाएँ, एक प्रत्यक्ष - निचले बाएँ से ऊपरी दाएँ कोने तक ग्राफ़ की दिशा की विशेषता है।

स्कैटरप्लॉट (स्कैटरिंग) का 3डी प्रतिनिधित्व

पारंपरिक 2D स्कैटरप्लॉट प्रस्तुति के अलावा, वर्तमान में सहसंबंध विश्लेषण के 3D ग्राफ़िकल प्रतिनिधित्व का उपयोग किया जाता है।

एक स्कैटरप्लॉट मैट्रिक्स का भी उपयोग किया जाता है, जो मैट्रिक्स प्रारूप में एक ही आकृति में सभी युग्मित भूखंडों को प्रदर्शित करता है। n चर के लिए, मैट्रिक्स में n पंक्तियाँ और n स्तंभ होते हैं। i-th पंक्ति और j-th कॉलम के चौराहे पर स्थित आरेख Xj की तुलना में चर Xi का एक ग्राफ है। इस प्रकार प्रत्येक पंक्ति और स्तंभ एक आयाम है, एक एकल कक्ष दो आयामों का स्कैटरप्लॉट प्रदर्शित करता है।

कनेक्शन की जकड़न का अनुमान

सहसंबंध की मजबूती सहसंबंध गुणांक (आर) द्वारा निर्धारित की जाती है: मजबूत - आर = ± 0.7 से ± 1, मध्यम - आर = ± 0.3 से ± 0.699, कमजोर - आर = 0 से ± 0.299। यह वर्गीकरण सख्त नहीं है। आंकड़ा थोड़ा अलग योजना दिखाता है।

सहसंबंध विश्लेषण पद्धति को लागू करने का एक उदाहरण

ब्रिटेन में एक दिलचस्प अध्ययन किया गया। यह फेफड़ों के कैंसर के साथ धूम्रपान के संबंध को समर्पित है, और सहसंबंध विश्लेषण द्वारा किया गया था। यह अवलोकन नीचे प्रस्तुत किया गया है।

पियर्सन का सहसंबंध परीक्षण। प्रतिगमन और सहसंबंध मापदंडों का सांख्यिकीय महत्व

परिचय। 2

1. छात्र के एफ-टेस्ट का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व का मूल्यांकन। 3

2. छात्र के एफ-टेस्ट का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व की गणना। 6

निष्कर्ष। 15

प्रतिगमन समीकरण के निर्माण के बाद, इसके महत्व की जांच करना आवश्यक है: विशेष मानदंडों का उपयोग करके, यह निर्धारित करें कि क्या परिणामी निर्भरता, प्रतिगमन समीकरण द्वारा व्यक्त की गई है, यादृच्छिक है, अर्थात। क्या इसका उपयोग भविष्य कहनेवाला उद्देश्यों और कारक विश्लेषण के लिए किया जा सकता है। आँकड़ों में, विचरण के विश्लेषण और विशेष मानदंड (उदाहरण के लिए, एफ-मानदंड) की गणना का उपयोग करके प्रतिगमन गुणांक के महत्व के कठोर परीक्षण के लिए तरीके विकसित किए गए हैं। औसत सापेक्ष रैखिक विचलन (ई) की गणना करके एक गैर-सख्त जांच की जा सकती है, जिसे औसत सन्निकटन त्रुटि कहा जाता है:

अब हम प्रतिगमन गुणांक bj के महत्व का आकलन करने और प्रतिगमन मॉडल Py (J=l,2,..., p) के मापदंडों के लिए एक विश्वास अंतराल का निर्माण करने के लिए आगे बढ़ते हैं।

खंड 5 - छात्र के टी-टेस्ट के मूल्य द्वारा प्रतिगमन गुणांक के महत्व का आकलन। टा के परिकलित मूल्यों की तुलना स्वीकार्य मूल्य से की जाती है

ब्लॉक 5 - ^-मानदंड के मान द्वारा प्रतिगमन गुणांक के महत्व का आकलन। T0n के परिकलित मानों की तुलना स्वीकार्य मान 4,/ से की जाती है, जो किसी दिए गए त्रुटि संभाव्यता (a) और स्वतंत्रता की डिग्री (/) की संख्या के लिए t - वितरण की तालिका से निर्धारित होता है।

संपूर्ण मॉडल के महत्व की जांच करने के अलावा, छात्र / -टेस्ट का उपयोग करके प्रतिगमन गुणांक के महत्व का परीक्षण करना आवश्यक है। प्रतिगमन गुणांक bg का न्यूनतम मान शर्त bifob- ^t के अनुरूप होना चाहिए, जहां i-th कारक विशेषता के साथ प्राकृतिक पैमाने में प्रतिगमन समीकरण के गुणांक का मान है; अब। - प्रत्येक गुणांक का मूल माध्य वर्ग त्रुटि। गुणांक डी के उनके महत्व के संदर्भ में आपस में असंगति;

आगे के सांख्यिकीय विश्लेषण प्रतिगमन गुणांक के महत्व का परीक्षण करने से संबंधित हैं। ऐसा करने के लिए, हम प्रतिगमन गुणांकों के ^-मानदंड का मान ज्ञात करते हैं। उनकी तुलना के परिणामस्वरूप, सबसे छोटा टी-मानदंड निर्धारित किया जाता है। वह कारक जिसका गुणांक सबसे छोटे ^-मानदंड से मेल खाता है, उसे आगे के विश्लेषण से बाहर रखा गया है।

प्रतिगमन और सहसंबंध गुणांक के सांख्यिकीय महत्व का आकलन करने के लिए, प्रत्येक संकेतक के लिए छात्र के टी-परीक्षण और विश्वास अंतराल की गणना की जाती है। परिकल्पना लेकिन संकेतकों की यादृच्छिक प्रकृति के बारे में आगे रखा गया है, अर्थात। शून्य से उनके महत्वहीन अंतर के बारे में। छात्र के एफ-टेस्ट का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व का आकलन उनके मूल्यों की यादृच्छिक त्रुटि के परिमाण के साथ तुलना करके किया जाता है:

शुद्ध प्रतिगमन के गुणांकों के महत्व का अनुमान/-छात्र के मानदंड का उपयोग करके मूल्य की गणना के लिए कम किया जाता है

श्रम की गुणवत्ता एक विशेष श्रम की विशेषता है, जो अर्थव्यवस्था के विकास के लिए इसकी जटिलता, तनाव (तीव्रता), स्थितियों और महत्व की डिग्री को दर्शाती है। के.टी. एक टैरिफ प्रणाली के माध्यम से मापा जाता है जो योग्यता के स्तर (श्रम की जटिलता), स्थितियों, श्रम की गंभीरता और इसकी तीव्रता के साथ-साथ व्यक्तिगत उद्योगों और उद्योगों, क्षेत्रों के महत्व के आधार पर मजदूरी में अंतर करना संभव बनाता है। देश की अर्थव्यवस्था के विकास के लिए क्षेत्र। के.टी. श्रमिकों की मजदूरी में अभिव्यक्ति पाता है, जो श्रम आपूर्ति और मांग (श्रम के विशिष्ट प्रकार) के प्रभाव में श्रम बाजार में बनता है। के.टी. - जटिल संरचना

परियोजना के व्यक्तिगत आर्थिक, सामाजिक और पर्यावरणीय परिणामों के सापेक्ष महत्व के लिए प्राप्त अंक आगे वैकल्पिक परियोजनाओं की तुलना करने के लिए एक आधार प्रदान करते हैं और परियोजना ईसी के "सामाजिक और पर्यावरणीय-आर्थिक दक्षता के जटिल स्कोरिंग आयामहीन मानदंड" का उपयोग करके गणना की जाती है। (औसत महत्व स्कोर में) सूत्र के अनुसार

अंतर-उद्योग विनियमन उद्योग की किसी भी शाखा में श्रमिकों के लिए मजदूरी में अंतर प्रदान करता है, जो इस उद्योग में व्यक्तिगत प्रकार के उत्पादन के महत्व पर निर्भर करता है, काम की जटिलता और शर्तों पर, और मजदूरी के रूपों पर भी।

व्यक्तिगत संकेतकों के महत्व को ध्यान में रखे बिना बेंचमार्क उद्यम के संबंध में विश्लेषित उद्यम का प्राप्त रेटिंग स्कोर तुलनात्मक है। कई उद्यमों की रेटिंग की तुलना करते समय, उच्चतम रेटिंग प्राप्त तुलनात्मक मूल्यांकन के न्यूनतम मूल्य वाले उद्यम की होती है।

किसी उत्पाद की गुणवत्ता को उसकी उपयोगिता के माप के रूप में समझना उसके मापन के बारे में एक व्यावहारिक रूप से महत्वपूर्ण प्रश्न उठाता है। विशिष्ट आवश्यकता को पूरा करने में व्यक्तिगत गुणों के महत्व का अध्ययन करके इसका समाधान प्राप्त किया जाता है। उत्पाद की खपत की शर्तों के आधार पर भी एक ही संपत्ति का महत्व भिन्न हो सकता है। नतीजतन, इसके उपयोग की विभिन्न परिस्थितियों में माल की उपयोगिता अलग है।

काम का दूसरा चरण सांख्यिकीय आंकड़ों का अध्ययन और संकेतकों के संबंध और बातचीत की पहचान, व्यक्तिगत कारकों के महत्व का निर्धारण और सामान्य संकेतकों में बदलाव के कारण हैं।

विचाराधीन सभी संकेतकों को एक साथ लाया जाता है ताकि परिणाम उद्यम की गतिविधियों के सभी विश्लेषण किए गए पहलुओं का एक व्यापक मूल्यांकन हो, इसकी गतिविधि की स्थितियों को ध्यान में रखते हुए, विभिन्न संकेतकों के महत्व की डिग्री को ध्यान में रखते हुए। निवेशकों के प्रकार:

प्रतिगमन गुणांक प्रदर्शन संकेतक पर कारकों के प्रभाव की तीव्रता को दर्शाता है। यदि कारक संकेतकों का प्रारंभिक मानकीकरण किया गया है, तो b0 कुल मिलाकर प्रभावी संकेतक के औसत मूल्य के बराबर है। गुणांक b, b2 ..... bl दिखाते हैं कि प्रभावी संकेतक का स्तर कितनी इकाइयों को उसके औसत मूल्य से विचलित करता है यदि कारक संकेतक के मान एक मानक विचलन द्वारा शून्य के बराबर औसत से विचलित होते हैं। इस प्रकार, प्रतिगमन गुणांक प्रभावी संकेतक के स्तर को बढ़ाने के लिए व्यक्तिगत कारकों के महत्व की डिग्री को दर्शाता है। प्रतिगमन गुणांक के विशिष्ट मान कम से कम वर्ग विधि (सामान्य समीकरणों की प्रणाली को हल करने के परिणामस्वरूप) के अनुसार अनुभवजन्य डेटा से निर्धारित होते हैं।

2. छात्र के एफ-टेस्ट का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व की गणना

आइए बहुक्रियात्मक संबंधों के रैखिक रूप को न केवल सबसे सरल, बल्कि पीसी के लिए एप्लिकेशन सॉफ़्टवेयर पैकेज द्वारा प्रदान किए गए एक रूप के रूप में भी देखें। यदि एक परिणामी विशेषता के साथ एक व्यक्तिगत कारक का संबंध रैखिक नहीं है, तो कारक विशेषता के मान को बदलकर या परिवर्तित करके समीकरण को रेखीयकृत किया जाता है।

बहुघटकीय प्रतिगमन समीकरण का सामान्य रूप है:


जहाँ k कारक सुविधाओं की संख्या है।

समीकरण के मापदंडों (8.32) की गणना करने के लिए आवश्यक न्यूनतम वर्ग समीकरणों की प्रणाली को सरल बनाने के लिए, इन विशेषताओं के औसत मूल्यों से सभी विशेषताओं के व्यक्तिगत मूल्यों के विचलन को आमतौर पर पेश किया जाता है।

हमें k कम से कम वर्ग समीकरणों की एक प्रणाली मिलती है:

इस प्रणाली को हल करते हुए, हम सशर्त रूप से शुद्ध प्रतिगमन गुणांक b के मान प्राप्त करते हैं। समीकरण की मुक्त अवधि की गणना सूत्र द्वारा की जाती है


"सशर्त-शुद्ध प्रतिगमन गुणांक" शब्द का अर्थ है कि प्रत्येक मान bj इसके औसत मूल्य से परिणामी विशेषता के जनसंख्या औसत विचलन को मापता है जब दिया गया कारक xj इसके माप की प्रति इकाई औसत मूल्य से विचलित होता है और बशर्ते कि सभी प्रतिगमन समीकरण में शामिल अन्य कारक, औसत मूल्यों पर तय, बदलते नहीं हैं, भिन्न नहीं होते हैं।

इस प्रकार, जोड़ी प्रतिगमन के गुणांक के विपरीत, सशर्त-शुद्ध प्रतिगमन का गुणांक एक कारक के प्रभाव को मापता है, इस कारक की भिन्नता और अन्य कारकों की भिन्नता के बीच के संबंध को अलग करता है। यदि परिणामी विशेषता की भिन्नता को प्रभावित करने वाले सभी कारकों को प्रतिगमन समीकरण में शामिल करना संभव होगा, तो मान बीजे। कारकों के शुद्ध प्रभाव के उपाय माने जा सकते हैं। लेकिन चूंकि समीकरण में सभी कारकों को शामिल करना वास्तव में असंभव है, गुणांक बीजे। समीकरण में शामिल नहीं किए गए कारकों के प्रभाव के मिश्रण से मुक्त नहीं।

प्रतिगमन समीकरण में सभी कारकों को तीन कारणों में से एक के लिए या उन सभी के लिए एक साथ शामिल करना असंभव है, क्योंकि:

1) कुछ कारक आधुनिक विज्ञान के लिए अज्ञात हो सकते हैं, किसी भी प्रक्रिया का ज्ञान हमेशा अधूरा होता है;

2) ज्ञात सैद्धांतिक कारकों के बारे में कोई जानकारी नहीं है या यह अविश्वसनीय है;

3) अध्ययन की गई आबादी (नमूना) का आकार सीमित है, जो आपको प्रतिगमन समीकरण में सीमित संख्या में कारकों को शामिल करने की अनुमति देता है।

सशर्त रूप से शुद्ध प्रतिगमन बीजे के गुणांक। नामित संख्याएं हैं, माप की विभिन्न इकाइयों में व्यक्त की जाती हैं, और इसलिए एक दूसरे के साथ अतुलनीय हैं। उन्हें तुलनीय सापेक्ष संकेतकों में बदलने के लिए, जोड़ी सहसंबंध गुणांक प्राप्त करने के लिए उसी परिवर्तन को लागू किया जाता है। परिणामी मूल्य को मानकीकृत प्रतिगमन गुणांक या?-गुणांक कहा जाता है।


कारक xj पर गुणांक कारक xj की भिन्नता के प्रभाव की डिग्री को प्रभावी विशेषता y की भिन्नता पर निर्धारित करता है जब प्रतिगमन समीकरण में शामिल अन्य कारकों को सहवर्ती भिन्नता से दूर ले जाया जाता है।

संचार के सापेक्ष तुलनीय संकेतकों, लोच गुणांक के रूप में सशर्त रूप से शुद्ध प्रतिगमन के गुणांक को व्यक्त करना उपयोगी है:

कारक xj की लोच का गुणांक इंगित करता है कि यदि इस कारक का मान इसके औसत मूल्य से 1% से विचलित होता है और यदि समीकरण में शामिल अन्य कारकों को ध्यान में रखा जाता है, तो परिणामी विशेषता अपने औसत मूल्य से ej प्रतिशत से विचलित हो जाएगी वाई अधिक बार, लोच गुणांक की व्याख्या और गतिशीलता के संदर्भ में लागू की जाती है: कारक x में इसके औसत मूल्य के 1% की वृद्धि के साथ, परिणामी विशेषता इसके औसत मूल्य के ई. प्रतिशत से बढ़ जाएगी।

समान 16 फार्मों (तालिका 8.1) के उदाहरण पर बहुभिन्नरूपी प्रतिगमन समीकरण की गणना और व्याख्या पर विचार करें। प्रभावी विशेषता सकल आय का स्तर है और इसे प्रभावित करने वाले तीन कारक तालिका में प्रस्तुत किए गए हैं। 8.7।

एक बार फिर से याद करें कि विश्वसनीय और पर्याप्त रूप से सटीक सहसंबंध संकेतक प्राप्त करने के लिए एक बड़ी आबादी की जरूरत है।


तालिका 8.7

सकल आय स्तर और उसके कारक

खेत संख्या

सकल आय, रगड़./आरए

श्रम लागत, मानव-दिन/हेक्टेयर X1

कृषि योग्य भूमि का हिस्सा

प्रति गाय दुग्ध उत्पादन,

तालिका 8.8 समाश्रयण समीकरण के संकेतक

आश्रित चर: वाई

प्रतिगमन गुणांक

लगातार -240,112905

एसटीडी। अनुमान की त्रुटि। = 79.243276


पीसी के लिए "माइक्रोस्टैट" कार्यक्रम का उपयोग करके समाधान किया गया था। यहाँ प्रिंटआउट से तालिकाएँ हैं: टैब। 8.7 सभी विशेषताओं का औसत मान और मानक विचलन देता है। टैब। 8.8 में प्रतिगमन गुणांक और उनका संभाव्य अनुमान शामिल है:

पहला स्तंभ "var" - चर, अर्थात कारक; दूसरा स्तंभ "प्रतिगमन गुणांक" - सशर्त रूप से शुद्ध प्रतिगमन बीजे के गुणांक; तीसरा कॉलम "एसटीडी। त्रुटि" - प्रतिगमन गुणांक के अनुमानों की त्रुटियां; चौथा स्तंभ - भिन्नता की स्वतंत्रता के 12 डिग्री पर छात्र के टी-टेस्ट के मान; पाँचवाँ स्तंभ "समस्या" - प्रतिगमन गुणांक के संबंध में शून्य परिकल्पना की संभावना;

छठा स्तंभ "आंशिक आर 2" - दृढ़ संकल्प के आंशिक गुणांक। कॉलम 3-6 में संकेतकों की गणना के लिए सामग्री और कार्यप्रणाली पर अध्याय 8 में आगे चर्चा की गई है। "स्थिर" - प्रतिगमन समीकरण का एक मुक्त शब्द; "एसटीडी। एस्ट की त्रुटि।" - प्रतिगमन समीकरण के अनुसार प्रभावी सुविधा के मूल्यांकन की जड़-माध्य-वर्ग त्रुटि। एकाधिक प्रतिगमन समीकरण प्राप्त किया गया था:

वाई \u003d 2.26x1 - 4.31x2 + 0.166x3 - 240।

इसका मतलब यह है कि प्रति हेक्टेयर कृषि भूमि की सकल आय का मूल्य औसतन 2.26 रूबल की वृद्धि हुई है। श्रम लागत में 1 घंटे/हेक्टेयर की वृद्धि के साथ; औसतन 4.31 रूबल की कमी आई। कृषि योग्य भूमि के हिस्से में 1% की वृद्धि और 0.166 रूबल की वृद्धि के साथ। प्रति गाय दूध उत्पादन में 1 किग्रा. मुक्त अवधि का नकारात्मक मूल्य काफी स्वाभाविक है, और, जैसा कि पहले ही पैरा 8.2 में उल्लेख किया गया है, प्रभावी विशेषता - सकल आय कारकों के शून्य मूल्यों तक पहुंचने से बहुत पहले शून्य हो जाती है, जो उत्पादन में असंभव है।

x ^ पर गुणांक का नकारात्मक मूल्य अध्ययन किए गए खेतों की अर्थव्यवस्था में महत्वपूर्ण परेशानी का संकेत है, जहां फसल उत्पादन लाभहीन है, और केवल पशुपालन लाभदायक है। खेती के तर्कसंगत तरीकों और सभी उद्योगों के उत्पादों के लिए सामान्य कीमतों (संतुलन या उनके करीब) के साथ, आय में कमी नहीं होनी चाहिए, लेकिन कृषि भूमि - कृषि योग्य भूमि में सबसे उपजाऊ हिस्से में वृद्धि के साथ वृद्धि होनी चाहिए।

तालिका की अंतिम दो पंक्तियों के डेटा के आधार पर। 8.7 और टैब। 8.8 सूत्र (8.34) और (8.35) के अनुसार पी-गुणांक और लोच गुणांक की गणना करें।

आय के स्तर में भिन्नता और गतिकी में इसके संभावित परिवर्तन दोनों ही कारक x3 - गायों की उत्पादकता और सबसे कमजोर - x2 - कृषि योग्य भूमि के हिस्से से सबसे अधिक प्रभावित होते हैं। Р2/ के मूल्यों का भविष्य में उपयोग किया जाएगा (तालिका 8.9);

तालिका 8.9 आय स्तर पर कारकों का तुलनात्मक प्रभाव

कारक एक्स जे


तो, हमने यह प्राप्त किया है कि कारक xj का गुणांक इस कारक की लोच के गुणांक को संदर्भित करता है, कारक की भिन्नता के गुणांक के रूप में प्रभावी विशेषता की भिन्नता के गुणांक के रूप में। चूंकि, जैसा कि तालिका की अंतिम पंक्ति से देखा जा सकता है। 8.7, सभी कारकों की भिन्नता के गुणांक परिणामी विशेषता की भिन्नता के गुणांक से कम हैं; सभी ?-गुणांक प्रत्यास्थता गुणांक से कम होते हैं।

-सी कारक के उदाहरण का उपयोग करके युग्मित और सशर्त रूप से शुद्ध प्रतिगमन गुणांक के बीच संबंध पर विचार करें। y और x के बीच संबंध के युग्मित रैखिक समीकरण का रूप है:

वाई = 3.886x1 - 243.2

X1 पर सशर्त रूप से शुद्ध प्रतिगमन गुणांक युग्मित का केवल 58% है। शेष 42% इस तथ्य के कारण हैं कि x1 भिन्नता x2 x3 कारक भिन्नता के साथ है, जो बदले में परिणामी विशेषता को प्रभावित करती है। सभी विशेषताओं के संबंध और उनके जोड़ीदार प्रतिगमन गुणांक संबंध ग्राफ (चित्र 8.2) पर प्रस्तुत किए गए हैं।


यदि हम y पर x1 भिन्नता के प्रत्यक्ष और अप्रत्यक्ष प्रभाव के अनुमानों को जोड़ते हैं, यानी, सभी "पथों" (चित्र 8.2) के लिए युग्मित प्रतिगमन गुणांक का उत्पाद, हमें मिलता है: 2.26 + 12.55 0.166 + (-0.00128) ) (-4.31) + (-0.00128) 17.00 0.166 = 4.344।

यह मान y के साथ युग्मित युग्मन गुणांक x1 से भी अधिक है। इसलिए, समीकरण में शामिल नहीं किए गए संकेतों-कारकों के माध्यम से x1 भिन्नता का अप्रत्यक्ष प्रभाव विपरीत है, कुल मिलाकर:

1 अयवाज़्यन एस.ए., मुख्तार्यान वी.एस. अनुप्रयुक्त सांख्यिकी और अर्थमिति के मूल सिद्धांत। हाई स्कूल के लिए पाठ्यपुस्तक। - एम .: यूनिटी, 2008, - 311पी।

2 जॉनसन जे अर्थमितीय तरीके। - एम .: सांख्यिकी, 1980,। - 282s।

3 डौघर्टी के. अर्थमिति का परिचय। - एम .: इंफ्रा-एम, 2004, - 354 पी।

4 ड्रेयर एन., स्मिथ जी., एप्लाइड रिग्रेशन एनालिसिस। - एम .: वित्त और सांख्यिकी, 2006, - 191।

5 मैग्नस या.आर., कार्तिशेव पी.के., पेरेसेट्स्की ए.ए. अर्थमिति। प्रारंभिक पाठ्यक्रम।-एम।: डेलो, 2006, - 259पी।

अर्थमिति / एड पर 6 कार्यशाला। I.I.Eliseeva.- एम .: वित्त और सांख्यिकी, 2004, - 248p।

7 अर्थमिति / एड। आई.आई.एलिसेवा।- एम।: वित्त और सांख्यिकी, 2004, - 541पी।

8 क्रेमर एन., पुटको बी. इकोनोमेट्रिक्स.- एम.: यूनिटी-दाना, 200, - 281पी।


अयवज़्यान एस.ए., मुख्तार्यान वी.एस. अनुप्रयुक्त सांख्यिकी और अर्थमिति के मूल सिद्धांत। हाई स्कूल के लिए पाठ्यपुस्तक। - एम.: यूनिटी, 2008,–पी। 23.

क्रेमर एन., पुटको बी. इकोनोमेट्रिक्स.- एम.: यूनिटी-डाना, 200, -पी.64

ड्रेयर एन., स्मिथ जी., एप्लाइड रिग्रेशन एनालिसिस। - एम.: वित्त और सांख्यिकी, 2006, - पृ.57।

अर्थमिति / एड पर कार्यशाला। आई.आई. एलिसेवा। - एम।: वित्त और सांख्यिकी, 2004, -पी। 172।

सहसंबंध विश्लेषण के लिए प्रारंभिक डेटा

पेशेवर समूह

नश्वरता

किसान, वनवासी और मछुआरे

खनिक और खदान कार्यकर्ता

गैस, कोक और रसायनों के निर्माता

ग्लास और सिरेमिक निर्माता

भट्टियों, फोर्ज, फाउंड्री और रोलिंग मिलों में काम करने वाले

इलेक्ट्रिकल और इलेक्ट्रॉनिक्स कर्मचारी

इंजीनियरिंग और संबंधित पेशे

लकड़ी का उत्पादन

चर्मकार

कपड़ा मजदूर

वर्कवियर निर्माता

खाद्य, पेय और तंबाकू उद्योग में श्रमिक

कागज और छपाई के निर्माता

अन्य उत्पादों के निर्माता

बिल्डर्स

कलाकार और सज्जाकार

स्थिर इंजन, क्रेन आदि के चालक।

श्रमिकों को अन्यत्र शामिल नहीं किया गया है

परिवहन और संचार कार्यकर्ता

गोदाम के कर्मचारी, स्टोरकीपर, पैकर्स और फिलिंग मशीन के कर्मचारी

कार्यालयीन कर्मचारी

सेलर्स

खेल और मनोरंजन सेवा कार्यकर्ता

प्रशासक और प्रबंधक

पेशेवर, तकनीशियन और कलाकार

हम सहसंबंध विश्लेषण शुरू करते हैं। एक ग्राफिकल विधि के साथ स्पष्टता के लिए समाधान शुरू करना बेहतर है, जिसके लिए हम एक स्कैटर (स्कैटर) डायग्राम बनाएंगे।

वह सीधा संबंध दिखाती है। हालाँकि, अकेले चित्रमय पद्धति के आधार पर एक स्पष्ट निष्कर्ष निकालना मुश्किल है। इसलिए, हम सहसंबंध विश्लेषण करना जारी रखेंगे। सहसंबंध गुणांक की गणना का एक उदाहरण नीचे दिखाया गया है।

सॉफ़्टवेयर टूल का उपयोग करना (एमएस एक्सेल के उदाहरण पर, इसे नीचे वर्णित किया जाएगा), हम सहसंबंध गुणांक निर्धारित करते हैं, जो 0.716 है, जिसका अर्थ है अध्ययन किए गए मापदंडों के बीच एक मजबूत संबंध। आइए हम संबंधित तालिका के अनुसार प्राप्त मूल्य के सांख्यिकीय महत्व को निर्धारित करते हैं, जिसके लिए हमें 25 जोड़े मूल्यों में से 2 घटाना होगा, परिणामस्वरूप हमें 23 मिलते हैं और तालिका में इस पंक्ति के लिए हम p = 0.01 के लिए r महत्वपूर्ण पाते हैं। (चूंकि ये मेडिकल डेटा हैं, एक अधिक सख्त निर्भरता, अन्य मामलों में p=0.05 पर्याप्त है), जो इस सहसंबंध विश्लेषण के लिए 0.51 है। उदाहरण ने प्रदर्शित किया कि परिकलित r महत्वपूर्ण r से अधिक है, सहसंबंध गुणांक का मान सांख्यिकीय रूप से महत्वपूर्ण माना जाता है।

सहसंबंध विश्लेषण में सॉफ्टवेयर का उपयोग

वर्णित प्रकार के सांख्यिकीय डेटा प्रोसेसिंग सॉफ्टवेयर का उपयोग करके किया जा सकता है, विशेष रूप से, एमएस एक्सेल। सहसंबंध में कार्यों का उपयोग करके निम्नलिखित पैरामीटरों की गणना शामिल है:

1. सहसंबंध गुणांक कोरल फ़ंक्शन (सरणी1; सरणी2) का उपयोग करके निर्धारित किया जाता है। Array1,2 परिणामी और कारक चर के मानों की श्रेणी का एक कक्ष है।

रैखिक सहसंबंध गुणांक को पियर्सन सहसंबंध गुणांक भी कहा जाता है, और इसलिए, एक्सेल 2007 से शुरू करके, आप उसी सरणियों के साथ फ़ंक्शन का उपयोग कर सकते हैं।

एक्सेल में सहसंबंध विश्लेषण का चित्रमय प्रदर्शन "स्कैटर प्लॉट" चयन के साथ "चार्ट" पैनल का उपयोग करके किया जाता है।

प्रारंभिक डेटा निर्दिष्ट करने के बाद, हमें एक ग्राफ मिलता है।

2. छात्र के टी-टेस्ट का उपयोग करके जोड़ी सहसंबंध गुणांक के महत्व का मूल्यांकन। टी-मानदंड के परिकलित मूल्य की तुलना इस सूचक के सारणीबद्ध (महत्वपूर्ण) मूल्य के साथ विचाराधीन पैरामीटर के मूल्यों की संगत तालिका से की जाती है, दिए गए महत्व के स्तर और स्वतंत्रता की डिग्री की संख्या को ध्यान में रखते हुए। यह अनुमान STUDIV(probability; Degree_of_freedom) फ़ंक्शन का उपयोग करके किया जाता है।

3. जोड़ी सहसंबंध गुणांक का मैट्रिक्स। विश्लेषण "डेटा विश्लेषण" उपकरण का उपयोग करके किया जाता है, जिसमें "सहसंबंध" का चयन किया जाता है। जोड़ी सहसंबंध गुणांक का सांख्यिकीय मूल्यांकन इसके पूर्ण मूल्य की सारणीबद्ध (महत्वपूर्ण) मूल्य के साथ तुलना करके किया जाता है। जब परिकलित जोड़ी सहसंबंध गुणांक उस महत्वपूर्ण एक से अधिक हो जाता है, तो हम कह सकते हैं कि संभाव्यता की दी गई डिग्री को ध्यान में रखते हुए, कि रैखिक संबंध के महत्व के बारे में अशक्त परिकल्पना को अस्वीकार नहीं किया जाता है।

आखिरकार

वैज्ञानिक अनुसंधान में सहसंबंध विश्लेषण की विधि का उपयोग विभिन्न कारकों और प्रदर्शन संकेतकों के बीच संबंध निर्धारित करना संभव बनाता है। उसी समय, यह ध्यान में रखा जाना चाहिए कि एक बेतुका जोड़ी या डेटा के सेट से एक उच्च सहसंबंध गुणांक भी प्राप्त किया जा सकता है, और इसलिए इस प्रकार का विश्लेषण पर्याप्त रूप से बड़े डेटा सरणी पर किया जाना चाहिए।

R का परिकलित मान प्राप्त करने के बाद, एक निश्चित मूल्य के सांख्यिकीय महत्व की पुष्टि करने के लिए r महत्वपूर्ण के साथ इसकी तुलना करना वांछनीय है। सहसंबंध विश्लेषण विशेष रूप से एमएस एक्सेल में सूत्रों का उपयोग करके या सॉफ्टवेयर टूल का उपयोग करके मैन्युअल रूप से किया जा सकता है। यहां आप सहसंबंध विश्लेषण के अध्ययन किए गए कारकों और परिणामी विशेषता के बीच संबंधों के दृश्य प्रतिनिधित्व के उद्देश्य से एक स्कैटर (स्कैटर) आरेख भी बना सकते हैं।

जैसा कि बार-बार नोट किया गया है, अध्ययन के तहत चर के बीच सहसंबंध की उपस्थिति या अनुपस्थिति के बारे में एक सांख्यिकीय निष्कर्ष के लिए, नमूना सहसंबंध गुणांक के महत्व की जांच करना आवश्यक है। इस तथ्य के कारण कि सहसंबंध गुणांक सहित सांख्यिकीय विशेषताओं की विश्वसनीयता, नमूना आकार पर निर्भर करती है, ऐसी स्थिति उत्पन्न हो सकती है जब सहसंबंध गुणांक का मूल्य पूरी तरह से नमूने में यादृच्छिक उतार-चढ़ाव के कारण होगा जिसके आधार पर यह है गणना की। चर के बीच एक महत्वपूर्ण संबंध के साथ, सहसंबंध गुणांक शून्य से महत्वपूर्ण रूप से भिन्न होना चाहिए। यदि अध्ययन किए गए चरों के बीच कोई संबंध नहीं है, तो सामान्य जनसंख्या ρ का सहसंबंध गुणांक शून्य के बराबर है। व्यावहारिक अध्ययन में, एक नियम के रूप में, वे चयनात्मक टिप्पणियों पर आधारित होते हैं। किसी भी सांख्यिकीय विशेषता की तरह, नमूना सहसंबंध गुणांक एक यादृच्छिक चर है, अर्थात, इसके मान एक ही नाम की सामान्य आबादी के पैरामीटर के आसपास बेतरतीब ढंग से बिखरे हुए हैं (सहसंबंध गुणांक का सही मूल्य)। चरों के बीच सहसंबंध के अभाव में वाई और एक्ससामान्य आबादी में सहसंबंध गुणांक शून्य है। लेकिन बिखरने की यादृच्छिक प्रकृति के कारण, ऐसी स्थितियाँ मौलिक रूप से संभव हैं जब इस जनसंख्या के नमूनों से गणना किए गए कुछ सहसंबंध गुणांक शून्य से भिन्न होंगे।

क्या देखे गए अंतरों को नमूने में यादृच्छिक उतार-चढ़ाव के लिए जिम्मेदार ठहराया जा सकता है, या क्या वे चर के बीच संबंधों के गठन के लिए स्थितियों में महत्वपूर्ण बदलाव को दर्शाते हैं? यदि नमूना सहसंबंध गुणांक के मान सूचक की यादृच्छिक प्रकृति के कारण बिखराव क्षेत्र में आते हैं, तो यह कनेक्शन की अनुपस्थिति का प्रमाण नहीं है। इस मामले में सबसे ज्यादा यही कहा जा सकता है कि अवलोकन डेटा चर के बीच संबंध की अनुपस्थिति से इनकार नहीं करता है। लेकिन अगर नमूना सहसंबंध गुणांक का मान उल्लिखित स्कैटर ज़ोन के बाहर है, तो यह निष्कर्ष निकाला जाता है कि यह शून्य से काफी अलग है, और हम यह मान सकते हैं कि चर के बीच वाई और एक्ससांख्यिकीय रूप से महत्वपूर्ण संबंध है। विभिन्न आँकड़ों के वितरण के आधार पर इस समस्या को हल करने के लिए प्रयुक्त कसौटी को सार्थकता कसौटी कहा जाता है।

महत्व परीक्षण प्रक्रिया शून्य परिकल्पना के निर्माण के साथ शुरू होती है एच0 . सामान्य शब्दों में, यह इस तथ्य में निहित है कि नमूना पैरामीटर और जनसंख्या पैरामीटर के बीच कोई महत्वपूर्ण अंतर नहीं है। वैकल्पिक परिकल्पना एच1 यह है कि इन मापदंडों के बीच महत्वपूर्ण अंतर हैं। उदाहरण के लिए, जनसंख्या में सहसंबंध के लिए परीक्षण करते समय, शून्य परिकल्पना यह है कि वास्तविक सहसंबंध गुणांक शून्य है ( एच0: ρ = 0)। यदि, परीक्षण के परिणामस्वरूप, यह पता चलता है कि शून्य परिकल्पना स्वीकार्य नहीं है, तो नमूना सहसंबंध गुणांक आरबहुत खूबशून्य से महत्वपूर्ण रूप से भिन्न (शून्य परिकल्पना को अस्वीकार कर दिया जाता है और विकल्प को स्वीकार कर लिया जाता है) एच1).दूसरे शब्दों में, सामान्य आबादी में असंबद्ध यादृच्छिक चर की धारणा को अनुचित माना जाना चाहिए। इसके विपरीत, यदि महत्व परीक्षण के आधार पर, शून्य परिकल्पना को स्वीकार किया जाता है, अर्थात आरबहुत खूबयादृच्छिक फैलाव के स्वीकार्य क्षेत्र में स्थित है, तो सामान्य आबादी में असंबद्ध चर की धारणा को संदिग्ध मानने का कोई कारण नहीं है।

एक महत्व परीक्षण में, शोधकर्ता एक महत्व स्तर α स्थापित करता है जो कुछ व्यावहारिक विश्वास देता है कि गलत निष्कर्ष बहुत दुर्लभ मामलों में ही निकाले जाएंगे। सार्थकता स्तर शून्य परिकल्पना की संभावना को व्यक्त करता है एच0उस समय खारिज कर दिया जब यह वास्तव में सच था। यह स्पष्ट है कि इस संभाव्यता को यथासंभव छोटा चुनना समझ में आता है।

नमूना विशेषता के वितरण को ज्ञात होने दें, जो कि जनसंख्या पैरामीटर का एक निष्पक्ष अनुमान है। चयनित महत्व स्तर α इस वितरण के वक्र के अंतर्गत छायांकित क्षेत्रों से मेल खाता है (चित्र 24 देखें)। वितरण वक्र के अंतर्गत अछायांकित क्षेत्र संभाव्यता को परिभाषित करता है पी = 1-α . छायांकित क्षेत्रों के तहत भुज अक्ष पर खंडों की सीमाओं को महत्वपूर्ण मान कहा जाता है, और खंड स्वयं महत्वपूर्ण क्षेत्र या परिकल्पना अस्वीकृति का क्षेत्र बनाते हैं।

परिकल्पना परीक्षण प्रक्रिया में, अवलोकनों के परिणामों से गणना की गई नमूना विशेषता की तुलना संबंधित महत्वपूर्ण मूल्य से की जाती है। इस मामले में, एक तरफा और दो तरफा महत्वपूर्ण क्षेत्रों के बीच अंतर करना चाहिए। महत्वपूर्ण क्षेत्र को निर्दिष्ट करने का रूप एक सांख्यिकीय अध्ययन में समस्या के निर्माण पर निर्भर करता है। एक दो तरफा महत्वपूर्ण क्षेत्र आवश्यक है, जब नमूना पैरामीटर और जनसंख्या पैरामीटर की तुलना करते समय, उनके बीच विसंगति के पूर्ण मूल्य का अनुमान लगाना आवश्यक है, अर्थात, अध्ययन किए गए मूल्यों के बीच सकारात्मक और नकारात्मक दोनों अंतर रुचि के हैं . जब यह सुनिश्चित करना आवश्यक हो जाता है कि एक मान औसत रूप से दूसरे से अधिक या कम है, एक तरफा महत्वपूर्ण क्षेत्र (दाएं- या बाएं हाथ) का उपयोग किया जाता है। यह बिल्कुल स्पष्ट है कि समान महत्वपूर्ण मूल्य के लिए एक तरफा महत्वपूर्ण क्षेत्र का उपयोग करते समय महत्व का स्तर दो तरफा एक का उपयोग करते समय कम होता है। यदि नमूना विशेषता का वितरण सममित है,

चावल। 24. अशक्त परिकल्पना H0 का परीक्षण

तब दो तरफा महत्वपूर्ण क्षेत्र के महत्व का स्तर α के बराबर होता है, और एक तरफा के महत्व का स्तर होता है (चित्र 24 देखें)। हम खुद को समस्या के सामान्य सूत्रीकरण तक ही सीमित रखते हैं। सांख्यिकीय परिकल्पनाओं के परीक्षण के लिए सैद्धांतिक औचित्य पर अधिक जानकारी विशेष साहित्य में पाई जा सकती है। इसके अलावा, हम केवल उनके निर्माण पर ध्यान दिए बिना, विभिन्न प्रक्रियाओं के लिए महत्व मानदंड का संकेत देंगे।

जोड़ी सहसंबंध गुणांक के महत्व की जाँच करके, अध्ययन की गई घटनाओं के बीच सहसंबंध की उपस्थिति या अनुपस्थिति स्थापित की जाती है। कनेक्शन के अभाव में, सामान्य जनसंख्या का सहसंबंध गुणांक शून्य (ρ = 0) के बराबर होता है। सत्यापन प्रक्रिया अशक्त और वैकल्पिक परिकल्पनाओं के निर्माण के साथ शुरू होती है:

एच0: नमूना सहसंबंध गुणांक के बीच अंतर आर और ρ = 0 नगण्य है,

एच 1: के बीच अंतर आरऔर ρ = 0 महत्वपूर्ण है, और इसलिए, चर के बीच परऔर एक्समहत्वपूर्ण संबंध है। यह वैकल्पिक परिकल्पना से अनुसरण करता है कि किसी को दो तरफा महत्वपूर्ण क्षेत्र का उपयोग करना चाहिए।

खंड 8.1 में यह पहले ही उल्लेख किया गया था कि नमूना सहसंबंध गुणांक, कुछ मान्यताओं के तहत, एक यादृच्छिक चर के साथ जुड़ा हुआ है टी, छात्र के वितरण का पालन करना एफ = एन- स्वतंत्रता की 2 डिग्री। नमूने के परिणामों से आँकड़ों की गणना

किसी दिए गए महत्व स्तर α पर छात्र की वितरण तालिका से निर्धारित महत्वपूर्ण मूल्य की तुलना में औरएफ = एन- स्वतंत्रता की 2 डिग्री। मानदंड लागू करने का नियम इस प्रकार है: यदि | टी| >tf,ए, फिर महत्व स्तर α पर अशक्त परिकल्पना अस्वीकृत, अर्थात चर के बीच संबंध महत्वपूर्ण है; अगर | टी| ≤tf,ए, तो महत्व स्तर α पर शून्य परिकल्पना स्वीकार की जाती है। मूल्य विचलन आर ρ = 0 से यादृच्छिक भिन्नता के लिए जिम्मेदार ठहराया जा सकता है। ये नमूने विचाराधीन परिकल्पना को बहुत संभव और प्रशंसनीय बताते हैं, यानी, कनेक्शन की अनुपस्थिति की परिकल्पना आपत्तिजनक नहीं है।

आँकड़ों के बजाय एक परिकल्पना के परीक्षण की प्रक्रिया बहुत सरल है टीसहसंबंध गुणांक के महत्वपूर्ण मूल्यों का उपयोग करें, जिसे (8.38) में प्रतिस्थापित करके छात्र के वितरण की मात्रा के संदर्भ में निर्धारित किया जा सकता है। टी= tf, एक और आर= ρ एफ, ए:

(8.39)

महत्वपूर्ण मूल्यों की विस्तृत तालिकाएँ हैं, जिसका एक अंश इस पुस्तक के परिशिष्ट में दिया गया है (तालिका 6 देखें)। इस मामले में परिकल्पना के परीक्षण का नियम इस प्रकार है: यदि आर> ρ एफ, ए, तो हम यह दावा कर सकते हैं कि चर के बीच संबंध महत्वपूर्ण है। अगर आरआरएफ,ए, तब अवलोकनों के परिणामों को एक संबंध की अनुपस्थिति की परिकल्पना के अनुरूप माना जाता है।

; ; .

अब आइए नमूना मानक विचलन के मूल्यों की गणना करें:

https://pandia.ru/text/78/148/images/image443_0.gif" width="413" height="60 src=">.

दसवीं कक्षा के छात्रों के स्तर के बीच सहसंबंध, गणित में उपलब्धि का औसत स्तर जितना अधिक होगा, और इसके विपरीत।

2. सहसंबंध गुणांक के महत्व की जाँच करना

चूंकि नमूना गुणांक की गणना नमूना डेटा से की जाती है, यह एक यादृच्छिक चर है . यदि , तो सवाल उठता है: क्या यह और चौड़ाई = "27" ऊंचाई = "25"> के बीच वास्तव में मौजूदा रैखिक संबंध के कारण है: (यदि सहसंबंध चिह्न ज्ञात नहीं है); या एकतरफा https://pandia.ru/text/78/148/images/image448_0.gif" width="43" height="23 src=">.gif" width="43" height="23 src ="> (यदि सहसंबंध का संकेत पूर्व निर्धारित किया जा सकता है)।

विधि 1।परिकल्पना का परीक्षण करने के लिए, हम उपयोग करते हैं https://pandia.ru/text/78/148/images/image150_1.gif" width="11" height="17 src=">-सूत्र के अनुसार छात्र की परीक्षा

https://pandia.ru/text/78/148/images/image406_0.gif" चौड़ाई="13" ऊंचाई="15">.gif" चौड़ाई="36 ऊंचाई=25" ऊंचाई="25">.gif "चौड़ाई="17" ऊंचाई="16"> और दो तरफा परीक्षण के लिए स्वतंत्रता की डिग्री की संख्या।

महत्वपूर्ण क्षेत्र असमानता द्वारा दिया जाता है .

अगर https://pandia.ru/text/78/148/images/image455_0.gif" width="99" height="29 src=">, तो शून्य परिकल्पना खारिज कर दी जाती है। हम निष्कर्ष निकालते हैं:

§ दो तरफा वैकल्पिक परिकल्पना के लिए - सहसंबंध गुणांक शून्य से काफी अलग है;

§ एकतरफा परिकल्पना के लिए, सांख्यिकीय रूप से महत्वपूर्ण सकारात्मक (या नकारात्मक) सहसंबंध होता है।

विधि 2।आप भी उपयोग कर सकते हैं सहसंबंध गुणांक के महत्वपूर्ण मूल्यों की तालिका, जिससे हम स्वतंत्रता की डिग्री की संख्या से सहसंबंध गुणांक के महत्वपूर्ण मूल्य का मूल्य पाते हैं https://pandia.ru/text/78/148/images/image367_1.gif" width="17 height=16" ऊँचाई = "16">।

अगर https://pandia.ru/text/78/148/images/image459_0.gif" width="101" height="29 src=">, तो यह निष्कर्ष निकाला गया है कि सहसंबंध गुणांक 0 से काफी अलग है और सांख्यिकीय रूप से महत्वपूर्ण सहसंबंध है.

तो, कुछ घटनाएँ एक साथ हो सकती हैं, लेकिन एक दूसरे से स्वतंत्र (संयुक्त घटनाएँ) होती हैं या बदलती हैं ( असत्यप्रतिगमन)। अन्य - एक दूसरे के साथ नहीं, बल्कि एक अधिक जटिल कारण संबंध के अनुसार एक कारण संबंध में होना ( अप्रत्यक्षप्रतिगमन)। इस प्रकार, एक महत्वपूर्ण सहसंबंध गुणांक के साथ, एक कारण संबंध की उपस्थिति के बारे में अंतिम निष्कर्ष केवल अध्ययन के तहत समस्या की बारीकियों को ध्यान में रखकर बनाया जा सकता है।

उदाहरण 2उदाहरण 1 में परिकलित नमूना सहसंबंध गुणांक का महत्व निर्धारित करें।

समाधान।

आइए एक परिकल्पना को सामने रखें: कि सामान्य जनसंख्या में कोई संबंध नहीं है। चूंकि उदाहरण 1 के समाधान के परिणामस्वरूप सहसंबंध का संकेत निर्धारित होता है - सहसंबंध सकारात्मक है, तो वैकल्पिक परिकल्पना एकतरफा है https://pandia.ru/text/78/148/images/ image448_0.gif" चौड़ाई="43" ऊंचाई="23 src =">.

मानदंड का अनुभवजन्य मूल्य खोजें:

https://pandia.ru/text/78/148/images/image461_0.gif" width="167 ऊंचाई=20" ऊंचाई="20">, हम सार्थकता स्तर के बराबर चुनते हैं। तालिका के अनुसार "महत्वपूर्ण मूल्य - विभिन्न महत्व स्तरों के लिए छात्र का परीक्षण ”हम महत्वपूर्ण मूल्य पाते हैं।

चूंकि https://pandia.ru/text/78/148/images/image434_0.gif" width="25 height=24" height="24"> और गणित में प्रदर्शन का औसत स्तर, सांख्यिकीय रूप से महत्वपूर्ण सहसंबंध है .

परीक्षण कार्य

1. कम से कम दो सही उत्तर चिन्हित करें। नमूना सहसंबंध गुणांक के महत्व का परीक्षण परिकल्पना के सांख्यिकीय परीक्षण पर आधारित है कि ...

1) सामान्य जनसंख्या में कोई संबंध नहीं है

2) नमूना सहसंबंध गुणांक के शून्य से अंतर को केवल नमूने की यादृच्छिकता द्वारा समझाया गया है

3) सहसंबंध गुणांक 0 से उल्लेखनीय रूप से भिन्न है

4) नमूना सहसंबंध गुणांक के शून्य से अंतर आकस्मिक नहीं है

2. यदि रैखिक सहसंबंध का नमूना गुणांक, तो एक विशेषता का बड़ा मान ... अन्य विशेषता के बड़े मान से मेल खाता है।

1) औसत

3) अधिकांश अवलोकनों में

4) कभी-कभार

3. नमूना सहसंबंध गुणांक https://pandia.ru/text/78/148/images/image465_0.gif" width="64" height="23 src="> (नमूना आकार और 0.05 के महत्व स्तर के लिए)। क्या यह संभव है कहने के लिए कि मनोवैज्ञानिक लक्षणों के बीच सांख्यिकीय रूप से महत्वपूर्ण सकारात्मक संबंध है?

5. नमूना सहसंबंध गुणांक को मनोवैज्ञानिक लक्षणों https://pandia.ru/text/78/148/images/image466_0.gif और 0.05 के महत्व स्तर के बीच एक रैखिक संबंध की ताकत की पहचान करने के कार्य में पाया जाना चाहिए।) क्या यह कहना संभव है कि नमूना सहसंबंध गुणांक के शून्य से अंतर केवल नमूने की यादृच्छिकता से समझाया गया है?

विषय 3. रैंक सहसंबंध गुणांक और संघ

1. रैंक सहसंबंध गुणांक https://pandia.ru/text/78/148/images/image130_3.gif" width="21 height=19" height="19"> और। फीचर वैल्यू की संख्या (संकेतक, विषय, गुण, लक्षण) कोई भी हो सकते हैं, लेकिन उनकी संख्या समान होनी चाहिए।

विषयों

फ़ीचर रैंक

फ़ीचर रैंक

आइए हम https://pandia.ru/text/78/148/images/image470_0.gif" width="319" height="66"> के माध्यम से प्रत्येक विषय के लिए दो वेरिएबल्स में रैंक के बीच अंतर को निरूपित करते हैं।

रैंक की गई सुविधाओं, संकेतकों के मूल्यों की संख्या कहां है।

रैंक सहसंबंध गुणांक -1 से +1 तक मान लेता हैऔर इसे पियर्सन सहसंबंध गुणांक का त्वरित अनुमान लगाने के साधन के रूप में माना जाता है।

के लिए स्पीयरमैन रैंकों के सहसंबंध गुणांक के महत्व का परीक्षण करना (यदि मूल्यों की संख्या https://pandia.ru/text/78/148/images/image472_0.gif" width="55" height="29"> संख्या और महत्व स्तर पर निर्भर करती है। यदि अनुभवजन्य मूल्य अधिक है, तो स्तर महत्व पर, यह तर्क दिया जा सकता है कि विशेषताएं सहसंबद्ध हैं।

उदाहरण 1मनोवैज्ञानिक यह पता लगाता है कि गणित और भौतिकी में छात्रों की प्रगति के परिणाम कैसे संबंधित हैं, जिसके परिणाम उपनामों द्वारा क्रमबद्ध श्रृंखला के रूप में प्रस्तुत किए जाते हैं।

विद्यार्थी

जोड़

अकादमिक प्रदर्शन

अंक शास्त्र

अकादमिक प्रदर्शन

भौतिकी में

रैंकों के बीच अंतर का वर्ग

योग की गणना करें, तो स्पीयरमैन के रैंकों का सहसंबंध गुणांक इसके बराबर है:

की जाँच करें पाया गया रैंक सहसंबंध गुणांक का महत्व. आइए स्पीयरमैन के रैंक सहसंबंध गुणांक के महत्वपूर्ण मूल्यों को तालिका से देखें (देखें परिशिष्ट):

https://pandia.ru/text/78/148/images/image480_0.gif" width="72" height="25"> मान = 0.64 और मान 0.79 से अधिक है। यह इंगित करता है कि मूल्य गिर गया सहसंबंध गुणांक के महत्व का क्षेत्र। इसलिए, यह तर्क दिया जा सकता है कि स्पीयरमैन रैंकों का सहसंबंध गुणांक 0 से काफी अलग है। इसका मतलब है कि गणित और भौतिकी में छात्रों की प्रगति के परिणाम सकारात्मक रूप से सहसम्बन्धित हैं . गणित में प्रदर्शन और भौतिकी में प्रदर्शन के बीच एक महत्वपूर्ण सकारात्मक संबंध है: गणित में प्रदर्शन जितना बेहतर होगा, भौतिकी में औसत प्रदर्शन उतना ही बेहतर होगा और इसके विपरीत।

पियर्सन और स्पीयरमैन सहसंबंध गुणांक की तुलना करते हुए, हम ध्यान देते हैं कि पियर्सन सहसंबंध गुणांक मूल्यों को सहसंबंधित करता है मात्रा, और स्पीयरमैन सहसंबंध गुणांक मान है रैंकये मान, इसलिए पियर्सन और स्पीयरमैन गुणांक के मान अक्सर समान नहीं होते हैं।

मनोवैज्ञानिक अनुसंधान में प्राप्त प्रायोगिक सामग्री की अधिक संपूर्ण समझ के लिए, पियर्सन और स्पीयरमैन दोनों के अनुसार गुणांकों की गणना करने की सलाह दी जाती है।

टिप्पणी. की उपस्थिति में समान रैंकरैंक श्रृंखला में और रैंक के सहसंबंध गुणांक की गणना के लिए सूत्र के अंश में, शब्द जोड़े जाते हैं - "रैंक के लिए सुधार": ; ,

जहां https://pandia.ru/text/78/148/images/image130_3.gif" width="21" height="19">;

https://pandia.ru/text/78/148/images/image165_1.gif" width="16" height="19">.

इस मामले में, रैंक सहसंबंध गुणांक की गणना करने का सूत्र https://pandia.ru/text/78/148/images/image485_0.gif" width="16" height="19"> का रूप लेता है।

संघ गुणांक लागू करने की शर्तें।

1. तुलनात्मक लक्षणों को द्विबीजपत्री पैमाने पर मापा गया।

2..gif" width="21" height="19">, 0 और 1 चिन्हों से चिह्नित, तालिका में दिए गए हैं।

अवलोकन संख्या

श्रेणियाँ

लोकप्रिय लेख

2023 "Kingad.ru" - मानव अंगों की अल्ट्रासाउंड परीक्षा