युग्म सहसंबंध गुणांकों का एक मैट्रिक्स बनाएं। बहुसंरेखता की जाँच करें

आर्थिक डेटा किसी भी आर्थिक वस्तु या प्रक्रिया की मात्रात्मक विशेषताओं का प्रतिनिधित्व करता है। वे कई कारकों के प्रभाव में बनते हैं, जिनमें से सभी बाहरी नियंत्रण के लिए सुलभ नहीं हैं। अनियंत्रित कारक मानों के कुछ सेट से यादृच्छिक मान ले सकते हैं और इस प्रकार उनके द्वारा परिभाषित डेटा को यादृच्छिक बना सकते हैं। आर्थिक अनुसंधान में मुख्य कार्यों में से एक है चरों के बीच निर्भरता का विश्लेषण।

विशेषताओं के बीच निर्भरता पर विचार करते समय, सबसे पहले, दो प्रकार के कनेक्शनों में अंतर करना आवश्यक है:

  • कार्यात्मक -कारक विशेषता में परिवर्तन और परिणामी मूल्य में परिवर्तन के बीच पूर्ण पत्राचार की विशेषता है: किसी कारक विशेषता का प्रत्येक मान परिणामी विशेषता के बहुत विशिष्ट मूल्यों से मेल खाता है।इस प्रकार के संबंध को सूत्रबद्ध संबंध के रूप में व्यक्त किया जाता है। कार्यात्मक निर्भरता एक प्रभावी विशेषता को एक या अधिक कारक विशेषताओं से जोड़ सकती है। इस प्रकार, समय-आधारित मजदूरी की राशि काम किए गए घंटों की संख्या पर निर्भर करती है;
  • सहसंबद्ध- दो संकेतों में परिवर्तन के बीच कोई पूर्ण पत्राचार नहीं है; वास्तविक डेटा के बड़े पैमाने पर अवलोकन के साथ, व्यक्तिगत कारकों का प्रभाव केवल औसत पर प्रकट होता है। बड़ी संख्या में विभिन्न कारकों का अध्ययन किए गए गुण पर एक साथ प्रभाव इस तथ्य की ओर ले जाता है किसी कारक विशेषता का एक ही मान परिणामी विशेषता के मूल्यों के संपूर्ण वितरण से मेल खाता है,चूँकि प्रत्येक विशिष्ट मामले में अन्य कारक विशेषताएँ उनके प्रभाव की ताकत और दिशा को बदल सकती हैं।

यह ध्यान में रखा जाना चाहिए कि यदि विशेषताओं के बीच कोई कार्यात्मक संबंध है, तो कारक विशेषता के मूल्य को जानकर, सटीक रूप से निर्धारित करना संभव है परिणामी चिह्न का मान.केवल सहसंबंध निर्भरता की उपस्थिति में परिणामी विशेषता में परिवर्तन की प्रवृत्तिजब कारक विशेषता का मान बदलता है।

संकेतों के बीच संबंधों का अध्ययन करते समय, उन्हें दिशा, रूप, कारकों की संख्या के अनुसार वर्गीकृत किया जाता है:

  • की ओरकनेक्शनों को विभाजित किया गया है सीधाऔर रिवर्स।प्रत्यक्ष संबंध के साथ, परिणामी विशेषता में परिवर्तन की दिशा कारक विशेषता में परिवर्तन की दिशा से मेल खाती है। फीडबैक के साथ, परिणामी विशेषता में परिवर्तन की दिशा कारक विशेषता में परिवर्तन की दिशा के विपरीत होती है। उदाहरण के लिए, कर्मचारी की योग्यता जितनी अधिक होगी, उसके श्रम की उत्पादकता का स्तर उतना ही अधिक होगा (सीधा संबंध)। श्रम उत्पादकता जितनी अधिक होगी, उत्पादन की प्रति इकाई लागत उतनी ही कम होगी (प्रतिक्रिया);
  • स्वरूप के अनुसार(फ़ंक्शन के प्रकार) कनेक्शनों को विभाजित किया गया है रेखीय(सीधी रेखा) और अरेखीय(वक्ररेखीय). एक रैखिक संबंध को एक सीधी रेखा द्वारा दर्शाया जाता है, एक गैर-रेखीय संबंध को एक वक्र (परवलय, हाइपरबोला, आदि) द्वारा दर्शाया जाता है। एक रैखिक संबंध में, किसी कारक विशेषता के मूल्य में वृद्धि के साथ, परिणामी विशेषता के मूल्य में एक समान वृद्धि (कमी) होती है;
  • प्रभावी विशेषता पर कार्य करने वाले कारकों की संख्या से,कनेक्शनों को विभाजित किया गया है एकल कारक(युग्मित) और बहुघटकीय.

पर्यावरणीय परिस्थितियों पर गुण भिन्नता की निर्भरता का अध्ययन सहसंबंध सिद्धांत की सामग्री है।

सहसंबंध विश्लेषण करते समय, डेटा के पूरे सेट को चर (कारकों) के एक सेट के रूप में माना जाता है, जिनमें से प्रत्येक में शामिल होता है पीअवलोकन.

दो कारकों के बीच संबंधों का अध्ययन करते समय, उन्हें आमतौर पर निर्दिष्ट किया जाता है एक्स=(एक्स पी एक्स 2,...,x n)और वाई= (वाई ( , वाई 2 ,..., y और).

सहप्रसरण -यह सांख्यिकीय है अंतःक्रिया का मापदो चर. उदाहरण के लिए, दो प्रतिभूतियों के रिटर्न के सहप्रसरण के लिए एक सकारात्मक मूल्य इंगित करता है कि इन प्रतिभूतियों के रिटर्न एक दिशा में बढ़ते हैं।

दो चरों के बीच सहप्रसरण एक्सऔर वाईइस प्रकार गणना की गई:

चरों के वास्तविक मान कहाँ हैं

एक्सऔर जी;

यदि यादृच्छिक चर ची वाईस्वतंत्र, सैद्धांतिक सहप्रसरण शून्य है।

सहप्रसरण उन इकाइयों पर निर्भर करता है जिनमें चर मापे जाते हैं हीहाँ, यह एक गैर-मानकीकृत मात्रा है। इसलिए, मापने के लिए कनेक्शन ताकतसहसंबंध गुणांक नामक एक अन्य आँकड़ा दो चरों के बीच प्रयोग किया जाता है।

दो चर के लिए एक्सऔर Y जोड़ी सहसंबंध गुणांक

को इस प्रकार परिभाषित किया गया है:

कहाँ एसएसवाई-मात्राओं की भिन्नता का अनुमान ही वाई.ये अनुमान बताते हैं बिखराव की डिग्रीमान एक्स (, एक्स 2, ..., एक्स एन (वाई 1, वाई 2, वाई एन)आपके औसत के आसपास एक्स(यक्रमशः), या परिवर्तनशीलताअवलोकनों के एक सेट पर इन चरों की (परिवर्तनशीलता)।

फैलाव(विचरण का अनुमान) सूत्र द्वारा निर्धारित किया जाता है

सामान्य तौर पर, विचरण का निष्पक्ष अनुमान प्राप्त करने के लिए, वर्गों के योग को अनुमान की स्वतंत्रता की डिग्री की संख्या से विभाजित किया जाना चाहिए (वगैरह),कहाँ पी -नमूने का आकार, आर -नमूने पर आरोपित कनेक्शनों की संख्या। चूँकि माध्य ज्ञात करने के लिए नमूने का उपयोग पहले ही एक बार किया जा चुका है एक्स,तो इस मामले में सुपरइम्पोज़्ड कनेक्शन की संख्या एक के बराबर है (पी = 1), और अनुमान की स्वतंत्रता की डिग्री की संख्या (यानी, स्वतंत्र नमूना तत्वों की संख्या) के बराबर है (पी - 1).

चर मानों के फैलाव की डिग्री को उन्हीं इकाइयों में मापना अधिक स्वाभाविक है जिनमें चर को स्वयं मापा जाता है। इस समस्या को एक सूचक द्वारा हल किया जाता है जिसे कहा जाता है मानक विचलन (मानक विचलन) या मानक त्रुटिचर एक्स(चर वाई)और संबंध द्वारा निर्धारित होता है

सूत्र (3.2.1) के अंश में पद दो चरों की परस्पर क्रिया को व्यक्त करते हैं और सहसंबंध का चिह्न (सकारात्मक या नकारात्मक) निर्धारित करते हैं। यदि, उदाहरण के लिए, चरों के बीच एक मजबूत सकारात्मक संबंध है (एक चर में वृद्धि जबकि दूसरे में वृद्धि), तो प्रत्येक पद एक सकारात्मक संख्या होगी। इसी तरह, यदि चरों के बीच एक मजबूत नकारात्मक संबंध है, तो अंश में सभी पद नकारात्मक संख्याएं होंगे, जिसके परिणामस्वरूप नकारात्मक सहसंबंध मान होगा।

जोड़ीवार सहसंबंध गुणांक के लिए व्यंजक का हर [देखें सूत्र (3.2.2)] बस अंश को इस तरह से सामान्यीकृत करता है कि सहसंबंध गुणांक बिना आयाम के आसानी से व्याख्या करने योग्य संख्या बन जाता है, और -1 से +1 तक मान लेता है।

सहसंबंध गुणांक के लिए अभिव्यक्ति का अंश, जिसकी माप की असामान्य इकाइयों के कारण व्याख्या करना मुश्किल है, है सहप्रसरण HiU.इस तथ्य के बावजूद कि इसे कभी-कभी एक स्वतंत्र विशेषता के रूप में उपयोग किया जाता है (उदाहरण के लिए, वित्त सिद्धांत में दो एक्सचेंजों पर स्टॉक की कीमतों में संयुक्त परिवर्तन का वर्णन करने के लिए), सहसंबंध गुणांक का उपयोग करना अधिक सुविधाजनक है। सहसंबंध और सहप्रसरण अनिवार्य रूप से एक ही जानकारी का प्रतिनिधित्व करते हैं, लेकिन सहसंबंध इस जानकारी को अधिक उपयोगी रूप में प्रस्तुत करता है।

सहसंबंध गुणांक का गुणात्मक मूल्यांकन करने के लिए, विभिन्न पैमानों का उपयोग किया जाता है, सबसे अधिक बार चैडॉक स्केल। सहसंबंध गुणांक के मूल्य के आधार पर, संबंध की निम्नलिखित रेटिंग में से एक हो सकती है:

  • 0.1-0.3 - कमजोर;
  • 0.3-0.5 - ध्यान देने योग्य;
  • 0.5-0.7 - मध्यम;
  • 0.7-0.9 - उच्च;
  • 0.9-1.0 - बहुत ऊँचा।

सहसंबंध गुणांक का उपयोग करके किसी कनेक्शन की निकटता की डिग्री का आकलन, एक नियम के रूप में, अध्ययन की जा रही घटना के बारे में कम या ज्यादा सीमित जानकारी के आधार पर किया जाता है। इस संबंध में, रैखिक सहसंबंध गुणांक के महत्व का आकलन करने की आवश्यकता है, जो नमूना परिणामों के आधार पर निष्कर्षों को सामान्य आबादी तक विस्तारित करना संभव बनाता है।

छोटे नमूना आकारों के लिए सहसंबंध गुणांक के महत्व का आकलन छात्र के 7-परीक्षण का उपयोग करके किया जाता है। इस मामले में, इस मानदंड का वास्तविक (मनाया गया) मान सूत्र द्वारा निर्धारित किया जाता है

इस सूत्र का उपयोग करके गणना किए गए मान/ओब्स की तुलना 7-मानदंड के महत्वपूर्ण मान से की जाती है, जो दिए गए महत्व स्तर ओसी और संख्या को ध्यान में रखते हुए छात्र के/-परीक्षण मानों की तालिका (परिशिष्ट 2 देखें) से लिया जाता है। स्वतंत्रता की डिग्री की (पी - 2).

यदि 7 अवलोकन > 7 टैब, तो सहसंबंध गुणांक का परिणामी मान महत्वपूर्ण माना जाता है (अर्थात, सहसंबंध गुणांक शून्य के बराबर है, यह बताने वाली शून्य परिकल्पना खारिज कर दी जाती है)। और इस प्रकार यह निष्कर्ष निकाला गया कि अध्ययन के अंतर्गत चरों के बीच घनिष्ठ सांख्यिकीय संबंध है।

यदि मान जी वाई एक्सशून्य के करीब, चरों के बीच संबंध कमजोर है। यदि यादृच्छिक चर के बीच सहसंबंध:

  • सकारात्मक, फिर जैसे-जैसे एक यादृच्छिक चर बढ़ता है, दूसरा औसतन बढ़ने लगता है;
  • नकारात्मक, तो जैसे-जैसे एक यादृच्छिक चर बढ़ता है, दूसरा औसतन घटता जाता है। युग्मित डेटा का विश्लेषण करने के लिए एक सुविधाजनक ग्राफिकल टूल है स्कैटर प्लॉट, जो दो कारकों के अनुरूप दो आयामों के स्थान में प्रत्येक अवलोकन का प्रतिनिधित्व करता है। स्कैटरप्लॉट, जो दो विशेषताओं के मूल्यों के एक सेट को दर्शाता है, भी कहा जाता है सहसंबंध क्षेत्र.इस आरेख में प्रत्येक बिंदु के निर्देशांक x (. और.) हैं य जीजैसे-जैसे रैखिक संबंध की ताकत बढ़ती है, ग्राफ़ पर बिंदु सीधी रेखा और परिमाण के करीब होंगे जीएकता के करीब होंगे.

जोड़ीवार सहसंबंध गुणांक का उपयोग उनमें से एक सेट से सुविधाओं के विभिन्न जोड़े के बीच रैखिक संबंधों की ताकत को मापने के लिए किया जाता है। कई सुविधाओं के लिए एक मिलता है जोड़ी सहसंबंध गुणांक का मैट्रिक्स।

मान लीजिए कि डेटा के पूरे सेट में एक वेरिएबल शामिल है य = =(य पी य 2, ..., वाई पी)और टीचर (कारक) एक्स,जिनमें से प्रत्येक में शामिल है पीअवलोकन. परिवर्तनशील मान वाईऔर एक्स,प्रेक्षित जनसंख्या में निहित को एक तालिका में दर्ज किया गया है (सारणी 3.2.1)।

तालिका 3.2.1

चर

संख्या

टिप्पणियों

एक्स टीजेड

एक्स टी.पी

इस तालिका में मौजूद आंकड़ों के आधार पर गणना करें जोड़ी सहसंबंध गुणांक आर का मैट्रिक्स,यह मुख्य विकर्ण के बारे में सममित है:


एकाधिक प्रतिगमन मॉडल का निर्माण करते समय जोड़ी सहसंबंध गुणांक के मैट्रिक्स का विश्लेषण किया जाता है।

एक सहसंबंध मैट्रिक्स मात्राओं के बीच निर्भरता का पूरी तरह से वर्णन नहीं कर सकता है। इस संबंध में, बहुभिन्नरूपी सहसंबंध विश्लेषण दो कार्यों पर विचार करता है:

  • 1. विश्लेषण में शामिल अन्य चरों की समग्रता के साथ एक यादृच्छिक चर के घनिष्ठ संबंध का निर्धारण।
  • 2. अन्य मात्राओं के प्रभाव को निश्चित या बहिष्कृत करते समय दो मात्राओं के बीच संबंध की निकटता का निर्धारण।

इन समस्याओं को क्रमशः एकाधिक और आंशिक सहसंबंध गुणांक का उपयोग करके हल किया जाता है।

पहली समस्या का समाधान (विश्लेषण में शामिल अन्य चर की समग्रता के साथ एक यादृच्छिक चर के घनिष्ठ संबंध का निर्धारण) का उपयोग करके किया जाता है नमूना एकाधिक सहसंबंध गुणांकसूत्र के अनुसार

कहाँ आर- आर[सेमी। सूत्र (3.2.6)]; Rjj-एक ही मैट्रिक्स के एक तत्व का बीजगणितीय पूरक आर।

वर्गांकित एकाधिक सहसंबंध गुणांक एस.सी.एचजे 2 जे _जे जे+एल मआमतौर पर कहा जाता है निर्धारण के एकाधिक गुणांक का नमूना; यह दर्शाता है कि अध्ययन किए जा रहे मूल्य में किस अनुपात में भिन्नता (यादृच्छिक बिखराव) है एक्सजेशेष यादृच्छिक चरों की भिन्नता की व्याख्या करता है एक्स ( , एक्स 2 ,..., एक्स टी.

एकाधिक सहसंबंध और निर्धारण के गुणांक सकारात्मक मात्राएं हैं, जो 0 से 1 तक की सीमा में मान लेते हैं। गुणांक का अनुमान लगाते समय आर 2 से एकता तक, हम यह निष्कर्ष निकाल सकते हैं कि यादृच्छिक चर के बीच संबंध घनिष्ठ है, लेकिन इसकी दिशा के बारे में नहीं। एकाधिक सहसंबंध गुणांक केवल तभी बढ़ सकता है जब मॉडल में अतिरिक्त चर शामिल किए जाएं, और यदि मौजूदा विशेषताओं में से किसी को बाहर रखा जाए तो यह नहीं बढ़ेगा।

निर्धारण के गुणांक के महत्व की जाँच फिशर/'-मानदंड के परिकलित मान की तुलना करके की जाती है

सारणीबद्ध के साथ एफरबल. मानदंड का सारणीबद्ध मान (परिशिष्ट 1 देखें) दिए गए महत्व स्तर ए और स्वतंत्रता की डिग्री द्वारा निर्धारित किया जाता है वी एल = एमएनवी 2 = एन-एम-एल।गुणक आर 2यदि असमानता कायम रहती है तो यह शून्य से काफी भिन्न है

यदि यादृच्छिक चर विचाराधीन हैं एक दूसरे के साथ सहसंबद्ध होनातब युग्म सहसंबंध गुणांक का मान अन्य मात्राओं के प्रभाव से आंशिक रूप से प्रभावित होता है। इस संबंध में, अन्य यादृच्छिक चर (एक या अधिक) के प्रभाव को छोड़कर मात्राओं के बीच आंशिक सहसंबंध का अध्ययन करने की आवश्यकता है।

आंशिक सहसंबंध गुणांक का नमूनासूत्र द्वारा निर्धारित किया गया है

कहाँ आर जेके, आरजेजे, आर केके -संगत मैट्रिक्स तत्वों में बीजगणितीय जोड़ आर[सेमी। सूत्र (3.2.6)]।

आंशिक सहसंबंध गुणांक, साथ ही जोड़ी सहसंबंध गुणांक, -1 से +1 तक भिन्न होता है।

अभिव्यक्ति (3.2.9) के अधीन टी = 3 जैसा दिखेगा

गुणांक r 12(3) कहलाता है x के बीच सहसंबंध गुणांक (और निश्चित x y के लिए x 2यह प्राथमिक सूचकांक 1, 2 के संबंध में सममित है। इसका द्वितीयक सूचकांक 3 एक निश्चित चर को संदर्भित करता है।

उदाहरण 3.2.1. युग्म गुणांकों की गणना,

एकाधिक और आंशिक सहसंबंध।

तालिका में 3.2.2 एक कंपनी की बिक्री मात्रा और विज्ञापन लागत के साथ-साथ कई चालू वर्षों के उपभोक्ता व्यय सूचकांक की जानकारी प्रदान करता है।

  • 1. चर "बिक्री की मात्रा" और "उपभोक्ता व्यय सूचकांक" के लिए एक स्कैटर आरेख (सहसंबंध क्षेत्र) का निर्माण करें।
  • 2. बिक्री की मात्रा पर उपभोक्ता व्यय सूचकांक के प्रभाव की डिग्री निर्धारित करें (युग्म सहसंबंध गुणांक की गणना करें)।
  • 3. परिकलित युग्म सहसंबंध गुणांक के महत्व का आकलन करें।
  • 4. तीन चरों के लिए जोड़ीवार सहसंबंध गुणांक का एक मैट्रिक्स बनाएं।
  • 5. बहु सहसंबंध गुणांक का अनुमान लगाएं।
  • 6. आंशिक सहसंबंध गुणांक के अनुमान खोजें।

1. हमारे उदाहरण में, स्कैटर आरेख का रूप चित्र में दिखाया गया है। 3.2.1. झुकी हुई रेखा के साथ स्कैटर आरेख पर बिंदुओं के बादल का विस्तार हमें यह धारणा बनाने की अनुमति देता है कि चर के मूल्यों के बीच सीधे रैखिक संबंध के लिए कुछ उद्देश्य प्रवृत्ति है एक्स 2 वाई(बिक्री की मात्रा).

चावल। 3.2.1.

2. चरों के बीच सहसंबंध गुणांक की गणना करते समय मध्यवर्ती गणना एक्स 2(उपभोक्ता व्यय सूचकांक) और वाई(बिक्री की मात्रा) तालिका में दी गई है। 3.2.3.

औसत मानयादृच्छिक चर एक्स 2और हाँ,जो अनुक्रमों को दर्शाने वाले सबसे सरल संकेतक हैं जेसीजे, एक्स 2,..., x 16 और य व य 2 ,..., y 16, निम्नलिखित सूत्रों का उपयोग करके गणना करें:


बिक्री की मात्रा Y, हजार रूबल।

अनुक्रमणिका

उपभोग करना

टेल्स्की

खर्च

बिक्री की मात्रा Y, हजार रूबल।

अनुक्रमणिका

उपभोग करना

टेल्स्की

खर्च

तालिका 3.2.3

एल:, - एक्स

(और - यू)(एक्स, - एक्स)

(एक्स, - एक्स) 2

(य, - - य) 2

फैलावमूल्यों के प्रसार की डिग्री की विशेषता है एक्स वी एक्स 2,एक्स:

आइए अब एक्सेल में उदाहरण 3.2.1 के समाधान पर विचार करें।

एक्सेल का उपयोग करके सहसंबंध की गणना करने के लिए, आप फ़ंक्शन का उपयोग कर सकते हैं =correl(), संख्याओं के दो स्तंभों के पते निर्दिष्ट करता है, जैसा चित्र में दिखाया गया है। 3.2.2. उत्तर D8 में रखा गया है और 0.816 के बराबर है।

चावल। 3.2.2.

(नोट: फ़ंक्शन तर्क कोरल संख्याएँ या नाम, सारणियाँ या संख्याएँ युक्त संदर्भ होने चाहिए। यदि तर्क, जो एक सरणी या संदर्भ है, में पाठ, बूलियन मान या खाली सेल शामिल हैं, तो ऐसे मानों को अनदेखा कर दिया जाता है; हालाँकि, जिन कोशिकाओं में शून्य मान होते हैं उन्हें गिना जाता है।

यदि सरणी! और array2 में डेटा बिंदुओं की अलग-अलग संख्या होती है, फिर फ़ंक्शन कोरेल त्रुटि मान #n/a लौटाता है।

यदि array1 या array2 खाली है या यदि उनके मानों का o (मानक विचलन) शून्य है, तो फ़ंक्शन कोरेल त्रुटि मान #div/0 लौटाता है!)

फ़ंक्शन का उपयोग करके छात्र के टी-सांख्यिकी का महत्वपूर्ण मूल्य भी प्राप्त किया जा सकता है 1 एक्सेल पैकेज का अध्ययन वितरण। फ़ंक्शन तर्क के रूप में, आपको स्वतंत्रता की बराबर डिग्री की संख्या निर्दिष्ट करनी होगी पी- 2 (हमारे उदाहरण में 16 - 2= 14) और महत्व स्तर ए (हमारे उदाहरण में ए = 0.1) (चित्र 3.2.3)। अगर असल मूल्य/-सांख्यिकी मॉड्यूलो अधिक है गंभीर,तब संभाव्यता (1 - ए) के साथ सहसंबंध गुणांक शून्य से काफी भिन्न होता है।


चावल। 3.2.3. /-सांख्यिकी का क्रांतिक मान 1.7613 है

एक्सेल में विभिन्न सांख्यिकीय समस्याओं को हल करने के लिए डिज़ाइन किए गए डेटा विश्लेषण टूल (तथाकथित विश्लेषण पैकेज) का एक सेट शामिल है। जोड़ी सहसंबंध गुणांक के मैट्रिक्स की गणना करने के लिए आरआपको सहसंबंध उपकरण (चित्र 3.2.4) का उपयोग करना चाहिए और संबंधित संवाद बॉक्स में विश्लेषण पैरामीटर सेट करना चाहिए। उत्तर एक नई वर्कशीट पर रखा जाएगा (चित्र 3.2.5)।

1 Excel 2010 में, फ़ंक्शन का नाम studrasprobr को stu में बदल दिया गया-

DENT.OBR.2X.

चावल। 3.2.4.


चावल। 3.2.5.

  • सहसंबंध के सिद्धांत के संस्थापक अंग्रेजी सांख्यिकीविद् एफ. गैल्टन (1822-1911) और के. पियर्सन (1857-1936) माने जाते हैं। शब्द "सहसंबंध" प्राकृतिक विज्ञान से लिया गया है और इसका अर्थ है "सहसंबंध, पत्राचार।" यादृच्छिक चर के बीच अन्योन्याश्रय के रूप में सहसंबंध का विचार सहसंबंध के गणितीय-सांख्यिकीय सिद्धांत को रेखांकित करता है।

कार्य 2

1. युग्म सहसंबंध गुणांकों का एक मैट्रिक्स बनाएं। बहुसंरेखता की जाँच करें. मॉडल में कारकों के चयन का औचित्य सिद्ध करें।

2. चयनित कारकों के साथ रैखिक रूप में एक बहु समाश्रयण समीकरण का निर्माण करें।

3. फिशर और छात्र परीक्षणों का उपयोग करके प्रतिगमन समीकरण और उसके मापदंडों के सांख्यिकीय महत्व का आकलन करें।

4. सांख्यिकीय रूप से महत्वपूर्ण कारकों के साथ एक प्रतिगमन समीकरण बनाएं। निर्धारण गुणांक R2 का उपयोग करके प्रतिगमन समीकरण की गुणवत्ता का आकलन करें। निर्मित मॉडल की सटीकता का मूल्यांकन करें।

5. उत्पादन मात्रा के पूर्वानुमान का मूल्यांकन करें यदि कारकों का पूर्वानुमान मान उनके अधिकतम मूल्यों का 75% है।

समस्या की स्थितियाँ (विकल्प 21)

तालिका 1 (एन = 17) में प्रस्तुत आंकड़ों के अनुसार, निम्नलिखित कारकों (चर) पर उत्पादन मात्रा वाई (मिलियन रूबल) की निर्भरता का अध्ययन किया जाता है:

एक्स 1 - औद्योगिक उत्पादन कर्मियों, लोगों की संख्या।

एक्स 2 - अचल संपत्तियों की औसत वार्षिक लागत, मिलियन रूबल।

एक्स 3 - अचल संपत्तियों का मूल्यह्रास, %

एक्स 4 - बिजली की आपूर्ति, किलोवाट।

एक्स 5 - एक कर्मचारी के तकनीकी उपकरण, मिलियन रूबल।

एक्स 6 - प्रति कर्मचारी विपणन योग्य उत्पादों का उत्पादन, रगड़।

तालिका 1. उत्पाद रिलीज़ डेटा

वाई एक्स 1 एक्स 2 एक्स 3 एक्स 4 एक्स 5 एक्स 6
39,5 4,9 3,2
46,4 60,5 20,4
43,7 24,9 9,5
35,7 50,4 34,7
41,8 5,1 17,9
49,8 35,9 12,1
44,1 48,1 18,9
48,1 69,5 12,2
47,6 31,9 8,1
58,6 139,4 29,7
70,4 16,9 5,3
37,5 17,8 5,6
62,0 27,6 12,3
34,4 13,9 3,2
35,4 37,3 19,0
40,8 55,3 19,3
48,1 35,1 12,4


युग्म सहसंबंध गुणांकों का एक मैट्रिक्स बनाएं। बहुसंरेखता की जाँच करें. मॉडल में कारकों के चयन का औचित्य सिद्ध करें

तालिका 2 से पता चलता है जोड़ी सहसंबंध गुणांक मैट्रिक्स विचार में शामिल सभी चरों के लिए। टूल का उपयोग करके मैट्रिक्स प्राप्त किया गया था सह - संबंधपैकेज से डेटा विश्लेषणवी एक्सेल.

तालिका 2. जोड़ी सहसंबंध गुणांक का मैट्रिक्स

वाई X1 एक्स2 एक्स3 एक्स4 X5 X6
वाई
X1 0,995634
एक्स2 0,996949 0,994947
एक्स3 -0,25446 -0,27074 -0,26264
एक्स4 0,12291 0,07251 0,107572 0,248622
X5 0,222946 0,166919 0,219914 -0,07573 0,671386
X6 0,067685 -0,00273 0,041955 -0,28755 0,366382 0,600899

मैट्रिक्स का दृश्य विश्लेषण आपको यह स्थापित करने की अनुमति देता है:

1) यूचर X1, X2 के साथ काफी उच्च जोड़ीदार सहसंबंध हैं (>0,5) और चर के साथ कम X3,X4,X5,X6 (<0,5);

2) विश्लेषण चर X1, X2 काफी उच्च जोड़ीदार सहसंबंध प्रदर्शित करते हैं, जिससे उनके बीच बहुसंरेखता की उपस्थिति के लिए कारकों की जांच करना आवश्यक हो जाता है। इसके अलावा, शास्त्रीय प्रतिगमन मॉडल की शर्तों में से एक व्याख्यात्मक चर की स्वतंत्रता की धारणा है।

कारकों की बहुसंरेखता की पहचान करने के लिए, हम प्रदर्शन करते हैं फर्रार-ग्लॉबर परीक्षण कारकों X1, X2 द्वारा, X3,X4,X5,X6.

कारकों की बहुसंरेखता के लिए फ़रार-ग्लॉबर परीक्षण की जाँच में कई चरण शामिल हैं।

1) चरों की संपूर्ण श्रृंखला की बहुसंरेखता की जाँच करना .

शास्त्रीय प्रतिगमन मॉडल की शर्तों में से एक व्याख्यात्मक चर की स्वतंत्रता की धारणा है। कारकों के बीच बहुसंरेखता की पहचान करने के लिए, डेटा विश्लेषण पैकेज (तालिका 3) का उपयोग करके इंटरफैक्टर सहसंबंध आर के मैट्रिक्स की गणना की जाती है।

तालिका 3. इंटरफैक्टर सहसंबंधों का मैट्रिक्स आर

X1 एक्स2 एक्स3 एक्स4 X5 X6
X1 0,994947 -0,27074 0,07251 0,166919 -0,00273
एक्स2 0,994947 -0,26264 0,107572 0,219914 0,041955
एक्स3 -0,27074 -0,26264 0,248622 -0,07573 -0,28755
एक्स4 0,07251 0,107572 0,248622 0,671386 0,366382
X5 0,166919 0,219914 -0,07573 0,671386 0,600899
X6 -0,00273 0,041955 -0,28755 0,366382 0,600899

कारक X1 और X2, X5 और X4, X6 और X5 के बीच एक मजबूत निर्भरता (>0.5) है।

निर्धारक det (R) = 0.001488 की गणना MOPRED फ़ंक्शन का उपयोग करके की जाती है। मैट्रिक्स आर का निर्धारक शून्य हो जाता है, जो हमें कारकों की सामान्य बहुसंरेखता के बारे में एक धारणा बनाने की अनुमति देता है।

2) प्रत्येक चर की अन्य चर के साथ बहुसंरेखता की जाँच करना:

आइए एक्सेल फ़ंक्शन MOBR (तालिका 4) का उपयोग करके व्युत्क्रम मैट्रिक्स R -1 की गणना करें:

तालिका 4. व्युत्क्रम मैट्रिक्स आर -1

X1 एक्स2 एक्स3 एक्स4 X5 X6
X1 150,1209 -149,95 3,415228 -1,70527 6,775768 4,236465
एक्स2 -149,95 150,9583 -3,00988 1,591549 -7,10952 -3,91954
एक्स3 3,415228 -3,00988 1,541199 -0,76909 0,325241 0,665121
एक्स4 -1,70527 1,591549 -0,76909 2,218969 -1,4854 -0,213
X5 6,775768 -7,10952 0,325241 -1,4854 2,943718 -0,81434
X6 4,236465 -3,91954 0,665121 -0,213 -0,81434 1,934647

· एफ-मानदंड की गणना, मैट्रिक्स के विकर्ण तत्व कहां हैं, एन = 17, के = 6 (तालिका 5)।

तालिका 5. एफ-परीक्षण मान

एफ1 (एक्स1) एफ2 (एक्स2) एफ3 (एक्स3) एफ4 (एक्स4) F5 (X5) एफ6 (एक्स6)
89,29396 89,79536 0,324071 0,729921 1,163903 0,559669

· वास्तविक एफ-परीक्षण मानों की तुलना तालिका मान से की जाती है एफ तालिका = 3.21(FDIST(0.05;6;10)) n1= 6 और n2 = n - k - 1=17-6-1=10 स्वतंत्रता की डिग्री और महत्व स्तर α=0.05 के साथ, जहां k कारकों की संख्या है।

· कारकों X1 और X2 के लिए F-मानदंड मान सारणीबद्ध मानों से अधिक हैं, जो इन कारकों के बीच बहुसंरेखता की उपस्थिति को इंगित करता है। फैक्टर X3 का कारकों की समग्र बहुसंरेखता पर सबसे कम प्रभाव पड़ता है।

3) चरों के प्रत्येक जोड़े की बहुसंरेखता की जाँच करना

· आइए सूत्र का उपयोग करके आंशिक सहसंबंध गुणांक की गणना करें, मैट्रिक्स के तत्व कहां हैं (तालिका 6)

तालिका 6. आंशिक सहसंबंध गुणांक का मैट्रिक्स

X1 एक्स2 एक्स3 एक्स4 X5 X6
X1
एक्स2 0,996086
एक्स3 -0,22453 0,197329
एक्स4 0,093432 -0,08696 0,415882
X5 -0,32232 0,337259 -0,1527 0,581191
X6 -0,24859 0,229354 -0,38519 0,102801 0,341239

· गणना टी-सूत्र के अनुसार मानदंड (तालिका 7)

n - डेटा की संख्या = 17

K - कारकों की संख्या = 6

आंशिक सहसंबंध गुणांक के लिए तालिका 7.टी-परीक्षण

X1 एक्स2 एक्स3 एक्स4 X5 X6
X1
एक्स2 35,6355
एक्स3 -0,72862 0,636526
एक्स4 0,296756 -0,27604 1,446126
X5 -1,07674 1,13288 -0,4886 2,258495
X6 -0,81158 0,745143 -1,31991 0,326817 1,147999

टी टेबल = स्टुडार्सोबीआर(0.05,10) = 2.23

टी-परीक्षणों के वास्तविक मूल्यों की तुलना स्वतंत्रता की डिग्री एन-के-1 = 17-6-1=10 और महत्व स्तर α=0.05 के साथ तालिका मूल्य के साथ की जाती है;

t21 > टेबल

t54 > टेबल

तालिका 6 और 7 से यह स्पष्ट है कि कारकों के दो जोड़े X1 और X2, X4 और X5 में उच्च सांख्यिकीय रूप से महत्वपूर्ण आंशिक सहसंबंध है, अर्थात, वे बहुसंरेखीय हैं। बहुसंरेखता से छुटकारा पाने के लिए, आप संरेख युग्म के किसी एक चर को बाहर कर सकते हैं। जोड़ी X1 और X2 में हम X2 छोड़ते हैं, जोड़ी X4 और X5 में हम X5 छोड़ते हैं।

इस प्रकार, फ़रार-ग्लॉबर परीक्षण की जाँच के परिणामस्वरूप, निम्नलिखित कारक बने रहते हैं: X2, X3, X5, X6.

सहसंबंध विश्लेषण प्रक्रियाओं को पूरा करते समय, परिणाम के साथ चयनित कारकों के आंशिक सहसंबंधों को देखने की सलाह दी जाती है वाई

आइए तालिका 8 में दिए गए डेटा के आधार पर युग्मित सहसंबंध गुणांक का एक मैट्रिक्स बनाएं।

तालिका 8. चयनित कारकों X2, X3, X5, X6 के साथ उत्पाद आउटपुट डेटा।

अवलोकन सं. वाई एक्स 2 एक्स 3 एक्स 5 एक्स 6
39,5 3,2
46,4 20,4
43,7 9,5
35,7 34,7
41,8 17,9
49,8 12,1
44,1 18,9
48,1 12,2
47,6 8,1
58,6 29,7
70,4 5,3
37,5 5,6
12,3
34,4 3,2
35,4
40,8 19,3
48,1 12,4

तालिका 9 का अंतिम कॉलम Y कॉलम के लिए t-परीक्षण मान प्रस्तुत करता है।

तालिका 9. परिणाम के साथ आंशिक सहसंबंध गुणांक का मैट्रिक्स वाई

वाई एक्स2 एक्स3 X5 X6 टी मानदंड (टी तालिका (0.05;11)= 2.200985
वाई 0,996949 -0,25446 0,222946 0,067685
एक्स2 0,996949 -0,26264 0,219914 0,041955 44,31676
एक्स3 -0,25446 -0,26264 -0,07573 -0,28755 0,916144
X5 0,222946 0,219914 -0,07573 0,600899 -0,88721
X6 0,067685 0,041955 -0,28755 0,600899 1,645749

तालिका 9 से यह स्पष्ट है कि चर वाईके साथ एक उच्च और एक ही समय में सांख्यिकीय रूप से महत्वपूर्ण आंशिक सहसंबंध है कारक X2.


वाई एक्स 1 एक्स 2 एक्स 3 एक्स 4 एक्स 5 एक्स 6
वाई
एक्स 1 0,519
एक्स 2 -0,273 0,030
एक्स 3 0,610 0,813 -0,116
एक्स 4 -0,572 -0,013 -0,022 -0,091
एक्स 5 0,297 0,043 -0,461 0,120 -0,359
एक्स 6 0,118 -0,366 -0,061 -0,329 -0,100 -0,290

विश्लेषण इंटरफैक्टोरियल("X" के बीच!) सहसंबंध गुणांक दर्शाता है कि मान 0.8 से अधिक है पूर्ण मूल्य मेंकेवल कारकों की एक जोड़ी के बीच सहसंबंध गुणांक एक्स 1 –एक्स 3 (बोल्ड में). कारकों एक्स 1 –एक्सइस प्रकार 3 को संरेख के रूप में पहचाना जाता है।

2. जैसा कि पैराग्राफ 1 में दिखाया गया है, कारक एक्स 1 –एक्स 3 संरेख हैं, जिसका अर्थ है कि वे प्रभावी रूप से एक-दूसरे के डुप्लिकेट हैं, और मॉडल में उन्हें एक साथ शामिल करने से संबंधित प्रतिगमन गुणांक की गलत व्याख्या हो जाएगी। यह स्पष्ट है कि कारक एक्स 3 का एक बड़ा है सापेक्षपरिणाम के साथ सहसंबंध गुणांक वाईकारक से एक्स 1: आर वाई , एक्स 1 =0,519; आर वाई , एक्स 3 =0.610; (सेमी। मेज़ 1). यह कारक के एक मजबूत प्रभाव को इंगित करता है एक्स 3 प्रति परिवर्तन वाई. कारक एक्सइसलिए 1 को विचार से बाहर रखा गया है।

प्रतिगमन समीकरण बनाने के लिए उपयोग किए गए चर के मान ( वाई,एक्स 2 , एक्स 3 , एक्स 4 , एक्स 5 , एक्स 6) एक खाली वर्कशीट में कॉपी करें ( adj. 3). हम ऐड-इन का उपयोग करके प्रतिगमन समीकरण बनाते हैं डेटा विश्लेषण...प्रतिगमन" (मेन्यू " सेवा"® « डेटा विश्लेषण…» ® « वापसी"). भरे हुए फ़ील्ड के साथ प्रतिगमन विश्लेषण पैनल दिखाया गया है चावल। 2.

प्रतिगमन विश्लेषण के परिणाम दिए गए हैं adj. 4और चले गए मेज़ 2. प्रतिगमन समीकरण का रूप है (देखें " कठिनाइयाँ"वी मेज़ 2):

प्रतिगमन समीकरण को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है, क्योंकि जिस रूप में इसे प्राप्त किया गया था उसमें इसके यादृच्छिक गठन की संभावना 8.80 × 10 -6 है (देखें)। "महत्व एफ"वी मेज़ 2), जो a=0.05 के स्वीकृत महत्व स्तर से काफी कम है।

एक्स 3 , एक्स 4 , एक्सस्वीकृत महत्व स्तर a=0.05 से 6 नीचे (देखें " पी-वैल्यू"वी मेज़ 2), जो गुणांकों के सांख्यिकीय महत्व और वार्षिक लाभ में परिवर्तन पर इन कारकों के महत्वपूर्ण प्रभाव को इंगित करता है वाई.

कारकों के लिए गुणांक के यादृच्छिक गठन की संभावना एक्स 2 और एक्स 5 स्वीकृत महत्व स्तर a=0.05 से अधिक है (देखें " पी-वैल्यू"वी मेज़ 2), और इन गुणांकों को सांख्यिकीय रूप से महत्वपूर्ण नहीं माना जाता है।

चावल। 2. मॉडल प्रतिगमन विश्लेषण पैनल वाई(एक्स 2 , एक्स 3 , एक्स 4 , एक्स 5 , एक्स 6)

तालिका 2

वाई(एक्स 2 , एक्स 3 , एक्स 4 , एक्स 5 , एक्स 6)

प्रतिगमन आँकड़े
बहुवचन आर 0,868
आर स्कवेयर 0,753
सामान्यीकृत आर-वर्ग 0,694
मानक त्रुटि 242,3
टिप्पणियों
भिन्नता का विश्लेषण
डीएफ एसएस एमएस एफ महत्व एफ
वापसी 3749838,2 749967,6 12,78 8.80ई-06
शेष 1232466,8 58688,9
कुल 4982305,0
प्रतिगमन समीकरण
कठिनाइयाँ मानक त्रुटि टी आँकड़ा पी-मूल्य
वाई-चौराहा 487,5 641,4 0,760 0,456
एक्स2 -0,0456 0,0373 -1,224 0,235
एक्स3 0,1043 0,0194 5,375 0,00002
एक्स4 -0,0965 0,0263 -3,674 0,001
X5 2,528 6,323 0,400 0,693
X6 248,2 113,0 2,197 0,039

3. पिछले पैराग्राफ में किए गए प्रतिगमन समीकरण गुणांक के सांख्यिकीय महत्व की जांच के परिणामों के आधार पर, हम एक नया प्रतिगमन मॉडल बनाते हैं जिसमें केवल सूचनात्मक कारक शामिल हैं, जिसमें शामिल हैं:

· ऐसे कारक जिनके गुणांक सांख्यिकीय रूप से महत्वपूर्ण हैं;

कारक जिनके गुणांक टी-सांख्यिकी निरपेक्ष मान में एक से अधिक है (दूसरे शब्दों में, गुणांक का निरपेक्ष मान इसकी मानक त्रुटि से अधिक है)।

पहले समूह में कारक शामिल हैं एक्स 3 , एक्स 4 , एक्स 6, दूसरे को - कारक एक्स 2. कारक एक्स 5 को सूचनाप्रद मानकर विचार से बाहर रखा गया है, और अंतिम प्रतिगमन मॉडल में कारक शामिल होंगे एक्स 2 , एक्स 3 , एक्स 4 , एक्स 6 .

प्रतिगमन समीकरण बनाने के लिए, उपयोग किए गए चर के मानों को एक रिक्त वर्कशीट में कॉपी करें ( adj. 5)और प्रतिगमन विश्लेषण करें ( चावल। 3). इसके नतीजे इसमें दिए गए हैं adj. 6और चले गए मेज़ 3. प्रतिगमन समीकरण है:

(सेमी। " कठिनाइयाँ"वी मेज़ 3).

चावल। 3. मॉडल प्रतिगमन विश्लेषण पैनल वाई(एक्स 2 , एक्स 3 , एक्स 4 , एक्स 6)

टेबल तीन

मॉडल के प्रतिगमन विश्लेषण के परिणाम वाई(एक्स 2 , एक्स 3 , एक्स 4 , एक्स 6)

प्रतिगमन आँकड़े
बहुवचन आर 0,866
आर स्कवेयर 0,751
सामान्यीकृत आर-वर्ग 0,705
मानक त्रुटि 237,6
टिप्पणियों
भिन्नता का विश्लेषण
डीएफ एसएस एमएस एफ महत्व एफ
वापसी 3740456,2 935114,1 16,57 2.14ई-06
शेष 1241848,7 56447,7
कुल 4982305,0
प्रतिगमन समीकरण
कठिनाइयाँ मानक त्रुटि टी आँकड़ा पी-मूल्य
वाई-चौराहा 712,2 303,0 2,351 0,028
एक्स2 -0,0541 0,0300 -1,806 0,085
एक्स3 0,1032 0,0188 5,476 0,00002
एक्स4 -0,1017 0,0223 -4,560 0,00015
X6 227,5 98,5 2,310 0,031

प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वपूर्ण है: इसके यादृच्छिक गठन की संभावना a=0.05 के स्वीकार्य महत्व स्तर से नीचे है (देखें " महत्व एफ"वी मेज़ 3).

कारकों के गुणांकों को सांख्यिकीय रूप से भी महत्वपूर्ण माना जाता है एक्स 3 , एक्स 4 , एक्स 6: उनके यादृच्छिक गठन की संभावना स्वीकार्य महत्व स्तर a=0.05 से नीचे है (देखें " पी-वैल्यू"वी मेज़ 3). यह वार्षिक बीमा प्रीमियम के महत्वपूर्ण प्रभाव को दर्शाता है एक्स 3, बीमा भुगतान की वार्षिक राशि एक्स 4 और स्वामित्व के रूप एक्सवार्षिक लाभ में प्रति परिवर्तन 6 रु वाई.

कारक गुणांक एक्स 2 (बीमा भंडार का वार्षिक आकार) सांख्यिकीय रूप से महत्वपूर्ण नहीं है। हालाँकि, इस कारक को अभी भी जानकारीपूर्ण माना जा सकता है टी-इसके गुणांक के आँकड़े अधिक हैं सापेक्षइकाई, हालांकि कारक के संबंध में आगे के निष्कर्ष एक्स 2 के साथ कुछ सावधानी बरतनी चाहिए।

4. आइए हम प्रतिगमन विश्लेषण के दौरान प्राप्त कुछ सांख्यिकीय विशेषताओं का उपयोग करके अंतिम प्रतिगमन समीकरण की गुणवत्ता और सटीकता का मूल्यांकन करें (देखें) . « प्रतिगमन आँकड़े" वी मेज़ 3):

निर्धारण का एकाधिक गुणांक

दर्शाता है कि प्रतिगमन मॉडल वार्षिक लाभ में 75.1% भिन्नता की व्याख्या करता है वाई, और यह भिन्नता प्रतिगमन मॉडल में शामिल कारकों में परिवर्तन के कारण है एक्स 2 , एक्स 3 , एक्स 4 और एक्स 6 ;

प्रतिगमन की मानक त्रुटि

हजार रूबल.

दर्शाता है कि प्रतिगमन समीकरण द्वारा अनुमानित वार्षिक लाभ के मूल्य वाईवास्तविक मूल्यों से औसतन 237.6 हजार रूबल का अंतर।

औसत सापेक्ष सन्निकटन त्रुटि अनुमानित सूत्र द्वारा निर्धारित की जाती है:

कहाँ हजार रूबल. - औसत वार्षिक लाभ (अंतर्निहित फ़ंक्शन का उपयोग करके निर्धारित " औसत»; adj. 1).

rel से पता चलता है कि प्रतिगमन समीकरण द्वारा अनुमानित वार्षिक लाभ के मूल्य वाईवास्तविक मूल्यों से औसतन 26.7% भिन्न है। मॉडल में असंतोषजनक सटीकता है (पर - मॉडल की सटीकता अधिक है, पर - निपुण - संतोषजनक, साथ - असंतोषजनक)।

5. प्रतिगमन समीकरण के गुणांकों की आर्थिक व्याख्या के लिए, हम स्रोत डेटा में चर के औसत मूल्यों और मानक विचलन को सारणीबद्ध करते हैं ( मेज़ 4) . औसत मान अंतर्निहित फ़ंक्शन का उपयोग करके निर्धारित किए गए थे " औसत", मानक विचलन - अंतर्निहित फ़ंक्शन का उपयोग करना " मानक विचलन" (सेमी। adj. 1).

2011 का डेटा रूसी संघ के दक्षिणी संघीय जिले के क्षेत्रों के लिए प्रदान किया गया है

संघीय जिले के क्षेत्र

सकल क्षेत्रीय उत्पाद, अरब रूबल, Y

अचल संपत्तियों में निवेश, अरब रूबल, X1

1. प्रतिनिधि. एडिगेया

2. प्रतिनिधि. दागिस्तान

3. प्रतिनिधि. इन्गुशेतिया

4. काबर्डिनो-बाल्केरियन गणराज्य

5. प्रतिनिधि. कल्मिकिया

6. कराची-चर्केस गणराज्य

7. प्रतिनिधि. उत्तर ओसेशिया अलानिया

8. क्रास्नोडार क्षेत्र)

9. स्टावरोपोल क्षेत्र

10. अस्त्रखान क्षेत्र।

11. वोल्गोग्राड क्षेत्र।

12. रोस्तोव क्षेत्र।

  • 1. युग्म सहसंबंध गुणांक के मैट्रिक्स की गणना करें; सहसंबंध गुणांकों के सांख्यिकीय महत्व का मूल्यांकन करें।
  • 2. प्रभावी विशेषता और उससे सबसे निकट से संबंधित कारक के बीच सहसंबंध का एक क्षेत्र बनाएं।
  • 3. प्रत्येक कारक के लिए रैखिक जोड़ी प्रतिगमन के मापदंडों की गणना करें एक्स..
  • 4. निर्धारण के गुणांक, सन्निकटन की औसत त्रुटि और फिशर एफ परीक्षण के माध्यम से प्रत्येक मॉडल की गुणवत्ता का आकलन करें। सर्वोत्तम मॉडल चुनें.

इसके अधिकतम मूल्य का 80% होगा. ग्राफ़िक रूप से प्रस्तुत करें: वास्तविक और मॉडल मान, पूर्वानुमान बिंदु।

  • 6. चरण-दर-चरण एकाधिक प्रतिगमन (बहिष्करण विधि या समावेशन विधि) का उपयोग करके, महत्वपूर्ण कारकों के कारण अपार्टमेंट मूल्य निर्धारण का एक मॉडल बनाएं। प्रतिगमन मॉडल गुणांकों की आर्थिक व्याख्या दीजिए।
  • 7. निर्मित मॉडल की गुणवत्ता का मूल्यांकन करें। क्या एकल-कारक मॉडल की तुलना में मॉडल की गुणवत्ता में सुधार हुआ है? - और - में लोच गुणांक का उपयोग करके परिणाम पर महत्वपूर्ण कारकों के प्रभाव का आकलन करें? गुणांकों

इस समस्या को हल करते समय, हम एक्सेल डेटा विश्लेषण सेटिंग्स का उपयोग करके गणना करेंगे और ग्राफ़ और आरेख का निर्माण करेंगे।

1. युग्म सहसंबंध गुणांकों के मैट्रिक्स की गणना करें और सहसंबंध गुणांकों के सांख्यिकीय महत्व का मूल्यांकन करें

सहसंबंध संवाद बॉक्स में, इनपुट अंतराल फ़ील्ड में, स्रोत डेटा वाले कक्षों की श्रेणी दर्ज करें। चूँकि हमने कॉलम शीर्षकों का भी चयन किया है, हम पहली पंक्ति में लेबल चेकबॉक्स को चेक करते हैं।

हमें निम्नलिखित परिणाम मिले:

तालिका 1.1 जोड़ी सहसंबंध गुणांक का मैट्रिक्स

जोड़ीवार सहसंबंध गुणांक के मैट्रिक्स के विश्लेषण से पता चलता है कि आश्रित चर Y, यानी सकल क्षेत्रीय उत्पाद, का X1 (स्थिर पूंजी में निवेश) के साथ घनिष्ठ संबंध है। सहसंबंध गुणांक 0.936 है। इसका मतलब यह है कि आश्रित चर Y (सकल क्षेत्रीय उत्पाद) का 93.6% संकेतक X1 (स्थिर पूंजी में निवेश) पर निर्भर करता है।

हम छात्र के टी-टेस्ट का उपयोग करके सहसंबंध गुणांक का सांख्यिकीय महत्व निर्धारित करेंगे। हम तालिका मान की तुलना परिकलित मानों से करते हैं।

आइए STUDISCOVER फ़ंक्शन का उपयोग करके तालिका मान की गणना करें।

टी तालिका = 0.129, आत्मविश्वास स्तर 0.9 और स्वतंत्रता की डिग्री (एन-2) के साथ।

फैक्टर X1 सांख्यिकीय रूप से महत्वपूर्ण है।

2. आइए प्रभावी विशेषता (सकल क्षेत्रीय उत्पाद) और उससे सबसे निकट से संबंधित कारक (स्थिर पूंजी में निवेश) के बीच सहसंबंध का एक क्षेत्र बनाएं।

ऐसा करने के लिए, हम एक्सेल स्कैटर प्लॉट टूल का उपयोग करेंगे।

परिणामस्वरूप, हमें सकल क्षेत्रीय उत्पाद, अरब रूबल की कीमत का सहसंबंध क्षेत्र प्राप्त होता है। और अचल संपत्तियों में निवेश, अरब रूबल। (चित्र 1.1.).

चित्र 1.1

3. प्रत्येक कारक X के लिए रैखिक युग्म प्रतिगमन के मापदंडों की गणना करें

रैखिक जोड़ीवार प्रतिगमन के मापदंडों की गणना करने के लिए, हम डेटा विश्लेषण सेटिंग में शामिल प्रतिगमन उपकरण का उपयोग करेंगे।

प्रतिगमन संवाद बॉक्स में, इनपुट अंतराल Y फ़ील्ड में, उन कोशिकाओं की श्रेणी का पता दर्ज करें जो आश्रित चर का प्रतिनिधित्व करते हैं। खेत मेँ

इनपुट अंतराल X हम उस श्रेणी का पता दर्ज करते हैं जिसमें स्वतंत्र चर के मान शामिल हैं। आइए हम कारक X के लिए युग्मित प्रतिगमन के मापदंडों की गणना करें।

X1 के लिए हमें तालिका 1.2 में प्रस्तुत निम्नलिखित डेटा प्राप्त हुआ:

तालिका 1.2

स्थिर पूंजी में निवेश पर सकल क्षेत्रीय उत्पाद की कीमत की निर्भरता के प्रतिगमन समीकरण का रूप है:

4. आइए निर्धारण के गुणांक, सन्निकटन की औसत त्रुटि और फिशर के एफ-परीक्षण के माध्यम से प्रत्येक मॉडल की गुणवत्ता का मूल्यांकन करें। आइए तय करें कि कौन सा मॉडल सबसे अच्छा है।

हमने पैराग्राफ 3 में की गई गणनाओं के परिणामस्वरूप निर्धारण का गुणांक, सन्निकटन की औसत त्रुटि प्राप्त की। प्राप्त डेटा निम्नलिखित तालिकाओं में प्रस्तुत किए गए हैं:

X1 डेटा:

तालिका 1.3ए

तालिका 1.4बी

ए) निर्धारण का गुणांक यह निर्धारित करता है कि मॉडल में विशेषता वाई की भिन्नता के किस अनुपात को ध्यान में रखा गया है और यह उस पर कारक एक्स के प्रभाव के कारण है। निर्धारण के गुणांक का मूल्य जितना अधिक होगा, के बीच संबंध उतना ही करीब होगा निर्मित गणितीय मॉडल में विशेषताएँ।

एक्सेल आर-स्क्वायर को संदर्भित करता है।

इस मानदंड के आधार पर, सबसे पर्याप्त मॉडल निश्चित पूंजी (X1) में निवेश पर सकल क्षेत्रीय उत्पाद की कीमत की निर्भरता का प्रतिगमन समीकरण है।

बी) हम सूत्र का उपयोग करके औसत सन्निकटन त्रुटि की गणना करते हैं:

जहां अंश वास्तविक मानों से परिकलित मानों के विचलन के वर्गों का योग है। तालिकाओं में यह एसएस कॉलम, शेष पंक्ति में स्थित है।

हम AVERAGE फ़ंक्शन का उपयोग करके एक्सेल में एक अपार्टमेंट की औसत कीमत की गणना करते हैं। = 24.18182 अरब रूबल।

आर्थिक गणना करते समय, यदि सन्निकटन की औसत त्रुटि 5% से कम है तो एक मॉडल को पर्याप्त रूप से सटीक माना जाता है; यदि सन्निकटन की औसत त्रुटि 15% से कम है तो मॉडल को स्वीकार्य माना जाता है।

इस मानदंड के अनुसार, निश्चित पूंजी (X1) में निवेश पर सकल क्षेत्रीय उत्पाद की कीमत की निर्भरता के प्रतिगमन समीकरण के लिए गणितीय मॉडल सबसे पर्याप्त है।

सी) एफ-परीक्षण का उपयोग प्रतिगमन मॉडल के महत्व का परीक्षण करने के लिए किया जाता है। ऐसा करने के लिए, फिशर एफ-परीक्षण के महत्वपूर्ण (सारणीबद्ध) मूल्यों की तुलना भी की जाती है।

परिकलित मान तालिका 1.4बी (अक्षर एफ द्वारा इंगित) में दिए गए हैं।

हम FDIST फ़ंक्शन का उपयोग करके Excel में फिशर F परीक्षण के सारणीबद्ध मान की गणना करेंगे। आइए प्रायिकता को 0.05 के बराबर लें। प्राप्त: = 4.75

प्रत्येक कारक के लिए फिशर के एफ परीक्षण के परिकलित मान तालिका मान के तुलनीय हैं:

71.02 > = 4.75 मॉडल इस मानदंड के अनुसार पर्याप्त है।

तीनों मानदंडों के अनुसार डेटा का विश्लेषण करने के बाद, हम यह निष्कर्ष निकाल सकते हैं कि सबसे अच्छा गणितीय मॉडल सकल क्षेत्रीय उत्पाद कारक के लिए बनाया गया है, जिसे रैखिक समीकरण द्वारा वर्णित किया गया है

5. सकल क्षेत्रीय उत्पाद की कीमत की निर्भरता के चयनित मॉडल के लिए

यदि कारक का अनुमानित मूल्य उसके अधिकतम मूल्य का 80% है, तो हम महत्व स्तर पर संकेतक के औसत मूल्य की भविष्यवाणी करेंगे। आइए इसे ग्राफ़िक रूप से प्रस्तुत करें: वास्तविक और मॉडल मान, पूर्वानुमान बिंदु।

आइए एक्स के अनुमानित मूल्य की गणना करें; शर्त के अनुसार, यह अधिकतम मूल्य का 80% होगा।

आइए MAX फ़ंक्शन का उपयोग करके Excel में X अधिकतम की गणना करें।

0,8 *52,8 = 42,24

आश्रित चर का पूर्वानुमानित अनुमान प्राप्त करने के लिए, हम स्वतंत्र चर के प्राप्त मूल्य को रैखिक समीकरण में प्रतिस्थापित करते हैं:

5.07+2.14*42.24 = 304.55 बिलियन रूबल।

आइए हम पूर्वानुमान का विश्वास अंतराल निर्धारित करें, जिसकी निम्नलिखित सीमाएँ होंगी:

अनुमानित मूल्य के लिए विश्वास अंतराल की गणना करने के लिए, हम प्रतिगमन रेखा से विचलन की गणना करते हैं।

युग्मित प्रतिगमन मॉडल के लिए, विचलन मान की गणना की जाती है:

वे। तालिका 1.5ए से मानक त्रुटि मान।

(चूंकि स्वतंत्रता की डिग्री की संख्या एक के बराबर है, हर n-2 के बराबर होगा)। सहसंबंध जोड़ी प्रतिगमन पूर्वानुमान

गुणांक की गणना करने के लिए, हम एक्सेल फ़ंक्शन STUDISCOVER का उपयोग करेंगे, संभावना को 0.1 के बराबर लेंगे, और स्वतंत्रता की डिग्री की संख्या 38 लेंगे।

हम एक्सेल का उपयोग करके मूल्य की गणना करते हैं और 12294 प्राप्त करते हैं।


आइए अंतराल की ऊपरी और निचली सीमाएं निर्धारित करें।

  • 304,55+27,472= 332,022
  • 304,55-27,472= 277,078

इस प्रकार, पूर्वानुमान मूल्य = 304.55 हजार डॉलर 277.078 हजार डॉलर के बराबर निचली सीमा के बीच होगा। और ऊपरी सीमा 332.022 बिलियन के बराबर है। रगड़ना।

वास्तविक और मॉडल मान, पूर्वानुमान बिंदु चित्र 1.2 में ग्राफिक रूप से प्रस्तुत किए गए हैं।


चित्र 1.2

6. चरण-दर-चरण एकाधिक प्रतिगमन (उन्मूलन विधि) का उपयोग करके, हम महत्वपूर्ण कारकों के कारण सकल क्षेत्रीय उत्पाद की कीमत के गठन के लिए एक मॉडल बनाएंगे

मल्टीपल रिग्रेशन बनाने के लिए, हम सभी कारकों सहित एक्सेल के रिग्रेशन फ़ंक्शन का उपयोग करेंगे। परिणामस्वरूप, हमें परिणाम तालिकाएँ प्राप्त होती हैं, जिनसे हमें विद्यार्थी के टी-टेस्ट की आवश्यकता होती है।

तालिका 1.8ए

तालिका 1.8बी

तालिका 1.8सी.

हमें एक मॉडल मिलता है जैसे:

क्योंकि< (4,75 < 71,024), уравнение регрессии следует признать адекватным.

आइए छात्र के टी-टेस्ट का सबसे छोटा निरपेक्ष मान चुनें, यह 8.427 के बराबर है, इसकी तुलना तालिका मान से करें, जिसे हम एक्सेल में गणना करते हैं, महत्व स्तर 0.10 के बराबर लेते हैं, स्वतंत्रता की डिग्री की संख्या एन-एम-1= 12-4=8: =1.8595

8.427>1.8595 के बाद से मॉडल को पर्याप्त माना जाना चाहिए।

7. परिणामी गणितीय मॉडल के महत्वपूर्ण कारक का आकलन करने के लिए, हम लोच गुणांक, और - गुणांक की गणना करते हैं

लोच गुणांक दर्शाता है कि कारक विशेषता में 1% परिवर्तन होने पर प्रभावी विशेषता कितने प्रतिशत बदल जाएगी:

ई एक्स4 = 2.137 * (10.69/24.182) = 0.94%

अर्थात्, अचल पूंजी में निवेश में 1% की वृद्धि के साथ, लागत औसतन 0.94% बढ़ जाती है।

गुणांक दर्शाता है कि मानक विचलन के किस भाग से एक मानक विचलन द्वारा स्वतंत्र चर में परिवर्तन के साथ आश्रित चर का औसत मूल्य बदलता है।

2,137* (14.736/33,632) = 0,936.

मानक विचलन डेटा वर्णनात्मक सांख्यिकी उपकरण का उपयोग करके प्राप्त तालिकाओं से लिया जाता है।

तालिका 1.11 वर्णनात्मक आँकड़े (वाई)

तालिका 1.12 वर्णनात्मक आँकड़े (X4)

गुणांक सभी कारकों के कुल प्रभाव में कारक के प्रभाव का हिस्सा निर्धारित करता है:

जोड़ी सहसंबंध गुणांक की गणना करने के लिए, हम डेटा विश्लेषण सेटिंग्स में सहसंबंध उपकरण का उपयोग करके एक्सेल में जोड़ी सहसंबंध गुणांक के मैट्रिक्स की गणना करते हैं।

तालिका 1.14

(0,93633*0,93626) / 0,87 = 1,00.

निष्कर्ष: प्राप्त गणनाओं से, हम यह निष्कर्ष निकाल सकते हैं कि प्रभावी विशेषता Y (सकल क्षेत्रीय उत्पाद) की कारक X1 (स्थिर पूंजी में निवेश) (100% तक) पर बड़ी निर्भरता है।

ग्रन्थसूची

  • 1. मैग्नस वाई.आर., कातिशेव पी.के., पेरेसेट्स्की ए.ए. अर्थमिति। शुरुआती कोर्स. ट्यूटोरियल। दूसरा संस्करण. - एम.: डेलो, 1998. - पी. 69 - 74.
  • 2. अर्थमिति पर कार्यशाला: पाठ्यपुस्तक / आई.आई. एलिसेवा, एस.वी. कुरीशेवा, एन.एम. गोर्डीन्को एट अल. 2002. - पी. 49-105.
  • 3. डफ़र्टी के. अर्थमिति का परिचय: अनुवाद। अंग्रेज़ी से - एम.: इंफ्रा-एम, 1999. - XIV, पी. 262-285.
  • 4. अयवीज़यान एस.ए., मिख्तिरयान वी.एस. अनुप्रयुक्त गणित और अर्थमिति के मूल सिद्धांत। -1998., पृ. 115-147.
  • 5. क्रेमर एन.एस.एच., पुटको बी.ए. अर्थमिति। -2007. 175-251 तक.
एक्स (1) एक्स (2) एक्स (3) एक्स (4) एक्स (5)
1.00 0.43 0.37 0.40 0.58 0.33
एक्स (1) 0.43 1.00 0.85 0.98 0.11 0.34
एक्स (2) 0.37 0.85 1.00 0.88 0.03 0.46
एक्स (3) 0.40 0.98 0.88 1.00 0.03 0.28
एक्स (4) 0.58 0.11 0.03 0.03 1.00 0.57
एक्स (5) 0.33 0.34 0.46 0.28 0.57 1.00

युग्मित सहसंबंध गुणांक के मैट्रिक्स के विश्लेषण से पता चलता है कि प्रभावी संकेतक संकेतक से सबसे निकट से संबंधित है एक्स(4) - प्रति 1 हेक्टेयर खपत उर्वरक की मात्रा ()।

साथ ही, गुण-तर्कों के बीच संबंध काफी घनिष्ठ है। इस प्रकार, पहिये वाले ट्रैक्टरों की संख्या के बीच व्यावहारिक रूप से कार्यात्मक संबंध है ( एक्स(1)) और सतही जुताई उपकरणों की संख्या .

बहुसंरेखता की उपस्थिति सहसंबंध गुणांक और द्वारा भी इंगित की जाती है। संकेतकों के बीच घनिष्ठ संबंध को ध्यान में रखते हुए एक्स (1) , एक्स(2) और एक्स(3), उनमें से केवल एक को उपज प्रतिगमन मॉडल में शामिल किया जा सकता है।

बहुसंरेखता के नकारात्मक प्रभाव को प्रदर्शित करने के लिए, सभी इनपुट संकेतकों सहित उपज के एक प्रतिगमन मॉडल पर विचार करें:

एफ ओब्स = 121.

समीकरण के गुणांकों के अनुमानों के मानक विचलन के सही अनुमानों के मान कोष्ठक में दर्शाए गए हैं .

निम्नलिखित पर्याप्तता पैरामीटर प्रतिगमन समीकरण के अंतर्गत प्रस्तुत किए गए हैं: निर्धारण के एकाधिक गुणांक; अवशिष्ट विचरण का सही अनुमान, सन्निकटन की औसत सापेक्ष त्रुटि और मानदंड एफ ओब्स = 121 का परिकलित मूल्य।

प्रतिगमन समीकरण महत्वपूर्ण है क्योंकि एफ ओब्स = 121 > एफ केपी = 2.85 तालिका से पाया गया एफ-ए=0.05 पर वितरण; एन 1 =6 और एन 2 =14.

इससे यह निष्कर्ष निकलता है कि Q¹0, अर्थात्। और समीकरण q के गुणांकों में से कम से कम एक जे (जे= 0, 1, 2, ..., 5) शून्य नहीं है।

व्यक्तिगत प्रतिगमन गुणांक H0 के महत्व के बारे में परिकल्पना का परीक्षण करने के लिए: q j = 0, जहां जे=1,2,3,4,5, क्रांतिक मान की तुलना करें टीकेपी = 2.14, तालिका से पाया गया टी-महत्व स्तर a=2 पर वितरण क्यू=0.05 और स्वतंत्रता की डिग्री की संख्या n=14, परिकलित मान के साथ। समीकरण से यह निष्कर्ष निकलता है कि प्रतिगमन गुणांक सांख्यिकीय रूप से केवल तभी महत्वपूर्ण होता है एक्स(4) ½ से टी 4 ½=2.90 > टीकेपी =2.14.



प्रतिगमन गुणांक के नकारात्मक संकेत आर्थिक व्याख्या के लिए उपयुक्त नहीं होते हैं एक्स(1) और एक्स(5) . गुणांकों के नकारात्मक मूल्यों से यह पता चलता है कि पहिएदार ट्रैक्टरों के साथ कृषि की संतृप्ति में वृद्धि ( एक्स(1)) और पादप स्वास्थ्य उत्पाद ( एक्स(5)) उपज पर नकारात्मक प्रभाव पड़ता है। इसलिए, परिणामी प्रतिगमन समीकरण अस्वीकार्य है।

महत्वपूर्ण गुणांकों के साथ एक प्रतिगमन समीकरण प्राप्त करने के लिए, हम चरण-दर-चरण प्रतिगमन विश्लेषण एल्गोरिदम का उपयोग करते हैं। प्रारंभ में, हम चर के उन्मूलन के साथ चरण-दर-चरण एल्गोरिदम का उपयोग करते हैं।

आइए वेरिएबल को मॉडल से बाहर निकालें एक्स(1) , जो ½ के न्यूनतम निरपेक्ष मान से मेल खाता है टी 1 ½=0.01. शेष चरों के लिए, हम फिर से प्रतिगमन समीकरण बनाते हैं:

परिणामी समीकरण महत्वपूर्ण है क्योंकि एफ देखा गया = 155 > एफ केपी = 2.90, महत्व स्तर पर पाया गया ए = 0.05 और तालिका के अनुसार स्वतंत्रता की डिग्री की संख्या एन 1 = 5 और एन 2 = 15 एफ-वितरण, यानी वेक्टर q¹0. हालाँकि, केवल प्रतिगमन गुणांक पर एक्स(4) . अनुमानित मूल्य ½ टीअन्य गुणांकों के लिए j ½ कम है टी kr = 2.131, तालिका से पाया गया टी-ए=2 पर वितरण क्यू=0.05 और n=15.

मॉडल से वेरिएबल को बाहर करके एक्स(3) , जो न्यूनतम मूल्य से मेल खाता है टी 3 =0.35 और हमें प्रतिगमन समीकरण मिलता है:

(2.9)

परिणामी समीकरण में, गुणांक पर एक्स(5) . बहिष्कृत करके एक्स(5) हमें प्रतिगमन समीकरण प्राप्त होता है:

(2.10)

हमने महत्वपूर्ण और व्याख्या योग्य गुणांकों के साथ एक महत्वपूर्ण प्रतिगमन समीकरण प्राप्त किया।

हालाँकि, परिणामी समीकरण हमारे उदाहरण में न केवल "अच्छा" है और न ही "सर्वोत्तम" उपज मॉडल है।

चलिए वो दिखाते हैं बहुसंरेखता स्थिति में, चर के समावेश के साथ एक चरणबद्ध एल्गोरिदम अधिक कुशल है।उपज मॉडल में पहला कदम परिवर्तनशील शामिल एक्स(4) , जिसके साथ उच्चतम सहसंबंध गुणांक है , चर द्वारा समझाया गया - आर(,एक्स(4))=0.58. दूसरे चरण में समीकरण सहित एक्स(4) चर एक्स(1)या एक्स(3), हम ऐसे मॉडल प्राप्त करेंगे, जो आर्थिक कारणों और सांख्यिकीय विशेषताओं के लिए, (2.10) से अधिक हैं:

(2.11)

(2.12)

समीकरण में शेष तीन चरों में से किसी को भी शामिल करने से इसके गुण खराब हो जाते हैं। उदाहरण के लिए, समीकरण (2.9) देखें।

इस प्रकार, हमारे पास तीन "अच्छे" उपज मॉडल हैं, जिनमें से हमें आर्थिक और सांख्यिकीय कारणों से एक को चुनने की आवश्यकता है।

सांख्यिकीय मानदंडों के अनुसार, मॉडल (2.11) सबसे पर्याप्त है। यह अवशिष्ट विचरण के न्यूनतम मान = 2.26 और सन्निकटन की औसत सापेक्ष त्रुटि और सबसे बड़े मान और एफओबी = 273 से मेल खाता है।

मॉडल (2.12) में पर्याप्तता संकेतक थोड़े खराब हैं, इसके बाद मॉडल (2.10) है।

अब हम सर्वश्रेष्ठ मॉडल (2.11) और (2.12) चुनेंगे। ये मॉडल चर के संदर्भ में एक दूसरे से भिन्न हैं एक्स(1) और एक्स(3) . हालाँकि, उपज मॉडल में परिवर्तनशील एक्स(1) (प्रति 100 हेक्टेयर पहिये वाले ट्रैक्टरों की संख्या) परिवर्तनीय से अधिक बेहतर है एक्स(3) (प्रति 100 हेक्टेयर सतह जुताई उपकरणों की संख्या), जो कुछ हद तक गौण है (या इससे प्राप्त हुई है) एक्स (1)).

इस संबंध में आर्थिक कारणों से मॉडल (2.12) को प्राथमिकता दी जानी चाहिए। इस प्रकार, चर को शामिल करने के साथ चरणबद्ध प्रतिगमन विश्लेषण एल्गोरिदम को लागू करने और इस तथ्य को ध्यान में रखते हुए कि तीन संबंधित चर में से केवल एक को समीकरण में प्रवेश करना चाहिए ( एक्स (1) , एक्स(2)या एक्स(3)) अंतिम प्रतिगमन समीकरण चुनें:

समीकरण a=0.05 पर महत्वपूर्ण है, क्योंकि एफ ओब्स = 266 > एफ केपी = 3.20, तालिका से पाया गया एफ-वितरण ए= पर क्यू=0.05; एन 1 =3 और एन 2 =17. समीकरण ½ में सभी प्रतिगमन गुणांक भी महत्वपूर्ण हैं टीजे½> टीकेपी(ए=2 क्यू=0.05; n=17)=2.11. प्रतिगमन गुणांक q 1 को आर्थिक कारणों से महत्वपूर्ण (q 1 ¹0) माना जाना चाहिए, जबकि टी 1 =2.09 केवल थोड़ा सा कम टीकेपी = 2.11.

प्रतिगमन समीकरण से यह पता चलता है कि प्रति 100 हेक्टेयर कृषि योग्य भूमि पर ट्रैक्टरों की संख्या में एक की वृद्धि (एक निश्चित मूल्य पर) एक्स(4)) अनाज की पैदावार में औसतन 0.345 सी/हेक्टेयर की वृद्धि होती है।

लोच गुणांक ई 1 »0.068 और ई 2 »0.161 की अनुमानित गणना से पता चलता है कि बढ़ते संकेतकों के साथ एक्स(1) और एक्स(4) 1% से, अनाज की उपज औसतन क्रमशः 0.068% और 0.161% बढ़ जाती है।

निर्धारण के एकाधिक गुणांक इंगित करते हैं कि उपज भिन्नता का केवल 46.9% मॉडल में शामिल संकेतकों द्वारा समझाया गया है ( एक्स(1) और एक्स(4)), यानी, ट्रैक्टर और उर्वरकों के साथ फसल उत्पादन की संतृप्ति। शेष भिन्नता बेहिसाब कारकों की कार्रवाई के कारण है ( एक्स (2) , एक्स (3) , एक्स(5), मौसम की स्थिति, आदि)। सन्निकटन की औसत सापेक्ष त्रुटि मॉडल की पर्याप्तता, साथ ही अवशिष्ट विचरण के मूल्य को दर्शाती है। प्रतिगमन समीकरण की व्याख्या करते समय, सन्निकटन की सापेक्ष त्रुटियों के मान रुचिकर होते हैं . आइए हम याद करें कि - प्रभावी संकेतक का मॉडल मूल्य विचाराधीन क्षेत्रों की समग्रता के लिए औसत उपज मूल्य को दर्शाता है, बशर्ते कि व्याख्यात्मक चर के मान एक्स(1) और एक्स(4) समान स्तर पर स्थिर होते हैं, अर्थात् एक्स (1) = एक्स मैं(1) और एक्स (4) = एक्स मैं(4) . फिर, d के मान के अनुसार मैंआप उपज के आधार पर क्षेत्रों की तुलना कर सकते हैं। वे क्षेत्र जिनसे d मान मेल खाते हैं मैं>0, औसत से अधिक उपज है, और डी मैं<0 - ниже среднего.

हमारे उदाहरण में, उपज की दृष्टि से, डी के अनुरूप क्षेत्र में फसल उत्पादन सबसे प्रभावी है 7 =28%, जहां उपज क्षेत्रीय औसत से 28% अधिक है, और सबसे कम प्रभावी डी वाले क्षेत्र में है 20 =-27,3%.


कार्य और अभ्यास

2.1. सामान्य जनसंख्या से ( , एक्स (1) , ..., एक्स(पी)), कहाँ सशर्त गणितीय अपेक्षा और विचरण एस 2 के साथ एक सामान्य वितरण कानून है, जिसका एक यादृच्छिक नमूना है एन, जाने देना ( यी, एक्स मैं (1) , ..., एक्स मैं(पी)) - परिणाम मैंवें अवलोकन ( मैं=1, 2, ..., एन). निर्धारित करें: ए) वेक्टर के न्यूनतम वर्ग अनुमान की गणितीय अपेक्षा क्यू; बी) वेक्टर के न्यूनतम वर्ग अनुमान का सहप्रसरण मैट्रिक्स क्यू; ग) मूल्यांकन की गणितीय अपेक्षा।

2.2. समस्या 2.1 की शर्तों के अनुसार, प्रतिगमन के कारण वर्ग विचलन के योग की गणितीय अपेक्षा ज्ञात कीजिए, अर्थात। ईक्यू आर, कहाँ

.

2.3. समस्या 2.1 की शर्तों के अनुसार, प्रतिगमन रेखाओं के सापेक्ष अवशिष्ट भिन्नता के कारण होने वाले वर्ग विचलन के योग की गणितीय अपेक्षा निर्धारित करें, अर्थात। eq केओस्ट, कहाँ

2.4. साबित करें कि जब परिकल्पना H 0 पूरी होती है: q=0 आँकड़े

स्वतंत्रता की डिग्री n 1 =p+1 और n 2 =n-p-1 के साथ F-वितरण है।

2.5. साबित करें कि जब परिकल्पना H 0: q j =0 पूरी हो जाती है, तो आंकड़ों में स्वतंत्रता की डिग्री n=n-p-1 की संख्या के साथ t-वितरण होता है।

2.6. चारे की रोटी के सिकुड़न की निर्भरता पर डेटा (तालिका 2.3) के आधार पर ( ) भंडारण अवधि पर ( एक्स) इस धारणा के तहत सशर्त अपेक्षा का एक बिंदु अनुमान ढूंढें कि सामान्य प्रतिगमन समीकरण रैखिक है।

तालिका 2.3.

आवश्यक: ए) इस धारणा के तहत अवशिष्ट विचरण एस 2 का अनुमान लगाएं कि सामान्य प्रतिगमन समीकरण का रूप है; बी) ए=0.05 पर प्रतिगमन समीकरण के महत्व की जांच करें, यानी। परिकल्पना एच 0: क्यू=0; सी) विश्वसनीयता जी=0.9 के साथ, पैरामीटर क्यू 0, क्यू 1 के अंतराल अनुमान निर्धारित करें; डी) विश्वसनीयता जी=0.95 के साथ, सशर्त गणितीय अपेक्षा का अंतराल अनुमान निर्धारित करें एक्स 0=6; ई) बिंदु पर भविष्यवाणी का विश्वास अंतराल g=0.95 पर निर्धारित करें एक्स=12.

2.7. तालिका में दिए गए 5 महीनों के लिए स्टॉक की कीमतों की वृद्धि दर की गतिशीलता पर डेटा के आधार पर। 2.4.

तालिका 2.4.

महीने ( एक्स)
(%)

और यह धारणा कि सामान्य प्रतिगमन समीकरण का रूप है, यह आवश्यक है: ए) प्रतिगमन समीकरण के दोनों मापदंडों और अवशिष्ट विचरण एस 2 का अनुमान निर्धारित करें; बी) ए=0.01 पर प्रतिगमन गुणांक के महत्व की जांच करें, यानी। परिकल्पना एच 0: क्यू 1 =0;

सी) विश्वसनीयता जी=0.95 के साथ, पैरामीटर क्यू 0 और क्यू 1 के अंतराल अनुमान खोजें; डी) विश्वसनीयता जी=0.9 के साथ, सशर्त गणितीय अपेक्षा का एक अंतराल अनुमान स्थापित करें एक्स 0=4; ई) बिंदु पर भविष्यवाणी का विश्वास अंतराल g=0.9 पर निर्धारित करें एक्स=5.

2.8. युवा जानवरों के वजन बढ़ने की गतिशीलता के अध्ययन के परिणाम तालिका 2.5 में दिए गए हैं।

तालिका 2.5.

यह मानते हुए कि सामान्य प्रतिगमन समीकरण रैखिक है, यह आवश्यक है: ए) प्रतिगमन समीकरण के दोनों मापदंडों और अवशिष्ट विचरण एस 2 का अनुमान निर्धारित करें; बी) ए=0.05 पर प्रतिगमन समीकरण के महत्व की जांच करें, यानी। परिकल्पना एच 0: क्यू=0;

सी) विश्वसनीयता जी=0.8 के साथ, पैरामीटर क्यू 0 और क्यू 1 के अंतराल अनुमान खोजें; डी) विश्वसनीयता जी=0.98 के साथ, सशर्त गणितीय अपेक्षा के अंतराल अनुमानों को निर्धारित और तुलना करें एक्स 0 =3 और एक्स 1 =6;

ई) बिंदु पर भविष्यवाणी का विश्वास अंतराल g=0.98 पर निर्धारित करें एक्स=8.

2.9. लागत ( ) प्रसार के आधार पर पुस्तक की एक प्रति ( एक्स) (हजार प्रतियां) प्रकाशन गृह द्वारा एकत्र किए गए डेटा की विशेषता है (तालिका 2.6)। विश्वसनीयता g=0.9 के साथ हाइपरबोलिक रिग्रेशन समीकरण के न्यूनतम वर्ग अनुमान और पैरामीटर निर्धारित करें, पैरामीटर q 0 और q 1 के लिए आत्मविश्वास अंतराल का निर्माण करें, साथ ही सशर्त अपेक्षा भी करें एक्स=10.

तालिका 2.6.

प्रपत्र के प्रतिगमन समीकरण के अनुमान और पैरामीटर निर्धारित करें, परिकल्पना H 0 का a = 0.05: q 1 = 0 पर परीक्षण करें और पैरामीटर q 0 और q 1 और सशर्त गणितीय अपेक्षा के लिए विश्वसनीयता g = 0.9 के साथ आत्मविश्वास अंतराल का निर्माण करें। एक्स=20.

2.11. तालिका में 2.8 निम्नलिखित व्यापक आर्थिक संकेतकों की विकास दर (%) पर डेटा प्रस्तुत करता है एन=1992 के लिए विश्व के 10 विकसित देश: जीएनपी - एक्स(1) , औद्योगिक उत्पादन - एक्स(2) , मूल्य सूचकांक - एक्स (3) .

तालिका 2.8.

देशों x और प्रतिगमन समीकरण के पैरामीटर, अवशिष्ट विचरण का अनुमान; बी) ए=0.05 पर प्रतिगमन गुणांक के महत्व की जांच करें, यानी। एच 0: क्यू 1 =0; ग) विश्वसनीयता g=0.9 के साथ, अंतराल अनुमान q 0 और q 1 खोजें; घ) बिंदु पर g=0.95 पर विश्वास अंतराल ज्ञात कीजिए एक्स 0 =एक्स मैं, कहाँ मैं=5; ई) प्रतिगमन समीकरणों की सांख्यिकीय विशेषताओं की तुलना करें: 1, 2 और 3।

2.12. समस्या 2.11 को ( पर) अनुक्रमणिका एक्स(1) , और व्याख्यात्मक के लिए ( एक्स) चर एक्स (3) .

1. अयवाज़यान एस.ए., मख़ितारियन वी.एस. व्यावहारिक आँकड़े और अर्थमिति के बुनियादी सिद्धांत: पाठ्यपुस्तक। एम., यूनिटी, 1998 (दूसरा संस्करण 2001);

2. अयवाज़यान एस.ए., मख़ितारियन वी.एस. समस्याओं और अभ्यासों में लागू आँकड़े: पाठ्यपुस्तक। एम. यूनिटी - दाना, 2001;

3. अयवज़्यान एस.ए., एन्युकोव आई.एस., मेशाल्किन एल.डी. एप्लाईड स्टैटस्टिक्स। निर्भरता अनुसंधान. एम., वित्त एवं सांख्यिकी, 1985, 487 पीपी.;

4. अयवज़्यान एस.ए., बुख़्स्ताबेर वी.एम., एन्युकोव आई.एस., मेशाल्किन एल.डी. एप्लाईड स्टैटस्टिक्स। वर्गीकरण और आयाम में कमी. एम., वित्त एवं सांख्यिकी, 1989, 607 पीपी.;

5. जॉन्सटन जे. इकोनोमेट्रिक तरीके, एम.: सांख्यिकी, 1980, 446 पीपी.;

6. डबरोव ए.वी., मख़ितारियन वी.एस., ट्रोशिन एल.आई. बहुभिन्नरूपी सांख्यिकीय विधियाँ। एम., वित्त एवं सांख्यिकी, 2000;

7. मख़ितारियन वी.एस., ट्रोशिन एल.आई. सहसंबंध और प्रतिगमन विधियों का उपयोग करके निर्भरता का अध्ययन। एम., एमईएसआई, 1995, 120 पीपी.;

8. मख़ितारियन वी.एस., डबरोव ए.एम., ट्रोशिन एल.आई. अर्थशास्त्र में बहुभिन्नरूपी सांख्यिकीय पद्धतियाँ। एम., एमईएसआई, 1995, 149 पीपी.;

9. डबरोव ए.एम., मखितारियन वी.एस., ट्रोशिन एल.आई. व्यवसायियों और प्रबंधकों के लिए गणितीय आँकड़े। एम., एमईएसआई, 2000, 140 पीपी.;

10. लुकाशिन यू.आई. प्रतिगमन और अनुकूली पूर्वानुमान विधियाँ: पाठ्यपुस्तक, एम., एमईएसआई, 1997।

11. लुकाशिन यू.आई. अल्पकालिक पूर्वानुमान की अनुकूली विधियाँ। - एम., सांख्यिकी, 1979।


अनुप्रयोग


परिशिष्ट 1. स्वतंत्र कंप्यूटर अनुसंधान के लिए कार्यों के विकल्प।

श्रेणियाँ

लोकप्रिय लेख

2024 "kingad.ru" - मानव अंगों की अल्ट्रासाउंड जांच