युग्म सहसंबंध गुणांकों का एक मैट्रिक्स बनाएं। बहुसंरेखता की जाँच करें
आर्थिक डेटा किसी भी आर्थिक वस्तु या प्रक्रिया की मात्रात्मक विशेषताओं का प्रतिनिधित्व करता है। वे कई कारकों के प्रभाव में बनते हैं, जिनमें से सभी बाहरी नियंत्रण के लिए सुलभ नहीं हैं। अनियंत्रित कारक मानों के कुछ सेट से यादृच्छिक मान ले सकते हैं और इस प्रकार उनके द्वारा परिभाषित डेटा को यादृच्छिक बना सकते हैं। आर्थिक अनुसंधान में मुख्य कार्यों में से एक है चरों के बीच निर्भरता का विश्लेषण।
विशेषताओं के बीच निर्भरता पर विचार करते समय, सबसे पहले, दो प्रकार के कनेक्शनों में अंतर करना आवश्यक है:
- कार्यात्मक -कारक विशेषता में परिवर्तन और परिणामी मूल्य में परिवर्तन के बीच पूर्ण पत्राचार की विशेषता है: किसी कारक विशेषता का प्रत्येक मान परिणामी विशेषता के बहुत विशिष्ट मूल्यों से मेल खाता है।इस प्रकार के संबंध को सूत्रबद्ध संबंध के रूप में व्यक्त किया जाता है। कार्यात्मक निर्भरता एक प्रभावी विशेषता को एक या अधिक कारक विशेषताओं से जोड़ सकती है। इस प्रकार, समय-आधारित मजदूरी की राशि काम किए गए घंटों की संख्या पर निर्भर करती है;
- सहसंबद्ध- दो संकेतों में परिवर्तन के बीच कोई पूर्ण पत्राचार नहीं है; वास्तविक डेटा के बड़े पैमाने पर अवलोकन के साथ, व्यक्तिगत कारकों का प्रभाव केवल औसत पर प्रकट होता है। बड़ी संख्या में विभिन्न कारकों का अध्ययन किए गए गुण पर एक साथ प्रभाव इस तथ्य की ओर ले जाता है किसी कारक विशेषता का एक ही मान परिणामी विशेषता के मूल्यों के संपूर्ण वितरण से मेल खाता है,चूँकि प्रत्येक विशिष्ट मामले में अन्य कारक विशेषताएँ उनके प्रभाव की ताकत और दिशा को बदल सकती हैं।
यह ध्यान में रखा जाना चाहिए कि यदि विशेषताओं के बीच कोई कार्यात्मक संबंध है, तो कारक विशेषता के मूल्य को जानकर, सटीक रूप से निर्धारित करना संभव है परिणामी चिह्न का मान.केवल सहसंबंध निर्भरता की उपस्थिति में परिणामी विशेषता में परिवर्तन की प्रवृत्तिजब कारक विशेषता का मान बदलता है।
संकेतों के बीच संबंधों का अध्ययन करते समय, उन्हें दिशा, रूप, कारकों की संख्या के अनुसार वर्गीकृत किया जाता है:
- की ओरकनेक्शनों को विभाजित किया गया है सीधाऔर रिवर्स।प्रत्यक्ष संबंध के साथ, परिणामी विशेषता में परिवर्तन की दिशा कारक विशेषता में परिवर्तन की दिशा से मेल खाती है। फीडबैक के साथ, परिणामी विशेषता में परिवर्तन की दिशा कारक विशेषता में परिवर्तन की दिशा के विपरीत होती है। उदाहरण के लिए, कर्मचारी की योग्यता जितनी अधिक होगी, उसके श्रम की उत्पादकता का स्तर उतना ही अधिक होगा (सीधा संबंध)। श्रम उत्पादकता जितनी अधिक होगी, उत्पादन की प्रति इकाई लागत उतनी ही कम होगी (प्रतिक्रिया);
- स्वरूप के अनुसार(फ़ंक्शन के प्रकार) कनेक्शनों को विभाजित किया गया है रेखीय(सीधी रेखा) और अरेखीय(वक्ररेखीय). एक रैखिक संबंध को एक सीधी रेखा द्वारा दर्शाया जाता है, एक गैर-रेखीय संबंध को एक वक्र (परवलय, हाइपरबोला, आदि) द्वारा दर्शाया जाता है। एक रैखिक संबंध में, किसी कारक विशेषता के मूल्य में वृद्धि के साथ, परिणामी विशेषता के मूल्य में एक समान वृद्धि (कमी) होती है;
- प्रभावी विशेषता पर कार्य करने वाले कारकों की संख्या से,कनेक्शनों को विभाजित किया गया है एकल कारक(युग्मित) और बहुघटकीय.
पर्यावरणीय परिस्थितियों पर गुण भिन्नता की निर्भरता का अध्ययन सहसंबंध सिद्धांत की सामग्री है।
सहसंबंध विश्लेषण करते समय, डेटा के पूरे सेट को चर (कारकों) के एक सेट के रूप में माना जाता है, जिनमें से प्रत्येक में शामिल होता है पीअवलोकन.
दो कारकों के बीच संबंधों का अध्ययन करते समय, उन्हें आमतौर पर निर्दिष्ट किया जाता है एक्स=(एक्स पी एक्स 2,...,x n)और वाई= (वाई ( , वाई 2 ,..., y और).
सहप्रसरण -यह सांख्यिकीय है अंतःक्रिया का मापदो चर. उदाहरण के लिए, दो प्रतिभूतियों के रिटर्न के सहप्रसरण के लिए एक सकारात्मक मूल्य इंगित करता है कि इन प्रतिभूतियों के रिटर्न एक दिशा में बढ़ते हैं।
दो चरों के बीच सहप्रसरण एक्सऔर वाईइस प्रकार गणना की गई:
चरों के वास्तविक मान कहाँ हैं
एक्सऔर जी;
यदि यादृच्छिक चर ची वाईस्वतंत्र, सैद्धांतिक सहप्रसरण शून्य है।
सहप्रसरण उन इकाइयों पर निर्भर करता है जिनमें चर मापे जाते हैं हीहाँ, यह एक गैर-मानकीकृत मात्रा है। इसलिए, मापने के लिए कनेक्शन ताकतसहसंबंध गुणांक नामक एक अन्य आँकड़ा दो चरों के बीच प्रयोग किया जाता है।
दो चर के लिए एक्सऔर Y जोड़ी सहसंबंध गुणांक
को इस प्रकार परिभाषित किया गया है:
कहाँ एसएसवाई-मात्राओं की भिन्नता का अनुमान ही वाई.ये अनुमान बताते हैं बिखराव की डिग्रीमान एक्स (, एक्स 2, ..., एक्स एन (वाई 1, वाई 2, वाई एन)आपके औसत के आसपास एक्स(यक्रमशः), या परिवर्तनशीलताअवलोकनों के एक सेट पर इन चरों की (परिवर्तनशीलता)।
फैलाव(विचरण का अनुमान) सूत्र द्वारा निर्धारित किया जाता है
सामान्य तौर पर, विचरण का निष्पक्ष अनुमान प्राप्त करने के लिए, वर्गों के योग को अनुमान की स्वतंत्रता की डिग्री की संख्या से विभाजित किया जाना चाहिए (वगैरह),कहाँ पी -नमूने का आकार, आर -नमूने पर आरोपित कनेक्शनों की संख्या। चूँकि माध्य ज्ञात करने के लिए नमूने का उपयोग पहले ही एक बार किया जा चुका है एक्स,तो इस मामले में सुपरइम्पोज़्ड कनेक्शन की संख्या एक के बराबर है (पी = 1), और अनुमान की स्वतंत्रता की डिग्री की संख्या (यानी, स्वतंत्र नमूना तत्वों की संख्या) के बराबर है (पी - 1).
चर मानों के फैलाव की डिग्री को उन्हीं इकाइयों में मापना अधिक स्वाभाविक है जिनमें चर को स्वयं मापा जाता है। इस समस्या को एक सूचक द्वारा हल किया जाता है जिसे कहा जाता है मानक विचलन (मानक विचलन) या मानक त्रुटिचर एक्स(चर वाई)और संबंध द्वारा निर्धारित होता है
सूत्र (3.2.1) के अंश में पद दो चरों की परस्पर क्रिया को व्यक्त करते हैं और सहसंबंध का चिह्न (सकारात्मक या नकारात्मक) निर्धारित करते हैं। यदि, उदाहरण के लिए, चरों के बीच एक मजबूत सकारात्मक संबंध है (एक चर में वृद्धि जबकि दूसरे में वृद्धि), तो प्रत्येक पद एक सकारात्मक संख्या होगी। इसी तरह, यदि चरों के बीच एक मजबूत नकारात्मक संबंध है, तो अंश में सभी पद नकारात्मक संख्याएं होंगे, जिसके परिणामस्वरूप नकारात्मक सहसंबंध मान होगा।
जोड़ीवार सहसंबंध गुणांक के लिए व्यंजक का हर [देखें सूत्र (3.2.2)] बस अंश को इस तरह से सामान्यीकृत करता है कि सहसंबंध गुणांक बिना आयाम के आसानी से व्याख्या करने योग्य संख्या बन जाता है, और -1 से +1 तक मान लेता है।
सहसंबंध गुणांक के लिए अभिव्यक्ति का अंश, जिसकी माप की असामान्य इकाइयों के कारण व्याख्या करना मुश्किल है, है सहप्रसरण HiU.इस तथ्य के बावजूद कि इसे कभी-कभी एक स्वतंत्र विशेषता के रूप में उपयोग किया जाता है (उदाहरण के लिए, वित्त सिद्धांत में दो एक्सचेंजों पर स्टॉक की कीमतों में संयुक्त परिवर्तन का वर्णन करने के लिए), सहसंबंध गुणांक का उपयोग करना अधिक सुविधाजनक है। सहसंबंध और सहप्रसरण अनिवार्य रूप से एक ही जानकारी का प्रतिनिधित्व करते हैं, लेकिन सहसंबंध इस जानकारी को अधिक उपयोगी रूप में प्रस्तुत करता है।
सहसंबंध गुणांक का गुणात्मक मूल्यांकन करने के लिए, विभिन्न पैमानों का उपयोग किया जाता है, सबसे अधिक बार चैडॉक स्केल। सहसंबंध गुणांक के मूल्य के आधार पर, संबंध की निम्नलिखित रेटिंग में से एक हो सकती है:
- 0.1-0.3 - कमजोर;
- 0.3-0.5 - ध्यान देने योग्य;
- 0.5-0.7 - मध्यम;
- 0.7-0.9 - उच्च;
- 0.9-1.0 - बहुत ऊँचा।
सहसंबंध गुणांक का उपयोग करके किसी कनेक्शन की निकटता की डिग्री का आकलन, एक नियम के रूप में, अध्ययन की जा रही घटना के बारे में कम या ज्यादा सीमित जानकारी के आधार पर किया जाता है। इस संबंध में, रैखिक सहसंबंध गुणांक के महत्व का आकलन करने की आवश्यकता है, जो नमूना परिणामों के आधार पर निष्कर्षों को सामान्य आबादी तक विस्तारित करना संभव बनाता है।
छोटे नमूना आकारों के लिए सहसंबंध गुणांक के महत्व का आकलन छात्र के 7-परीक्षण का उपयोग करके किया जाता है। इस मामले में, इस मानदंड का वास्तविक (मनाया गया) मान सूत्र द्वारा निर्धारित किया जाता है
इस सूत्र का उपयोग करके गणना किए गए मान/ओब्स की तुलना 7-मानदंड के महत्वपूर्ण मान से की जाती है, जो दिए गए महत्व स्तर ओसी और संख्या को ध्यान में रखते हुए छात्र के/-परीक्षण मानों की तालिका (परिशिष्ट 2 देखें) से लिया जाता है। स्वतंत्रता की डिग्री की (पी - 2).
यदि 7 अवलोकन > 7 टैब, तो सहसंबंध गुणांक का परिणामी मान महत्वपूर्ण माना जाता है (अर्थात, सहसंबंध गुणांक शून्य के बराबर है, यह बताने वाली शून्य परिकल्पना खारिज कर दी जाती है)। और इस प्रकार यह निष्कर्ष निकाला गया कि अध्ययन के अंतर्गत चरों के बीच घनिष्ठ सांख्यिकीय संबंध है।
यदि मान जी वाई एक्सशून्य के करीब, चरों के बीच संबंध कमजोर है। यदि यादृच्छिक चर के बीच सहसंबंध:
- सकारात्मक, फिर जैसे-जैसे एक यादृच्छिक चर बढ़ता है, दूसरा औसतन बढ़ने लगता है;
- नकारात्मक, तो जैसे-जैसे एक यादृच्छिक चर बढ़ता है, दूसरा औसतन घटता जाता है। युग्मित डेटा का विश्लेषण करने के लिए एक सुविधाजनक ग्राफिकल टूल है स्कैटर प्लॉट, जो दो कारकों के अनुरूप दो आयामों के स्थान में प्रत्येक अवलोकन का प्रतिनिधित्व करता है। स्कैटरप्लॉट, जो दो विशेषताओं के मूल्यों के एक सेट को दर्शाता है, भी कहा जाता है सहसंबंध क्षेत्र.इस आरेख में प्रत्येक बिंदु के निर्देशांक x (. और.) हैं य जीजैसे-जैसे रैखिक संबंध की ताकत बढ़ती है, ग्राफ़ पर बिंदु सीधी रेखा और परिमाण के करीब होंगे जीएकता के करीब होंगे.
जोड़ीवार सहसंबंध गुणांक का उपयोग उनमें से एक सेट से सुविधाओं के विभिन्न जोड़े के बीच रैखिक संबंधों की ताकत को मापने के लिए किया जाता है। कई सुविधाओं के लिए एक मिलता है जोड़ी सहसंबंध गुणांक का मैट्रिक्स।
मान लीजिए कि डेटा के पूरे सेट में एक वेरिएबल शामिल है य = =(य पी य 2, ..., वाई पी)और टीचर (कारक) एक्स,जिनमें से प्रत्येक में शामिल है पीअवलोकन. परिवर्तनशील मान वाईऔर एक्स,प्रेक्षित जनसंख्या में निहित को एक तालिका में दर्ज किया गया है (सारणी 3.2.1)।
तालिका 3.2.1
चर संख्या टिप्पणियों |
|||||
एक्स टीजेड |
|||||
एक्स टी.पी |
इस तालिका में मौजूद आंकड़ों के आधार पर गणना करें जोड़ी सहसंबंध गुणांक आर का मैट्रिक्स,यह मुख्य विकर्ण के बारे में सममित है:
एकाधिक प्रतिगमन मॉडल का निर्माण करते समय जोड़ी सहसंबंध गुणांक के मैट्रिक्स का विश्लेषण किया जाता है।
एक सहसंबंध मैट्रिक्स मात्राओं के बीच निर्भरता का पूरी तरह से वर्णन नहीं कर सकता है। इस संबंध में, बहुभिन्नरूपी सहसंबंध विश्लेषण दो कार्यों पर विचार करता है:
- 1. विश्लेषण में शामिल अन्य चरों की समग्रता के साथ एक यादृच्छिक चर के घनिष्ठ संबंध का निर्धारण।
- 2. अन्य मात्राओं के प्रभाव को निश्चित या बहिष्कृत करते समय दो मात्राओं के बीच संबंध की निकटता का निर्धारण।
इन समस्याओं को क्रमशः एकाधिक और आंशिक सहसंबंध गुणांक का उपयोग करके हल किया जाता है।
पहली समस्या का समाधान (विश्लेषण में शामिल अन्य चर की समग्रता के साथ एक यादृच्छिक चर के घनिष्ठ संबंध का निर्धारण) का उपयोग करके किया जाता है नमूना एकाधिक सहसंबंध गुणांकसूत्र के अनुसार
कहाँ आर- आर[सेमी। सूत्र (3.2.6)]; Rjj-एक ही मैट्रिक्स के एक तत्व का बीजगणितीय पूरक आर।
वर्गांकित एकाधिक सहसंबंध गुणांक एस.सी.एचजे 2 जे _जे जे+एल मआमतौर पर कहा जाता है निर्धारण के एकाधिक गुणांक का नमूना; यह दर्शाता है कि अध्ययन किए जा रहे मूल्य में किस अनुपात में भिन्नता (यादृच्छिक बिखराव) है एक्सजेशेष यादृच्छिक चरों की भिन्नता की व्याख्या करता है एक्स ( , एक्स 2 ,..., एक्स टी.
एकाधिक सहसंबंध और निर्धारण के गुणांक सकारात्मक मात्राएं हैं, जो 0 से 1 तक की सीमा में मान लेते हैं। गुणांक का अनुमान लगाते समय आर 2 से एकता तक, हम यह निष्कर्ष निकाल सकते हैं कि यादृच्छिक चर के बीच संबंध घनिष्ठ है, लेकिन इसकी दिशा के बारे में नहीं। एकाधिक सहसंबंध गुणांक केवल तभी बढ़ सकता है जब मॉडल में अतिरिक्त चर शामिल किए जाएं, और यदि मौजूदा विशेषताओं में से किसी को बाहर रखा जाए तो यह नहीं बढ़ेगा।
निर्धारण के गुणांक के महत्व की जाँच फिशर/'-मानदंड के परिकलित मान की तुलना करके की जाती है
सारणीबद्ध के साथ एफरबल. मानदंड का सारणीबद्ध मान (परिशिष्ट 1 देखें) दिए गए महत्व स्तर ए और स्वतंत्रता की डिग्री द्वारा निर्धारित किया जाता है वी एल = एमएनवी 2 = एन-एम-एल।गुणक आर 2यदि असमानता कायम रहती है तो यह शून्य से काफी भिन्न है
यदि यादृच्छिक चर विचाराधीन हैं एक दूसरे के साथ सहसंबद्ध होनातब युग्म सहसंबंध गुणांक का मान अन्य मात्राओं के प्रभाव से आंशिक रूप से प्रभावित होता है। इस संबंध में, अन्य यादृच्छिक चर (एक या अधिक) के प्रभाव को छोड़कर मात्राओं के बीच आंशिक सहसंबंध का अध्ययन करने की आवश्यकता है।
आंशिक सहसंबंध गुणांक का नमूनासूत्र द्वारा निर्धारित किया गया है
कहाँ आर जेके, आरजेजे, आर केके -संगत मैट्रिक्स तत्वों में बीजगणितीय जोड़ आर[सेमी। सूत्र (3.2.6)]।
आंशिक सहसंबंध गुणांक, साथ ही जोड़ी सहसंबंध गुणांक, -1 से +1 तक भिन्न होता है।
अभिव्यक्ति (3.2.9) के अधीन टी = 3 जैसा दिखेगा
गुणांक r 12(3) कहलाता है x के बीच सहसंबंध गुणांक (और निश्चित x y के लिए x 2यह प्राथमिक सूचकांक 1, 2 के संबंध में सममित है। इसका द्वितीयक सूचकांक 3 एक निश्चित चर को संदर्भित करता है।
उदाहरण 3.2.1. युग्म गुणांकों की गणना,
एकाधिक और आंशिक सहसंबंध।
तालिका में 3.2.2 एक कंपनी की बिक्री मात्रा और विज्ञापन लागत के साथ-साथ कई चालू वर्षों के उपभोक्ता व्यय सूचकांक की जानकारी प्रदान करता है।
- 1. चर "बिक्री की मात्रा" और "उपभोक्ता व्यय सूचकांक" के लिए एक स्कैटर आरेख (सहसंबंध क्षेत्र) का निर्माण करें।
- 2. बिक्री की मात्रा पर उपभोक्ता व्यय सूचकांक के प्रभाव की डिग्री निर्धारित करें (युग्म सहसंबंध गुणांक की गणना करें)।
- 3. परिकलित युग्म सहसंबंध गुणांक के महत्व का आकलन करें।
- 4. तीन चरों के लिए जोड़ीवार सहसंबंध गुणांक का एक मैट्रिक्स बनाएं।
- 5. बहु सहसंबंध गुणांक का अनुमान लगाएं।
- 6. आंशिक सहसंबंध गुणांक के अनुमान खोजें।
1. हमारे उदाहरण में, स्कैटर आरेख का रूप चित्र में दिखाया गया है। 3.2.1. झुकी हुई रेखा के साथ स्कैटर आरेख पर बिंदुओं के बादल का विस्तार हमें यह धारणा बनाने की अनुमति देता है कि चर के मूल्यों के बीच सीधे रैखिक संबंध के लिए कुछ उद्देश्य प्रवृत्ति है एक्स 2 वाई(बिक्री की मात्रा).
चावल। 3.2.1.
2. चरों के बीच सहसंबंध गुणांक की गणना करते समय मध्यवर्ती गणना एक्स 2(उपभोक्ता व्यय सूचकांक) और वाई(बिक्री की मात्रा) तालिका में दी गई है। 3.2.3.
औसत मानयादृच्छिक चर एक्स 2और हाँ,जो अनुक्रमों को दर्शाने वाले सबसे सरल संकेतक हैं जेसीजे, एक्स 2,..., x 16 और य व य 2 ,..., y 16, निम्नलिखित सूत्रों का उपयोग करके गणना करें:
बिक्री की मात्रा Y, हजार रूबल। |
अनुक्रमणिका उपभोग करना टेल्स्की खर्च |
बिक्री की मात्रा Y, हजार रूबल। |
अनुक्रमणिका उपभोग करना टेल्स्की खर्च |
||
तालिका 3.2.3
एल:, - एक्स |
(और - यू)(एक्स, - एक्स) |
(एक्स, - एक्स) 2 |
(य, - - य) 2 |
||||
फैलावमूल्यों के प्रसार की डिग्री की विशेषता है एक्स वी एक्स 2,एक्स:
आइए अब एक्सेल में उदाहरण 3.2.1 के समाधान पर विचार करें।
एक्सेल का उपयोग करके सहसंबंध की गणना करने के लिए, आप फ़ंक्शन का उपयोग कर सकते हैं =correl(), संख्याओं के दो स्तंभों के पते निर्दिष्ट करता है, जैसा चित्र में दिखाया गया है। 3.2.2. उत्तर D8 में रखा गया है और 0.816 के बराबर है।
चावल। 3.2.2.
(नोट: फ़ंक्शन तर्क कोरल संख्याएँ या नाम, सारणियाँ या संख्याएँ युक्त संदर्भ होने चाहिए। यदि तर्क, जो एक सरणी या संदर्भ है, में पाठ, बूलियन मान या खाली सेल शामिल हैं, तो ऐसे मानों को अनदेखा कर दिया जाता है; हालाँकि, जिन कोशिकाओं में शून्य मान होते हैं उन्हें गिना जाता है।
यदि सरणी! और array2 में डेटा बिंदुओं की अलग-अलग संख्या होती है, फिर फ़ंक्शन कोरेल त्रुटि मान #n/a लौटाता है।
यदि array1 या array2 खाली है या यदि उनके मानों का o (मानक विचलन) शून्य है, तो फ़ंक्शन कोरेल त्रुटि मान #div/0 लौटाता है!)
फ़ंक्शन का उपयोग करके छात्र के टी-सांख्यिकी का महत्वपूर्ण मूल्य भी प्राप्त किया जा सकता है 1 एक्सेल पैकेज का अध्ययन वितरण। फ़ंक्शन तर्क के रूप में, आपको स्वतंत्रता की बराबर डिग्री की संख्या निर्दिष्ट करनी होगी पी- 2 (हमारे उदाहरण में 16 - 2= 14) और महत्व स्तर ए (हमारे उदाहरण में ए = 0.1) (चित्र 3.2.3)। अगर असल मूल्य/-सांख्यिकी मॉड्यूलो अधिक है गंभीर,तब संभाव्यता (1 - ए) के साथ सहसंबंध गुणांक शून्य से काफी भिन्न होता है।
चावल। 3.2.3. /-सांख्यिकी का क्रांतिक मान 1.7613 है
एक्सेल में विभिन्न सांख्यिकीय समस्याओं को हल करने के लिए डिज़ाइन किए गए डेटा विश्लेषण टूल (तथाकथित विश्लेषण पैकेज) का एक सेट शामिल है। जोड़ी सहसंबंध गुणांक के मैट्रिक्स की गणना करने के लिए आरआपको सहसंबंध उपकरण (चित्र 3.2.4) का उपयोग करना चाहिए और संबंधित संवाद बॉक्स में विश्लेषण पैरामीटर सेट करना चाहिए। उत्तर एक नई वर्कशीट पर रखा जाएगा (चित्र 3.2.5)।
1 Excel 2010 में, फ़ंक्शन का नाम studrasprobr को stu में बदल दिया गया-
DENT.OBR.2X.
चावल। 3.2.4.
चावल। 3.2.5.
- सहसंबंध के सिद्धांत के संस्थापक अंग्रेजी सांख्यिकीविद् एफ. गैल्टन (1822-1911) और के. पियर्सन (1857-1936) माने जाते हैं। शब्द "सहसंबंध" प्राकृतिक विज्ञान से लिया गया है और इसका अर्थ है "सहसंबंध, पत्राचार।" यादृच्छिक चर के बीच अन्योन्याश्रय के रूप में सहसंबंध का विचार सहसंबंध के गणितीय-सांख्यिकीय सिद्धांत को रेखांकित करता है।
कार्य 2
1. युग्म सहसंबंध गुणांकों का एक मैट्रिक्स बनाएं। बहुसंरेखता की जाँच करें. मॉडल में कारकों के चयन का औचित्य सिद्ध करें।
2. चयनित कारकों के साथ रैखिक रूप में एक बहु समाश्रयण समीकरण का निर्माण करें।
3. फिशर और छात्र परीक्षणों का उपयोग करके प्रतिगमन समीकरण और उसके मापदंडों के सांख्यिकीय महत्व का आकलन करें।
4. सांख्यिकीय रूप से महत्वपूर्ण कारकों के साथ एक प्रतिगमन समीकरण बनाएं। निर्धारण गुणांक R2 का उपयोग करके प्रतिगमन समीकरण की गुणवत्ता का आकलन करें। निर्मित मॉडल की सटीकता का मूल्यांकन करें।
5. उत्पादन मात्रा के पूर्वानुमान का मूल्यांकन करें यदि कारकों का पूर्वानुमान मान उनके अधिकतम मूल्यों का 75% है।
समस्या की स्थितियाँ (विकल्प 21)
तालिका 1 (एन = 17) में प्रस्तुत आंकड़ों के अनुसार, निम्नलिखित कारकों (चर) पर उत्पादन मात्रा वाई (मिलियन रूबल) की निर्भरता का अध्ययन किया जाता है:
एक्स 1 - औद्योगिक उत्पादन कर्मियों, लोगों की संख्या।
एक्स 2 - अचल संपत्तियों की औसत वार्षिक लागत, मिलियन रूबल।
एक्स 3 - अचल संपत्तियों का मूल्यह्रास, %
एक्स 4 - बिजली की आपूर्ति, किलोवाट।
एक्स 5 - एक कर्मचारी के तकनीकी उपकरण, मिलियन रूबल।
एक्स 6 - प्रति कर्मचारी विपणन योग्य उत्पादों का उत्पादन, रगड़।
तालिका 1. उत्पाद रिलीज़ डेटा
№ | वाई | एक्स 1 | एक्स 2 | एक्स 3 | एक्स 4 | एक्स 5 | एक्स 6 |
39,5 | 4,9 | 3,2 | |||||
46,4 | 60,5 | 20,4 | |||||
43,7 | 24,9 | 9,5 | |||||
35,7 | 50,4 | 34,7 | |||||
41,8 | 5,1 | 17,9 | |||||
49,8 | 35,9 | 12,1 | |||||
44,1 | 48,1 | 18,9 | |||||
48,1 | 69,5 | 12,2 | |||||
47,6 | 31,9 | 8,1 | |||||
58,6 | 139,4 | 29,7 | |||||
70,4 | 16,9 | 5,3 | |||||
37,5 | 17,8 | 5,6 | |||||
62,0 | 27,6 | 12,3 | |||||
34,4 | 13,9 | 3,2 | |||||
35,4 | 37,3 | 19,0 | |||||
40,8 | 55,3 | 19,3 | |||||
48,1 | 35,1 | 12,4 |
युग्म सहसंबंध गुणांकों का एक मैट्रिक्स बनाएं। बहुसंरेखता की जाँच करें. मॉडल में कारकों के चयन का औचित्य सिद्ध करें
तालिका 2 से पता चलता है जोड़ी सहसंबंध गुणांक मैट्रिक्स विचार में शामिल सभी चरों के लिए। टूल का उपयोग करके मैट्रिक्स प्राप्त किया गया था सह - संबंधपैकेज से डेटा विश्लेषणवी एक्सेल.
तालिका 2. जोड़ी सहसंबंध गुणांक का मैट्रिक्स
वाई | X1 | एक्स2 | एक्स3 | एक्स4 | X5 | X6 | |
वाई | |||||||
X1 | 0,995634 | ||||||
एक्स2 | 0,996949 | 0,994947 | |||||
एक्स3 | -0,25446 | -0,27074 | -0,26264 | ||||
एक्स4 | 0,12291 | 0,07251 | 0,107572 | 0,248622 | |||
X5 | 0,222946 | 0,166919 | 0,219914 | -0,07573 | 0,671386 | ||
X6 | 0,067685 | -0,00273 | 0,041955 | -0,28755 | 0,366382 | 0,600899 |
मैट्रिक्स का दृश्य विश्लेषण आपको यह स्थापित करने की अनुमति देता है:
1) यूचर X1, X2 के साथ काफी उच्च जोड़ीदार सहसंबंध हैं (>0,5) और चर के साथ कम X3,X4,X5,X6 (<0,5);
2) विश्लेषण चर X1, X2 काफी उच्च जोड़ीदार सहसंबंध प्रदर्शित करते हैं, जिससे उनके बीच बहुसंरेखता की उपस्थिति के लिए कारकों की जांच करना आवश्यक हो जाता है। इसके अलावा, शास्त्रीय प्रतिगमन मॉडल की शर्तों में से एक व्याख्यात्मक चर की स्वतंत्रता की धारणा है।
कारकों की बहुसंरेखता की पहचान करने के लिए, हम प्रदर्शन करते हैं फर्रार-ग्लॉबर परीक्षण कारकों X1, X2 द्वारा, X3,X4,X5,X6.
कारकों की बहुसंरेखता के लिए फ़रार-ग्लॉबर परीक्षण की जाँच में कई चरण शामिल हैं।
1) चरों की संपूर्ण श्रृंखला की बहुसंरेखता की जाँच करना .
शास्त्रीय प्रतिगमन मॉडल की शर्तों में से एक व्याख्यात्मक चर की स्वतंत्रता की धारणा है। कारकों के बीच बहुसंरेखता की पहचान करने के लिए, डेटा विश्लेषण पैकेज (तालिका 3) का उपयोग करके इंटरफैक्टर सहसंबंध आर के मैट्रिक्स की गणना की जाती है।
तालिका 3. इंटरफैक्टर सहसंबंधों का मैट्रिक्स आर
X1 | एक्स2 | एक्स3 | एक्स4 | X5 | X6 | |
X1 | 0,994947 | -0,27074 | 0,07251 | 0,166919 | -0,00273 | |
एक्स2 | 0,994947 | -0,26264 | 0,107572 | 0,219914 | 0,041955 | |
एक्स3 | -0,27074 | -0,26264 | 0,248622 | -0,07573 | -0,28755 | |
एक्स4 | 0,07251 | 0,107572 | 0,248622 | 0,671386 | 0,366382 | |
X5 | 0,166919 | 0,219914 | -0,07573 | 0,671386 | 0,600899 | |
X6 | -0,00273 | 0,041955 | -0,28755 | 0,366382 | 0,600899 |
कारक X1 और X2, X5 और X4, X6 और X5 के बीच एक मजबूत निर्भरता (>0.5) है।
निर्धारक det (R) = 0.001488 की गणना MOPRED फ़ंक्शन का उपयोग करके की जाती है। मैट्रिक्स आर का निर्धारक शून्य हो जाता है, जो हमें कारकों की सामान्य बहुसंरेखता के बारे में एक धारणा बनाने की अनुमति देता है।
2) प्रत्येक चर की अन्य चर के साथ बहुसंरेखता की जाँच करना:
आइए एक्सेल फ़ंक्शन MOBR (तालिका 4) का उपयोग करके व्युत्क्रम मैट्रिक्स R -1 की गणना करें:
तालिका 4. व्युत्क्रम मैट्रिक्स आर -1
X1 | एक्स2 | एक्स3 | एक्स4 | X5 | X6 | |
X1 | 150,1209 | -149,95 | 3,415228 | -1,70527 | 6,775768 | 4,236465 |
एक्स2 | -149,95 | 150,9583 | -3,00988 | 1,591549 | -7,10952 | -3,91954 |
एक्स3 | 3,415228 | -3,00988 | 1,541199 | -0,76909 | 0,325241 | 0,665121 |
एक्स4 | -1,70527 | 1,591549 | -0,76909 | 2,218969 | -1,4854 | -0,213 |
X5 | 6,775768 | -7,10952 | 0,325241 | -1,4854 | 2,943718 | -0,81434 |
X6 | 4,236465 | -3,91954 | 0,665121 | -0,213 | -0,81434 | 1,934647 |
· एफ-मानदंड की गणना, मैट्रिक्स के विकर्ण तत्व कहां हैं, एन = 17, के = 6 (तालिका 5)।
तालिका 5. एफ-परीक्षण मान
एफ1 (एक्स1) | एफ2 (एक्स2) | एफ3 (एक्स3) | एफ4 (एक्स4) | F5 (X5) | एफ6 (एक्स6) |
89,29396 | 89,79536 | 0,324071 | 0,729921 | 1,163903 | 0,559669 |
· वास्तविक एफ-परीक्षण मानों की तुलना तालिका मान से की जाती है एफ तालिका = 3.21(FDIST(0.05;6;10)) n1= 6 और n2 = n - k - 1=17-6-1=10 स्वतंत्रता की डिग्री और महत्व स्तर α=0.05 के साथ, जहां k कारकों की संख्या है।
· कारकों X1 और X2 के लिए F-मानदंड मान सारणीबद्ध मानों से अधिक हैं, जो इन कारकों के बीच बहुसंरेखता की उपस्थिति को इंगित करता है। फैक्टर X3 का कारकों की समग्र बहुसंरेखता पर सबसे कम प्रभाव पड़ता है।
3) चरों के प्रत्येक जोड़े की बहुसंरेखता की जाँच करना
· आइए सूत्र का उपयोग करके आंशिक सहसंबंध गुणांक की गणना करें, मैट्रिक्स के तत्व कहां हैं (तालिका 6)
तालिका 6. आंशिक सहसंबंध गुणांक का मैट्रिक्स
X1 | एक्स2 | एक्स3 | एक्स4 | X5 | X6 | |
X1 | ||||||
एक्स2 | 0,996086 | |||||
एक्स3 | -0,22453 | 0,197329 | ||||
एक्स4 | 0,093432 | -0,08696 | 0,415882 | |||
X5 | -0,32232 | 0,337259 | -0,1527 | 0,581191 | ||
X6 | -0,24859 | 0,229354 | -0,38519 | 0,102801 | 0,341239 |
· गणना टी-सूत्र के अनुसार मानदंड (तालिका 7)
n - डेटा की संख्या = 17
K - कारकों की संख्या = 6
आंशिक सहसंबंध गुणांक के लिए तालिका 7.टी-परीक्षण
X1 | एक्स2 | एक्स3 | एक्स4 | X5 | X6 | |
X1 | ||||||
एक्स2 | 35,6355 | |||||
एक्स3 | -0,72862 | 0,636526 | ||||
एक्स4 | 0,296756 | -0,27604 | 1,446126 | |||
X5 | -1,07674 | 1,13288 | -0,4886 | 2,258495 | ||
X6 | -0,81158 | 0,745143 | -1,31991 | 0,326817 | 1,147999 |
टी टेबल = स्टुडार्सोबीआर(0.05,10) = 2.23
टी-परीक्षणों के वास्तविक मूल्यों की तुलना स्वतंत्रता की डिग्री एन-के-1 = 17-6-1=10 और महत्व स्तर α=0.05 के साथ तालिका मूल्य के साथ की जाती है;
t21 > टेबल
t54 > टेबल
तालिका 6 और 7 से यह स्पष्ट है कि कारकों के दो जोड़े X1 और X2, X4 और X5 में उच्च सांख्यिकीय रूप से महत्वपूर्ण आंशिक सहसंबंध है, अर्थात, वे बहुसंरेखीय हैं। बहुसंरेखता से छुटकारा पाने के लिए, आप संरेख युग्म के किसी एक चर को बाहर कर सकते हैं। जोड़ी X1 और X2 में हम X2 छोड़ते हैं, जोड़ी X4 और X5 में हम X5 छोड़ते हैं।
इस प्रकार, फ़रार-ग्लॉबर परीक्षण की जाँच के परिणामस्वरूप, निम्नलिखित कारक बने रहते हैं: X2, X3, X5, X6.
सहसंबंध विश्लेषण प्रक्रियाओं को पूरा करते समय, परिणाम के साथ चयनित कारकों के आंशिक सहसंबंधों को देखने की सलाह दी जाती है वाई
आइए तालिका 8 में दिए गए डेटा के आधार पर युग्मित सहसंबंध गुणांक का एक मैट्रिक्स बनाएं।
तालिका 8. चयनित कारकों X2, X3, X5, X6 के साथ उत्पाद आउटपुट डेटा।
अवलोकन सं. | वाई | एक्स 2 | एक्स 3 | एक्स 5 | एक्स 6 |
39,5 | 3,2 | ||||
46,4 | 20,4 | ||||
43,7 | 9,5 | ||||
35,7 | 34,7 | ||||
41,8 | 17,9 | ||||
49,8 | 12,1 | ||||
44,1 | 18,9 | ||||
48,1 | 12,2 | ||||
47,6 | 8,1 | ||||
58,6 | 29,7 | ||||
70,4 | 5,3 | ||||
37,5 | 5,6 | ||||
12,3 | |||||
34,4 | 3,2 | ||||
35,4 | |||||
40,8 | 19,3 | ||||
48,1 | 12,4 |
तालिका 9 का अंतिम कॉलम Y कॉलम के लिए t-परीक्षण मान प्रस्तुत करता है।
तालिका 9. परिणाम के साथ आंशिक सहसंबंध गुणांक का मैट्रिक्स वाई
वाई | एक्स2 | एक्स3 | X5 | X6 | टी मानदंड (टी तालिका (0.05;11)= 2.200985 | |
वाई | 0,996949 | -0,25446 | 0,222946 | 0,067685 | ||
एक्स2 | 0,996949 | -0,26264 | 0,219914 | 0,041955 | 44,31676 | |
एक्स3 | -0,25446 | -0,26264 | -0,07573 | -0,28755 | 0,916144 | |
X5 | 0,222946 | 0,219914 | -0,07573 | 0,600899 | -0,88721 | |
X6 | 0,067685 | 0,041955 | -0,28755 | 0,600899 | 1,645749 |
तालिका 9 से यह स्पष्ट है कि चर वाईके साथ एक उच्च और एक ही समय में सांख्यिकीय रूप से महत्वपूर्ण आंशिक सहसंबंध है कारक X2.
वाई | एक्स 1 | एक्स 2 | एक्स 3 | एक्स 4 | एक्स 5 | एक्स 6 | |
वाई | |||||||
एक्स 1 | 0,519 | ||||||
एक्स 2 | -0,273 | 0,030 | |||||
एक्स 3 | 0,610 | 0,813 | -0,116 | ||||
एक्स 4 | -0,572 | -0,013 | -0,022 | -0,091 | |||
एक्स 5 | 0,297 | 0,043 | -0,461 | 0,120 | -0,359 | ||
एक्स 6 | 0,118 | -0,366 | -0,061 | -0,329 | -0,100 | -0,290 |
विश्लेषण इंटरफैक्टोरियल("X" के बीच!) सहसंबंध गुणांक दर्शाता है कि मान 0.8 से अधिक है पूर्ण मूल्य मेंकेवल कारकों की एक जोड़ी के बीच सहसंबंध गुणांक एक्स 1 –एक्स 3 (बोल्ड में). कारकों एक्स 1 –एक्सइस प्रकार 3 को संरेख के रूप में पहचाना जाता है।
2. जैसा कि पैराग्राफ 1 में दिखाया गया है, कारक एक्स 1 –एक्स 3 संरेख हैं, जिसका अर्थ है कि वे प्रभावी रूप से एक-दूसरे के डुप्लिकेट हैं, और मॉडल में उन्हें एक साथ शामिल करने से संबंधित प्रतिगमन गुणांक की गलत व्याख्या हो जाएगी। यह स्पष्ट है कि कारक एक्स 3 का एक बड़ा है सापेक्षपरिणाम के साथ सहसंबंध गुणांक वाईकारक से एक्स 1: आर वाई , एक्स 1 =0,519; आर वाई , एक्स 3 =0.610; (सेमी। मेज़ 1). यह कारक के एक मजबूत प्रभाव को इंगित करता है एक्स 3 प्रति परिवर्तन वाई. कारक एक्सइसलिए 1 को विचार से बाहर रखा गया है।
प्रतिगमन समीकरण बनाने के लिए उपयोग किए गए चर के मान ( वाई,एक्स 2 , एक्स 3 , एक्स 4 , एक्स 5 , एक्स 6) एक खाली वर्कशीट में कॉपी करें ( adj. 3). हम ऐड-इन का उपयोग करके प्रतिगमन समीकरण बनाते हैं डेटा विश्लेषण...प्रतिगमन" (मेन्यू " सेवा"® « डेटा विश्लेषण…» ® « वापसी"). भरे हुए फ़ील्ड के साथ प्रतिगमन विश्लेषण पैनल दिखाया गया है चावल। 2.
प्रतिगमन विश्लेषण के परिणाम दिए गए हैं adj. 4और चले गए मेज़ 2. प्रतिगमन समीकरण का रूप है (देखें " कठिनाइयाँ"वी मेज़ 2):
प्रतिगमन समीकरण को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है, क्योंकि जिस रूप में इसे प्राप्त किया गया था उसमें इसके यादृच्छिक गठन की संभावना 8.80 × 10 -6 है (देखें)। "महत्व एफ"वी मेज़ 2), जो a=0.05 के स्वीकृत महत्व स्तर से काफी कम है।
एक्स 3 , एक्स 4 , एक्सस्वीकृत महत्व स्तर a=0.05 से 6 नीचे (देखें " पी-वैल्यू"वी मेज़ 2), जो गुणांकों के सांख्यिकीय महत्व और वार्षिक लाभ में परिवर्तन पर इन कारकों के महत्वपूर्ण प्रभाव को इंगित करता है वाई.
कारकों के लिए गुणांक के यादृच्छिक गठन की संभावना एक्स 2 और एक्स 5 स्वीकृत महत्व स्तर a=0.05 से अधिक है (देखें " पी-वैल्यू"वी मेज़ 2), और इन गुणांकों को सांख्यिकीय रूप से महत्वपूर्ण नहीं माना जाता है।
चावल। 2. मॉडल प्रतिगमन विश्लेषण पैनल वाई(एक्स 2 , एक्स 3 , एक्स 4 , एक्स 5 , एक्स 6)
तालिका 2
वाई(एक्स 2 , एक्स 3 , एक्स 4 , एक्स 5 , एक्स 6)
प्रतिगमन आँकड़े | |||||||||
बहुवचन आर | 0,868 | ||||||||
आर स्कवेयर | 0,753 | ||||||||
सामान्यीकृत आर-वर्ग | 0,694 | ||||||||
मानक त्रुटि | 242,3 | ||||||||
टिप्पणियों | |||||||||
भिन्नता का विश्लेषण | |||||||||
डीएफ | एसएस | एमएस | एफ | महत्व एफ | |||||
वापसी | 3749838,2 | 749967,6 | 12,78 | 8.80ई-06 | |||||
शेष | 1232466,8 | 58688,9 | |||||||
कुल | 4982305,0 | ||||||||
प्रतिगमन समीकरण | |||||||||
कठिनाइयाँ | मानक त्रुटि | टी आँकड़ा | पी-मूल्य | ||||||
वाई-चौराहा | 487,5 | 641,4 | 0,760 | 0,456 | |||||
एक्स2 | -0,0456 | 0,0373 | -1,224 | 0,235 | |||||
एक्स3 | 0,1043 | 0,0194 | 5,375 | 0,00002 | |||||
एक्स4 | -0,0965 | 0,0263 | -3,674 | 0,001 | |||||
X5 | 2,528 | 6,323 | 0,400 | 0,693 | |||||
X6 | 248,2 | 113,0 | 2,197 | 0,039 | |||||
3. पिछले पैराग्राफ में किए गए प्रतिगमन समीकरण गुणांक के सांख्यिकीय महत्व की जांच के परिणामों के आधार पर, हम एक नया प्रतिगमन मॉडल बनाते हैं जिसमें केवल सूचनात्मक कारक शामिल हैं, जिसमें शामिल हैं:
· ऐसे कारक जिनके गुणांक सांख्यिकीय रूप से महत्वपूर्ण हैं;
कारक जिनके गुणांक टी-सांख्यिकी निरपेक्ष मान में एक से अधिक है (दूसरे शब्दों में, गुणांक का निरपेक्ष मान इसकी मानक त्रुटि से अधिक है)।
पहले समूह में कारक शामिल हैं एक्स 3 , एक्स 4 , एक्स 6, दूसरे को - कारक एक्स 2. कारक एक्स 5 को सूचनाप्रद मानकर विचार से बाहर रखा गया है, और अंतिम प्रतिगमन मॉडल में कारक शामिल होंगे एक्स 2 , एक्स 3 , एक्स 4 , एक्स 6 .
प्रतिगमन समीकरण बनाने के लिए, उपयोग किए गए चर के मानों को एक रिक्त वर्कशीट में कॉपी करें ( adj. 5)और प्रतिगमन विश्लेषण करें ( चावल। 3). इसके नतीजे इसमें दिए गए हैं adj. 6और चले गए मेज़ 3. प्रतिगमन समीकरण है:
(सेमी। " कठिनाइयाँ"वी मेज़ 3).
चावल। 3. मॉडल प्रतिगमन विश्लेषण पैनल वाई(एक्स 2 , एक्स 3 , एक्स 4 , एक्स 6)
टेबल तीन
मॉडल के प्रतिगमन विश्लेषण के परिणाम वाई(एक्स 2 , एक्स 3 , एक्स 4 , एक्स 6)
प्रतिगमन आँकड़े | |||||||||
बहुवचन आर | 0,866 | ||||||||
आर स्कवेयर | 0,751 | ||||||||
सामान्यीकृत आर-वर्ग | 0,705 | ||||||||
मानक त्रुटि | 237,6 | ||||||||
टिप्पणियों | |||||||||
भिन्नता का विश्लेषण | |||||||||
डीएफ | एसएस | एमएस | एफ | महत्व एफ | |||||
वापसी | 3740456,2 | 935114,1 | 16,57 | 2.14ई-06 | |||||
शेष | 1241848,7 | 56447,7 | |||||||
कुल | 4982305,0 | ||||||||
प्रतिगमन समीकरण | |||||||||
कठिनाइयाँ | मानक त्रुटि | टी आँकड़ा | पी-मूल्य | ||||||
वाई-चौराहा | 712,2 | 303,0 | 2,351 | 0,028 | |||||
एक्स2 | -0,0541 | 0,0300 | -1,806 | 0,085 | |||||
एक्स3 | 0,1032 | 0,0188 | 5,476 | 0,00002 | |||||
एक्स4 | -0,1017 | 0,0223 | -4,560 | 0,00015 | |||||
X6 | 227,5 | 98,5 | 2,310 | 0,031 | |||||
प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वपूर्ण है: इसके यादृच्छिक गठन की संभावना a=0.05 के स्वीकार्य महत्व स्तर से नीचे है (देखें " महत्व एफ"वी मेज़ 3).
कारकों के गुणांकों को सांख्यिकीय रूप से भी महत्वपूर्ण माना जाता है एक्स 3 , एक्स 4 , एक्स 6: उनके यादृच्छिक गठन की संभावना स्वीकार्य महत्व स्तर a=0.05 से नीचे है (देखें " पी-वैल्यू"वी मेज़ 3). यह वार्षिक बीमा प्रीमियम के महत्वपूर्ण प्रभाव को दर्शाता है एक्स 3, बीमा भुगतान की वार्षिक राशि एक्स 4 और स्वामित्व के रूप एक्सवार्षिक लाभ में प्रति परिवर्तन 6 रु वाई.
कारक गुणांक एक्स 2 (बीमा भंडार का वार्षिक आकार) सांख्यिकीय रूप से महत्वपूर्ण नहीं है। हालाँकि, इस कारक को अभी भी जानकारीपूर्ण माना जा सकता है टी-इसके गुणांक के आँकड़े अधिक हैं सापेक्षइकाई, हालांकि कारक के संबंध में आगे के निष्कर्ष एक्स 2 के साथ कुछ सावधानी बरतनी चाहिए।
4. आइए हम प्रतिगमन विश्लेषण के दौरान प्राप्त कुछ सांख्यिकीय विशेषताओं का उपयोग करके अंतिम प्रतिगमन समीकरण की गुणवत्ता और सटीकता का मूल्यांकन करें (देखें) . « प्रतिगमन आँकड़े" वी मेज़ 3):
निर्धारण का एकाधिक गुणांक
दर्शाता है कि प्रतिगमन मॉडल वार्षिक लाभ में 75.1% भिन्नता की व्याख्या करता है वाई, और यह भिन्नता प्रतिगमन मॉडल में शामिल कारकों में परिवर्तन के कारण है एक्स 2 , एक्स 3 , एक्स 4 और एक्स 6 ;
प्रतिगमन की मानक त्रुटि
हजार रूबल.
दर्शाता है कि प्रतिगमन समीकरण द्वारा अनुमानित वार्षिक लाभ के मूल्य वाईवास्तविक मूल्यों से औसतन 237.6 हजार रूबल का अंतर।
औसत सापेक्ष सन्निकटन त्रुटि अनुमानित सूत्र द्वारा निर्धारित की जाती है:
कहाँ हजार रूबल. - औसत वार्षिक लाभ (अंतर्निहित फ़ंक्शन का उपयोग करके निर्धारित " औसत»; adj. 1).
इ rel से पता चलता है कि प्रतिगमन समीकरण द्वारा अनुमानित वार्षिक लाभ के मूल्य वाईवास्तविक मूल्यों से औसतन 26.7% भिन्न है। मॉडल में असंतोषजनक सटीकता है (पर - मॉडल की सटीकता अधिक है, पर - निपुण - संतोषजनक, साथ - असंतोषजनक)।
5. प्रतिगमन समीकरण के गुणांकों की आर्थिक व्याख्या के लिए, हम स्रोत डेटा में चर के औसत मूल्यों और मानक विचलन को सारणीबद्ध करते हैं ( मेज़ 4) . औसत मान अंतर्निहित फ़ंक्शन का उपयोग करके निर्धारित किए गए थे " औसत", मानक विचलन - अंतर्निहित फ़ंक्शन का उपयोग करना " मानक विचलन" (सेमी। adj. 1).
2011 का डेटा रूसी संघ के दक्षिणी संघीय जिले के क्षेत्रों के लिए प्रदान किया गया है
संघीय जिले के क्षेत्र |
सकल क्षेत्रीय उत्पाद, अरब रूबल, Y |
अचल संपत्तियों में निवेश, अरब रूबल, X1 |
1. प्रतिनिधि. एडिगेया |
||
2. प्रतिनिधि. दागिस्तान |
||
3. प्रतिनिधि. इन्गुशेतिया |
||
4. काबर्डिनो-बाल्केरियन गणराज्य |
||
5. प्रतिनिधि. कल्मिकिया |
||
6. कराची-चर्केस गणराज्य |
||
7. प्रतिनिधि. उत्तर ओसेशिया अलानिया |
||
8. क्रास्नोडार क्षेत्र) |
||
9. स्टावरोपोल क्षेत्र |
||
10. अस्त्रखान क्षेत्र। |
||
11. वोल्गोग्राड क्षेत्र। |
||
12. रोस्तोव क्षेत्र। |
- 1. युग्म सहसंबंध गुणांक के मैट्रिक्स की गणना करें; सहसंबंध गुणांकों के सांख्यिकीय महत्व का मूल्यांकन करें।
- 2. प्रभावी विशेषता और उससे सबसे निकट से संबंधित कारक के बीच सहसंबंध का एक क्षेत्र बनाएं।
- 3. प्रत्येक कारक के लिए रैखिक जोड़ी प्रतिगमन के मापदंडों की गणना करें एक्स..
- 4. निर्धारण के गुणांक, सन्निकटन की औसत त्रुटि और फिशर एफ परीक्षण के माध्यम से प्रत्येक मॉडल की गुणवत्ता का आकलन करें। सर्वोत्तम मॉडल चुनें.
इसके अधिकतम मूल्य का 80% होगा. ग्राफ़िक रूप से प्रस्तुत करें: वास्तविक और मॉडल मान, पूर्वानुमान बिंदु।
- 6. चरण-दर-चरण एकाधिक प्रतिगमन (बहिष्करण विधि या समावेशन विधि) का उपयोग करके, महत्वपूर्ण कारकों के कारण अपार्टमेंट मूल्य निर्धारण का एक मॉडल बनाएं। प्रतिगमन मॉडल गुणांकों की आर्थिक व्याख्या दीजिए।
- 7. निर्मित मॉडल की गुणवत्ता का मूल्यांकन करें। क्या एकल-कारक मॉडल की तुलना में मॉडल की गुणवत्ता में सुधार हुआ है? - और - में लोच गुणांक का उपयोग करके परिणाम पर महत्वपूर्ण कारकों के प्रभाव का आकलन करें? गुणांकों
इस समस्या को हल करते समय, हम एक्सेल डेटा विश्लेषण सेटिंग्स का उपयोग करके गणना करेंगे और ग्राफ़ और आरेख का निर्माण करेंगे।
1. युग्म सहसंबंध गुणांकों के मैट्रिक्स की गणना करें और सहसंबंध गुणांकों के सांख्यिकीय महत्व का मूल्यांकन करें
सहसंबंध संवाद बॉक्स में, इनपुट अंतराल फ़ील्ड में, स्रोत डेटा वाले कक्षों की श्रेणी दर्ज करें। चूँकि हमने कॉलम शीर्षकों का भी चयन किया है, हम पहली पंक्ति में लेबल चेकबॉक्स को चेक करते हैं।
हमें निम्नलिखित परिणाम मिले:
तालिका 1.1 जोड़ी सहसंबंध गुणांक का मैट्रिक्स
जोड़ीवार सहसंबंध गुणांक के मैट्रिक्स के विश्लेषण से पता चलता है कि आश्रित चर Y, यानी सकल क्षेत्रीय उत्पाद, का X1 (स्थिर पूंजी में निवेश) के साथ घनिष्ठ संबंध है। सहसंबंध गुणांक 0.936 है। इसका मतलब यह है कि आश्रित चर Y (सकल क्षेत्रीय उत्पाद) का 93.6% संकेतक X1 (स्थिर पूंजी में निवेश) पर निर्भर करता है।
हम छात्र के टी-टेस्ट का उपयोग करके सहसंबंध गुणांक का सांख्यिकीय महत्व निर्धारित करेंगे। हम तालिका मान की तुलना परिकलित मानों से करते हैं।
आइए STUDISCOVER फ़ंक्शन का उपयोग करके तालिका मान की गणना करें।
टी तालिका = 0.129, आत्मविश्वास स्तर 0.9 और स्वतंत्रता की डिग्री (एन-2) के साथ।
फैक्टर X1 सांख्यिकीय रूप से महत्वपूर्ण है।
2. आइए प्रभावी विशेषता (सकल क्षेत्रीय उत्पाद) और उससे सबसे निकट से संबंधित कारक (स्थिर पूंजी में निवेश) के बीच सहसंबंध का एक क्षेत्र बनाएं।
ऐसा करने के लिए, हम एक्सेल स्कैटर प्लॉट टूल का उपयोग करेंगे।
परिणामस्वरूप, हमें सकल क्षेत्रीय उत्पाद, अरब रूबल की कीमत का सहसंबंध क्षेत्र प्राप्त होता है। और अचल संपत्तियों में निवेश, अरब रूबल। (चित्र 1.1.).
चित्र 1.1
3. प्रत्येक कारक X के लिए रैखिक युग्म प्रतिगमन के मापदंडों की गणना करें
रैखिक जोड़ीवार प्रतिगमन के मापदंडों की गणना करने के लिए, हम डेटा विश्लेषण सेटिंग में शामिल प्रतिगमन उपकरण का उपयोग करेंगे।
प्रतिगमन संवाद बॉक्स में, इनपुट अंतराल Y फ़ील्ड में, उन कोशिकाओं की श्रेणी का पता दर्ज करें जो आश्रित चर का प्रतिनिधित्व करते हैं। खेत मेँ
इनपुट अंतराल X हम उस श्रेणी का पता दर्ज करते हैं जिसमें स्वतंत्र चर के मान शामिल हैं। आइए हम कारक X के लिए युग्मित प्रतिगमन के मापदंडों की गणना करें।
X1 के लिए हमें तालिका 1.2 में प्रस्तुत निम्नलिखित डेटा प्राप्त हुआ:
तालिका 1.2
स्थिर पूंजी में निवेश पर सकल क्षेत्रीय उत्पाद की कीमत की निर्भरता के प्रतिगमन समीकरण का रूप है:
4. आइए निर्धारण के गुणांक, सन्निकटन की औसत त्रुटि और फिशर के एफ-परीक्षण के माध्यम से प्रत्येक मॉडल की गुणवत्ता का मूल्यांकन करें। आइए तय करें कि कौन सा मॉडल सबसे अच्छा है।
हमने पैराग्राफ 3 में की गई गणनाओं के परिणामस्वरूप निर्धारण का गुणांक, सन्निकटन की औसत त्रुटि प्राप्त की। प्राप्त डेटा निम्नलिखित तालिकाओं में प्रस्तुत किए गए हैं:
X1 डेटा:
तालिका 1.3ए
तालिका 1.4बी
ए) निर्धारण का गुणांक यह निर्धारित करता है कि मॉडल में विशेषता वाई की भिन्नता के किस अनुपात को ध्यान में रखा गया है और यह उस पर कारक एक्स के प्रभाव के कारण है। निर्धारण के गुणांक का मूल्य जितना अधिक होगा, के बीच संबंध उतना ही करीब होगा निर्मित गणितीय मॉडल में विशेषताएँ।
एक्सेल आर-स्क्वायर को संदर्भित करता है।
इस मानदंड के आधार पर, सबसे पर्याप्त मॉडल निश्चित पूंजी (X1) में निवेश पर सकल क्षेत्रीय उत्पाद की कीमत की निर्भरता का प्रतिगमन समीकरण है।
बी) हम सूत्र का उपयोग करके औसत सन्निकटन त्रुटि की गणना करते हैं:
जहां अंश वास्तविक मानों से परिकलित मानों के विचलन के वर्गों का योग है। तालिकाओं में यह एसएस कॉलम, शेष पंक्ति में स्थित है।
हम AVERAGE फ़ंक्शन का उपयोग करके एक्सेल में एक अपार्टमेंट की औसत कीमत की गणना करते हैं। = 24.18182 अरब रूबल।
आर्थिक गणना करते समय, यदि सन्निकटन की औसत त्रुटि 5% से कम है तो एक मॉडल को पर्याप्त रूप से सटीक माना जाता है; यदि सन्निकटन की औसत त्रुटि 15% से कम है तो मॉडल को स्वीकार्य माना जाता है।
इस मानदंड के अनुसार, निश्चित पूंजी (X1) में निवेश पर सकल क्षेत्रीय उत्पाद की कीमत की निर्भरता के प्रतिगमन समीकरण के लिए गणितीय मॉडल सबसे पर्याप्त है।
सी) एफ-परीक्षण का उपयोग प्रतिगमन मॉडल के महत्व का परीक्षण करने के लिए किया जाता है। ऐसा करने के लिए, फिशर एफ-परीक्षण के महत्वपूर्ण (सारणीबद्ध) मूल्यों की तुलना भी की जाती है।
परिकलित मान तालिका 1.4बी (अक्षर एफ द्वारा इंगित) में दिए गए हैं।
हम FDIST फ़ंक्शन का उपयोग करके Excel में फिशर F परीक्षण के सारणीबद्ध मान की गणना करेंगे। आइए प्रायिकता को 0.05 के बराबर लें। प्राप्त: = 4.75
प्रत्येक कारक के लिए फिशर के एफ परीक्षण के परिकलित मान तालिका मान के तुलनीय हैं:
71.02 > = 4.75 मॉडल इस मानदंड के अनुसार पर्याप्त है।
तीनों मानदंडों के अनुसार डेटा का विश्लेषण करने के बाद, हम यह निष्कर्ष निकाल सकते हैं कि सबसे अच्छा गणितीय मॉडल सकल क्षेत्रीय उत्पाद कारक के लिए बनाया गया है, जिसे रैखिक समीकरण द्वारा वर्णित किया गया है
5. सकल क्षेत्रीय उत्पाद की कीमत की निर्भरता के चयनित मॉडल के लिए
यदि कारक का अनुमानित मूल्य उसके अधिकतम मूल्य का 80% है, तो हम महत्व स्तर पर संकेतक के औसत मूल्य की भविष्यवाणी करेंगे। आइए इसे ग्राफ़िक रूप से प्रस्तुत करें: वास्तविक और मॉडल मान, पूर्वानुमान बिंदु।
आइए एक्स के अनुमानित मूल्य की गणना करें; शर्त के अनुसार, यह अधिकतम मूल्य का 80% होगा।
आइए MAX फ़ंक्शन का उपयोग करके Excel में X अधिकतम की गणना करें।
0,8 *52,8 = 42,24
आश्रित चर का पूर्वानुमानित अनुमान प्राप्त करने के लिए, हम स्वतंत्र चर के प्राप्त मूल्य को रैखिक समीकरण में प्रतिस्थापित करते हैं:
5.07+2.14*42.24 = 304.55 बिलियन रूबल।
आइए हम पूर्वानुमान का विश्वास अंतराल निर्धारित करें, जिसकी निम्नलिखित सीमाएँ होंगी:
अनुमानित मूल्य के लिए विश्वास अंतराल की गणना करने के लिए, हम प्रतिगमन रेखा से विचलन की गणना करते हैं।
युग्मित प्रतिगमन मॉडल के लिए, विचलन मान की गणना की जाती है:
वे। तालिका 1.5ए से मानक त्रुटि मान।
(चूंकि स्वतंत्रता की डिग्री की संख्या एक के बराबर है, हर n-2 के बराबर होगा)। सहसंबंध जोड़ी प्रतिगमन पूर्वानुमान
गुणांक की गणना करने के लिए, हम एक्सेल फ़ंक्शन STUDISCOVER का उपयोग करेंगे, संभावना को 0.1 के बराबर लेंगे, और स्वतंत्रता की डिग्री की संख्या 38 लेंगे।
हम एक्सेल का उपयोग करके मूल्य की गणना करते हैं और 12294 प्राप्त करते हैं।
आइए अंतराल की ऊपरी और निचली सीमाएं निर्धारित करें।
- 304,55+27,472= 332,022
- 304,55-27,472= 277,078
इस प्रकार, पूर्वानुमान मूल्य = 304.55 हजार डॉलर 277.078 हजार डॉलर के बराबर निचली सीमा के बीच होगा। और ऊपरी सीमा 332.022 बिलियन के बराबर है। रगड़ना।
वास्तविक और मॉडल मान, पूर्वानुमान बिंदु चित्र 1.2 में ग्राफिक रूप से प्रस्तुत किए गए हैं।
चित्र 1.2
6. चरण-दर-चरण एकाधिक प्रतिगमन (उन्मूलन विधि) का उपयोग करके, हम महत्वपूर्ण कारकों के कारण सकल क्षेत्रीय उत्पाद की कीमत के गठन के लिए एक मॉडल बनाएंगे
मल्टीपल रिग्रेशन बनाने के लिए, हम सभी कारकों सहित एक्सेल के रिग्रेशन फ़ंक्शन का उपयोग करेंगे। परिणामस्वरूप, हमें परिणाम तालिकाएँ प्राप्त होती हैं, जिनसे हमें विद्यार्थी के टी-टेस्ट की आवश्यकता होती है।
तालिका 1.8ए
तालिका 1.8बी
तालिका 1.8सी.
हमें एक मॉडल मिलता है जैसे:
क्योंकि< (4,75 < 71,024), уравнение регрессии следует признать адекватным.
आइए छात्र के टी-टेस्ट का सबसे छोटा निरपेक्ष मान चुनें, यह 8.427 के बराबर है, इसकी तुलना तालिका मान से करें, जिसे हम एक्सेल में गणना करते हैं, महत्व स्तर 0.10 के बराबर लेते हैं, स्वतंत्रता की डिग्री की संख्या एन-एम-1= 12-4=8: =1.8595
8.427>1.8595 के बाद से मॉडल को पर्याप्त माना जाना चाहिए।
7. परिणामी गणितीय मॉडल के महत्वपूर्ण कारक का आकलन करने के लिए, हम लोच गुणांक, और - गुणांक की गणना करते हैं
लोच गुणांक दर्शाता है कि कारक विशेषता में 1% परिवर्तन होने पर प्रभावी विशेषता कितने प्रतिशत बदल जाएगी:
ई एक्स4 = 2.137 * (10.69/24.182) = 0.94%
अर्थात्, अचल पूंजी में निवेश में 1% की वृद्धि के साथ, लागत औसतन 0.94% बढ़ जाती है।
गुणांक दर्शाता है कि मानक विचलन के किस भाग से एक मानक विचलन द्वारा स्वतंत्र चर में परिवर्तन के साथ आश्रित चर का औसत मूल्य बदलता है।
2,137* (14.736/33,632) = 0,936.
मानक विचलन डेटा वर्णनात्मक सांख्यिकी उपकरण का उपयोग करके प्राप्त तालिकाओं से लिया जाता है।
तालिका 1.11 वर्णनात्मक आँकड़े (वाई)
तालिका 1.12 वर्णनात्मक आँकड़े (X4)
गुणांक सभी कारकों के कुल प्रभाव में कारक के प्रभाव का हिस्सा निर्धारित करता है:
जोड़ी सहसंबंध गुणांक की गणना करने के लिए, हम डेटा विश्लेषण सेटिंग्स में सहसंबंध उपकरण का उपयोग करके एक्सेल में जोड़ी सहसंबंध गुणांक के मैट्रिक्स की गणना करते हैं।
तालिका 1.14
(0,93633*0,93626) / 0,87 = 1,00.
निष्कर्ष: प्राप्त गणनाओं से, हम यह निष्कर्ष निकाल सकते हैं कि प्रभावी विशेषता Y (सकल क्षेत्रीय उत्पाद) की कारक X1 (स्थिर पूंजी में निवेश) (100% तक) पर बड़ी निर्भरता है।
ग्रन्थसूची
- 1. मैग्नस वाई.आर., कातिशेव पी.के., पेरेसेट्स्की ए.ए. अर्थमिति। शुरुआती कोर्स. ट्यूटोरियल। दूसरा संस्करण. - एम.: डेलो, 1998. - पी. 69 - 74.
- 2. अर्थमिति पर कार्यशाला: पाठ्यपुस्तक / आई.आई. एलिसेवा, एस.वी. कुरीशेवा, एन.एम. गोर्डीन्को एट अल. 2002. - पी. 49-105.
- 3. डफ़र्टी के. अर्थमिति का परिचय: अनुवाद। अंग्रेज़ी से - एम.: इंफ्रा-एम, 1999. - XIV, पी. 262-285.
- 4. अयवीज़यान एस.ए., मिख्तिरयान वी.एस. अनुप्रयुक्त गणित और अर्थमिति के मूल सिद्धांत। -1998., पृ. 115-147.
- 5. क्रेमर एन.एस.एच., पुटको बी.ए. अर्थमिति। -2007. 175-251 तक.
य | एक्स (1) | एक्स (2) | एक्स (3) | एक्स (4) | एक्स (5) | |
य | 1.00 | 0.43 | 0.37 | 0.40 | 0.58 | 0.33 |
एक्स (1) | 0.43 | 1.00 | 0.85 | 0.98 | 0.11 | 0.34 |
एक्स (2) | 0.37 | 0.85 | 1.00 | 0.88 | 0.03 | 0.46 |
एक्स (3) | 0.40 | 0.98 | 0.88 | 1.00 | 0.03 | 0.28 |
एक्स (4) | 0.58 | 0.11 | 0.03 | 0.03 | 1.00 | 0.57 |
एक्स (5) | 0.33 | 0.34 | 0.46 | 0.28 | 0.57 | 1.00 |
युग्मित सहसंबंध गुणांक के मैट्रिक्स के विश्लेषण से पता चलता है कि प्रभावी संकेतक संकेतक से सबसे निकट से संबंधित है एक्स(4) - प्रति 1 हेक्टेयर खपत उर्वरक की मात्रा ()।
साथ ही, गुण-तर्कों के बीच संबंध काफी घनिष्ठ है। इस प्रकार, पहिये वाले ट्रैक्टरों की संख्या के बीच व्यावहारिक रूप से कार्यात्मक संबंध है ( एक्स(1)) और सतही जुताई उपकरणों की संख्या .
बहुसंरेखता की उपस्थिति सहसंबंध गुणांक और द्वारा भी इंगित की जाती है। संकेतकों के बीच घनिष्ठ संबंध को ध्यान में रखते हुए एक्स (1) , एक्स(2) और एक्स(3), उनमें से केवल एक को उपज प्रतिगमन मॉडल में शामिल किया जा सकता है।
बहुसंरेखता के नकारात्मक प्रभाव को प्रदर्शित करने के लिए, सभी इनपुट संकेतकों सहित उपज के एक प्रतिगमन मॉडल पर विचार करें:
एफ ओब्स = 121.
समीकरण के गुणांकों के अनुमानों के मानक विचलन के सही अनुमानों के मान कोष्ठक में दर्शाए गए हैं .
निम्नलिखित पर्याप्तता पैरामीटर प्रतिगमन समीकरण के अंतर्गत प्रस्तुत किए गए हैं: निर्धारण के एकाधिक गुणांक; अवशिष्ट विचरण का सही अनुमान, सन्निकटन की औसत सापेक्ष त्रुटि और मानदंड एफ ओब्स = 121 का परिकलित मूल्य।
प्रतिगमन समीकरण महत्वपूर्ण है क्योंकि एफ ओब्स = 121 > एफ केपी = 2.85 तालिका से पाया गया एफ-ए=0.05 पर वितरण; एन 1 =6 और एन 2 =14.
इससे यह निष्कर्ष निकलता है कि Q¹0, अर्थात्। और समीकरण q के गुणांकों में से कम से कम एक जे (जे= 0, 1, 2, ..., 5) शून्य नहीं है।
व्यक्तिगत प्रतिगमन गुणांक H0 के महत्व के बारे में परिकल्पना का परीक्षण करने के लिए: q j = 0, जहां जे=1,2,3,4,5, क्रांतिक मान की तुलना करें टीकेपी = 2.14, तालिका से पाया गया टी-महत्व स्तर a=2 पर वितरण क्यू=0.05 और स्वतंत्रता की डिग्री की संख्या n=14, परिकलित मान के साथ। समीकरण से यह निष्कर्ष निकलता है कि प्रतिगमन गुणांक सांख्यिकीय रूप से केवल तभी महत्वपूर्ण होता है एक्स(4) ½ से टी 4 ½=2.90 > टीकेपी =2.14.
प्रतिगमन गुणांक के नकारात्मक संकेत आर्थिक व्याख्या के लिए उपयुक्त नहीं होते हैं एक्स(1) और एक्स(5) . गुणांकों के नकारात्मक मूल्यों से यह पता चलता है कि पहिएदार ट्रैक्टरों के साथ कृषि की संतृप्ति में वृद्धि ( एक्स(1)) और पादप स्वास्थ्य उत्पाद ( एक्स(5)) उपज पर नकारात्मक प्रभाव पड़ता है। इसलिए, परिणामी प्रतिगमन समीकरण अस्वीकार्य है।
महत्वपूर्ण गुणांकों के साथ एक प्रतिगमन समीकरण प्राप्त करने के लिए, हम चरण-दर-चरण प्रतिगमन विश्लेषण एल्गोरिदम का उपयोग करते हैं। प्रारंभ में, हम चर के उन्मूलन के साथ चरण-दर-चरण एल्गोरिदम का उपयोग करते हैं।
आइए वेरिएबल को मॉडल से बाहर निकालें एक्स(1) , जो ½ के न्यूनतम निरपेक्ष मान से मेल खाता है टी 1 ½=0.01. शेष चरों के लिए, हम फिर से प्रतिगमन समीकरण बनाते हैं:
परिणामी समीकरण महत्वपूर्ण है क्योंकि एफ देखा गया = 155 > एफ केपी = 2.90, महत्व स्तर पर पाया गया ए = 0.05 और तालिका के अनुसार स्वतंत्रता की डिग्री की संख्या एन 1 = 5 और एन 2 = 15 एफ-वितरण, यानी वेक्टर q¹0. हालाँकि, केवल प्रतिगमन गुणांक पर एक्स(4) . अनुमानित मूल्य ½ टीअन्य गुणांकों के लिए j ½ कम है टी kr = 2.131, तालिका से पाया गया टी-ए=2 पर वितरण क्यू=0.05 और n=15.
मॉडल से वेरिएबल को बाहर करके एक्स(3) , जो न्यूनतम मूल्य से मेल खाता है टी 3 =0.35 और हमें प्रतिगमन समीकरण मिलता है:
(2.9)
परिणामी समीकरण में, गुणांक पर एक्स(5) . बहिष्कृत करके एक्स(5) हमें प्रतिगमन समीकरण प्राप्त होता है:
(2.10)
हमने महत्वपूर्ण और व्याख्या योग्य गुणांकों के साथ एक महत्वपूर्ण प्रतिगमन समीकरण प्राप्त किया।
हालाँकि, परिणामी समीकरण हमारे उदाहरण में न केवल "अच्छा" है और न ही "सर्वोत्तम" उपज मॉडल है।
चलिए वो दिखाते हैं बहुसंरेखता स्थिति में, चर के समावेश के साथ एक चरणबद्ध एल्गोरिदम अधिक कुशल है।उपज मॉडल में पहला कदम यपरिवर्तनशील शामिल एक्स(4) , जिसके साथ उच्चतम सहसंबंध गुणांक है य, चर द्वारा समझाया गया - आर(य,एक्स(4))=0.58. दूसरे चरण में समीकरण सहित एक्स(4) चर एक्स(1)या एक्स(3), हम ऐसे मॉडल प्राप्त करेंगे, जो आर्थिक कारणों और सांख्यिकीय विशेषताओं के लिए, (2.10) से अधिक हैं:
(2.11)
(2.12)
समीकरण में शेष तीन चरों में से किसी को भी शामिल करने से इसके गुण खराब हो जाते हैं। उदाहरण के लिए, समीकरण (2.9) देखें।
इस प्रकार, हमारे पास तीन "अच्छे" उपज मॉडल हैं, जिनमें से हमें आर्थिक और सांख्यिकीय कारणों से एक को चुनने की आवश्यकता है।
सांख्यिकीय मानदंडों के अनुसार, मॉडल (2.11) सबसे पर्याप्त है। यह अवशिष्ट विचरण के न्यूनतम मान = 2.26 और सन्निकटन की औसत सापेक्ष त्रुटि और सबसे बड़े मान और एफओबी = 273 से मेल खाता है।
मॉडल (2.12) में पर्याप्तता संकेतक थोड़े खराब हैं, इसके बाद मॉडल (2.10) है।
अब हम सर्वश्रेष्ठ मॉडल (2.11) और (2.12) चुनेंगे। ये मॉडल चर के संदर्भ में एक दूसरे से भिन्न हैं एक्स(1) और एक्स(3) . हालाँकि, उपज मॉडल में परिवर्तनशील एक्स(1) (प्रति 100 हेक्टेयर पहिये वाले ट्रैक्टरों की संख्या) परिवर्तनीय से अधिक बेहतर है एक्स(3) (प्रति 100 हेक्टेयर सतह जुताई उपकरणों की संख्या), जो कुछ हद तक गौण है (या इससे प्राप्त हुई है) एक्स (1)).
इस संबंध में आर्थिक कारणों से मॉडल (2.12) को प्राथमिकता दी जानी चाहिए। इस प्रकार, चर को शामिल करने के साथ चरणबद्ध प्रतिगमन विश्लेषण एल्गोरिदम को लागू करने और इस तथ्य को ध्यान में रखते हुए कि तीन संबंधित चर में से केवल एक को समीकरण में प्रवेश करना चाहिए ( एक्स (1) , एक्स(2)या एक्स(3)) अंतिम प्रतिगमन समीकरण चुनें:
समीकरण a=0.05 पर महत्वपूर्ण है, क्योंकि एफ ओब्स = 266 > एफ केपी = 3.20, तालिका से पाया गया एफ-वितरण ए= पर क्यू=0.05; एन 1 =3 और एन 2 =17. समीकरण ½ में सभी प्रतिगमन गुणांक भी महत्वपूर्ण हैं टीजे½> टीकेपी(ए=2 क्यू=0.05; n=17)=2.11. प्रतिगमन गुणांक q 1 को आर्थिक कारणों से महत्वपूर्ण (q 1 ¹0) माना जाना चाहिए, जबकि टी 1 =2.09 केवल थोड़ा सा कम टीकेपी = 2.11.
प्रतिगमन समीकरण से यह पता चलता है कि प्रति 100 हेक्टेयर कृषि योग्य भूमि पर ट्रैक्टरों की संख्या में एक की वृद्धि (एक निश्चित मूल्य पर) एक्स(4)) अनाज की पैदावार में औसतन 0.345 सी/हेक्टेयर की वृद्धि होती है।
लोच गुणांक ई 1 »0.068 और ई 2 »0.161 की अनुमानित गणना से पता चलता है कि बढ़ते संकेतकों के साथ एक्स(1) और एक्स(4) 1% से, अनाज की उपज औसतन क्रमशः 0.068% और 0.161% बढ़ जाती है।
निर्धारण के एकाधिक गुणांक इंगित करते हैं कि उपज भिन्नता का केवल 46.9% मॉडल में शामिल संकेतकों द्वारा समझाया गया है ( एक्स(1) और एक्स(4)), यानी, ट्रैक्टर और उर्वरकों के साथ फसल उत्पादन की संतृप्ति। शेष भिन्नता बेहिसाब कारकों की कार्रवाई के कारण है ( एक्स (2) , एक्स (3) , एक्स(5), मौसम की स्थिति, आदि)। सन्निकटन की औसत सापेक्ष त्रुटि मॉडल की पर्याप्तता, साथ ही अवशिष्ट विचरण के मूल्य को दर्शाती है। प्रतिगमन समीकरण की व्याख्या करते समय, सन्निकटन की सापेक्ष त्रुटियों के मान रुचिकर होते हैं . आइए हम याद करें कि - प्रभावी संकेतक का मॉडल मूल्य विचाराधीन क्षेत्रों की समग्रता के लिए औसत उपज मूल्य को दर्शाता है, बशर्ते कि व्याख्यात्मक चर के मान एक्स(1) और एक्स(4) समान स्तर पर स्थिर होते हैं, अर्थात् एक्स (1) = एक्स मैं(1) और एक्स (4) = एक्स मैं(4) . फिर, d के मान के अनुसार मैंआप उपज के आधार पर क्षेत्रों की तुलना कर सकते हैं। वे क्षेत्र जिनसे d मान मेल खाते हैं मैं>0, औसत से अधिक उपज है, और डी मैं<0 - ниже среднего.
हमारे उदाहरण में, उपज की दृष्टि से, डी के अनुरूप क्षेत्र में फसल उत्पादन सबसे प्रभावी है 7 =28%, जहां उपज क्षेत्रीय औसत से 28% अधिक है, और सबसे कम प्रभावी डी वाले क्षेत्र में है 20 =-27,3%.
कार्य और अभ्यास
2.1. सामान्य जनसंख्या से ( य, एक्स (1) , ..., एक्स(पी)), कहाँ यसशर्त गणितीय अपेक्षा और विचरण एस 2 के साथ एक सामान्य वितरण कानून है, जिसका एक यादृच्छिक नमूना है एन, जाने देना ( यी, एक्स मैं (1) , ..., एक्स मैं(पी)) - परिणाम मैंवें अवलोकन ( मैं=1, 2, ..., एन). निर्धारित करें: ए) वेक्टर के न्यूनतम वर्ग अनुमान की गणितीय अपेक्षा क्यू; बी) वेक्टर के न्यूनतम वर्ग अनुमान का सहप्रसरण मैट्रिक्स क्यू; ग) मूल्यांकन की गणितीय अपेक्षा।
2.2. समस्या 2.1 की शर्तों के अनुसार, प्रतिगमन के कारण वर्ग विचलन के योग की गणितीय अपेक्षा ज्ञात कीजिए, अर्थात। ईक्यू आर, कहाँ
.
2.3. समस्या 2.1 की शर्तों के अनुसार, प्रतिगमन रेखाओं के सापेक्ष अवशिष्ट भिन्नता के कारण होने वाले वर्ग विचलन के योग की गणितीय अपेक्षा निर्धारित करें, अर्थात। eq केओस्ट, कहाँ
2.4. साबित करें कि जब परिकल्पना H 0 पूरी होती है: q=0 आँकड़े
स्वतंत्रता की डिग्री n 1 =p+1 और n 2 =n-p-1 के साथ F-वितरण है।
2.5. साबित करें कि जब परिकल्पना H 0: q j =0 पूरी हो जाती है, तो आंकड़ों में स्वतंत्रता की डिग्री n=n-p-1 की संख्या के साथ t-वितरण होता है।
2.6. चारे की रोटी के सिकुड़न की निर्भरता पर डेटा (तालिका 2.3) के आधार पर ( य) भंडारण अवधि पर ( एक्स) इस धारणा के तहत सशर्त अपेक्षा का एक बिंदु अनुमान ढूंढें कि सामान्य प्रतिगमन समीकरण रैखिक है।
तालिका 2.3.
आवश्यक: ए) इस धारणा के तहत अवशिष्ट विचरण एस 2 का अनुमान लगाएं कि सामान्य प्रतिगमन समीकरण का रूप है; बी) ए=0.05 पर प्रतिगमन समीकरण के महत्व की जांच करें, यानी। परिकल्पना एच 0: क्यू=0; सी) विश्वसनीयता जी=0.9 के साथ, पैरामीटर क्यू 0, क्यू 1 के अंतराल अनुमान निर्धारित करें; डी) विश्वसनीयता जी=0.95 के साथ, सशर्त गणितीय अपेक्षा का अंतराल अनुमान निर्धारित करें एक्स 0=6; ई) बिंदु पर भविष्यवाणी का विश्वास अंतराल g=0.95 पर निर्धारित करें एक्स=12.
2.7. तालिका में दिए गए 5 महीनों के लिए स्टॉक की कीमतों की वृद्धि दर की गतिशीलता पर डेटा के आधार पर। 2.4.
तालिका 2.4.
महीने ( एक्स) | |||||
य (%) |
और यह धारणा कि सामान्य प्रतिगमन समीकरण का रूप है, यह आवश्यक है: ए) प्रतिगमन समीकरण के दोनों मापदंडों और अवशिष्ट विचरण एस 2 का अनुमान निर्धारित करें; बी) ए=0.01 पर प्रतिगमन गुणांक के महत्व की जांच करें, यानी। परिकल्पना एच 0: क्यू 1 =0;
सी) विश्वसनीयता जी=0.95 के साथ, पैरामीटर क्यू 0 और क्यू 1 के अंतराल अनुमान खोजें; डी) विश्वसनीयता जी=0.9 के साथ, सशर्त गणितीय अपेक्षा का एक अंतराल अनुमान स्थापित करें एक्स 0=4; ई) बिंदु पर भविष्यवाणी का विश्वास अंतराल g=0.9 पर निर्धारित करें एक्स=5.
2.8. युवा जानवरों के वजन बढ़ने की गतिशीलता के अध्ययन के परिणाम तालिका 2.5 में दिए गए हैं।
तालिका 2.5.
यह मानते हुए कि सामान्य प्रतिगमन समीकरण रैखिक है, यह आवश्यक है: ए) प्रतिगमन समीकरण के दोनों मापदंडों और अवशिष्ट विचरण एस 2 का अनुमान निर्धारित करें; बी) ए=0.05 पर प्रतिगमन समीकरण के महत्व की जांच करें, यानी। परिकल्पना एच 0: क्यू=0;
सी) विश्वसनीयता जी=0.8 के साथ, पैरामीटर क्यू 0 और क्यू 1 के अंतराल अनुमान खोजें; डी) विश्वसनीयता जी=0.98 के साथ, सशर्त गणितीय अपेक्षा के अंतराल अनुमानों को निर्धारित और तुलना करें एक्स 0 =3 और एक्स 1 =6;
ई) बिंदु पर भविष्यवाणी का विश्वास अंतराल g=0.98 पर निर्धारित करें एक्स=8.
2.9. लागत ( य) प्रसार के आधार पर पुस्तक की एक प्रति ( एक्स) (हजार प्रतियां) प्रकाशन गृह द्वारा एकत्र किए गए डेटा की विशेषता है (तालिका 2.6)। विश्वसनीयता g=0.9 के साथ हाइपरबोलिक रिग्रेशन समीकरण के न्यूनतम वर्ग अनुमान और पैरामीटर निर्धारित करें, पैरामीटर q 0 और q 1 के लिए आत्मविश्वास अंतराल का निर्माण करें, साथ ही सशर्त अपेक्षा भी करें एक्स=10.
तालिका 2.6.
प्रपत्र के प्रतिगमन समीकरण के अनुमान और पैरामीटर निर्धारित करें, परिकल्पना H 0 का a = 0.05: q 1 = 0 पर परीक्षण करें और पैरामीटर q 0 और q 1 और सशर्त गणितीय अपेक्षा के लिए विश्वसनीयता g = 0.9 के साथ आत्मविश्वास अंतराल का निर्माण करें। एक्स=20.
2.11. तालिका में 2.8 निम्नलिखित व्यापक आर्थिक संकेतकों की विकास दर (%) पर डेटा प्रस्तुत करता है एन=1992 के लिए विश्व के 10 विकसित देश: जीएनपी - एक्स(1) , औद्योगिक उत्पादन - एक्स(2) , मूल्य सूचकांक - एक्स (3) .
तालिका 2.8.
देशों | x और प्रतिगमन समीकरण के पैरामीटर, अवशिष्ट विचरण का अनुमान; बी) ए=0.05 पर प्रतिगमन गुणांक के महत्व की जांच करें, यानी। एच 0: क्यू 1 =0; ग) विश्वसनीयता g=0.9 के साथ, अंतराल अनुमान q 0 और q 1 खोजें; घ) बिंदु पर g=0.95 पर विश्वास अंतराल ज्ञात कीजिए एक्स 0 =एक्स मैं, कहाँ मैं=5; ई) प्रतिगमन समीकरणों की सांख्यिकीय विशेषताओं की तुलना करें: 1, 2 और 3। 2.12. समस्या 2.11 को ( पर) अनुक्रमणिका एक्स(1) , और व्याख्यात्मक के लिए ( एक्स) चर एक्स (3) . 1. अयवाज़यान एस.ए., मख़ितारियन वी.एस. व्यावहारिक आँकड़े और अर्थमिति के बुनियादी सिद्धांत: पाठ्यपुस्तक। एम., यूनिटी, 1998 (दूसरा संस्करण 2001); 2. अयवाज़यान एस.ए., मख़ितारियन वी.एस. समस्याओं और अभ्यासों में लागू आँकड़े: पाठ्यपुस्तक। एम. यूनिटी - दाना, 2001; 3. अयवज़्यान एस.ए., एन्युकोव आई.एस., मेशाल्किन एल.डी. एप्लाईड स्टैटस्टिक्स। निर्भरता अनुसंधान. एम., वित्त एवं सांख्यिकी, 1985, 487 पीपी.; 4. अयवज़्यान एस.ए., बुख़्स्ताबेर वी.एम., एन्युकोव आई.एस., मेशाल्किन एल.डी. एप्लाईड स्टैटस्टिक्स। वर्गीकरण और आयाम में कमी. एम., वित्त एवं सांख्यिकी, 1989, 607 पीपी.; 5. जॉन्सटन जे. इकोनोमेट्रिक तरीके, एम.: सांख्यिकी, 1980, 446 पीपी.; 6. डबरोव ए.वी., मख़ितारियन वी.एस., ट्रोशिन एल.आई. बहुभिन्नरूपी सांख्यिकीय विधियाँ। एम., वित्त एवं सांख्यिकी, 2000; 7. मख़ितारियन वी.एस., ट्रोशिन एल.आई. सहसंबंध और प्रतिगमन विधियों का उपयोग करके निर्भरता का अध्ययन। एम., एमईएसआई, 1995, 120 पीपी.; 8. मख़ितारियन वी.एस., डबरोव ए.एम., ट्रोशिन एल.आई. अर्थशास्त्र में बहुभिन्नरूपी सांख्यिकीय पद्धतियाँ। एम., एमईएसआई, 1995, 149 पीपी.; 9. डबरोव ए.एम., मखितारियन वी.एस., ट्रोशिन एल.आई. व्यवसायियों और प्रबंधकों के लिए गणितीय आँकड़े। एम., एमईएसआई, 2000, 140 पीपी.; 10. लुकाशिन यू.आई. प्रतिगमन और अनुकूली पूर्वानुमान विधियाँ: पाठ्यपुस्तक, एम., एमईएसआई, 1997। 11. लुकाशिन यू.आई. अल्पकालिक पूर्वानुमान की अनुकूली विधियाँ। - एम., सांख्यिकी, 1979। अनुप्रयोग परिशिष्ट 1. स्वतंत्र कंप्यूटर अनुसंधान के लिए कार्यों के विकल्प। |