युग्मित सहसंबंध गुणांकों का एक मैट्रिक्स बनाएँ। बहुसंरेखता के लिए जाँच करें
आर्थिक डेटा किसी भी आर्थिक वस्तुओं या प्रक्रियाओं की मात्रात्मक विशेषताएं हैं। वे कई कारकों के प्रभाव में बनते हैं, जिनमें से सभी बाहरी नियंत्रण के लिए उपलब्ध नहीं होते हैं। बेकाबू कारक मूल्यों के एक सेट से यादृच्छिक मान ले सकते हैं और इस तरह उनके द्वारा निर्धारित डेटा की यादृच्छिकता का कारण बन सकते हैं। आर्थिक अनुसंधान में मुख्य कार्यों में से एक है चर के बीच निर्भरता का विश्लेषण।
सुविधाओं के बीच निर्भरता को ध्यान में रखते हुए, सबसे पहले दो प्रकार के संबंधों में अंतर करना आवश्यक है:
- कार्यात्मक -कारक विशेषता में परिवर्तन और परिणामी मूल्य में परिवर्तन के बीच पूर्ण पत्राचार की विशेषता है: विशेषता-कारक का प्रत्येक मान प्रभावी विशेषता के अच्छी तरह से परिभाषित मूल्यों से मेल खाता है।इस प्रकार के संबंध को सूत्रीय संबंध के रूप में अभिव्यक्त किया जाता है। एक कार्यात्मक निर्भरता एक परिणामी विशेषता को एक या अधिक कारक लक्षणों से जोड़ सकती है। इस प्रकार, समय मजदूरी के लिए मजदूरी की राशि काम किए गए घंटों की संख्या पर निर्भर करती है;
- सह - संबंध- दो संकेतों के परिवर्तन के बीच कोई पूर्ण पत्राचार नहीं है, वास्तविक डेटा के बड़े पैमाने पर अवलोकन के साथ व्यक्तिगत कारकों का प्रभाव केवल औसत पर प्रकट होता है। बड़ी संख्या में विभिन्न कारकों के अध्ययन किए गए गुण पर एक साथ प्रभाव इस तथ्य की ओर जाता है विशेषता-कारक का समान मूल्य परिणामी विशेषता के मूल्यों के संपूर्ण वितरण से मेल खाता है,चूंकि प्रत्येक विशिष्ट मामले में, अन्य कारक संकेत उनके प्रभाव की ताकत और दिशा बदल सकते हैं।
यह ध्यान में रखा जाना चाहिए कि यदि संकेतों के बीच एक कार्यात्मक संबंध है, तो कारक चिह्न के मूल्य को जानना संभव है, सटीक रूप से निर्धारित करना परिणाम का मूल्य।एक सहसंबंध निर्भरता की उपस्थिति में, केवल प्रभावी सुविधा के परिवर्तन की प्रवृत्तिकारक चिन्ह का मान बदलते समय।
संकेतों के बीच संबंध का अध्ययन करते हुए, उन्हें दिशा, रूप, कारकों की संख्या के अनुसार वर्गीकृत किया जाता है:
- की ओरकनेक्शन में बांटा गया है सीधाऔर उलटना।प्रत्यक्ष संबंध के साथ, प्रभावी विशेषता में परिवर्तन की दिशा साइन-फैक्टर में परिवर्तन की दिशा से मेल खाती है। प्रतिक्रिया के साथ, प्रभावी सुविधा में परिवर्तन की दिशा सुविधा-कारक में परिवर्तन की दिशा के विपरीत होती है। उदाहरण के लिए, किसी कार्यकर्ता की योग्यता जितनी अधिक होगी, उसके श्रम की उत्पादकता का स्तर उतना ही अधिक होगा (प्रत्यक्ष संबंध)। श्रम की उत्पादकता जितनी अधिक होगी, उत्पादन की इकाई लागत उतनी ही कम होगी (प्रतिक्रिया);
- सूचित करना(फ़ंक्शन का प्रकार) कनेक्शन में विभाजित हैं रेखीय(सीधा) और गैर रेखीय(वक्रीय)। एक रेखीय संबंध को एक सीधी रेखा के रूप में प्रदर्शित किया जाता है, एक गैर-रैखिक संबंध - एक वक्र (परबोला, अतिपरवलय, आदि) के रूप में। कारक विशेषता के मूल्य में वृद्धि के साथ एक रैखिक संबंध के साथ, परिणामी विशेषता के मूल्य में एक समान वृद्धि (कमी) होती है;
- प्रभावी संकेत पर अभिनय करने वाले कारकों की संख्या से,संचार में बांटा गया है एकल कारक(युग्मित) और बहुघटकीय।
आसपास की स्थितियों पर एक संकेत की भिन्नता की निर्भरता का अध्ययन सहसंबंध के सिद्धांत की सामग्री है।
सहसंबंध विश्लेषण करते समय, डेटा के पूरे सेट को चर (कारकों) के सेट के रूप में माना जाता है, जिनमें से प्रत्येक में शामिल होता है पीटिप्पणियों।
दो कारकों के बीच संबंध का अध्ययन करते समय, उन्हें आमतौर पर निरूपित किया जाता है एक्स =(एक्स पी एक्स 2,..., एक्स पी)और वाई = (वाई ( , वाई 2 ,..., वाई और)।
सहप्रसरण -यह सांख्यिकीय है परस्पर क्रिया का पैमानादो चर। उदाहरण के लिए, दो प्रतिभूतियों पर रिटर्न के सहप्रसरण के लिए एक सकारात्मक मूल्य इंगित करता है कि उन प्रतिभूतियों पर रिटर्न एक ही दिशा में चलते हैं।
दो चरों के बीच सहप्रसरण एक्सऔर वाईनिम्नानुसार गणना की गई:
जहाँ चर के वास्तविक मान हैं
एक्सऔर जी;
यदि यादृच्छिक चर ही वाईस्वतंत्र हैं, सैद्धांतिक सहप्रसरण शून्य है।
सहप्रसरण उन इकाइयों पर निर्भर करता है जिनमें चरों को मापा जाता है ही Y, यह एक असामान्य मात्रा है। इसलिए मापने के लिए संचार बलोंदो चरों के बीच, एक अन्य आँकड़ा प्रयोग किया जाता है, जिसे सहसंबंध गुणांक कहा जाता है।
दो चर के लिए एक्सऔर वाई जोड़ी सहसंबंध गुणांक
निम्नानुसार परिभाषित किया गया है:
कहाँ एसएसवाई-विचरण अनुमान ही वाई.ये अनुमान विशेषताएँ हैं फैलाव की डिग्रीमान x ( , x 2 , ..., x n (y 1 , y 2 , y n)अपने औसत के आसपास एक्स (वाईक्रमशः), या परिवर्तनशीलता(परिवर्तनशीलता) टिप्पणियों के एक सेट पर इन चरों की।
फैलाव(विचरण अनुमान) सूत्र द्वारा निर्धारित किया जाता है
सामान्य स्थिति में, विचरण का एक निष्पक्ष अनुमान प्राप्त करने के लिए, वर्गों के योग को अनुमान की स्वतंत्रता की डिग्री की संख्या से विभाजित किया जाना चाहिए। (वगैरह),कहाँ पी -नमूने का आकार, आर -नमूने पर लगाए गए लिंक की संख्या। चूंकि माध्य निर्धारित करने के लिए नमूना पहले ही एक बार उपयोग किया जा चुका है एक्स,तो इस मामले में सुपरिंपोज्ड बॉन्ड की संख्या एक के बराबर है (पी = 1), और अनुमान की स्वतंत्रता की डिग्री की संख्या (अर्थात, स्वतंत्र नमूना तत्वों की संख्या) के बराबर है (पी - 1).
उन्हीं इकाइयों में चर के मूल्यों में प्रसार की डिग्री को मापना अधिक स्वाभाविक है जिसमें चर को ही मापा जाता है। इस समस्या को एक संकेतक द्वारा हल किया जाता है जिसे कहा जाता है मानक विचलन (मानक विचलन) या मानक त्रुटिचर एक्स(चर वाई)और अनुपात से निर्धारित होता है
सूत्र के अंश (3.2.1) में शब्द दो चरों की परस्पर क्रिया को व्यक्त करते हैं और सहसंबंध (सकारात्मक या नकारात्मक) के संकेत को निर्धारित करते हैं। यदि, उदाहरण के लिए, चर के बीच एक मजबूत सकारात्मक संबंध है (एक चर में वृद्धि जब दूसरे में वृद्धि होती है), तो प्रत्येक पद एक सकारात्मक संख्या होगी। इसी तरह, यदि चरों के बीच एक मजबूत नकारात्मक संबंध है, तो अंश में सभी पद ऋणात्मक संख्याएँ होंगे, जिसके परिणामस्वरूप नकारात्मक सहसंबंध मूल्य होगा।
जोड़ी सहसंबंध गुणांक के लिए अभिव्यक्ति का भाजक [देखें। सूत्र (3.2.2)] बस अंश को इस तरह से सामान्य करता है कि सहसंबंध गुणांक एक आसानी से व्याख्या की जाने वाली संख्या है जिसका कोई आयाम नहीं है और -1 से +1 तक मान लेता है।
सहसंबंध गुणांक के लिए व्यंजक का अंश, जिसकी असामान्य इकाइयों के कारण व्याख्या करना कठिन है, है XY सहप्रसरण।इस तथ्य के बावजूद कि इसे कभी-कभी एक स्वतंत्र विशेषता के रूप में उपयोग किया जाता है (उदाहरण के लिए, दो एक्सचेंजों पर स्टॉक की कीमतों में संयुक्त परिवर्तन का वर्णन करने के लिए वित्त के सिद्धांत में), सहसंबंध गुणांक का उपयोग करना अधिक सुविधाजनक है। सहसंबंध और सहप्रसरण अनिवार्य रूप से एक ही जानकारी का प्रतिनिधित्व करते हैं, लेकिन सहसंबंध इस जानकारी को अधिक सुविधाजनक रूप में प्रस्तुत करता है।
सहसंबंध गुणांक के गुणात्मक मूल्यांकन के लिए, विभिन्न पैमानों का उपयोग किया जाता है, सबसे अधिक बार चाडॉक स्केल। सहसंबंध गुणांक के मूल्य के आधार पर, रिश्ते में निम्नलिखित अनुमानों में से एक हो सकता है:
- 0.1-0.3 - कमजोर;
- 0.3-0.5 - ध्यान देने योग्य;
- 0.5-0.7 - मध्यम;
- 0.7-0.9 - उच्च;
- 0.9-1.0 - बहुत अधिक।
अध्ययन के तहत घटना के बारे में अधिक या कम सीमित जानकारी के आधार पर, एक नियम के रूप में, सहसंबंध गुणांक का उपयोग करके कनेक्शन की निकटता की डिग्री का आकलन किया जाता है। इस संबंध में, रैखिक सहसंबंध गुणांक के महत्व का आकलन करने की आवश्यकता है, जो नमूने के परिणामों के आधार पर निष्कर्ष को सामान्य जनसंख्या तक विस्तारित करना संभव बनाता है।
छोटे नमूने के आकार के लिए सहसंबंध गुणांक के महत्व का आकलन छात्र के 7-टेस्ट का उपयोग करके किया जाता है। इस मामले में, इस मानदंड का वास्तविक (मनाया गया) मूल्य सूत्र द्वारा निर्धारित किया जाता है
इस सूत्र का उपयोग करके गणना की गई मान / अवलोकन की तुलना θ-मानदंड के महत्वपूर्ण मूल्य से की जाती है, जिसे छात्र के / -टेस्ट के मूल्यों की तालिका से लिया जाता है (परिशिष्ट 2 देखें), दिए गए महत्व स्तर σ को ध्यान में रखते हुए और स्वतंत्रता की डिग्री की संख्या (पी - 2).
यदि 7 अवलोकन> 7 टैब, तो सहसंबंध गुणांक के प्राप्त मूल्य को महत्वपूर्ण माना जाता है (यानी, शून्य परिकल्पना यह दावा करती है कि सहसंबंध गुणांक शून्य के बराबर है) अस्वीकार कर दिया गया है। और इस प्रकार यह निष्कर्ष निकाला जाता है कि अध्ययन किए गए चरों के बीच घनिष्ठ सांख्यिकीय संबंध है।
यदि मान वाई एक्सशून्य के करीब, चरों के बीच संबंध कमजोर है। यदि यादृच्छिक चर के बीच संबंध:
- धनात्मक है, तो जैसे-जैसे एक यादृच्छिक चर बढ़ता है, दूसरा औसत रूप से बढ़ने लगता है;
- ऋणात्मक है, तो जैसे-जैसे एक यादृच्छिक चर बढ़ता है, दूसरा औसतन घटता जाता है। युग्मित डेटा के विश्लेषण के लिए एक सुविधाजनक ग्राफिकल टूल है स्कैटर प्लॉट, जो दो कारकों के अनुरूप दो आयामों के स्थान में प्रत्येक अवलोकन का प्रतिनिधित्व करता है। एक स्कैटरप्लॉट, जो दो विशेषताओं के मूल्यों के एक सेट को दर्शाता है, उसे भी कहा जाता है सहसंबंध क्षेत्र।इस आरेख के प्रत्येक बिंदु में x निर्देशांक (. और वाई जीजैसे-जैसे रैखिक संबंध की ताकत बढ़ती है, ग्राफ पर बिंदु एक सीधी रेखा और परिमाण के करीब होंगे जीएकता के करीब होगा।
जोड़ी सहसंबंध गुणांक का उपयोग उनके सेट से सुविधाओं के विभिन्न जोड़े के बीच रैखिक संबंधों की ताकत को मापने के लिए किया जाता है। सुविधाओं के एक सेट के लिए, प्राप्त करें जोड़ी सहसंबंध गुणांक का मैट्रिक्स।
संपूर्ण डेटासेट को एक चर से युक्त होने दें वाई ==(आर पर वाई 2, ..., वाई पी)और टीचर (कारक) एक्स,जिनमें से प्रत्येक शामिल है पीटिप्पणियों। परिवर्तनशील मान वाईऔर एक्स,प्रेक्षित जनसंख्या में निहित तालिका (तालिका 3.2.1) में दर्ज की गई हैं।
तालिका 3.2.1
चर संख्या टिप्पणियों |
|||||
एक्स टी3 |
|||||
एच टी.पी |
इस तालिका में निहित आंकड़ों के आधार पर, गणना करें जोड़ी सहसंबंध गुणांक आर का मैट्रिक्स,यह मुख्य विकर्ण के बारे में सममित है:
जोड़ी सहसंबंध गुणांक के मैट्रिक्स का विश्लेषण कई प्रतिगमन मॉडल के निर्माण में उपयोग किया जाता है।
एक सहसंबंध मैट्रिक्स पूरी तरह से मात्राओं के बीच निर्भरता का वर्णन नहीं कर सकता। इस संबंध में, बहुभिन्नरूपी सहसंबंध विश्लेषण में दो समस्याओं पर विचार किया जाता है:
- 1. विश्लेषण में शामिल अन्य चरों की समग्रता के साथ एक यादृच्छिक चर के संबंध की जकड़न का निर्धारण।
- 2. अन्य राशियों के प्रभाव को स्थिर या हटाते समय दो राशियों के बीच संबंध की जकड़न का निर्धारण करना।
इन समस्याओं को क्रमशः बहु और आंशिक सहसंबंध गुणांक की सहायता से हल किया जाता है।
पहली समस्या का समाधान (विश्लेषण में शामिल अन्य चर के सेट के साथ एक यादृच्छिक चर के कनेक्शन की निकटता का निर्धारण) का उपयोग करके किया जाता है नमूना एकाधिक सहसंबंध गुणांकसूत्र के अनुसार
कहाँ आर- आर[सेमी। सूत्र (3.2.6)]; रज्ज-एक ही मैट्रिक्स के एक तत्व के बीजगणितीय पूरक आर।
एकाधिक सहसंबंध गुणांक का वर्ग अनुसूचित जातिj2 जे _जे जे + एलएमबुलाया दृढ़ संकल्प के चयनात्मक एकाधिक गुणांक; यह दिखाता है कि अध्ययन के तहत मात्रा की भिन्नता (यादृच्छिक बिखराव) का अनुपात क्या है Xjअन्य यादृच्छिक चर की भिन्नता की व्याख्या करता है एक्स (, एक्स 2 ,..., एक्स टी।
एकाधिक सहसंबंध और दृढ़ संकल्प के गुणांक सकारात्मक मान हैं, मान 0 से 1 तक की सीमा में ले रहे हैं। जब गुणांक दृष्टिकोण आर 2 से एकता, हम यह निष्कर्ष निकाल सकते हैं कि यादृच्छिक चर का संबंध निकट है, लेकिन इसकी दिशा के बारे में नहीं। एकाधिक सहसंबंध गुणांक केवल तभी बढ़ सकता है जब मॉडल में अतिरिक्त चर शामिल किए जाते हैं, और यदि उपलब्ध सुविधाओं में से किसी को बाहर रखा जाता है तो यह नहीं बढ़ेगा।
निर्धारण के गुणांक के महत्व की जाँच /'-फिशर की कसौटी के परिकलित मूल्य की तुलना करके की जाती है
तालिका के साथ एफ rabl. मानदंड का सारणीबद्ध मान (परिशिष्ट 1 देखें) दिए गए महत्व के स्तर और स्वतंत्रता की डिग्री द्वारा निर्धारित किया जाता है वी एल \u003d एमएनवी 2 \u003d एन-एम-एल।गुणक आर 2यदि असमानता शून्य से महत्वपूर्ण रूप से भिन्न है
यदि यादृच्छिक चर माना जाता है आपस में संबंध स्थापित करनातब जोड़ी सहसंबंध गुणांक का मान अन्य मात्राओं के प्रभाव से आंशिक रूप से प्रभावित होता है। इस संबंध में, अन्य यादृच्छिक चर (एक या अधिक) के प्रभाव को बाहर करते हुए चर के बीच आंशिक सहसंबंध का अध्ययन करने की आवश्यकता है।
नमूना आंशिक सहसंबंध गुणांकसूत्र द्वारा निर्धारित किया जाता है
कहाँ आरजेके, आरजेजे, आरकेके -इसी मैट्रिक्स तत्वों के लिए बीजगणितीय जोड़ आर[सेमी। सूत्र (3.2.6)]।
आंशिक सहसंबंध गुणांक, साथ ही जोड़ीदार सहसंबंध गुणांक, -1 से +1 तक भिन्न होता है।
स्थिति के तहत अभिव्यक्ति (3.2.9)। टी = 3 जैसा दिखेगा
गुणांक r 12(3) कहलाता है एक्स के बीच सहसंबंध गुणांक (और x 2 नियत x y के लिएयह प्राथमिक सूचकांक 1, 2 के संबंध में सममित है। इसका द्वितीयक सूचकांक 3 एक निश्चित चर को संदर्भित करता है।
उदाहरण 3.2.1। जोड़ी गुणांक की गणना,
एकाधिक और आंशिक सहसंबंध।
तालिका में। 3.2.2 बिक्री की मात्रा और एक कंपनी की विज्ञापन लागत के साथ-साथ कई चालू वर्षों के लिए उपभोक्ता व्यय सूचकांक के बारे में जानकारी प्रदान करता है।
- 1. चर "बिक्री की मात्रा" और "उपभोक्ता खर्च सूचकांक" के लिए एक स्कैटरप्लॉट (सहसंबंध क्षेत्र) का निर्माण करें।
- 2. बिक्री की मात्रा पर उपभोक्ता व्यय सूचकांक के प्रभाव की डिग्री निर्धारित करें (जोड़ी सहसंबंध गुणांक की गणना करें)।
- 3. परिकलित जोड़ी सहसंबंध गुणांक के महत्व का आकलन करें।
- 4. तीन चरों के लिए युग्म सहसंबंध गुणांकों का एक मैट्रिक्स बनाएँ।
- 5. बहु सहसंबंध गुणांक का अनुमान लगाएं।
- 6. आंशिक सहसंबंध गुणांकों का अनुमान लगाएं।
1. हमारे उदाहरण में, स्कैटर आरेख का रूप चित्र में दिखाया गया है। 3.2.1। एक झुकी हुई सीधी रेखा के साथ स्कैटरप्लॉट में बिंदु बादल का बढ़ाव हमें यह धारणा बनाने की अनुमति देता है कि चर के मूल्यों के बीच प्रत्यक्ष रैखिक संबंध के लिए कुछ वस्तुनिष्ठ प्रवृत्ति है एक्स 2 वाई(बिक्री की मात्रा)।
चावल। 3.2.1।
2. चर के बीच सहसंबंध गुणांक की गणना करते समय मध्यवर्ती गणना एक्स 2(उपभोक्ता व्यय सूचकांक) और वाई(बिक्री की मात्रा) तालिका में दी गई है। 3.2.3।
औसतयादृच्छिक चर एक्स 2और वाई,जो अनुक्रम jCj की विशेषता बताने वाले सबसे सरल संकेतक हैं, एक्स 2,..., एक्स 16 और वाई वी वाई 2,..., y 16 , हम निम्नलिखित सूत्रों द्वारा गणना करते हैं:
बिक्री की मात्रा वाई, हजार रूबल |
अनुक्रमणिका उपभोग करना टेल्स्की खर्च |
बिक्री की मात्रा वाई, हजार रूबल |
अनुक्रमणिका उपभोग करना टेल्स्की खर्च |
||
तालिका 3.2.3
एल:, - एक्स |
(और - वाई) (एक्स, - एक्स) |
(एक्स, - एक्स) 2 |
(य, - - वाई) 2 |
||||
फैलावमूल्यों के प्रसार की डिग्री की विशेषता है एक्स वी एक्स 2 , एक्स :
अब एक्सेल में उदाहरण 3.2.1 के समाधान पर विचार करें।
एक्सेल का उपयोग करके सहसंबंध की गणना करने के लिए, आप फ़ंक्शन का उपयोग कर सकते हैं =correl(), संख्या के दो स्तंभों के पते निर्दिष्ट करते हुए, जैसा कि अंजीर में दिखाया गया है। 3.2.2। उत्तर D8 में रखा गया है और 0.816 के बराबर है।
चावल। 3.2.2।
(नोट: फ़ंक्शन तर्क कोरल संख्या या नाम, सरणियाँ या संख्या वाले संदर्भ होने चाहिए। यदि तर्क, जो कि एक सरणी या लिंक है, में टेक्स्ट, बूलियन्स, या खाली सेल हैं, तो उन मानों को अनदेखा कर दिया जाता है; हालाँकि, शून्य मान वाली कोशिकाओं को गिना जाता है।
अगर एक सरणी! और array2 में डेटा बिंदुओं की एक अलग संख्या है, फिर फ़ंक्शन Correl #n/a त्रुटि मान लौटाता है।
यदि सरणी 1 या सरणी 2 खाली है या यदि उनके मानों का ओ (मानक विचलन) शून्य है, तो फ़ंक्शन Correl त्रुटि मान देता है #div/0 !।)
/-स्टूडेंट स्टेटिस्टिक का महत्वपूर्ण मूल्य भी फ़ंक्शन का उपयोग करके प्राप्त किया जा सकता है steudrasprobr 1 एक्सेल पैकेज। समारोह के तर्कों के रूप में, आपको स्वतंत्रता की डिग्री की संख्या निर्दिष्ट करनी होगी, के बराबर पी- 2 (हमारे उदाहरण में 16 - 2 = 14) और सार्थकता स्तर a (हमारे उदाहरण में a = 0.1) (चित्र 3.2.3)। अगर असल मूल्य/-सांख्यिकी, मोडुलो लिया, अधिक गंभीर,तब संभाव्यता (1 - ए) के साथ सहसंबंध गुणांक शून्य से काफी भिन्न होता है।
चावल। 3.2.3। /-सांख्यिकीय का महत्वपूर्ण मूल्य 1.7613 है
एक्सेल में विभिन्न सांख्यिकीय समस्याओं को हल करने के लिए डिज़ाइन किए गए डेटा विश्लेषण टूल (तथाकथित विश्लेषण पैकेज) का एक सेट शामिल है। जोड़ी सहसंबंध गुणांक के मैट्रिक्स की गणना करने के लिए आरसहसंबंध उपकरण (चित्र 3.2.4) का उपयोग करें और संबंधित डायलॉग बॉक्स में विश्लेषण पैरामीटर सेट करें। उत्तर को एक नई वर्कशीट (चित्र 3.2.5) पर रखा जाएगा।
1 एक्सेल 2010 में, फ़ंक्शन का नाम steudrasprobr steu में बदल गया-
DENT.ORD.2X।
चावल। 3.2.4।
चावल। 3.2.5।
- अंग्रेजी सांख्यिकीविद् एफ. गैल्टन (1822-1911) और के. पियर्सन (1857-1936) को सहसंबंध के सिद्धांत के संस्थापक माना जाता है। शब्द "सहसंबंध" प्राकृतिक विज्ञान से उधार लिया गया था और इसका अर्थ है "सहसंबंध, पत्राचार"। यादृच्छिक चर के बीच परस्पर निर्भरता के रूप में सहसंबंध की अवधारणा सहसंबंध के गणितीय-सांख्यिकीय सिद्धांत को रेखांकित करती है।
कार्य 2
1. युग्मित सहसंबंध गुणांकों का एक मैट्रिक्स बनाएँ। बहुसंरेखता के लिए जाँच करें। मॉडल में कारकों के चयन का औचित्य सिद्ध कीजिए।
2. चयनित कारकों के साथ रैखिक रूप में एक बहु प्रतिगमन समीकरण बनाएँ।
3. फिशर और छात्र के परीक्षणों का उपयोग करके प्रतिगमन समीकरण और उसके मापदंडों के सांख्यिकीय महत्व का मूल्यांकन करें।
4. सांख्यिकीय रूप से महत्वपूर्ण कारकों के साथ एक प्रतिगमन समीकरण बनाएँ। दृढ़ संकल्प R 2 के गुणांक का उपयोग करके समाश्रयण समीकरण की गुणवत्ता का आकलन करें। निर्मित मॉडल की सटीकता का आकलन करें।
5. आउटपुट की मात्रा के लिए पूर्वानुमान का अनुमान लगाएं, यदि कारकों का पूर्वानुमान मूल्य उनके अधिकतम मूल्यों का 75% है।
कार्य की शर्तें (विकल्प 21)
तालिका 1 (n = 17) में प्रस्तुत आंकड़ों के अनुसार, हम निम्नलिखित कारकों (चर) पर आउटपुट Y (मिलियन रूबल) की मात्रा की निर्भरता का अध्ययन करते हैं:
एक्स 1 - औद्योगिक और उत्पादन कर्मियों, लोगों की संख्या।
एक्स 2 - अचल संपत्तियों की औसत वार्षिक लागत, मिलियन रूबल।
एक्स 3 - अचल संपत्तियों का मूल्यह्रास,%
एक्स 4 - विद्युत शक्ति, kWh।
एक्स 5 - एक कार्यकर्ता के तकनीकी उपकरण, मिलियन रूबल।
एक्स 6 - प्रति कार्यकर्ता विपणन योग्य उत्पादों का उत्पादन, रगड़ना।
तालिका 1. उत्पादन डेटा
№ | वाई | x1 | x2 | x3 | x4 | x5 | x6 |
39,5 | 4,9 | 3,2 | |||||
46,4 | 60,5 | 20,4 | |||||
43,7 | 24,9 | 9,5 | |||||
35,7 | 50,4 | 34,7 | |||||
41,8 | 5,1 | 17,9 | |||||
49,8 | 35,9 | 12,1 | |||||
44,1 | 48,1 | 18,9 | |||||
48,1 | 69,5 | 12,2 | |||||
47,6 | 31,9 | 8,1 | |||||
58,6 | 139,4 | 29,7 | |||||
70,4 | 16,9 | 5,3 | |||||
37,5 | 17,8 | 5,6 | |||||
62,0 | 27,6 | 12,3 | |||||
34,4 | 13,9 | 3,2 | |||||
35,4 | 37,3 | 19,0 | |||||
40,8 | 55,3 | 19,3 | |||||
48,1 | 35,1 | 12,4 |
युग्मित सहसंबंध गुणांकों का एक मैट्रिक्स बनाएँ। बहुसंरेखता के लिए जाँच करें। मॉडल में कारकों के चयन का औचित्य सिद्ध कीजिए
तालिका 2 प्रस्तुत करता है जोड़ी सहसंबंध गुणांक मैट्रिक्स विचार में शामिल सभी चर के लिए। उपकरण का उपयोग करके प्राप्त मैट्रिक्स सह - संबंधपैकेज से डेटा विश्लेषणवी एक्सेल।
तालिका 2. जोड़ी सहसंबंध गुणांक का मैट्रिक्स
वाई | X1 | X2 | X3 | एक्स 4 | X5 | X6 | |
वाई | |||||||
X1 | 0,995634 | ||||||
X2 | 0,996949 | 0,994947 | |||||
X3 | -0,25446 | -0,27074 | -0,26264 | ||||
एक्स 4 | 0,12291 | 0,07251 | 0,107572 | 0,248622 | |||
X5 | 0,222946 | 0,166919 | 0,219914 | -0,07573 | 0,671386 | ||
X6 | 0,067685 | -0,00273 | 0,041955 | -0,28755 | 0,366382 | 0,600899 |
मैट्रिक्स का दृश्य विश्लेषण आपको स्थापित करने की अनुमति देता है:
1) परचर X1, X2 के साथ बल्कि उच्च जोड़ीदार सहसंबंध हैं (>0,5) और चर के साथ कम एक्स3, एक्स4, एक्स5, एक्स6 (<0,5);
2) विश्लेषण चर X1, X2 बल्कि उच्च जोड़ीदार सहसंबंध प्रदर्शित करते हैं, जो उनके बीच बहुसंरेखता की उपस्थिति के लिए कारकों की जांच करने की आवश्यकता होती है। इसके अलावा, शास्त्रीय प्रतिगमन मॉडल की शर्तों में से एक व्याख्यात्मक चर की स्वतंत्रता की धारणा है।
कारकों की बहुसंरेखता की पहचान करने के लिए, हम प्रदर्शन करते हैं फर्रार-ग्लोबर परीक्षण कारकों द्वारा X1, X2, एक्स3, एक्स4, एक्स5, एक्स6.
कारकों की बहुसंरेखता के लिए फर्रार-ग्लोबर परीक्षण के सत्यापन में कई चरण शामिल हैं।
1) चरों की संपूर्ण सरणी की बहुसंरेखता की जाँच करना .
शास्त्रीय प्रतिगमन मॉडल की शर्तों में से एक यह धारणा है कि व्याख्यात्मक चर स्वतंत्र हैं। कारकों के बीच बहुसंरेखता की पहचान करने के लिए, इंटरफैक्टोरियल सहसंबंधों के मैट्रिक्स की गणना डेटा विश्लेषण पैकेज (तालिका 3) का उपयोग करके की जाती है।
तालिका 3. इंटरफैक्टर सहसंबंध मैट्रिक्स आर
X1 | X2 | X3 | एक्स 4 | X5 | X6 | |
X1 | 0,994947 | -0,27074 | 0,07251 | 0,166919 | -0,00273 | |
X2 | 0,994947 | -0,26264 | 0,107572 | 0,219914 | 0,041955 | |
X3 | -0,27074 | -0,26264 | 0,248622 | -0,07573 | -0,28755 | |
एक्स 4 | 0,07251 | 0,107572 | 0,248622 | 0,671386 | 0,366382 | |
X5 | 0,166919 | 0,219914 | -0,07573 | 0,671386 | 0,600899 | |
X6 | -0,00273 | 0,041955 | -0,28755 | 0,366382 | 0,600899 |
कारकों X1 और X2, X5 और X4, X6 और X5 (>0.5) के बीच एक मजबूत संबंध है।
निर्धारक det (R) = 0.001488 की गणना MOPRED फ़ंक्शन का उपयोग करके की जाती है। मैट्रिक्स R का निर्धारक शून्य हो जाता है, जो हमें कारकों की सामान्य बहुसंख्या के बारे में एक धारणा बनाने की अनुमति देता है।
2) अन्य चरों के साथ प्रत्येक चर की बहुसंरेखता की जाँच करना:
एक्सेल एमआईएनएफ फ़ंक्शन (तालिका 4) का उपयोग करके उलटा मैट्रिक्स आर -1 की गणना करें:
तालिका 4. उलटा मैट्रिक्स आर -1
X1 | X2 | X3 | एक्स 4 | X5 | X6 | |
X1 | 150,1209 | -149,95 | 3,415228 | -1,70527 | 6,775768 | 4,236465 |
X2 | -149,95 | 150,9583 | -3,00988 | 1,591549 | -7,10952 | -3,91954 |
X3 | 3,415228 | -3,00988 | 1,541199 | -0,76909 | 0,325241 | 0,665121 |
एक्स 4 | -1,70527 | 1,591549 | -0,76909 | 2,218969 | -1,4854 | -0,213 |
X5 | 6,775768 | -7,10952 | 0,325241 | -1,4854 | 2,943718 | -0,81434 |
X6 | 4,236465 | -3,91954 | 0,665121 | -0,213 | -0,81434 | 1,934647 |
· एफ-मापदंडों की गणना, जहां मैट्रिक्स के विकर्ण तत्व हैं, n=17, k = 6 (तालिका 5)।
तालिका 5. एफ-मानदंड मान
F1 (Х1) | F2 (Х2) | F3 (X3) | एफ4 (एक्स4) | F5 (x5) | एफ6 (एक्स6) |
89,29396 | 89,79536 | 0,324071 | 0,729921 | 1,163903 | 0,559669 |
एफ-मापदंडों के वास्तविक मूल्यों की तुलना तालिका मूल्य से की जाती है एफ टेबल = 3.21(FDISP(0.05;6;10)) के साथ n1= 6 और n2 = n - k – 1=17-6-1=10 स्वतंत्रता और महत्व स्तर α=0.05, जहां k कारकों की संख्या है।
· कारक X1 और X2 के लिए F-मानदंड के मान तालिका मान से बड़े हैं, जो इन कारकों के बीच बहुसंरेखता की उपस्थिति को इंगित करता है। फैक्टर X3 का कारकों की समग्र बहुसंख्या पर सबसे कम प्रभाव पड़ता है।
3) चर के प्रत्येक जोड़े के लिए बहुसंरेखता की जाँच करना
सूत्र का उपयोग करके आंशिक सहसंबंध गुणांक की गणना करें, जहां मैट्रिक्स के तत्व हैं (तालिका 6)
तालिका 6. आंशिक सहसंबंधों के गुणांकों का मैट्रिक्स
X1 | X2 | X3 | एक्स 4 | X5 | X6 | |
X1 | ||||||
X2 | 0,996086 | |||||
X3 | -0,22453 | 0,197329 | ||||
एक्स 4 | 0,093432 | -0,08696 | 0,415882 | |||
X5 | -0,32232 | 0,337259 | -0,1527 | 0,581191 | ||
X6 | -0,24859 | 0,229354 | -0,38519 | 0,102801 | 0,341239 |
· गणना टी- सूत्र के अनुसार मानदंड (तालिका 7)
n - डेटा की संख्या = 17
के - कारकों की संख्या = 6
आंशिक सहसंबंध गुणांकों के लिए तालिका 7.t-परीक्षण
X1 | X2 | X3 | एक्स 4 | X5 | X6 | |
X1 | ||||||
X2 | 35,6355 | |||||
X3 | -0,72862 | 0,636526 | ||||
एक्स 4 | 0,296756 | -0,27604 | 1,446126 | |||
X5 | -1,07674 | 1,13288 | -0,4886 | 2,258495 | ||
X6 | -0,81158 | 0,745143 | -1,31991 | 0,326817 | 1,147999 |
टी टेबल \u003d अध्ययन (0.05; 10) \u003d 2.23
टी-मापदंडों के वास्तविक मूल्यों की तुलना स्वतंत्रता की डिग्री n-k-1 = 17-6-1=10 और महत्व स्तर α=0.05 पर तालिका मूल्य के साथ की जाती है;
t21 > ttable
t54 > ttable
टेबल्स 6 और 7 दिखाते हैं कि कारकों के दो जोड़े X1 और X2, X4 और X5 में एक उच्च सांख्यिकीय रूप से महत्वपूर्ण आंशिक सहसंबंध है, अर्थात, वे बहुरेखीय हैं। बहुसंरेखता से छुटकारा पाने के लिए, संरेख जोड़ी के चरों में से एक को समाप्त किया जा सकता है। X1 और X2 की जोड़ी में हम X2 छोड़ते हैं, X4 और X5 की जोड़ी में हम X5 छोड़ते हैं।
इस प्रकार, फर्रार-ग्लोबर परीक्षण की जाँच के परिणामस्वरूप, निम्नलिखित कारक बने रहते हैं: एक्स2, एक्स3, एक्स5, एक्स6।
सहसंबंध विश्लेषण की प्रक्रियाओं को पूरा करते हुए, परिणाम के साथ चयनित कारकों के आंशिक सहसंबंधों को देखने की सलाह दी जाती है वाई
तालिका 8 में डेटा के आधार पर युग्मित सहसंबंध गुणांकों का एक मैट्रिक्स बनाते हैं।
तालिका 8. चयनित कारकों X2, X3, X5, X6 के साथ आउटपुट डेटा।
अवलोकन की संख्या | वाई | x2 | x3 | x5 | x6 |
39,5 | 3,2 | ||||
46,4 | 20,4 | ||||
43,7 | 9,5 | ||||
35,7 | 34,7 | ||||
41,8 | 17,9 | ||||
49,8 | 12,1 | ||||
44,1 | 18,9 | ||||
48,1 | 12,2 | ||||
47,6 | 8,1 | ||||
58,6 | 29,7 | ||||
70,4 | 5,3 | ||||
37,5 | 5,6 | ||||
12,3 | |||||
34,4 | 3,2 | ||||
35,4 | |||||
40,8 | 19,3 | ||||
48,1 | 12,4 |
तालिका 9 का अंतिम स्तंभ स्तंभ Y के लिए t-परीक्षण मान दिखाता है।
तालिका 9. परिणाम के साथ आंशिक सहसंबंध के गुणांकों का मैट्रिक्स वाई
वाई | X2 | X3 | X5 | X6 | टी मानदंड (टी टैब (0.05; 11) = 2.200985 | |
वाई | 0,996949 | -0,25446 | 0,222946 | 0,067685 | ||
X2 | 0,996949 | -0,26264 | 0,219914 | 0,041955 | 44,31676 | |
X3 | -0,25446 | -0,26264 | -0,07573 | -0,28755 | 0,916144 | |
X5 | 0,222946 | 0,219914 | -0,07573 | 0,600899 | -0,88721 | |
X6 | 0,067685 | 0,041955 | -0,28755 | 0,600899 | 1,645749 |
तालिका 9 से पता चलता है कि चर वाईके साथ एक उच्च और एक ही समय में सांख्यिकीय रूप से महत्वपूर्ण आंशिक सहसंबंध है X2 कारक।
वाई | एक्स 1 | एक्स 2 | एक्स 3 | एक्स 4 | एक्स 5 | एक्स 6 | |
वाई | |||||||
एक्स 1 | 0,519 | ||||||
एक्स 2 | -0,273 | 0,030 | |||||
एक्स 3 | 0,610 | 0,813 | -0,116 | ||||
एक्स 4 | -0,572 | -0,013 | -0,022 | -0,091 | |||
एक्स 5 | 0,297 | 0,043 | -0,461 | 0,120 | -0,359 | ||
एक्स 6 | 0,118 | -0,366 | -0,061 | -0,329 | -0,100 | -0,290 |
विश्लेषण इंटरफैक्टोरियल("xes" के बीच!) सहसंबंध गुणांक दर्शाता है कि 0.8 का मान अधिक है पूर्ण मूल्य मेंकारकों की एक जोड़ी के बीच केवल सहसंबंध गुणांक एक्स 1 –एक्स 3 (बोल्ड में हाइलाइट किया गया)। कारकों एक्स 1 –एक्सइस प्रकार 3 को संरेख के रूप में पहचाना जाता है।
2. जैसा कि पैरा 1 में दिखाया गया है, कारक एक्स 1 –एक्स 3 संरेख हैं, जिसका अर्थ है कि वे एक दूसरे के प्रभावी रूप से डुप्लिकेट हैं, और एक ही समय में उन्हें मॉडल में शामिल करने से संबंधित प्रतिगमन गुणांक की गलत व्याख्या होगी। कारक देखा जा सकता है एक्स 3 एक बड़ा है सापेक्षपरिणाम के साथ सहसंबंध गुणांक वाईकारक की तुलना में एक्स 1: आर वाई , एक्स 1 =0,519; आर वाई , एक्स 3=0.610; (सेमी। टैब। 1). यह कारक के एक मजबूत प्रभाव को इंगित करता है एक्स 3 बदलने के लिए वाई. कारक एक्स 1 इस प्रकार विचार से बाहर रखा गया है।
प्रतिगमन समीकरण का निर्माण करने के लिए, उपयोग किए गए चर के मान ( वाई,एक्स 2 , एक्स 3 , एक्स 4 , एक्स 5 , एक्स 6) एक खाली वर्कशीट में कॉपी करें ( adj। 3). हम ऐड-ऑन का उपयोग करके प्रतिगमन समीकरण बनाते हैं " डेटा विश्लेषण ... प्रतिगमन" (मेन्यू " सेवा"® « डेटा विश्लेषण…» ® « वापसी")। भरे हुए क्षेत्रों के साथ प्रतिगमन विश्लेषण पैनल में दिखाया गया है चावल। 2.
प्रतिगमन विश्लेषण के परिणाम में दिए गए हैं adj। 4और स्थानांतरित कर दिया गया टैब। 2. प्रतिगमन समीकरण का रूप है (देखें " कठिनाइयाँ"वी टैब। 2):
प्रतिगमन समीकरण को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है, क्योंकि इसके यादृच्छिक गठन की संभावना जिस रूप में प्राप्त की गई थी वह 8.80 × 10 -6 है (चित्र देखें। "एफ महत्व"वी टैब। 2), जो स्वीकृत महत्व स्तर a = 0.05 से काफी कम है।
एक्स 3 , एक्स 4 , एक्सस्वीकृत महत्व स्तर के नीचे 6 = 0.05 (देखें " पी-वैल्यू"वी टैब। 2), जो वार्षिक लाभ में परिवर्तन पर गुणांकों के सांख्यिकीय महत्व और इन कारकों के महत्वपूर्ण प्रभाव को इंगित करता है वाई.
कारकों पर गुणांक के यादृच्छिक गठन की संभावना एक्स 2 और एक्स 5 स्वीकृत महत्व स्तर a=0.05 से अधिक है (देखें " पी-वैल्यू"वी टैब। 2), और इन गुणांकों को सांख्यिकीय रूप से महत्वपूर्ण नहीं माना जाता है।
चावल। 2. मॉडल प्रतिगमन विश्लेषण पैनल वाई(एक्स 2 , एक्स 3 , एक्स 4 , एक्स 5 , एक्स 6)
तालिका 2
वाई(एक्स 2 , एक्स 3 , एक्स 4 , एक्स 5 , एक्स 6)
प्रतिगमन आँकड़े | |||||||||
एकाधिक आर | 0,868 | ||||||||
आर स्कवेयर | 0,753 | ||||||||
सामान्यीकृत आर-स्क्वायर | 0,694 | ||||||||
मानक त्रुटि | 242,3 | ||||||||
टिप्पणियों | |||||||||
भिन्नता का विश्लेषण | |||||||||
df | एसएस | एमएस | एफ | महत्व एफ | |||||
वापसी | 3749838,2 | 749967,6 | 12,78 | 8.80ई-06 | |||||
शेष | 1232466,8 | 58688,9 | |||||||
कुल | 4982305,0 | ||||||||
प्रतिगमन समीकरण | |||||||||
कठिनाइयाँ | मानक त्रुटि | टी आँकड़ा | पी-वैल्यू | ||||||
वाई-चौराहा | 487,5 | 641,4 | 0,760 | 0,456 | |||||
X2 | -0,0456 | 0,0373 | -1,224 | 0,235 | |||||
X3 | 0,1043 | 0,0194 | 5,375 | 0,00002 | |||||
एक्स 4 | -0,0965 | 0,0263 | -3,674 | 0,001 | |||||
X5 | 2,528 | 6,323 | 0,400 | 0,693 | |||||
X6 | 248,2 | 113,0 | 2,197 | 0,039 | |||||
3. पिछले पैराग्राफ में किए गए प्रतिगमन समीकरण के गुणांकों के सांख्यिकीय महत्व की जाँच के परिणामों के आधार पर, हम केवल सूचनात्मक कारकों वाले एक नए प्रतिगमन मॉडल का निर्माण करते हैं, जिसमें शामिल हैं:
कारक, गुणांक जिनके लिए सांख्यिकीय रूप से महत्वपूर्ण हैं;
कारक जिनके गुणांक टी-सांख्यिकी मॉड्यूल एक से अधिक है (दूसरे शब्दों में, गुणांक का पूर्ण मान इसकी मानक त्रुटि से अधिक है)।
पहले समूह में कारक शामिल हैं एक्स 3 , एक्स 4 , एक्स 6 , दूसरे - कारक के लिए एक्स 2. कारक एक्स 5 को असूचनात्मक के रूप में विचार से बाहर रखा गया है, और अंतिम प्रतिगमन मॉडल में कारक शामिल होंगे एक्स 2 , एक्स 3 , एक्स 4 , एक्स 6 .
प्रतिगमन समीकरण बनाने के लिए, रिक्त वर्कशीट में उपयोग किए गए चर के मानों की प्रतिलिपि बनाएँ ( adj। 5)और एक प्रतिगमन विश्लेषण करें ( चावल। 3). इसके परिणाम में दिए गए हैं adj। 6और स्थानांतरित कर दिया गया टैब। 3. प्रतिगमन समीकरण ऐसा दिखता है:
(सेमी। " कठिनाइयाँ"वी टैब। 3).
चावल। 3. मॉडल का पैनल प्रतिगमन विश्लेषण वाई(एक्स 2 , एक्स 3 , एक्स 4 , एक्स 6)
टेबल तीन
मॉडल प्रतिगमन विश्लेषण परिणाम वाई(एक्स 2 , एक्स 3 , एक्स 4 , एक्स 6)
प्रतिगमन आँकड़े | |||||||||
एकाधिक आर | 0,866 | ||||||||
आर स्कवेयर | 0,751 | ||||||||
सामान्यीकृत आर-स्क्वायर | 0,705 | ||||||||
मानक त्रुटि | 237,6 | ||||||||
टिप्पणियों | |||||||||
भिन्नता का विश्लेषण | |||||||||
df | एसएस | एमएस | एफ | महत्व एफ | |||||
वापसी | 3740456,2 | 935114,1 | 16,57 | 2.14ई-06 | |||||
शेष | 1241848,7 | 56447,7 | |||||||
कुल | 4982305,0 | ||||||||
प्रतिगमन समीकरण | |||||||||
कठिनाइयाँ | मानक त्रुटि | टी आँकड़ा | पी-वैल्यू | ||||||
वाई-चौराहा | 712,2 | 303,0 | 2,351 | 0,028 | |||||
X2 | -0,0541 | 0,0300 | -1,806 | 0,085 | |||||
X3 | 0,1032 | 0,0188 | 5,476 | 0,00002 | |||||
एक्स 4 | -0,1017 | 0,0223 | -4,560 | 0,00015 | |||||
X6 | 227,5 | 98,5 | 2,310 | 0,031 | |||||
प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वपूर्ण है: इसके यादृच्छिक गठन की संभावना स्वीकार्य महत्व स्तर a=0.05 से नीचे है (देखें " महत्व एफ"वी टैब। 3).
कारकों के लिए सांख्यिकीय रूप से महत्वपूर्ण गुणांक भी हैं एक्स 3 , एक्स 4 , एक्स 6: उनके यादृच्छिक गठन की संभावना स्वीकार्य महत्व स्तर a=0.05 से नीचे है (देखें " पी-वैल्यू"वी टैब। 3). यह बीमा शुल्क के वार्षिक आकार के महत्वपूर्ण प्रभाव को इंगित करता है। एक्स 3, वार्षिक बीमा भुगतान एक्स 4 और स्वामित्व के रूप एक्सवार्षिक लाभ में 6 प्रति परिवर्तन वाई.
कारक पर गुणांक एक्स 2 (बीमा भंडार की वार्षिक राशि) सांख्यिकीय रूप से महत्वपूर्ण नहीं है। हालाँकि, इस कारक को अभी भी सूचनात्मक माना जा सकता है, क्योंकि टी- इसके अनुपात के आँकड़े अधिक हैं सापेक्षइकाई, हालांकि कारक के बारे में और निष्कर्ष एक्स 2 कुछ सावधानी के साथ इलाज किया जाना चाहिए।
4. हम प्रतिगमन विश्लेषण के दौरान प्राप्त कुछ सांख्यिकीय विशेषताओं का उपयोग करके अंतिम प्रतिगमन समीकरण की गुणवत्ता और सटीकता का मूल्यांकन करते हैं (देखें . « प्रतिगमन आँकड़े"वी टैब। 3):
दृढ़ संकल्प के एकाधिक गुणांक
दर्शाता है कि प्रतिगमन मॉडल वार्षिक लाभ भिन्नता के 75.1% की व्याख्या करता है वाई, और यह भिन्नता प्रतिगमन मॉडल में शामिल कारकों में बदलाव के कारण है एक्स 2 , एक्स 3 , एक्स 4 और एक्स 6 ;
प्रतिगमन मानक त्रुटि
हजार रूबल।
दर्शाता है कि प्रतिगमन समीकरण द्वारा अनुमानित वार्षिक लाभ के मूल्य वाईवास्तविक मूल्यों से औसतन 237.6 हजार रूबल से भिन्न है।
औसत सापेक्ष सन्निकटन त्रुटि अनुमानित सूत्र द्वारा निर्धारित की जाती है:
कहाँ हजार रूबल। - वार्षिक लाभ का औसत मूल्य (अंतर्निहित फ़ंक्शन का उपयोग करके निर्धारित " औसत»; adj। 1).
इ rel से पता चलता है कि प्रतिगमन समीकरण द्वारा अनुमानित वार्षिक लाभ के मूल्य वाईवास्तविक मूल्यों से औसतन 26.7% भिन्न है। मॉडल में असंतोषजनक सटीकता है (पर - मॉडल की सटीकता उच्च है, पर - निपुण - संतोषजनक, पर - असंतोषजनक)।
5. प्रतिगमन समीकरण के गुणांकों की आर्थिक व्याख्या के लिए, हम प्रारंभिक डेटा में औसत मूल्यों और चर के मानक विचलन को सारणीबद्ध करते हैं ( टैब। 4) . माध्य मान अंतर्निहित फ़ंक्शन का उपयोग करके निर्धारित किए गए थे " औसत", मानक विचलन - अंतर्निहित फ़ंक्शन का उपयोग करना" STDEV" (सेमी। adj। 1).
रूसी संघ के दक्षिणी संघीय जिले के क्षेत्रों के लिए, डेटा 2011 के लिए दिए गए हैं
संघीय जिले के क्षेत्र |
सकल क्षेत्रीय उत्पाद, अरब रूबल, वाई |
अचल पूंजी में निवेश, अरब रूबल, X1 |
1. निरसित। एडिगेया |
||
2. निरसित। दागिस्तान |
||
3. निरसित। इन्गुशेतिया |
||
4. काबर्डिनो-बाल्केरियन गणराज्य |
||
5. निरसित। कल्मिकिया |
||
6. कराची-चर्केस गणराज्य |
||
7. निरसित। उत्तर ओसेशिया अलानिया |
||
8. क्रास्नोडार क्षेत्र) |
||
9. स्टावरोपोल टेरिटरी |
||
10. अस्त्रखान क्षेत्र |
||
11. वोल्गोग्राड क्षेत्र |
||
12. रोस्तोव क्षेत्र |
- 1. युग्मित सहसंबंध गुणांकों के मैट्रिक्स की गणना करें; सहसंबंध गुणांकों के सांख्यिकीय महत्व का मूल्यांकन करें।
- 2. परिणामी विशेषता का सहसंबंध क्षेत्र और सबसे निकट से संबंधित कारक बनाएँ।
- 3. प्रत्येक कारक X के लिए रैखिक जोड़ी प्रतिगमन के मापदंडों की गणना करें।
- 4. दृढ़ संकल्प के गुणांक, औसत सन्निकटन त्रुटि और फिशर के एफ-टेस्ट के माध्यम से प्रत्येक मॉडल की गुणवत्ता का मूल्यांकन करें। सर्वश्रेष्ठ मॉडल चुनें।
इसके अधिकतम मूल्य का 80% होगा। रेखांकन प्रस्तुत करें: वास्तविक और मॉडल मान, पूर्वानुमान बिंदु।
- 6. स्टेपवाइज मल्टीपल रिग्रेशन (बहिष्करण विधि या समावेशन विधि) का उपयोग करके, महत्वपूर्ण कारकों के कारण अपार्टमेंट मूल्य निर्माण का एक मॉडल बनाएं। प्रतिगमन मॉडल के गुणांकों की आर्थिक व्याख्या दें।
- 7. निर्मित मॉडल की गुणवत्ता का मूल्यांकन करें। क्या एक-कारक मॉडल की तुलना में मॉडल की गुणवत्ता में सुधार हुआ है? - और - में लोच गुणांक का उपयोग करके परिणाम पर महत्वपूर्ण कारकों के प्रभाव का आकलन करें? गुणांक।
इस समस्या को हल करते समय, हम एक्सेल सेटिंग्स डेटा विश्लेषण का उपयोग करके ग्राफ़ और चार्ट की गणना और प्लॉटिंग करेंगे।
1. युग्मित सहसंबंध गुणांकों के मैट्रिक्स की गणना करें और सहसंबंध गुणांकों के सांख्यिकीय महत्व का मूल्यांकन करें
सहसंबंध संवाद बॉक्स में, इनपुट अंतराल फ़ील्ड में, स्रोत डेटा वाले कक्षों की श्रेणी दर्ज करें। चूंकि हमने कॉलम शीर्षकों का भी चयन किया है, हम पहली पंक्ति चेकबॉक्स में लेबल की जांच करते हैं।
हमें निम्नलिखित परिणाम मिले:
तालिका 1.1 जोड़ीदार सहसंबंध गुणांक का मैट्रिक्स
जोड़ी सहसंबंध गुणांक के मैट्रिक्स के विश्लेषण से पता चलता है कि आश्रित चर Y, यानी सकल क्षेत्रीय उत्पाद, X1 (स्थिर पूंजी में निवेश) के साथ घनिष्ठ संबंध है। सहसंबंध गुणांक 0.936 है। इसका मतलब है कि आश्रित चर Y (सकल क्षेत्रीय उत्पाद) X1 (अचल संपत्तियों में निवेश) पर 93.6% निर्भर है।
छात्र के टी-टेस्ट का उपयोग करके सहसंबंध गुणांक का सांख्यिकीय महत्व निर्धारित किया जाएगा। तालिका मान की तुलना परिकलित मानों से की जाती है।
आइए STUDRIST फ़ंक्शन का उपयोग करके तालिका मान की गणना करें।
टी तालिका = 0.129 आत्मविश्वास के स्तर के बराबर 0.9 और स्वतंत्रता की डिग्री (एन-2) के साथ।
X1 कारक सांख्यिकीय रूप से महत्वपूर्ण है।
2. आइए प्रभावी विशेषता (सकल क्षेत्रीय उत्पाद) और सबसे निकट संबंधी कारक (स्थिर पूंजी में निवेश) के सहसंबंध के क्षेत्र का निर्माण करें
ऐसा करने के लिए, हम एक्सेल में स्कैटर प्लॉट बनाने के लिए टूल का उपयोग करेंगे।
नतीजतन, हम सकल क्षेत्रीय उत्पाद, अरब रूबल की कीमत के सहसंबंध का क्षेत्र प्राप्त करते हैं। और निश्चित पूंजी में निवेश, अरब रूबल। (चित्र 1.1।)।
चित्र 1.1
3. प्रत्येक कारक X के लिए रैखिक जोड़ी प्रतिगमन के मापदंडों की गणना करें
एक रेखीय जोड़ीदार प्रतिगमन के मापदंडों की गणना करने के लिए, हम डेटा विश्लेषण सेटिंग में शामिल प्रतिगमन उपकरण का उपयोग करेंगे।
प्रतिगमन संवाद बॉक्स में, इनपुट अंतराल Y फ़ील्ड में, आश्रित चर का प्रतिनिधित्व करने वाली कोशिकाओं की श्रेणी का पता दर्ज करें। खेत मेँ
इनपुट अंतराल X हम उस श्रेणी का पता दर्ज करते हैं जिसमें स्वतंत्र चर के मान होते हैं। आइए कारक X के लिए जोड़ीदार प्रतिगमन मापदंडों की गणना करें।
X1 के लिए, निम्न डेटा प्राप्त किया गया, तालिका 1.2 में प्रस्तुत किया गया:
तालिका 1.2
अचल पूंजी में निवेश पर सकल क्षेत्रीय उत्पाद की कीमत की निर्भरता के लिए प्रतिगमन समीकरण का रूप है:
4. आइए निर्धारण के गुणांक, औसत सन्निकटन त्रुटि और फिशर के एफ-मानदंड के माध्यम से प्रत्येक मॉडल की गुणवत्ता का मूल्यांकन करें। आइए जानें कि कौन सा मॉडल सबसे अच्छा है।
दृढ़ संकल्प का गुणांक, औसत सन्निकटन त्रुटि, हमने पैराग्राफ 3 में की गई गणनाओं के परिणामस्वरूप प्राप्त किया। प्राप्त आंकड़ों को निम्नलिखित तालिकाओं में प्रस्तुत किया गया है:
X1 के लिए डेटा:
तालिका 1.3ए
तालिका 1.4बी
ए) दृढ़ संकल्प का गुणांक यह निर्धारित करता है कि विशेषता वाई की भिन्नता का अनुपात मॉडल में क्या ध्यान में रखा जाता है और उस पर कारक एक्स के प्रभाव के कारण होता है। दृढ़ संकल्प के गुणांक का मूल्य जितना अधिक होगा, संबंध उतना ही करीब होगा निर्मित गणितीय मॉडल में विशेषताओं के बीच।
एक्सेल में, आर-स्क्वायर को निरूपित किया जाता है।
इस मानदंड के आधार पर, अचल संपत्तियों (X1) में निवेश पर सकल क्षेत्रीय उत्पाद की कीमत की निर्भरता के लिए प्रतिगमन समीकरण का मॉडल सबसे पर्याप्त है।
बी) सूत्र का उपयोग करके औसत सन्निकटन त्रुटि की गणना करें:
जहां अंश वास्तविक से परिकलित मानों के वर्ग विचलन का योग है। तालिकाओं में, यह एसएस कॉलम, अवशिष्ट पंक्ति में है।
हम औसत फ़ंक्शन का उपयोग करके एक्सेल में एक अपार्टमेंट की कीमत के औसत मूल्य की गणना करते हैं। = 24.18182 बिलियन रूबल
आर्थिक गणना करते समय, मॉडल को पर्याप्त रूप से सटीक माना जाता है यदि औसत सन्निकटन त्रुटि 5% से कम है, तो मॉडल को स्वीकार्य माना जाता है यदि औसत सन्निकटन त्रुटि 15% से कम है।
इस मानदंड के अनुसार, अचल संपत्तियों (X1) में निवेश पर सकल क्षेत्रीय उत्पाद की कीमत की निर्भरता के प्रतिगमन समीकरण के लिए गणितीय मॉडल सबसे पर्याप्त है।
सी) प्रतिगमन मॉडल के महत्व का परीक्षण करने के लिए एक एफ-परीक्षण का उपयोग किया जाता है। इसके लिए, फिशर के एफ-टेस्ट के महत्वपूर्ण (सारणीबद्ध) मूल्यों की तुलना भी की जाती है।
परिकलित मान तालिका 1.4b (अक्षर F द्वारा इंगित) में दिए गए हैं।
फ़िशर के F-परीक्षण के तालिका मान की गणना Excel में FDISP फ़ंक्शन का उपयोग करके की जाती है। हम प्रायिकता को 0.05 के बराबर लेते हैं। प्राप्त: = 4.75
प्रत्येक कारक के लिए फिशर के एफ-टेस्ट के परिकलित मान तालिका मान के साथ तुलनीय हैं:
71.02 > = 4.75 मॉडल इस कसौटी के अनुसार पर्याप्त है।
सभी तीन मानदंडों के लिए डेटा का विश्लेषण करने के बाद, हम यह निष्कर्ष निकाल सकते हैं कि सबसे अच्छा गणितीय मॉडल है जो सकल क्षेत्रीय उत्पाद कारक के लिए बनाया गया है, जिसे रैखिक समीकरण द्वारा वर्णित किया गया है।
5. सकल क्षेत्रीय उत्पाद की कीमत की निर्भरता के चुने हुए मॉडल के लिए
हम महत्व के स्तर पर संकेतक के औसत मूल्य की भविष्यवाणी करेंगे यदि कारक का अनुमानित मूल्य उसके अधिकतम मूल्य का 80% है। आइए रेखांकन का प्रतिनिधित्व करें: वास्तविक और मॉडल मान, पूर्वानुमान बिंदु।
एक्स के अनुमानित मूल्य की गणना करें, शर्त के अनुसार, यह अधिकतम मूल्य का 80% होगा।
मैक्स फ़ंक्शन का उपयोग करके एक्सेल में एक्स मैक्स की गणना करें।
0,8 *52,8 = 42,24
आश्रित चर के अनुमानित अनुमान प्राप्त करने के लिए, हम स्वतंत्र चर के प्राप्त मूल्य को रैखिक समीकरण में प्रतिस्थापित करते हैं:
5.07 + 2.14 * 42.24 \u003d 304.55 बिलियन रूबल।
आइए हम पूर्वानुमान का विश्वास अंतराल निर्धारित करें, जिसकी निम्नलिखित सीमाएँ होंगी:
अनुमानित मूल्य के लिए विश्वास अंतराल की गणना करने के लिए, हम प्रतिगमन रेखा से विचलन की गणना करते हैं।
युग्मित प्रतिगमन मॉडल के लिए, विचलन मान की गणना की जाती है:
वे। तालिका 1.5a से मानक त्रुटि मान।
(चूंकि स्वतंत्रता की डिग्री की संख्या एक के बराबर है, भाजक n-2 के बराबर होगा)। सहसंबंध जोड़ीदार प्रतिगमन भविष्यवाणी
गुणांक की गणना करने के लिए, हम एक्सेल फ़ंक्शन STUDRASP का उपयोग करेंगे, प्रायिकता को 0.1 के बराबर लिया जाएगा, स्वतंत्रता की डिग्री की संख्या 38 है।
हम एक्सेल का उपयोग करके मूल्य की गणना करते हैं, हमें 12294 मिलते हैं।
आइए अंतराल की ऊपरी और निचली सीमाओं को परिभाषित करें।
- 304,55+27,472= 332,022
- 304,55-27,472= 277,078
इस प्रकार, पूर्वानुमान मूल्य = 304.55 हजार डॉलर निचली सीमा के बीच होगा, 277.078 हजार डॉलर के बराबर। और ऊपरी सीमा 332.022 बिलियन रूबल के बराबर है। रगड़ना।
वास्तविक और मॉडल मान, पूर्वानुमान बिंदुओं को चित्र 1.2 में रेखांकन के रूप में प्रस्तुत किया गया है।
चित्र 1.2
6. स्टेपवाइज मल्टीपल रिग्रेशन (बहिष्करण विधि) का उपयोग करते हुए, हम महत्वपूर्ण कारकों के कारण सकल क्षेत्रीय उत्पाद की कीमत के गठन के लिए एक मॉडल का निर्माण करेंगे।
एक बहु प्रतिगमन बनाने के लिए, हम इसमें सभी कारकों सहित एक्सेल रिग्रेशन फ़ंक्शन का उपयोग करेंगे। नतीजतन, हम परिणाम तालिका प्राप्त करते हैं, जिससे हमें छात्र के टी-टेस्ट की आवश्यकता होती है।
तालिका 1.8ए
तालिका 1.8बी
तालिका 1.8सी।
हमें दृश्य मॉडल मिलता है:
क्योंकि< (4,75 < 71,024), уравнение регрессии следует признать адекватным.
आइए स्टूडेंट के टी-टेस्ट का सबसे छोटा मॉडुलो मान चुनें, यह 8.427 के बराबर है, इसकी तुलना उस सारणीबद्ध मान से करें जिसकी हम एक्सेल में गणना करते हैं, महत्व स्तर को 0.10 के बराबर लें, स्वतंत्रता की डिग्री की संख्या n-m-1=12- 4=8: =1.8595
चूंकि 8.427>1.8595 मॉडल को पर्याप्त माना जाना चाहिए।
7. प्राप्त गणितीय मॉडल के महत्वपूर्ण कारक का मूल्यांकन करने के लिए, हम लोच के गुणांक और - गुणांक की गणना करते हैं
लोच गुणांक दिखाता है कि जब कारक चिह्न 1% बदलता है तो परिणामी चिह्न कितने प्रतिशत बदल जाएगा:
ई X4 \u003d 2.137 * (10.69 / 24.182) \u003d 0.94%
यानी, अचल पूंजी में निवेश में 1% की वृद्धि के साथ, लागत में औसतन 0.94% की वृद्धि होती है।
गुणांक यह दर्शाता है कि मानक विचलन के मान के किस भाग से आश्रित चर का औसत मान एक मानक विचलन द्वारा स्वतंत्र चर में परिवर्तन के साथ बदलता है।
2,137* (14.736/33,632) = 0,936.
वर्णनात्मक सांख्यिकी उपकरण का उपयोग करके प्राप्त तालिकाओं से मानक विचलन डेटा लिया जाता है।
तालिका 1.11 वर्णनात्मक आंकड़े (वाई)
तालिका 1.12 वर्णनात्मक आँकड़े (X4)
गुणांक सभी कारकों के कुल प्रभाव में कारक के प्रभाव का हिस्सा निर्धारित करता है:
जोड़ी सहसंबंध गुणांक की गणना करने के लिए, हम डेटा विश्लेषण सेटिंग्स के सहसंबंध उपकरण का उपयोग करके एक्सेल में जोड़ी सहसंबंध गुणांक के मैट्रिक्स की गणना करते हैं।
तालिका 1.14
(0,93633*0,93626) / 0,87 = 1,00.
निष्कर्ष: प्राप्त गणनाओं के आधार पर, हम यह निष्कर्ष निकाल सकते हैं कि प्रभावी विशेषता Y (सकल क्षेत्रीय उत्पाद) कारक X1 (स्थिर पूंजी में निवेश) (100% तक) पर अत्यधिक निर्भर है।
ग्रन्थसूची
- 1. मैग्नस वाई.आर., कातिशेव पी.के., पेरेसेट्स्की ए.ए. अर्थमिति। प्रारंभिक पाठ्यक्रम। ट्यूटोरियल। दूसरा संस्करण। - एम .: डेलो, 1998. - पी। 69 - 74।
- 2. अर्थमिति पर कार्यशाला: पाठ्यपुस्तक / आई.आई. एलिसेवा, एस.वी. कुरीशेवा, एन.एम. गोर्डीन्को और अन्य 2002. - पी। 49 - 105।
- 3. डौगर्टी के। अर्थमिति का परिचय: प्रति। अंग्रेज़ी से। - एम .: इंफ्रा-एम, 1999. - XIV, पी। 262 - 285।
- 4. ऐव्य्ज़न एस.ए., मिख्तिरयान वी.एस. अनुप्रयुक्त गणित और अर्थमिति की नींव। -1998., पीपी. 115-147.
- 5. क्रेमर एन.एस., पुटको बी.ए. अर्थमिति। -2007। 175-251 से।
वाई | एक्स (1) | एक्स (2) | एक्स (3) | एक्स (4) | एक्स (5) | |
वाई | 1.00 | 0.43 | 0.37 | 0.40 | 0.58 | 0.33 |
एक्स (1) | 0.43 | 1.00 | 0.85 | 0.98 | 0.11 | 0.34 |
एक्स (2) | 0.37 | 0.85 | 1.00 | 0.88 | 0.03 | 0.46 |
एक्स (3) | 0.40 | 0.98 | 0.88 | 1.00 | 0.03 | 0.28 |
एक्स (4) | 0.58 | 0.11 | 0.03 | 0.03 | 1.00 | 0.57 |
एक्स (5) | 0.33 | 0.34 | 0.46 | 0.28 | 0.57 | 1.00 |
युग्मित सहसंबंध गुणांकों के मैट्रिक्स के विश्लेषण से पता चलता है कि प्रदर्शन सूचक सूचक से सबसे निकट से संबंधित है एक्स(4) - 1 हेक्टेयर () में प्रयुक्त उर्वरकों की मात्रा।
साथ ही, सुविधाओं-तर्कों के बीच संबंध काफी करीब है। तो, पहिएदार ट्रैक्टरों की संख्या के बीच व्यावहारिक रूप से एक कार्यात्मक संबंध है ( एक्स(1)) और सतह जुताई के औजारों की संख्या .
बहुसंरेखता की उपस्थिति भी सहसंबंध गुणांक और द्वारा प्रमाणित है। संकेतकों के घनिष्ठ संबंध को देखते हुए एक्स (1) , एक्स(2) और एक्स(3) उनमें से केवल एक ही उपज प्रतिगमन मॉडल में प्रवेश कर सकता है।
बहुसंरेखता के नकारात्मक प्रभाव को प्रदर्शित करने के लिए, सभी इनपुट सहित उपज प्रतिगमन मॉडल पर विचार करें:
फोब्स = 121।
कोष्ठक में समीकरण के गुणांकों के अनुमानों के मानक विचलन के सही अनुमानों के मान हैं .
प्रतिगमन समीकरण के तहत, निम्नलिखित पर्याप्तता पैरामीटर प्रस्तुत किए जाते हैं: दृढ़ संकल्प के कई गुणांक; अवशिष्ट विचरण का सही अनुमान, औसत सापेक्ष सन्निकटन त्रुटि और -मानदंड फोब्स = 121 की गणना मूल्य।
प्रतिगमन समीकरण महत्वपूर्ण है क्योंकि टेबल से F obl = 121 > F kp = 2.85 मिला एफ- a=0.05 पर वितरण; एन 1 =6 और एन 2 =14।
इससे यह पता चलता है कि Q¹0, यानी, और समीकरण q के गुणांकों में से कम से कम एक जे (जे= 0, 1, 2, ..., 5) शून्य के बराबर नहीं है।
अलग-अलग प्रतिगमन गुणांक H0 के महत्व के बारे में परिकल्पना का परीक्षण करने के लिए: q j = 0, जहाँ जे=1,2,3,4,5, क्रिटिकल वैल्यू की तुलना करें टीकेपी = 2.14, तालिका से मिला टी-महत्व स्तर पर वितरण a=2 क्यू=0.05 और परिकलित मूल्य के साथ स्वतंत्रता की डिग्री n=14 की संख्या। यह समीकरण से अनुसरण करता है कि प्रतिगमन गुणांक केवल तभी सांख्यिकीय रूप से महत्वपूर्ण होता है एक्स(4) 1/2 से टी 4½=2.90 > टीकेपी=2.14।
प्रतिगमन गुणांक के नकारात्मक संकेत पर एक्स(1) और एक्स(5) । गुणांक के नकारात्मक मूल्यों से, यह इस प्रकार है कि पहिएदार ट्रैक्टरों के साथ कृषि की संतृप्ति में वृद्धि ( एक्स(1)) और पादप स्वास्थ्य उत्पाद ( एक्स(5)) उपज को नकारात्मक रूप से प्रभावित करता है। इस प्रकार, परिणामी प्रतिगमन समीकरण अस्वीकार्य है।
महत्वपूर्ण गुणांकों के साथ एक प्रतिगमन समीकरण प्राप्त करने के लिए, हम चरण-दर-चरण प्रतिगमन विश्लेषण एल्गोरिथ्म का उपयोग करते हैं। प्रारंभ में, हम चर के उन्मूलन के साथ चरण-दर-चरण एल्गोरिथम का उपयोग करते हैं।
मॉडल से एक चर को बाहर करें एक्स(1) , जो ½ के न्यूनतम निरपेक्ष मान से मेल खाता है टी 1½=0.01। शेष चरों के लिए, हम फिर से प्रतिगमन समीकरण का निर्माण करेंगे:
परिणामी समीकरण महत्वपूर्ण है, क्योंकि F obs = 155 > F kp = 2.90, एक महत्व स्तर a=0.05 पर पाया गया और तालिका के अनुसार स्वतंत्रता की डिग्री की संख्या n 1 =5 और n 2 =15 एफ-वितरण, यानी सदिश q¹0। हालाँकि, समीकरण में केवल प्रतिगमन गुणांक महत्वपूर्ण है एक्स(4) । परिकलित मान ½ टी j ½ अन्य गुणांक से कम के लिए टी kr = 2.131 तालिका में पाया गया टीएक = 2 के लिए वितरण क्यू=0.05 और एन=15।
मॉडल से एक चर को बाहर करना एक्स(3) , जो न्यूनतम मूल्य से मेल खाता है टी 3 = 0.35 और प्रतिगमन समीकरण प्राप्त करें:
(2.9)
परिणामी समीकरण में, यह सांख्यिकीय रूप से महत्वपूर्ण नहीं है और हम आर्थिक रूप से गुणांक की व्याख्या नहीं कर सकते हैं एक्स(5) । के सिवा एक्स(5) हमें प्रतिगमन समीकरण मिलता है:
(2.10)
हमने सार्थक और व्याख्यात्मक गुणांकों के साथ एक सार्थक प्रतिगमन समीकरण प्राप्त किया है।
हालाँकि, परिणामी समीकरण हमारे उदाहरण में केवल "अच्छा" या "सर्वश्रेष्ठ" उपज मॉडल नहीं है।
आइए दिखाते हैं मल्टीकोलिनियरिटी की स्थिति में, चरण-दर-चरण एल्गोरिदम चर के समावेश के साथ अधिक कुशल है।उपज मॉडल में पहला कदम वाईएक चर शामिल है एक्स(4) जिसके साथ उच्चतम सहसंबंध गुणांक है वाई, चर द्वारा समझाया - आर(वाई,एक्स(4))=0.58। दूसरे चरण में, समीकरण सहित एक्स(4) चर एक्स(1) या एक्स(3) हमें ऐसे मॉडल मिलेंगे जो आर्थिक कारणों और सांख्यिकीय विशेषताओं के लिए (2.10) से बेहतर हैं:
(2.11)
(2.12)
समीकरण में शेष तीन चरों में से किसी को शामिल करने से इसके गुण बिगड़ जाते हैं। उदाहरण के लिए, समीकरण (2.9) देखें।
इस प्रकार, हमारे पास तीन "अच्छे" उपज मॉडल हैं, जिनमें से एक को आर्थिक और सांख्यिकीय कारणों से चुना जाना चाहिए।
सांख्यिकीय मानदंडों के अनुसार, मॉडल (2.11) सबसे पर्याप्त है। यह अवशिष्ट विचरण के न्यूनतम मूल्यों = 2.26 और औसत सापेक्ष सन्निकटन त्रुटि और सबसे बड़े मूल्यों और फोब्स = 273 से मेल खाता है।
मॉडल (2.12) में पर्याप्तता के कुछ बदतर संकेतक हैं, और फिर मॉडल (2.10)।
अब हम सर्वश्रेष्ठ मॉडल (2.11) और (2.12) चुनेंगे। ये मॉडल चर में एक दूसरे से भिन्न होते हैं एक्स(1) और एक्स(3) । हालाँकि, उपज मॉडल में, चर एक्स(1) (प्रति 100 हेक्टेयर पहिएदार ट्रैक्टरों की संख्या) चर के लिए बेहतर है एक्स(3) (सतह जुताई की संख्या प्रति 100 हेक्टेयर), जो कुछ हद तक गौण है (या इससे प्राप्त)। एक्स (1)).
इस संबंध में आर्थिक कारणों से मॉडल (2.12) को वरीयता दी जानी चाहिए। इस प्रकार, चरणबद्ध प्रतिगमन विश्लेषण एल्गोरिथ्म को चर के समावेश के साथ लागू करने के बाद और इस तथ्य को ध्यान में रखते हुए कि तीन संबंधित चर में से केवल एक को समीकरण में प्रवेश करना चाहिए ( एक्स (1) , एक्स(2) या एक्स(3)) अंतिम प्रतिगमन समीकरण चुनें:
समीकरण = 0.05 पर महत्वपूर्ण है, क्योंकि तालिका से F obl = 266 > F kp = 3.20 प्राप्त हुआ एफएक = के लिए वितरण क्यू=0.05; एन 1 =3 और एन 2 =17। समीकरण ½ में सभी प्रतिगमन गुणांक भी महत्वपूर्ण हैं टीजे½> टीकेपी (ए = 2 क्यू=0.05; एन=17)=2.11। प्रतिगमन गुणांक q 1 को आर्थिक कारणों से महत्वपूर्ण (q 1 ¹0) के रूप में पहचाना जाना चाहिए, जबकि टी 1 =2.09 केवल थोड़ा सा कम टीकेपी = 2.11।
प्रतिगमन समीकरण से यह पता चलता है कि प्रति 100 हेक्टेयर कृषि योग्य भूमि (एक निश्चित मूल्य के साथ) में ट्रैक्टरों की संख्या में प्रति इकाई वृद्धि एक्स(4)) अनाज की पैदावार में औसतन 0.345 सी / हेक्टेयर की वृद्धि होती है।
लोच गुणांक ई 1 "0.068 और ई 2" 0.161 की अनुमानित गणना से पता चलता है कि संकेतकों में वृद्धि के साथ एक्स(1) और एक्स(4) 1% से, अनाज की उपज क्रमशः 0.068% और 0.161% की औसत से बढ़ जाती है।
दृढ़ संकल्प के कई गुणांक इंगित करते हैं कि उपज भिन्नता का केवल 46.9% मॉडल में शामिल संकेतकों द्वारा समझाया गया है ( एक्स(1) और एक्स(4)), यानी ट्रैक्टर और उर्वरकों के साथ फसल उत्पादन की संतृप्ति। बाकी भिन्नता कारकों के लिए बेहिसाब कार्रवाई के कारण है ( एक्स (2) , एक्स (3) , एक्स(5), मौसम की स्थिति, आदि)। औसत सापेक्ष सन्निकटन त्रुटि मॉडल की पर्याप्तता, साथ ही अवशिष्ट विचरण के मूल्य की विशेषता है। प्रतिगमन समीकरण की व्याख्या करते समय, सापेक्ष सन्निकटन त्रुटियों के मूल्य रुचि के होते हैं . स्मरण करो कि - प्रभावी संकेतक का मॉडल मूल्य, विचार किए गए क्षेत्रों की समग्रता के लिए उत्पादकता के औसत मूल्य की विशेषता है, बशर्ते कि व्याख्यात्मक चर के मान एक्स(1) और एक्स(4) समान स्तर पर निश्चित, अर्थात् एक्स (1) = एक्स मैं(1) और एक्स (4) = x मैं(4) । फिर डी के मूल्यों के लिए मैंउपज की तुलना की जा सकती है। क्षेत्र जो d मानों के अनुरूप हैं मैं> 0, औसत से अधिक उपज है, और डी मैं<0 - ниже среднего.
हमारे उदाहरण में, d के अनुरूप क्षेत्र में फसल उत्पादन सबसे अधिक कुशल है 7 \u003d 28%, जहां उपज क्षेत्र के लिए औसत से 28% अधिक है, और कम से कम कुशल - डी वाले क्षेत्र में 20 =-27,3%.
कार्य और व्यायाम
2.1. सामान्य जनसंख्या से ( वाई, एक्स (1) , ..., एक्स(पी)), जहां वाईसशर्त गणितीय अपेक्षा और विचरण s 2 के साथ एक सामान्य वितरण कानून है, मात्रा का एक यादृच्छिक नमूना एन, जाने देना ( यी, एक्स मैं (1) , ..., एक्स मैं(पी)) - परिणाम मैंवें अवलोकन ( मैं=1, 2, ..., एन). निर्धारित करें: ए) वेक्टर के कम से कम वर्गों के अनुमान की गणितीय अपेक्षा क्यू; बी) सदिश के कम से कम वर्गों के सहप्रसरण मैट्रिक्स का अनुमान क्यू; c) अनुमान की गणितीय अपेक्षा।
2.2. समस्या 2.1 की स्थिति के अनुसार, प्रतिगमन के कारण वर्ग विचलन के योग की गणितीय अपेक्षा का पता लगाएं, अर्थात ईक्यू आर, कहाँ
.
2.3. समस्या 2.1 की स्थिति के अनुसार, प्रतिगमन रेखाओं के सापेक्ष अवशिष्ट भिन्नता के कारण वर्ग विचलन के योग की गणितीय अपेक्षा निर्धारित करें, अर्थात eq केओस्ट जहां
2.4. साबित करें कि परिकल्पना के तहत Н 0: q=0 आंकड़े
स्वतंत्रता की डिग्री के साथ एक एफ-वितरण है n 1 =p+1 और n 2 =n-p-1।
2.5. साबित करें कि जब परिकल्पना एच 0: क्यू जे = 0 पूरा हो जाता है, तो आंकड़ों में स्वतंत्रता की डिग्री एन = एन-पी-1 की संख्या के साथ टी-वितरण होता है।
2.6. चारे की ब्रेड संकोचन की निर्भरता पर डेटा (तालिका 2.3) के आधार पर ( वाई) भंडारण की अवधि पर ( एक्स) इस धारणा के तहत सशर्त गणितीय अपेक्षा का एक बिंदु अनुमान खोजें कि सामान्य प्रतिगमन समीकरण रैखिक है।
तालिका 2.3।
यह आवश्यक है: ए) अनुमान और अवशिष्ट भिन्नता एस 2 को इस धारणा के तहत खोजने के लिए कि सामान्य प्रतिगमन समीकरण का रूप है; ख) a=0.05 प्रतिगमन समीकरण के महत्व की जांच करें, अर्थात परिकल्पना एच 0: क्यू = 0; ग) विश्वसनीयता के साथ जी=0.9 पैरामीटर के अंतराल अनुमान निर्धारित करें क्यू 0 , क्यू 1 ; घ) विश्वसनीयता के साथ g=0.95 के लिए सशर्त अपेक्षा का अंतराल अनुमान निर्धारित करें एक्स 0=6; ई) बिंदु पर भविष्यवाणी के आत्मविश्वास अंतराल जी = 0.95 पर निर्धारित करें एक्स=12.
2.7. तालिका में दिए गए 5 महीनों के लिए शेयर मूल्य की वृद्धि दर की गतिशीलता के आंकड़ों के आधार पर। 2.4।
तालिका 2.4।
महीने ( एक्स) | |||||
वाई (%) |
और धारणा है कि सामान्य प्रतिगमन समीकरण का रूप है, यह आवश्यक है: ए) प्रतिगमन समीकरण और अवशिष्ट विचरण के अनुमानों और मापदंडों को निर्धारित करने के लिए 2; बी) a=0.01 पर प्रतिगमन गुणांक के महत्व की जांच करें, अर्थात परिकल्पना एच 0: क्यू 1 = 0;
ग) विश्वसनीयता के साथ g=0.95 प्राचलों q 0 और q 1 के अंतराल अनुमानों का पता लगाएं; घ) विश्वसनीयता जी = 0.9 के साथ, के लिए सशर्त गणितीय अपेक्षा का एक अंतराल अनुमान स्थापित करें एक्स 0=4; ई) बिंदु पर भविष्यवाणी के विश्वास अंतराल जी = 0.9 पर निर्धारित करें एक्स=5.
2.8. युवा जानवरों में वजन बढ़ने की गतिशीलता के अध्ययन के परिणाम तालिका 2.5 में दिए गए हैं।
तालिका 2.5।
यह मानते हुए कि सामान्य प्रतिगमन समीकरण रैखिक है, यह आवश्यक है: क) प्रतिगमन समीकरण और अवशिष्ट विचरण s 2 के अनुमानों और मापदंडों को निर्धारित करने के लिए; ख) a=0.05 प्रतिगमन समीकरण के महत्व की जांच करें, अर्थात परिकल्पना एच 0: क्यू=0;
c) विश्वसनीयता के साथ g=0.8 पैरामीटर q 0 और q 1 के अंतराल अनुमानों को खोजने के लिए; d) विश्वसनीयता के साथ g=0.98 के लिए सशर्त गणितीय अपेक्षा के अंतराल अनुमानों का निर्धारण और तुलना करें एक्स 0 = 3 और एक्स 1 =6;
ई) बिंदु पर भविष्यवाणी के विश्वास अंतराल जी = 0.98 पर निर्धारित करें एक्स=8.
2.9. लागत मूल्य ( वाई) संचलन के आधार पर पुस्तक की एक प्रति ( एक्स) (हजार प्रतियाँ) प्रकाशन गृह (तालिका 2.6) द्वारा एकत्रित आंकड़ों की विशेषता है। अतिपरवलयिक प्रतिगमन समीकरण के कम से कम वर्ग अनुमान और पैरामीटर निर्धारित करें, विश्वसनीयता के साथ g=0.9 पैरामीटर q 0 और q 1 के लिए आत्मविश्वास अंतराल बनाएं, साथ ही सशर्त गणितीय अपेक्षा भी एक्स=10.
तालिका 2.6।
प्रकार के प्रतिगमन समीकरण के अनुमान और पैरामीटर निर्धारित करें एक्स=20.
2.11. तालिका में। 2.8 ने निम्नलिखित व्यापक आर्थिक संकेतकों की वृद्धि दर (%) की सूचना दी एन\u003d 1992 के लिए दुनिया के 10 विकसित देश: GNP - एक्स(1) औद्योगिक उत्पादन - एक्स(2) मूल्य सूचकांक - एक्स (3) .
तालिका 2.8।
देशों | एक्स और प्रतिगमन समीकरण के पैरामीटर, अवशिष्ट विचरण का अनुमान; बी) a=0.05 पर प्रतिगमन गुणांक के महत्व की जांच करें, अर्थात एच 0: क्यू 1 = 0; ग) विश्वसनीयता के साथ g=0.9 अंतराल अनुमान q 0 और q 1 खोजें; डी) जी = 0.95 पर बिंदु पर विश्वास अंतराल खोजें एक्स 0 =एक्स मैं, कहाँ मैं=5; ई) प्रतिगमन समीकरणों की सांख्यिकीय विशेषताओं की तुलना करें: 1, 2 और 3। 2.12. व्याख्या किए जाने वाले मान को लेकर समस्या 2.11 को हल करें ( पर) अनुक्रमणिका एक्स(1) , और व्याख्यात्मक के लिए ( एक्स) चर एक्स (3) . 1. अयवज़्यान एस.ए., मुख्तार्यान वी.एस. अनुप्रयुक्त सांख्यिकी और अर्थमिति के मूल सिद्धांत: पाठ्यपुस्तक। एम., यूनिटी, 1998 (दूसरा संस्करण 2001); 2. अयवज़्यान एस.ए., मुख्तार्यान वी.एस. समस्याओं और अभ्यासों में अनुप्रयुक्त सांख्यिकी: पाठ्यपुस्तक। एम। एकता - दाना, 2001; 3. ऐवाज़्यान एस.ए., एन्युकोव आई.एस., मेशालिन एल.डी. एप्लाईड स्टैटस्टिक्स। निर्भरता अनुसंधान। एम।, वित्त और सांख्यिकी, 1985, 487p।; 4. ऐवाज़्यान एस.ए., बुचस्टाबर वी.एम., एन्युकोव आई.एस., मेशाल्किन एल.डी. एप्लाईड स्टैटस्टिक्स। वर्गीकरण और आयामीता में कमी। एम।, वित्त और सांख्यिकी, 1989, 607p।; 5. जॉनसन जे. इकोनोमेट्रिक मेथड्स, मॉस्को: स्टेटिस्टिक्स, 1980, 446 पीपी.; 6. डबरोव ए.वी., मुख्तार्यान वी.एस., ट्रोशिन एल.आई. बहुभिन्नरूपी सांख्यिकीय तरीके। एम।, वित्त और सांख्यिकी, 2000; 7. मुख्तारयन वी.एस., ट्रोशिन एल.आई. सहसंबंध और प्रतिगमन के तरीकों से निर्भरता का अनुसंधान। एम., एमईएसआई, 1995, 120 पीपी.; 8. मुख्तारयन वी.एस., डबरोव ए.एम., ट्रोशिन एल.आई. अर्थशास्त्र में बहुआयामी सांख्यिकीय तरीके। एम., एमईएसआई, 1995, 149पी.; 9. डबरोव ए.एम., मुख्तार्यान वी.एस., ट्रोशिन एल.आई. व्यवसायियों और प्रबंधकों के लिए गणितीय आँकड़े। एम., एमईएसआई, 2000, 140s.; 10. लुकाशिन यू.आई. प्रतिगमन और अनुकूली पूर्वानुमान के तरीके: पाठ्यपुस्तक, एम।, एमईएसआई, 1997। 11. लुकाशिन यू.आई. अल्पकालिक पूर्वानुमान के अनुकूली तरीके। - एम।, सांख्यिकी, 1979। ऐप्स परिशिष्ट 1. स्वतंत्र कंप्यूटर अनुसंधान के लिए कार्यों के विकल्प। |