रेखीय प्रतिगमन मापदंडों का अनुमान। एक्सेल में रिग्रेशन: समीकरण, उदाहरण

रेखीय प्रतिगमन को फॉर्म का समीकरण खोजने के लिए कम किया जाता है:

पहली अभिव्यक्ति कारक के दिए गए मूल्यों की अनुमति देती है एक्सप्रभावी विशेषता के सैद्धांतिक मूल्यों की गणना करें, इसमें कारकों के वास्तविक मूल्यों को प्रतिस्थापित करें। ग्राफ (चित्र 1.2) पर, सैद्धांतिक मान एक सीधी रेखा पर स्थित हैं, जो एक प्रतिगमन रेखा है।

एक रेखीय प्रतिगमन का निर्माण इसके मापदंडों - ए और बी का अनुमान लगाने के लिए कम किया गया है। रेखीय प्रतिगमन मापदंडों का आकलन करने के लिए शास्त्रीय दृष्टिकोण कम से कम वर्ग विधि (एलएसएम) पर आधारित है।

एलएसएम ऐसे पैरामीटर अनुमान प्राप्त करने की अनुमति देता है और बी,जिस पर वास्तविक मानों के वर्ग विचलन का योग होता है परसैद्धांतिक से वाई एक्सन्यूनतम:

चावल। 1.2।

न्यूनतम खोजने के लिए, प्रत्येक पैरामीटर (ए और फीट) के संबंध में राशि (1.4) के आंशिक डेरिवेटिव की गणना करना और उन्हें शून्य के बराबर करना आवश्यक है:

परिवर्तन के बाद, हम सामान्य समीकरणों की एक प्रणाली प्राप्त करते हैं:

सिस्टम में पी- नमूना आकार, राशियों की गणना स्रोत डेटा से आसानी से की जाती है। के सम्बन्ध में व्यवस्था का समाधान करना और बी,हम पाते हैं:

अभिव्यक्ति (1.7) को दूसरे रूप में लिखा जा सकता है:

जहां सीओवी (एक्स, वाई) -सुविधा सहप्रसरण; सु * - कारक का विचरण एक्स।

पैरामीटर बी को प्रतिगमन गुणांक कहा जाता है। इसका मान एक इकाई द्वारा कारक में वृद्धि के साथ परिणाम में औसत परिवर्तन दर्शाता है। प्रतिगमन गुणांक की स्पष्ट आर्थिक व्याख्या की संभावना ने रैखिक जोड़ी प्रतिगमन समीकरण को अर्थमितीय अध्ययनों में काफी सामान्य बना दिया है।

औपचारिक रूप से ए -अर्थ परपर एक्स = 0. अगर एक्सशून्य मान नहीं है और न ही हो सकता है, फिर मुक्त पद की ऐसी व्याख्या कोई मतलब नहीं है। पैरामीटर अधिकांश समय इसमें कोई आर्थिक सामग्री नहीं होती है। आर्थिक रूप से इसकी व्याख्या करने का प्रयास बेतुकापन पैदा कर सकता है, खासकर जब और 0. पैरामीटर पर केवल चिह्न की व्याख्या की जा सकती है एक।अगर एक > 0 है, तो परिणाम में सापेक्षिक परिवर्तन कारक में परिवर्तन की तुलना में धीमा है। आइए इन सापेक्ष परिवर्तनों की तुलना करें:

कभी-कभी माध्य से विचलन के लिए एक रेखीय जोड़ी प्रतिगमन समीकरण लिखा जाता है:

कहाँ

इस मामले में, मुक्त पद शून्य के बराबर है, जो अभिव्यक्ति (1.10) में परिलक्षित होता है। यह तथ्य ज्यामितीय विचारों से आता है: एक ही सीधी रेखा (1.3) प्रतिगमन समीकरण से मेल खाती है, लेकिन विचलन में प्रतिगमन का अनुमान लगाते समय, निर्देशांक की उत्पत्ति निर्देशांक (3c, y) के साथ बिंदु पर जाती है। इस स्थिति में, अभिव्यक्ति (1.8) में, दोनों योग शून्य के बराबर होंगे, जो मुक्त पद की समानता को शून्य तक ले जाएगा। इस मामले में भाव (1.7) और (1.9) भी सरल किए गए हैं।

एक उदाहरण के रूप में, एक प्रकार के उत्पाद का उत्पादन करने वाले उद्यमों के समूह के लिए उत्पादन पर लागत की प्रतिगमन निर्भरता पर विचार करें वाई = ए + बीएक्स+ ई (तालिका 1.1)।

सामान्य समीकरणों की प्रणाली दिखेगी

इसे हल करने पर, हमें प्राप्त होता है - -5,79, बी - 36,84.

प्रतिगमन समीकरण का रूप है

तालिका 1.1

युग्मित रेखीय मॉडल के पैरामीटरों का आकलन करने के लिए प्रारंभिक डेटा

आउटपुट (एक्स), हजार इकाइयां

उत्पादन लागत (य),एमएलएन रगड़।

प्रतिगमन समीकरण में x के मान को प्रतिस्थापित करते हुए, हम y के सैद्धांतिक मान (तालिका 1.1 का अंतिम स्तंभ) पाते हैं।

कीमत कोई आर्थिक अर्थ नहीं है। यदि चर एक्सऔर परऔसत स्तरों से विचलन के संदर्भ में व्यक्त किया जाता है, तो ग्राफ पर प्रतिगमन रेखा मूल से होकर गुजरेगी। प्रतिगमन गुणांक का अनुमान नहीं बदलेगा: y" = 36.84x", जहां y" = y-y, x" = x-x।

एक अन्य उदाहरण के रूप में, प्रपत्र के उपभोग फलन पर विचार करें:

जहाँ सी - खपत; पर- आय; के, एल -विकल्प।

यह रेखीय प्रतिगमन समीकरण आमतौर पर संतुलन समीकरण के साथ प्रयोग किया जाता है

कहाँ / - निवेश की राशि; जी- जमा पूंजी।

सरलता के लिए, मान लें कि आय उपभोग और निवेश पर खर्च की जाती है। इस प्रकार, हम समीकरणों की प्रणाली पर विचार करते हैं

संतुलन समानता की उपस्थिति प्रतिगमन गुणांक के मूल्य पर प्रतिबंध लगाती है, जो एक से अधिक नहीं हो सकता है, अर्थात के 1.

मान लीजिए कि खपत समारोह है सी = 1.9 + 0.65वाई।

प्रतिगमन गुणांक उपभोग करने की प्रवृत्ति को दर्शाता है। यह दर्शाता है कि आय के प्रत्येक हजार रूबल में से औसतन 650 रूबल खपत पर और 350 रूबल खर्च किए जाते हैं। निवेश किया। यदि हम आय से निवेश के आकार के प्रतिगमन की गणना करते हैं, अर्थात मैं = ए + द्वारा,तो प्रतिगमन समीकरण होगा मैं\u003d -1.9 + 0.35y। इसे परिभाषित किया जा सकता है या नहीं भी किया जा सकता है, क्योंकि यह उपभोग फलन से प्राप्त होता है। इन दो समीकरणों के प्रतिगमन गुणांक समीकरण 0.65 + 0.35 = 1 से संबंधित हैं। यदि प्रतिगमन गुणांक एक से अधिक है, तो और न केवल आय को उपभोग पर खर्च किया जाता है, बल्कि बचत पर भी खर्च किया जाता है।

प्रतिगमन गुणांक कोउपभोग समारोह में गुणक की गणना करने के लिए प्रयोग किया जाता है:

कहाँ टी» 2.86, इसलिए, 1 हजार रूबल का अतिरिक्त निवेश। लंबे समय तक, 2.86 हजार रूबल की अतिरिक्त आय के लिए, क्रेटरिस परिबस का नेतृत्व करेंगे।

रेखीय प्रतिगमन के साथ, रेखीय सहसंबंध गुणांक संबंध की जकड़न के एक संकेतक के रूप में कार्य करता है जी।

इसके मान सीमा के भीतर हैं: - 1 आर 1। यदि 6> 0, तो 0 जी बी 0-1 जी 0। उदाहरण के अनुसार, अभिव्यक्ति की गणना (1.11) देता है आर = 0.991, जिसका अर्थ है उत्पादन की मात्रा पर उत्पादन लागत की बहुत निकट निर्भरता।

एक रैखिक समारोह के चयन की गुणवत्ता का आकलन करने के लिए, दृढ़ संकल्प के गुणांक की गणना रैखिक सहसंबंध गुणांक के वर्ग के रूप में की जाती है मैं 2।यह परिणामी विशेषता के कुल विचरण में प्रतिगमन द्वारा समझाया गया परिणामी विशेषता y के विचरण के अनुपात को दर्शाता है:

मान 1 - जी 2फैलाव के हिस्से की विशेषता है वाई,मॉडल में ध्यान में नहीं रखे गए अन्य कारकों के प्रभाव के कारण।

उदाहरण में जी 2 = 0.982। प्रतिगमन समीकरण y प्रसरण के 98.2% की व्याख्या करता है, जबकि अन्य कारक 1.8% के लिए खाते हैं - यह अवशिष्ट विचरण है।

रेखीय प्रतिगमन व्यापक रूप से अर्थमिति में इसके मापदंडों की स्पष्ट आर्थिक व्याख्या के रूप में उपयोग किया जाता है। रेखीय प्रतिगमन को फॉर्म का समीकरण खोजने के लिए कम किया जाता है

या । (4.6)

फॉर्म का समीकरण कारक के दिए गए मूल्यों के लिए अनुमति देता है एक्सप्रभावी विशेषता के सैद्धांतिक मूल्य हैं, इसमें कारक के वास्तविक मूल्यों को प्रतिस्थापित करना एक्स. ग्राफ पर, सैद्धांतिक मूल्य प्रतिगमन रेखा (चित्र। 4.2) का प्रतिनिधित्व करते हैं।

चावल। 4.2। रेखीय प्रतिगमन मापदंडों का चित्रमय अनुमान

एक रेखीय प्रतिगमन का निर्माण इसके मापदंडों का अनुमान लगाने के लिए कम किया जाता है और रेखीय प्रतिगमन मापदंडों का अनुमान विभिन्न तरीकों से पाया जा सकता है। आप सहसंबंध क्षेत्र की ओर मुड़ सकते हैं और ग्राफ पर दो बिंदुओं का चयन करके, उनके माध्यम से एक सीधी रेखा खींच सकते हैं (चित्र 4.2 देखें)। आगे ग्राफ पर, आप मापदंडों के मान निर्धारित कर सकते हैं। पैरामीटर को अक्ष के साथ प्रतिगमन रेखा के चौराहे के बिंदु के रूप में परिभाषित किया गया है, और प्रतिगमन रेखा के ढलान के आधार पर पैरामीटर का अनुमान लगाया गया है, जहां परिणाम की वृद्धि वाई,एक कारक वृद्धि एक्स,अर्थात।

रेखीय प्रतिगमन मापदंडों का आकलन करने के लिए शास्त्रीय दृष्टिकोण पर आधारित है कम से कम वर्गों(एमएनके)।

एलएसएम आपको मापदंडों के ऐसे अनुमान प्राप्त करने की अनुमति देता है और , जिसमें प्रभावी सुविधा के वास्तविक मूल्यों के चुकता विचलन का योग होता है (वाई)परिकलित (सैद्धांतिक) न्यूनतम से:

दूसरे शब्दों में, रेखाओं के पूरे सेट से, ग्राफ़ पर प्रतिगमन रेखा को चुना जाता है ताकि बिंदुओं और इस रेखा के बीच लंबवत दूरी के वर्गों का योग न्यूनतम हो:

इस तरह

फ़ंक्शन (4.7) का न्यूनतम पता लगाने के लिए, प्रत्येक पैरामीटर के संबंध में आंशिक डेरिवेटिव की गणना करना आवश्यक है और बीऔर उन्हें शून्य के बराबर करें।

द्वारा निरूपित करें एस, तब:

इस प्रणाली को बदलने से, हम मापदंडों का अनुमान लगाने के लिए सामान्य समीकरणों की निम्नलिखित प्रणाली प्राप्त करते हैं:

. (4.8)

सामान्य समीकरणों की प्रणाली (4.8) को या तो चर के क्रमिक उन्मूलन की विधि से या निर्धारकों की विधि से हल करते हुए, हम वांछित मापदंडों के संख्यात्मक मान पाते हैं और . आप निम्नलिखित तैयार किए गए फ़ार्मुलों का उपयोग कर सकते हैं:

. (4.9)

फॉर्मूला (4.9) को सिस्टम के पहले समीकरण (4.8) से प्राप्त किया जाता है, यदि इसकी सभी शर्तों को विभाजित किया जाता है पी।

सुविधा सहप्रसरण कहाँ है;

फ़ीचर विचरण एक्स.

इस तथ्य के कारण , , हम पैरामीटर अनुमान की गणना के लिए निम्न सूत्र प्राप्त करते हैं बी:

. (4.10)

पैरामीटर को प्रतिगमन गुणांक कहा जाता है। इसका मान एक इकाई द्वारा कारक में परिवर्तन के साथ परिणाम में औसत परिवर्तन दर्शाता है। तो, अगर लागत समारोह में (पर -लागत (हजार रूबल), एक्स- उत्पादन की इकाइयों की संख्या)। इसलिए, उत्पादन की मात्रा में वृद्धि के साथ (एक्स) 1 यूनिट के लिए उत्पादन लागत में औसतन 2 हजार रूबल की वृद्धि होती है, यानी उत्पादन में 1 यूनिट की अतिरिक्त वृद्धि। लागत में औसतन 2 हजार रूबल की वृद्धि की आवश्यकता होगी।


प्रतिगमन गुणांक की स्पष्ट आर्थिक व्याख्या की संभावना ने अर्थमितीय अध्ययनों में रैखिक प्रतिगमन समीकरण को काफी सामान्य बना दिया है।

औपचारिक - अर्थ परपर एक्स= 0। यदि विशेषता-कारक का शून्य मान नहीं है और न ही हो सकता है, तो मुक्त पद की उपरोक्त व्याख्या का कोई मतलब नहीं है। पैरामीटर में आर्थिक सामग्री नहीं हो सकती है। आर्थिक रूप से पैरामीटर की व्याख्या करने का प्रयास बेहूदगी पैदा कर सकता है, खासकर जब < 0.

100 आरपहला ऑर्डर बोनस

काम का प्रकार चुनें ग्रेजुएशन वर्क टर्म पेपर एब्स्ट्रैक्ट मास्टर की थीसिस प्रैक्टिस पर रिपोर्ट आर्टिकल रिपोर्ट रिव्यू टेस्ट वर्क मोनोग्राफ प्रॉब्लम सॉल्विंग बिजनेस प्लान सवालों के जवाब क्रिएटिव वर्क निबंध ड्रॉइंग कंपोज़िशन ट्रांसलेशन प्रेजेंटेशन टाइपिंग अन्य टेक्स्ट की विशिष्टता बढ़ाने में कैंडिडेट की थीसिस लेबोरेटरी वर्क में मदद- पंक्ति

कीमत पूछो

प्रतिगमन समीकरण के मापदंडों का अनुमान लगाते समय, कम से कम वर्ग विधि (LSM) का उपयोग किया जाता है। इस मामले में, यादृच्छिक घटक ई के संबंध में कुछ पूर्वापेक्षाएँ की जाती हैं। मॉडल में, यादृच्छिक घटक ई एक अप्राप्य मात्रा है। मॉडल मापदंडों का अनुमान लगाने के बाद, प्रभावी विशेषता y के वास्तविक और सैद्धांतिक मूल्यों के बीच अंतर की गणना करना , हम यादृच्छिक घटक का अनुमान निर्धारित कर सकते हैं। चूंकि वे वास्तविक यादृच्छिक अवशेष नहीं हैं, इसलिए उन्हें दिए गए समीकरण के अज्ञात अवशिष्ट के कुछ चुनिंदा अहसास के रूप में माना जा सकता है, अर्थात।

जब मॉडल की विशिष्टता बदल जाती है, जब इसमें नए अवलोकन जोड़े जाते हैं, तो अवशिष्ट ई के नमूना अनुमान बदल सकते हैं। इसलिए, प्रतिगमन विश्लेषण के कार्य में न केवल मॉडल का निर्माण शामिल है, बल्कि यादृच्छिक विचलन ईआई, यानी अवशिष्ट मूल्यों का अध्ययन भी शामिल है।

फिशर और छात्र परीक्षणों का उपयोग करते समय, अवशिष्टों के व्यवहार के बारे में धारणाएँ बनाई जाती हैं - अवशिष्ट स्वतंत्र यादृच्छिक चर होते हैं और उनका माध्य मान 0 होता है; उनके पास समान (स्थिर) विचरण है और एक सामान्य वितरण का पालन करते हैं।

प्रतिगमन मापदंडों की सांख्यिकीय जांच, सहसंबंध संकेतक यादृच्छिक घटक ईआई के वितरण की अविश्वसनीय मान्यताओं पर आधारित हैं। वे केवल प्रारंभिक हैं। प्रतिगमन समीकरण के निर्माण के बाद, की उपस्थिति के लिए एक जाँच की जाती है

अनुमानित ईआई (यादृच्छिक अवशेष) उन गुणों का जिन्हें ग्रहण किया गया था। यह इस तथ्य के कारण है कि प्रतिगमन मापदंडों के अनुमानों को कुछ मानदंडों को पूरा करना चाहिए। उन्हें निष्पक्ष, सुसंगत और कुशल होना चाहिए। प्रतिगमन और सहसंबंध परिणामों के उपयोग में ओएलएस अनुमानों के ये गुण अत्यंत महत्वपूर्ण व्यावहारिक महत्व के हैं।

निष्पक्ष अनुमान का अर्थ है कि अवशिष्टों का माध्य शून्य है। यदि अनुमान निष्पक्ष हैं, तो विभिन्न अध्ययनों में उनकी तुलना की जा सकती है।

रेटिंग्स पर विचार किया जाता है असरदारयदि उनके पास सबसे छोटा विचरण है। व्यावहारिक शोध में, इसका अर्थ है एक बिंदु से अंतराल के अनुमान में जाने की संभावना।

करदानक्षमता अनुमान बढ़ते नमूने के आकार के साथ उनकी सटीकता में वृद्धि की विशेषता है। महान व्यावहारिक रुचि के वे प्रतिगमन परिणाम हैं जिनके लिए प्रतिगमन पैरामीटर द्वि के अपेक्षित मूल्य का विश्वास अंतराल एक के बराबर संभाव्यता मूल्यों की एक सीमा है। दूसरे शब्दों में, पैरामीटर के वास्तविक मान से दी गई दूरी पर अनुमान प्राप्त करने की संभावना एकता के करीब है।

मूल्यांकन के विभिन्न तरीकों में निर्दिष्ट मूल्यांकन मानदंड (गैर-पूर्वाग्रह, स्थिरता और दक्षता) को आवश्यक रूप से ध्यान में रखा जाता है। कम से कम वर्ग विधि अवशिष्टों के वर्गों के योग को कम करने के आधार पर प्रतिगमन अनुमान बनाती है। इसलिए, प्रतिगमन अवशेषों के व्यवहार की जांच करना बहुत महत्वपूर्ण है। निष्पक्ष, सुसंगत और कुशल अनुमानक प्राप्त करने के लिए आवश्यक शर्तें OLS पूर्वापेक्षाएँ हैं जो विश्वसनीय प्रतिगमन परिणाम प्राप्त करने के लिए वांछनीय हैं।

ईआई अवशेषों के अध्ययन में निम्नलिखित की उपस्थिति की जाँच करना शामिल है ओएलएस के पांच परिसर:

1. अवशेषों की यादृच्छिक प्रकृति;

2. अवशिष्टों का शून्य औसत मान, xi से स्वतंत्र;

3. समरूपता - प्रत्येक विचलन ई का विचरण x के सभी मूल्यों के लिए समान है ;

4. अवशिष्टों के स्वतःसंबंध की अनुपस्थिति - अवशिष्ट ई के मान एक दूसरे से स्वतंत्र रूप से वितरित किए जाते हैं;

5. अवशिष्ट एक सामान्य वितरण का पालन करते हैं।

यदि यादृच्छिक अवशिष्ट ईआई का वितरण कुछ एलएसएम मान्यताओं के अनुरूप नहीं है, तो मॉडल को ठीक किया जाना चाहिए।

सबसे पहले, अवशिष्ट ई की यादृच्छिक प्रकृति की जाँच की जाती है, जो कि कम से कम वर्गों का पहला आधार है। इस प्रयोजन के लिए, परिणामी विशेषता के सैद्धांतिक मूल्यों पर अवशिष्ट ई की निर्भरता का एक ग्राफ तैयार किया गया है।

यदि ग्राफ पर एक क्षैतिज पट्टी प्राप्त की जाती है, तो अवशिष्ट ई यादृच्छिक चर हैं और एलएसएम उचित है, सैद्धांतिक मूल्य वाई के वास्तविक मूल्यों का अनुमान लगाते हैं।

यदि ई पर निर्भर करता है तो निम्नलिखित मामले संभव हैं वह:

1) शेष e यादृच्छिक नहीं हैं

2) अवशिष्ट ई में निरंतर फैलाव नहीं होता है

3) अवशेष ई व्यवस्थित हैं।

इन मामलों में, यह आवश्यक है कि या तो कोई अन्य फ़ंक्शन लागू किया जाए, या अतिरिक्त जानकारी पेश की जाए और प्रतिगमन समीकरण का पुनर्निर्माण तब तक किया जाए जब तक कि अवशिष्ट ई यादृच्छिक चर न हों।

अवशिष्टों के शून्य माध्य के संबंध में दूसरी OLS धारणा का अर्थ है . यह रैखिक मॉडल और मॉडल के लिए संभव है जो शामिल चर के संबंध में गैर-रैखिक हैं।

उसी समय, एलएसएम द्वारा प्राप्त प्रतिगमन गुणांक के अनुमानों की निष्पक्षता यादृच्छिक अवशेषों और एक्स मूल्यों की स्वतंत्रता पर निर्भर करती है, जिसका अध्ययन एलएसएम के दूसरे आधार के ढांचे के भीतर भी किया जाता है। इस प्रयोजन के लिए, परिणामी विशेषता के सैद्धांतिक मूल्यों पर अवशिष्ट ई की निर्भरता के उपरोक्त ग्राफ के साथ, प्रतिगमन एक्सजे में शामिल कारकों पर यादृच्छिक अवशिष्ट ई की निर्भरता का एक ग्राफ बनाया गया है।

यदि चार्ट पर अवशिष्टों को एक क्षैतिज पट्टी के रूप में व्यवस्थित किया जाता है, तो वे xj के मानों से स्वतंत्र होते हैं। यदि ग्राफ ई और एक्सजे की निर्भरता दिखाता है, तो मॉडल अपर्याप्त है। अपर्याप्तता के कारण अलग हो सकते हैं। यह संभव है कि कम से कम वर्गों के तीसरे आधार का उल्लंघन किया गया हो और गुणक xj के प्रत्येक मान के लिए अवशिष्टों का प्रसरण स्थिर न हो। मॉडल विनिर्देश गलत हो सकता है और आपको प्रवेश करने की आवश्यकता है

एक्सजे से अतिरिक्त शर्तें, उदाहरण के लिए। कारक xj के मूल्यों के कुछ क्षेत्रों में अंकों का संचय मॉडल में एक व्यवस्थित त्रुटि की उपस्थिति को इंगित करता है।

अवशिष्टों के सामान्य वितरण की धारणा F- और t-परीक्षणों का उपयोग करके प्रतिगमन और सहसंबंध पैरामीटरों के परीक्षण की अनुमति देती है। इसी समय, कम से कम वर्ग विधि का उपयोग करते हुए पाए जाने वाले प्रतिगमन अनुमानों में अवशिष्टों के सामान्य वितरण की अनुपस्थिति में भी अच्छे गुण होते हैं, अर्थात कम से कम वर्गों के पांचवें आधार के उल्लंघन में।

कम से कम वर्ग विधि से प्रतिगमन मापदंडों के लगातार अनुमान प्राप्त करना नितांत आवश्यक है, तीसरी और चौथी पूर्वापेक्षाओं का पालन है।

तीसरे OLS आधार के लिए आवश्यक है कि अवशिष्टों का विचरण हो समलिंगी. इसका मतलब है कि कारक xj के प्रत्येक मान के लिए अवशिष्ट ई में समान विचरण होता है। यदि एलएसएम लागू करने की यह शर्त पूरी नहीं होती है, तो हमारे पास है विषमलैंगिकता. विषमलैंगिकता की उपस्थिति को सहसंबंध क्षेत्र से स्पष्ट रूप से देखा जा सकता है:

1. x बढ़ने पर अवशिष्टों का प्रसरण बढ़ता है।

फिर हमारे पास विषमलैंगिकता का निम्न रूप है: बड़े मूल्यों के लिए बड़ा विचरण ई

2. अवशिष्टों का विचरण एक्स के औसत मूल्यों पर अपने अधिकतम मूल्य तक पहुँचता है, और न्यूनतम और अधिकतम मूल्यों पर घटता है।

फिर हमारे पास विषमलैंगिकता का निम्न रूप है: माध्य मानों के लिए बड़ा विचरण ei, और छोटे और बड़े मूल्यों के लिए छोटा विचरण ei

3. अवशिष्टों का अधिकतम विचरण x के छोटे मूल्यों पर होता है और x बढ़ने पर अवशिष्टों का विचरण एक समान होता है।

फिर हमारे पास विषमलैंगिकता का निम्न रूप है: के छोटे मूल्यों के लिए बड़ा विचरण ईआई, अवशिष्ट ई के विचरण में कमी के रूप में

प्रतिगमन मॉडल का निर्माण करते समय, एलएसएम के चौथे आधार का अनुपालन करना अत्यंत महत्वपूर्ण है - अवशिष्टों के स्वतःसंबंध की अनुपस्थिति, अर्थात, अवशिष्ट ई के मान एक दूसरे से स्वतंत्र रूप से वितरित किए जाते हैं।

अवशिष्टों के स्वत: संबंध का अर्थ है वर्तमान और पिछले (बाद के) अवलोकनों के अवशेषों के बीच संबंध की उपस्थिति। ei और ej के बीच सहसंबंध गुणांक, जहां ei वर्तमान प्रेक्षणों के अवशेष हैं, ej पिछले प्रेक्षणों के अवशेष हैं (उदाहरण के लिए, j=i-1), को इस प्रकार परिभाषित किया जा सकता है:

यानी, रैखिक सहसंबंध गुणांक के सामान्य सूत्र के अनुसार। यदि यह गुणांक शून्य से महत्वपूर्ण रूप से भिन्न होता है, तो अवशिष्ट स्वत: सहसंबद्ध होते हैं और संभाव्यता घनत्व फ़ंक्शन F(e) j पर निर्भर करता है -वाँ अवलोकन बिंदु और अन्य अवलोकन बिंदुओं पर अवशिष्ट मूल्यों के वितरण से।

अवशिष्टों के स्वत: सहसंबंध की अनुपस्थिति प्रतिगमन गुणांकों के अनुमानों की निरंतरता और दक्षता सुनिश्चित करती है। समय श्रृंखला के लिए प्रतिगमन मॉडल का निर्माण करते समय इस एलएसएम आधार का अनुपालन करना विशेष रूप से महत्वपूर्ण है, जहां एक प्रवृत्ति की उपस्थिति के कारण, समय श्रृंखला के बाद के स्तर, एक नियम के रूप में, उनके पिछले स्तरों पर निर्भर करते हैं।

यदि बुनियादी पूर्वापेक्षाएँ पूरी नहीं होती हैं, तो एलएसएम को अपने विनिर्देश को बदलकर मॉडल को ठीक करना होगा, कुछ कारकों को जोड़ना (बहिष्कृत करना), प्रतिगमन गुणांक के अनुमानों को प्राप्त करने के लिए प्रारंभिक डेटा को बदलना होगा, जिसमें निष्पक्षता की संपत्ति है, एक छोटा है अवशिष्ट विचरण और, इसलिए, प्रतिगमन मापदंडों के महत्व का अधिक कुशल सांख्यिकीय परीक्षण प्रदान करते हैं।

प्रतिगमन समीकरण के मापदंडों का अनुमान लगाने का दिन सबसे अधिक बार कम से कम वर्गों की विधि का उपयोग करता है (एमएनके)।

कम से कम वर्ग विधि अनुमान देता है कि यदि सामान्य रैखिक प्रतिगमन मॉडल की मान्यताओं को पूरा किया जाता है, तो सभी रैखिक अनुमानों के वर्ग में सबसे छोटा विचरण होता है।

एलएसएम मॉडल मूल्यों से देखे गए मूल्यों के वर्ग विचलन के योग को कम करता है .

कम से कम वर्गों की विधि के सिद्धांत के अनुसार, अनुमानों और वर्गों के योग को न्यूनतम करके पाया जाता है

सभी संभावित मूल्यों के लिए और दिए गए (देखे गए) मूल्यों के लिए
.

एलएसएम लागू करने के परिणामस्वरूप, हम युग्मित प्रतिगमन मॉडल के मापदंडों की गणना के लिए सूत्र प्राप्त करते हैं।

(3)

ऐसा समाधान तभी मौजूद हो सकता है जब स्थिति

जो सामान्य समीकरणों की प्रणाली के अशून्य निर्धारक के बराबर है। दरअसल, यह निर्धारक है

अंतिम शर्त कहलाती है पहचान की स्थितिअवलोकन मॉडल, और इसका मतलब है कि सभी मान नहीं
आपस में मेल करो। यदि इस शर्त का उल्लंघन किया जाता है सभीअंक
, एक ही ऊर्ध्वाधर रेखा पर लेटें

अनुमान कहलाते हैं कम से कम वर्ग अनुमान . आइए पैरामीटर के परिणामी अभिव्यक्ति पर ध्यान दें। इस व्यंजक में उन वर्गों का योग शामिल है जो पहले नमूना प्रसरण के निर्धारण में भाग लेते थे

और नमूना सहप्रसरण
तो, इन शर्तों में, पैरामीटर ऐसे मिल सकता है:

=
=
=

=

प्रतिगमन समीकरण की गुणवत्ता का मूल्यांकन

प्रतिगमन मॉडल की गुणवत्ता प्रेक्षित (अनुभवजन्य) डेटा के लिए मॉडल की पर्याप्तता से जुड़ी है। अवलोकित डेटा के साथ प्रतिगमन मॉडल की पर्याप्तता (या अनुपालन) की जाँच अवशिष्ट विश्लेषण के आधार पर की जाती है।

प्रतिगमन समीकरण बनाने के बाद, हम प्रत्येक अवलोकन में Y मान को दो घटकों में विभाजित कर सकते हैं - और .

शेष गणना द्वारा प्राप्त इस चर के मूल्य से आश्रित चर के वास्तविक मूल्य के विचलन का प्रतिनिधित्व करता है:
(
).

व्यवहार में, एक नियम के रूप में, सैद्धांतिक प्रतिगमन रेखा के सापेक्ष सहसंबंध क्षेत्र के बिंदुओं का कुछ फैलाव होता है, अर्थात सैद्धांतिक लोगों से अनुभवजन्य डेटा का विचलन (
). इन विचलनों का परिमाण समीकरण के गुणवत्ता (पर्याप्तता) संकेतकों की गणना को रेखांकित करता है।

प्रतिगमन मॉडल की गुणवत्ता का विश्लेषण करते समय, विचरण के विश्लेषण के मुख्य प्रावधान का उपयोग किया जाता है, जिसके अनुसार माध्य से आश्रित चर के वर्ग विचलन का कुल योग दो घटकों में विघटित किया जा सकता है - विचरण प्रतिगमन समीकरण द्वारा समझाया और अस्पष्टीकृत:

(4)

कहाँ - मान वाई, मॉडल द्वारा गणना की गई
.

(4) के दाएँ और बाएँ पक्षों को विभाजित करना

,

.

निर्धारण गुणांक निम्नानुसार परिभाषित किया गया है:

निर्धारण गुणांक परिणामी विशेषता की भिन्नता का अनुपात दिखाता है जो अध्ययन किए गए कारकों के प्रभाव में है, अर्थात, यह निर्धारित करता है कि मॉडल में विशेषता Y की भिन्नता के किस अनुपात को ध्यान में रखा गया है और उस पर कारकों के प्रभाव के कारण है।

करीब
से 1, मॉडल की गुणवत्ता जितनी अधिक होगी।

प्रतिगमन मॉडल की गुणवत्ता का आकलन करने के लिए भी उपयोग करने की सलाह दी जाती है एकाधिक सहसंबंध गुणांक (सहसंबंध सूचकांक) आर

यह गुणांक सार्वभौमिक है, क्योंकि यह संबंध की जकड़न और मॉडल की सटीकता को दर्शाता है, और इसका उपयोग चर के बीच किसी भी प्रकार के संबंध के लिए भी किया जा सकता है।

एक-कारक मॉडल का निर्माण करते समय, यह रैखिक सहसंबंध गुणांक के बराबर होता है
.

जाहिर है, बेहिसाब कारकों का प्रभाव जितना छोटा होगा, मॉडल वास्तविक डेटा के लिए उतना ही बेहतर होगा।

इसके अलावा, प्रतिगमन मॉडल की गुणवत्ता का आकलन करने के लिए, औसत सन्निकटन त्रुटि का उपयोग करने की सलाह दी जाती है:


सैद्धांतिक प्रतिगमन रेखा के आसपास अनुभवजन्य बिंदुओं का फैलाव जितना छोटा होगा, औसत सन्निकटन त्रुटि उतनी ही कम होगी। 7% से कम की अनुमानित त्रुटि मॉडल की अच्छी गुणवत्ता दर्शाती है।

प्रतिगमन समीकरण बनने के बाद, संपूर्ण और व्यक्तिगत मापदंडों के रूप में निर्मित समीकरण के महत्व की जाँच की जाती है।

प्रतिगमन समीकरण के महत्व का आकलन करने के लिए - इसका मतलब यह स्थापित करना है कि क्या Y और X के बीच संबंध व्यक्त करने वाला गणितीय मॉडल वास्तविक डेटा से मेल खाता है और क्या आश्रित चर Y का वर्णन करने के लिए समीकरण में पर्याप्त व्याख्यात्मक चर X शामिल हैं या नहीं

प्रतिगमन समीकरण के महत्व का मूल्यांकन यह पता लगाने के लिए किया जाता है कि क्या प्रतिगमन समीकरण व्यावहारिक उपयोग के लिए उपयुक्त है (उदाहरण के लिए, पूर्वानुमान के लिए) या नहीं। उसी समय, मुख्य परिकल्पना को समग्र रूप से समीकरण के महत्व के बारे में सामने रखा जाता है, जो औपचारिक रूप से इस परिकल्पना को कम करता है कि प्रतिगमन पैरामीटर शून्य के बराबर हैं, या, जो समान है, वह निर्धारण गुणांक के बराबर है शून्य करने के लिए:
. समीकरण के महत्व के बारे में एक वैकल्पिक परिकल्पना परिकल्पना है कि प्रतिगमन पैरामीटर शून्य के बराबर नहीं हैं।

के लिए मॉडल महत्व परीक्षण प्रतिगमन इस्तेमाल किया फिशर एफ परीक्षण , मूल श्रृंखला के भिन्नता और अवशिष्ट घटक के निष्पक्ष भिन्नता के अनुपात के रूप में गणना की जाती है। यदि  1 = k और  2 = (n - k - 1) स्वतंत्रता की डिग्री के साथ परिकलित मान, जहाँ k मॉडल में शामिल कारकों की संख्या है, किसी दिए गए महत्व स्तर पर सारणीबद्ध मान से अधिक है, तो मॉडल को महत्वपूर्ण माना है।

युग्मित प्रतिगमन मॉडल के लिए:

जैसा सटीकता के उपाय अवशिष्ट घटक के विचरण का एक निष्पक्ष अनुमान लागू करें, जो अवशिष्ट घटक के स्तरों के वर्गों के योग का अनुपात (n-k-1) है, जहाँ k मॉडल में शामिल कारकों की संख्या है। इस मात्रा का वर्गमूल ( ) कहा जाता है मानक त्रुटि :

डी युग्मित प्रतिगमन मॉडल के लिए

श्रेणियाँ

लोकप्रिय लेख

2023 "Kingad.ru" - मानव अंगों की अल्ट्रासाउंड परीक्षा