रैखिक प्रतिगमन गुणांक सूत्र। प्रतिगमन समीकरण

प्रतिगमन विश्लेषण एक सांख्यिकीय अनुसंधान पद्धति है जो आपको एक या अधिक स्वतंत्र चर पर एक पैरामीटर की निर्भरता दिखाने की अनुमति देती है। पूर्व-कंप्यूटर युग में, इसका उपयोग काफी कठिन था, खासकर जब बड़ी मात्रा में डेटा की बात हो। आज, एक्सेल में एक प्रतिगमन बनाने का तरीका जानने के बाद, आप कुछ ही मिनटों में जटिल सांख्यिकीय समस्याओं को हल कर सकते हैं। नीचे अर्थशास्त्र के क्षेत्र से विशिष्ट उदाहरण दिए गए हैं।

प्रतिगमन के प्रकार

इस अवधारणा को ही 1886 में गणित में पेश किया गया था। प्रतिगमन होता है:

  • रैखिक;
  • परवलयिक;
  • शक्ति;
  • घातीय;
  • अतिपरवलिक;
  • प्रदर्शनकारी;
  • लघुगणक।

उदाहरण 1

6 औद्योगिक उद्यमों में औसत वेतन पर सेवानिवृत्त टीम के सदस्यों की संख्या की निर्भरता निर्धारित करने की समस्या पर विचार करें।

काम। छह उद्यमों में, हमने औसत मासिक वेतन और अपनी मर्जी से छोड़ने वाले कर्मचारियों की संख्या का विश्लेषण किया। सारणीबद्ध रूप में हमारे पास है:

जाने वाले लोगों की संख्या

वेतन

30000 रूबल

35000 रूबल

40000 रूबल

45000 रूबल

50000 रूबल

55000 रूबल

60000 रूबल

6 उद्यमों में औसत वेतन पर सेवानिवृत्त श्रमिकों की संख्या की निर्भरता निर्धारित करने की समस्या के लिए, प्रतिगमन मॉडल में समीकरण Y = a 0 + a 1 x 1 +…+a k x k का रूप है, जहां x i प्रभावशाली चर हैं , a i प्रतिगमन गुणांक हैं, a k कारकों की संख्या है।

इस कार्य के लिए, Y छोड़ने वाले कर्मचारियों का संकेतक है, और प्रभावित करने वाला कारक वेतन है, जिसे हम X द्वारा निरूपित करते हैं।

स्प्रेडशीट "एक्सेल" की क्षमताओं का उपयोग करना

Excel में प्रतिगमन विश्लेषण उपलब्ध सारणीबद्ध डेटा में अंतर्निहित कार्यों के अनुप्रयोग से पहले होना चाहिए। हालांकि, इन उद्देश्यों के लिए बहुत उपयोगी ऐड-इन "विश्लेषण टूलकिट" का उपयोग करना बेहतर है। इसे सक्रिय करने के लिए आपको चाहिए:

  • "फ़ाइल" टैब से, "विकल्प" अनुभाग पर जाएँ;
  • खुलने वाली विंडो में, "ऐड-ऑन" लाइन चुनें;
  • "प्रबंधन" लाइन के दाईं ओर नीचे स्थित "जाओ" बटन पर क्लिक करें;
  • "विश्लेषण पैकेज" नाम के बगल में स्थित बॉक्स को चेक करें और "ओके" पर क्लिक करके अपने कार्यों की पुष्टि करें।

यदि सब कुछ सही ढंग से किया जाता है, तो एक्सेल वर्कशीट के ऊपर स्थित डेटा टैब के दाईं ओर वांछित बटन दिखाई देगा।

एक्सेल में

अब जब हमारे पास अर्थमितीय गणना करने के लिए सभी आवश्यक आभासी उपकरण हैं, तो हम अपनी समस्या को हल करना शुरू कर सकते हैं। इसके लिए:

  • "डेटा विश्लेषण" बटन पर क्लिक करें;
  • खुलने वाली विंडो में, "रिग्रेशन" बटन पर क्लिक करें;
  • दिखाई देने वाले टैब में, Y (छोड़ने वाले कर्मचारियों की संख्या) और X (उनके वेतन) के लिए मानों की श्रेणी दर्ज करें;
  • हम "ओके" बटन दबाकर अपने कार्यों की पुष्टि करते हैं।

नतीजतन, प्रोग्राम प्रतिगमन विश्लेषण डेटा के साथ स्प्रेडशीट की एक नई शीट को स्वचालित रूप से पॉप्युलेट करेगा। टिप्पणी! एक्सेल में इस उद्देश्य के लिए आपके द्वारा पसंद किए जाने वाले स्थान को मैन्युअल रूप से सेट करने की क्षमता है। उदाहरण के लिए, यह वही शीट हो सकती है जहां Y और X मान हैं, या यहां तक ​​कि विशेष रूप से ऐसे डेटा को संग्रहीत करने के लिए डिज़ाइन की गई एक नई कार्यपुस्तिका हो सकती है।

आर-स्क्वायर के लिए प्रतिगमन परिणामों का विश्लेषण

एक्सेल में, विचार किए गए उदाहरण के डेटा के प्रसंस्करण के दौरान प्राप्त डेटा इस तरह दिखता है:

सबसे पहले आपको आर-स्क्वायर के मान पर ध्यान देना चाहिए। यह दृढ़ संकल्प का गुणांक है। इस उदाहरण में, आर-स्क्वायर = 0.755 (75.5%), यानी, मॉडल के परिकलित पैरामीटर 75.5% द्वारा विचारित पैरामीटर के बीच संबंध की व्याख्या करते हैं। दृढ़ संकल्प के गुणांक का मूल्य जितना अधिक होगा, किसी विशेष कार्य के लिए चुने गए मॉडल को उतना ही अधिक लागू किया जाएगा। ऐसा माना जाता है कि यह 0.8 से ऊपर के आर-वर्ग मान के साथ वास्तविक स्थिति का सही वर्णन करता है। यदि आर-स्क्वेर्ड<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

अनुपात विश्लेषण

संख्या 64.1428 से पता चलता है कि Y का मान क्या होगा यदि हम जिस मॉडल पर विचार कर रहे हैं उसमें सभी चर xi शून्य पर सेट हैं। दूसरे शब्दों में, यह तर्क दिया जा सकता है कि विश्लेषित पैरामीटर का मूल्य अन्य कारकों से भी प्रभावित होता है जो किसी विशेष मॉडल में वर्णित नहीं हैं।

सेल B18 में स्थित अगला गुणांक -0.16285, Y पर चर X के प्रभाव के भार को दर्शाता है। इसका मतलब है कि विचाराधीन मॉडल के भीतर कर्मचारियों का औसत मासिक वेतन -0.16285 के भार के साथ छोड़ने वालों की संख्या को प्रभावित करता है, अर्थात। इसके प्रभाव की डिग्री बिल्कुल छोटी है। "-" चिह्न दर्शाता है कि गुणांक का मान ऋणात्मक है। यह स्पष्ट है, क्योंकि सभी जानते हैं कि उद्यम में वेतन जितना अधिक होता है, कम लोग रोजगार अनुबंध को समाप्त करने या छोड़ने की इच्छा व्यक्त करते हैं।

एकाधिक प्रतिगमन

यह शब्द फॉर्म के कई स्वतंत्र चर के साथ एक कनेक्शन समीकरण को संदर्भित करता है:

y \u003d f (x 1 + x 2 + ... x m) + ε, जहां y प्रभावी विशेषता (आश्रित चर) है, और x 1 , x 2 , ... x m कारक कारक (स्वतंत्र चर) हैं।

पैरामीटर अनुमान

एकाधिक प्रतिगमन (MR) के लिए इसे कम से कम वर्ग (OLS) की विधि का उपयोग करके किया जाता है। Y = a + b 1 x 1 +…+b m x m + ε के रूप के रैखिक समीकरणों के लिए, हम सामान्य समीकरणों की एक प्रणाली का निर्माण करते हैं (नीचे देखें)

विधि के सिद्धांत को समझने के लिए, दो-कारक मामले पर विचार करें। तब हमारे पास सूत्र द्वारा वर्णित स्थिति है

यहाँ से हमें मिलता है:

जहां σ सूचकांक में परिलक्षित संबंधित विशेषता का विचरण है।

एलएसएम एक मानक पैमाने पर एमपी समीकरण पर लागू होता है। इस मामले में, हमें समीकरण मिलता है:

जहाँ t y , t x 1, … t xm मानकीकृत चर हैं जिनके लिए माध्य मान 0 हैं; β मैं मानकीकृत प्रतिगमन गुणांक हैं, और मानक विचलन 1 है।

कृपया ध्यान दें कि इस मामले में सभी β i को सामान्यीकृत और केंद्रीकृत के रूप में सेट किया गया है, इसलिए एक दूसरे के साथ उनकी तुलना को सही और स्वीकार्य माना जाता है। इसके अलावा, यह उन कारकों को फ़िल्टर करने के लिए प्रथागत है, जिन्हें βi के सबसे छोटे मूल्यों के साथ छोड़ दिया जाता है।

रेखीय समाश्रयण समीकरण का उपयोग करने में समस्या

मान लीजिए कि पिछले 8 महीनों के दौरान किसी विशेष उत्पाद एन की कीमत की गतिशीलता की एक तालिका है। 1850 रूबल/टी की कीमत पर इसके बैच को खरीदने की सलाह पर निर्णय लेना आवश्यक है।

महीने की संख्या

महीने का नाम

आइटम एन की कीमत

1750 रूबल प्रति टन

1755 रूबल प्रति टन

1767 रूबल प्रति टन

1760 रूबल प्रति टन

1770 रूबल प्रति टन

1790 रूबल प्रति टन

प्रति टन 1810 रूबल

1840 रूबल प्रति टन

एक्सेल स्प्रेडशीट में इस समस्या को हल करने के लिए, आपको उपरोक्त उदाहरण से पहले से ज्ञात डेटा विश्लेषण टूल का उपयोग करने की आवश्यकता है। अगला, "प्रतिगमन" अनुभाग चुनें और पैरामीटर सेट करें। यह याद रखना चाहिए कि "इनपुट अंतराल Y" फ़ील्ड में, निर्भर चर के लिए मानों की एक श्रेणी (इस मामले में, वर्ष के विशिष्ट महीनों में किसी उत्पाद की कीमत) दर्ज की जानी चाहिए, और "इनपुट" में अंतराल एक्स" - स्वतंत्र चर (महीने की संख्या) के लिए। "ओके" पर क्लिक करके कार्रवाई की पुष्टि करें। एक नई शीट पर (यदि ऐसा संकेत दिया गया था), हमें प्रतिगमन के लिए डेटा मिलता है।

उनके आधार पर, हम y = ax + b के रूप का एक रेखीय समीकरण बनाते हैं, जहाँ पैरामीटर a और b महीने की संख्या के नाम के साथ पंक्ति के गुणांक हैं और गुणांक और "Y- प्रतिच्छेदन" पंक्ति से प्रतिगमन विश्लेषण के परिणामों के साथ शीट। इस प्रकार, समस्या 3 के लिए रेखीय प्रतिगमन समीकरण (LE) को इस प्रकार लिखा गया है:

उत्पाद की कीमत N = 11.714* माह संख्या + 1727.54।

या बीजगणितीय संकेतन में

वाई = 11.714 एक्स + 1727.54

परिणामों का विश्लेषण

यह तय करने के लिए कि परिणामी रेखीय प्रतिगमन समीकरण पर्याप्त है या नहीं, एकाधिक सहसंबंध गुणांक (एमसीसी) और दृढ़ संकल्प गुणांक का उपयोग किया जाता है, साथ ही फिशर का परीक्षण और छात्र का परीक्षण। एक्सेल तालिका में प्रतिगमन परिणामों के साथ, वे क्रमशः एकाधिक आर, आर-स्क्वायर, एफ-सांख्यिकीय और टी-सांख्यिकीय के नामों के तहत दिखाई देते हैं।

केएमसी आर स्वतंत्र और निर्भर चर के बीच संभाव्य संबंधों की जकड़न का आकलन करना संभव बनाता है। इसका उच्च मूल्य "महीने की संख्या" और "1 टन प्रति रूबल में माल एन की कीमत" चर के बीच काफी मजबूत संबंध को इंगित करता है। हालाँकि, इस रिश्ते की प्रकृति अज्ञात है।

दृढ़ संकल्प के गुणांक का वर्ग आर 2 (आरआई) कुल बिखराव के हिस्से की एक संख्यात्मक विशेषता है और प्रायोगिक डेटा के किस भाग के बिखराव को दर्शाता है, अर्थात। आश्रित चर के मान रैखिक प्रतिगमन समीकरण से मेल खाते हैं। विचाराधीन समस्या में, यह मान 84.8% के बराबर है, अर्थात, प्राप्त एसडी द्वारा सांख्यिकीय डेटा को उच्च स्तर की सटीकता के साथ वर्णित किया गया है।

एफ-सांख्यिकी, जिसे फिशर का परीक्षण भी कहा जाता है, का उपयोग एक रैखिक संबंध के महत्व का आकलन करने के लिए किया जाता है, इसके अस्तित्व की परिकल्पना का खंडन या पुष्टि करता है।

(छात्र का मानदंड) एक रैखिक संबंध के अज्ञात या मुक्त पद के साथ गुणांक के महत्व का मूल्यांकन करने में मदद करता है। यदि t-मानदंड का मान > t cr, तो रैखिक समीकरण के मुक्त पद के महत्वहीनता की परिकल्पना को अस्वीकार कर दिया जाता है।

मुक्त सदस्य के लिए विचाराधीन समस्या में, एक्सेल टूल्स का उपयोग करके, यह प्राप्त किया गया था कि टी = 169.20903, और पी = 2.89ई-12, यानी हमारे पास शून्य संभावना है कि मुक्त सदस्य के महत्व के बारे में सही परिकल्पना होगी अस्वीकार कर दिया। अज्ञात टी = 5.79405, और पी = 0.001158 पर गुणांक के लिए। दूसरे शब्दों में, संभावना है कि अज्ञात के लिए गुणांक के महत्व के बारे में सही परिकल्पना को अस्वीकार कर दिया जाएगा 0.12%।

इस प्रकार, यह तर्क दिया जा सकता है कि परिणामी रेखीय प्रतिगमन समीकरण पर्याप्त है।

शेयरों का एक ब्लॉक खरीदने की समीचीनता की समस्या

एक्सेल में एकाधिक प्रतिगमन एक ही डेटा विश्लेषण उपकरण का उपयोग करके किया जाता है। एक विशिष्ट लागू समस्या पर विचार करें।

NNN के प्रबंधन को MMM SA में 20% हिस्सेदारी खरीदने की सलाह पर निर्णय लेना चाहिए। पैकेज (जेवी) की लागत 70 मिलियन अमेरिकी डॉलर है। एनएनएन के विशेषज्ञों ने समान लेन-देन पर डेटा एकत्र किया। लाखों अमेरिकी डॉलर में व्यक्त ऐसे मापदंडों के अनुसार शेयरों के ब्लॉक के मूल्य का मूल्यांकन करने का निर्णय लिया गया:

  • देय खाते (वीके);
  • वार्षिक कारोबार (वीओ);
  • प्राप्य खाते (वीडी);
  • अचल संपत्तियों की लागत (SOF)।

इसके अलावा, हजारों अमेरिकी डॉलर में उद्यम के पैरामीटर पेरोल बकाया (V3 P) का उपयोग किया जाता है।

एक्सेल स्प्रेडशीट का उपयोग कर समाधान

सबसे पहले, आपको प्रारंभिक डेटा की एक तालिका बनाने की आवश्यकता है। यह इस तरह दिख रहा है:

  • "डेटा विश्लेषण" विंडो को कॉल करें;
  • "प्रतिगमन" अनुभाग का चयन करें;
  • बॉक्स में "इनपुट अंतराल वाई" कॉलम जी से आश्रित चर के मूल्यों की श्रेणी दर्ज करें;
  • "इनपुट अंतराल एक्स" विंडो के दाईं ओर लाल तीर वाले आइकन पर क्लिक करें और शीट पर कॉलम बी, सी, डी, एफ से सभी मानों की श्रेणी का चयन करें।

"नई वर्कशीट" चुनें और "ओके" पर क्लिक करें।

दी गई समस्या के लिए प्रतिगमन विश्लेषण प्राप्त करें।

परिणामों और निष्कर्षों की परीक्षा

एक्सेल स्प्रेडशीट शीट पर ऊपर प्रस्तुत गोल डेटा से "हम एकत्र करते हैं", प्रतिगमन समीकरण:

एसपी \u003d 0.103 * एसओएफ + 0.541 * वीओ - 0.031 * वीके + 0.405 * वीडी + 0.691 * वीजेडपी - 265.844।

अधिक परिचित गणितीय रूप में, इसे इस प्रकार लिखा जा सकता है:

वाई = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844

जेएससी "एमएमएम" के लिए डेटा तालिका में प्रस्तुत किया गया है:

उन्हें प्रतिगमन समीकरण में प्रतिस्थापित करने पर, उन्हें 64.72 मिलियन अमेरिकी डॉलर का आंकड़ा मिलता है। इसका मतलब यह है कि JSC MMM के शेयर नहीं खरीदे जाने चाहिए, क्योंकि उनका 70 मिलियन अमेरिकी डॉलर का मूल्य बढ़ा-चढ़ाकर बताया गया है।

जैसा कि आप देख सकते हैं, एक्सेल स्प्रेडशीट और प्रतिगमन समीकरण के उपयोग ने एक बहुत विशिष्ट लेनदेन की व्यवहार्यता के बारे में सूचित निर्णय लेना संभव बना दिया है।

अब आप जानते हैं कि प्रतिगमन क्या है। एक्सेल में ऊपर चर्चा किए गए उदाहरण अर्थमिति के क्षेत्र से व्यावहारिक समस्याओं को हल करने में आपकी सहायता करेंगे।

पिछले नोटों में, फोकस अक्सर एकल संख्यात्मक चर पर रहा है, जैसे म्यूचुअल फंड रिटर्न, वेब पेज लोड समय, या सॉफ्ट ड्रिंक की खपत। इसमें और निम्नलिखित नोटों में, हम एक या अधिक अन्य संख्यात्मक चर के मानों के आधार पर एक संख्यात्मक चर के मूल्यों की भविष्यवाणी करने के तरीकों पर विचार करेंगे।

सामग्री को उदाहरण के माध्यम से चित्रित किया जाएगा। कपड़ों की दुकान में बिक्री की मात्रा का पूर्वानुमान।डिस्काउंट क्लोथिंग स्टोर्स की सूरजमुखी श्रृंखला 25 वर्षों से लगातार विस्तार कर रही है। हालाँकि, कंपनी के पास वर्तमान में नए आउटलेट्स के चयन के लिए एक व्यवस्थित दृष्टिकोण नहीं है। वह स्थान जहाँ कंपनी एक नया स्टोर खोलने का इरादा रखती है, व्यक्तिपरक विचारों के आधार पर निर्धारित किया जाता है। चयन मानदंड अनुकूल किराये की स्थिति या स्टोर के आदर्श स्थान के प्रबंधक के विचार हैं। कल्पना कीजिए कि आप विशेष परियोजनाओं और योजना विभाग के प्रमुख हैं। आपको नए स्टोर खोलने के लिए एक रणनीतिक योजना विकसित करने का काम सौंपा गया है। इस योजना में नए खोले गए स्टोरों में वार्षिक बिक्री का पूर्वानुमान शामिल होना चाहिए। आप मानते हैं कि बिक्री स्थान सीधे राजस्व से संबंधित है और इस तथ्य को अपने निर्णय लेने की प्रक्रिया में शामिल करना चाहते हैं। आप एक सांख्यिकीय मॉडल कैसे विकसित करते हैं जो नए स्टोर आकार के आधार पर वार्षिक बिक्री की भविष्यवाणी करता है?

आमतौर पर, प्रतिगमन विश्लेषण का उपयोग चर के मूल्यों की भविष्यवाणी करने के लिए किया जाता है। इसका लक्ष्य एक सांख्यिकीय मॉडल विकसित करना है जो कम से कम एक स्वतंत्र, या व्याख्यात्मक, चर के मूल्यों से आश्रित चर, या प्रतिक्रिया के मूल्यों की भविष्यवाणी करता है। इस नोट में, हम एक साधारण रेखीय प्रतिगमन पर विचार करेंगे - एक सांख्यिकीय पद्धति जो आपको आश्रित चर के मूल्यों की भविष्यवाणी करने की अनुमति देती है वाईस्वतंत्र चर के मूल्यों द्वारा एक्स. निम्नलिखित नोट स्वतंत्र चर के मूल्यों की भविष्यवाणी करने के लिए डिज़ाइन किए गए एक बहु प्रतिगमन मॉडल का वर्णन करेंगे वाईकई आश्रित चर के मूल्यों से ( एक्स 1 , एक्स 2 , …, एक्स के).

नोट या प्रारूप में डाउनलोड करें, प्रारूप में उदाहरण

प्रतिगमन मॉडल के प्रकार

कहाँ ρ 1 स्वतःसंबंध गुणांक है; अगर ρ 1 = 0 (कोई स्वत: संबंध नहीं), डी≈ 2; अगर ρ 1 ≈ 1 (सकारात्मक स्वसहसंबंध), डी≈ 0; अगर ρ 1 = -1 (नकारात्मक स्वसहसंबंध), डी ≈ 4.

व्यवहार में, डर्बिन-वाटसन कसौटी का प्रयोग मूल्य की तुलना पर आधारित है डीमहत्वपूर्ण सैद्धांतिक मूल्यों के साथ डी एलऔर डी यूटिप्पणियों की एक निश्चित संख्या के लिए एन, मॉडल के स्वतंत्र चर की संख्या (सरल रेखीय प्रतिगमन के लिए = 1) और महत्व स्तर α। अगर डी< d L , यादृच्छिक विचलन की स्वतंत्रता की परिकल्पना को अस्वीकार कर दिया गया है (इसलिए, एक सकारात्मक स्वसंबंध है); अगर डी> डी यू, परिकल्पना को अस्वीकार नहीं किया गया है (अर्थात, कोई स्वसंबंध नहीं है); अगर डी एल< D < d U निर्णय लेने के लिए पर्याप्त कारण नहीं है। जब गणना मूल्य डी 2 से अधिक है, तो डी एलऔर डी यूयह वह गुणांक नहीं है जिसकी तुलना की जा रही है डी, और व्यंजक (4 - डी).

एक्सेल में डर्बिन-वाटसन के आँकड़ों की गणना करने के लिए, हम अंजीर में नीचे की तालिका की ओर मुड़ते हैं। 14 शेष निकासी. अभिव्यक्ति में अंश (10) की गणना फ़ंक्शन = SUMMQDIFF(array1, array2), और भाजक = SUMMQ(सरणी) (चित्र 16) का उपयोग करके की जाती है।

चावल। 16. डर्बिन-वाटसन आँकड़ों की गणना के लिए सूत्र

हमारे उदाहरण में डी= 0.883। मुख्य प्रश्न यह है: डर्बिन-वाटसन सांख्यिकी के किस मूल्य को इतना छोटा माना जाना चाहिए कि यह निष्कर्ष निकाला जा सके कि एक सकारात्मक स्वसंबंध है? डी के मूल्य को महत्वपूर्ण मूल्यों के साथ सहसंबंधित करना आवश्यक है ( डी एलऔर डी यू) टिप्पणियों की संख्या के आधार पर एनऔर सार्थकता स्तर α (चित्र 17)।

चावल। 17. डर्बिन-वाटसन आँकड़ों के महत्वपूर्ण मूल्य (तालिका खंड)

इस प्रकार, आपके घर पर सामान पहुंचाने वाले स्टोर में बिक्री की मात्रा की समस्या में, एक स्वतंत्र चर है ( = 1), 15 प्रेक्षण ( एन= 15) और सार्थकता स्तर α = 0.05। इस तरह, डी एल= 1.08 और डीयू= 1.36। क्योंकि डी = 0,883 < डी एल= 1.08, अवशिष्टों के बीच एक सकारात्मक स्वत: संबंध है, कम से कम वर्ग विधि लागू नहीं की जा सकती।

ढलान और सहसंबंध गुणांक के बारे में परीक्षण परिकल्पना

उपरोक्त प्रतिगमन केवल पूर्वानुमान के लिए लागू किया गया था। प्रतिगमन गुणांक निर्धारित करने और एक चर के मूल्य की भविष्यवाणी करने के लिए वाईकिसी दिए गए चर मान के लिए एक्सन्यूनतम वर्ग विधि का प्रयोग किया गया। इसके अलावा, हमने अनुमान की मानक त्रुटि और मिश्रित सहसंबंध के गुणांक पर विचार किया। यदि अवशिष्ट विश्लेषण पुष्टि करता है कि कम से कम वर्ग विधि की प्रयोज्यता शर्तों का उल्लंघन नहीं किया गया है, और नमूना डेटा के आधार पर सरल रैखिक प्रतिगमन मॉडल पर्याप्त है, तो यह तर्क दिया जा सकता है कि जनसंख्या में चर के बीच एक रैखिक संबंध है।

आवेदनटी ढलान के लिए मानदंड।यह जाँच कर कि क्या जनसंख्या ढलान β 1 शून्य के बराबर है, कोई यह निर्धारित कर सकता है कि चर के बीच सांख्यिकीय रूप से महत्वपूर्ण संबंध है या नहीं एक्सऔर वाई. यदि इस परिकल्पना को अस्वीकार कर दिया जाता है, तो यह तर्क दिया जा सकता है कि चर के बीच एक्सऔर वाईएक रैखिक संबंध है। अशक्त और वैकल्पिक परिकल्पना निम्नानुसार तैयार की जाती है: H 0: β 1 = 0 (कोई रैखिक संबंध नहीं), H1: β 1 ≠ 0 (एक रैखिक संबंध है)। ए-प्राथमिकता टी-सांख्यिकीय नमूना ढलान और काल्पनिक जनसंख्या ढलान के बीच के अंतर के बराबर है, जो ढलान अनुमान की मानक त्रुटि से विभाजित है:

(11) टी = (बी 1 β 1 ) / एसबी 1

कहाँ बी 1 नमूना डेटा के आधार पर प्रत्यक्ष प्रतिगमन का ढलान है, β1 प्रत्यक्ष सामान्य जनसंख्या का काल्पनिक ढलान है, , और परीक्षण आँकड़े टीयह है टी- के साथ वितरण एन - 2स्वतंत्रता की कोटियां।

आइए देखें कि α = 0.05 पर स्टोर आकार और वार्षिक बिक्री के बीच सांख्यिकीय रूप से महत्वपूर्ण संबंध है या नहीं। टी-मानदंड का उपयोग करते समय अन्य मापदंडों के साथ प्रदर्शित किया जाता है विश्लेषण पैकेज(विकल्प वापसी). विश्लेषण पैकेज के पूर्ण परिणाम चित्र में दिखाए गए हैं। 4, टी-सांख्यिकी से संबंधित एक टुकड़ा - अंजीर में। 18.

चावल। 18. आवेदन के परिणाम टी

क्योंकि दुकानों की संख्या एन= 14 (चित्र 3 देखें), महत्वपूर्ण मूल्य टी-सांख्यिकी महत्व स्तर α = 0.05 सूत्र द्वारा पाया जा सकता है: टी एल= STUDENT.INV(0.025;12) = -2.1788 जहां 0.025 महत्व स्तर का आधा है और 12 = एन – 2; टी यू\u003d छात्र.INV (0.975, 12) \u003d +2.1788।

क्योंकि टी-सांख्यिकी = 10.64> टी यू= 2.1788 (चित्र 19), अशक्त परिकल्पना एच 0अस्वीकृत है। दूसरी ओर, आर-के लिए मूल्य एक्स\u003d 10.6411, सूत्र द्वारा गणना की गई \u003d 1-छात्र.DIST (D3, 12, TRUE), लगभग शून्य के बराबर है, इसलिए परिकल्पना एच 0पुनः अस्वीकृत हो जाता है। यह तथ्य कि आर-मूल्य लगभग शून्य है, जिसका अर्थ है कि यदि स्टोर आकार और वार्षिक बिक्री के बीच कोई वास्तविक रैखिक संबंध नहीं होता, तो रैखिक प्रतिगमन का उपयोग करके इसे खोजना लगभग असंभव होगा। इसलिए, औसत वार्षिक स्टोर बिक्री और स्टोर आकार के बीच सांख्यिकीय रूप से महत्वपूर्ण रैखिक संबंध है।

चावल। 19. स्वतंत्रता के 0.05 और 12 डिग्री के महत्व स्तर पर सामान्य आबादी के ढलान के बारे में परिकल्पना का परीक्षण

आवेदनएफ ढलान के लिए मानदंड।एक साधारण रेखीय प्रतिगमन के ढलान के बारे में परिकल्पना के परीक्षण के लिए एक वैकल्पिक दृष्टिकोण का उपयोग करना है एफ-मानदंड। याद करें कि एफ-मानदंड का उपयोग दो भिन्नताओं के बीच संबंधों का परीक्षण करने के लिए किया जाता है (विवरण देखें)। ढलान परिकल्पना का परीक्षण करते समय, यादृच्छिक त्रुटियों का माप त्रुटि विचरण (स्वतंत्रता की डिग्री की संख्या से विभाजित चुकता त्रुटियों का योग) है, इसलिए एफ-टेस्ट प्रतिगमन द्वारा समझाए गए विचरण के अनुपात का उपयोग करता है (अर्थात, मान एसएसआरस्वतंत्र चर की संख्या से विभाजित ), त्रुटि भिन्नता के लिए ( एमएसई = एसवाईएक्स 2 ).

ए-प्राथमिकता एफ-सांख्यिकी प्रतिगमन (MSR) के कारण औसत चुकता विचलन के बराबर है जो त्रुटि विचरण (MSE) से विभाजित है: एफ = एमएसआर/ एमएसई, कहाँ एमएसआर =एसएसआर / , एमएसई =एसएसई/(एन- के - 1), केप्रतिगमन मॉडल में स्वतंत्र चर की संख्या है। परीक्षण आँकड़े एफयह है एफ- के साथ वितरण और एन- के - 1स्वतंत्रता की कोटियां।

किसी दिए गए महत्व स्तर α के लिए, निर्णय नियम निम्नानुसार तैयार किया गया है: यदि एफ > एफयूशून्य परिकल्पना को अस्वीकार कर दिया गया है; अन्यथा, इसे अस्वीकार नहीं किया जाता है। विचरण के विश्लेषण की सारांश तालिका के रूप में प्रस्तुत परिणाम, अंजीर में दिखाए गए हैं। 20.

चावल। 20. प्रतिगमन गुणांक के सांख्यिकीय महत्व की परिकल्पना का परीक्षण करने के लिए विचरण के विश्लेषण की तालिका

उसी प्रकार टी-मानदंड एफ-मानदंड का उपयोग करते समय तालिका में प्रदर्शित किया जाता है विश्लेषण पैकेज(विकल्प वापसी). काम का पूरा परिणाम विश्लेषण पैकेजचित्र में दिखाया गया है। 4, से संबंधित टुकड़ा एफ-सांख्यिकी - अंजीर में। 21.

चावल। 21. आवेदन परिणाम एफ- एक्सेल एनालिसिस टूलपैक का उपयोग करके प्राप्त मानदंड

एफ-सांख्यिकीय 113.23 और है आर-मूल्य शून्य के करीब (सेल महत्वएफ). यदि महत्व स्तर α 0.05 है, तो महत्वपूर्ण मान निर्धारित करें एफ-स्वतंत्रता की एक और 12 डिग्री वाले वितरण सूत्र से प्राप्त किए जा सकते हैं एफ यू\u003d एफ। ओबीआर (1-0.05; 1; 12) \u003d 4.7472 (चित्र। 22)। क्योंकि एफ = 113,23 > एफ यू= 4.7472, और आर-मूल्य 0 के करीब< 0,05, нулевая гипотеза एच 0विचलन, अर्थात् एक स्टोर का आकार उसकी वार्षिक बिक्री की मात्रा से निकटता से संबंधित है।

चावल। 22. स्वतंत्रता के एक और 12 डिग्री के साथ 0.05 के महत्व स्तर पर सामान्य आबादी के ढलान के बारे में परिकल्पना का परीक्षण

ढलान β 1 युक्त विश्वास अंतराल।चर के बीच एक रैखिक संबंध के अस्तित्व की परिकल्पना का परीक्षण करने के लिए, आप ढलान β 1 वाले एक विश्वास अंतराल का निर्माण कर सकते हैं और यह सुनिश्चित कर सकते हैं कि काल्पनिक मान β 1 = 0 इस अंतराल से संबंधित है। ढलान β 1 युक्त विश्वास अंतराल का केंद्र नमूना ढलान है बी 1 , और इसकी सीमाएँ मात्राएँ हैं बी 1 ±टी एन –2 एसबी 1

जैसा कि चित्र में दिखाया गया है। 18, बी 1 = +1,670, एन = 14, एसबी 1 = 0,157. टी 12 \u003d छात्र.ओबीआर (0.975, 12) \u003d 2.1788। इस तरह, बी 1 ±टी एन –2 एसबी 1 = +1.670 ± 2.1788 * 0.157 = +1.670 ± 0.342, या + 1.328 ≤ β 1 ≤ +2.012। इस प्रकार, 0.95 की संभावना के साथ जनसंख्या का ढलान +1.328 से +2.012 (यानी, $1,328,000 से $2,012,000 तक) की सीमा में है। क्योंकि ये मान शून्य से अधिक हैं, वार्षिक बिक्री और स्टोर क्षेत्र के बीच सांख्यिकीय रूप से महत्वपूर्ण रैखिक संबंध है। यदि कॉन्फिडेंस इंटरवल में शून्य होता है, तो वेरिएबल्स के बीच कोई संबंध नहीं होगा। इसके अलावा, कॉन्फ़िडेंस इंटरवल का मतलब है कि हर 1,000 sq. फीट के परिणामस्वरूप औसत बिक्री $1,328,000 से $2,012,000 तक बढ़ जाती है।

प्रयोगटी सहसंबंध गुणांक के लिए मानदंड।सहसंबंध गुणांक पेश किया गया था आर, जो दो अंकीय चरों के बीच संबंध का माप है। इसका उपयोग यह निर्धारित करने के लिए किया जा सकता है कि क्या दो चर के बीच सांख्यिकीय रूप से महत्वपूर्ण संबंध है। आइए हम प्रतीक ρ द्वारा दोनों चरों की आबादी के बीच सहसंबंध गुणांक को निरूपित करें। अशक्त और वैकल्पिक परिकल्पनाएँ निम्नानुसार तैयार की जाती हैं: एच 0: ρ = 0 (कोई सहसंबंध नहीं), एच 1: ρ ≠ 0 (एक सहसंबंध है)। सहसंबंध के अस्तित्व की जाँच:

कहाँ आर = + , अगर बी 1 > 0, आर = – , अगर बी 1 < 0. Тестовая статистика टीयह है टी- के साथ वितरण एन - 2स्वतंत्रता की कोटियां।

सूरजमुखी स्टोर चेन की समस्या में आर 2= 0.904, और बी 1- +1.670 (चित्र 4 देखें)। क्योंकि बी 1> 0, वार्षिक बिक्री और स्टोर आकार के बीच सहसंबंध गुणांक है आर= +√0.904 = +0.951। आइए अशक्त परिकल्पना का परीक्षण करें कि इन चरों का उपयोग करने के बीच कोई संबंध नहीं है टी- आँकड़े:

α = 0.05 के महत्व स्तर पर, शून्य परिकल्पना को अस्वीकार कर दिया जाना चाहिए क्योंकि टी= 10.64 > 2.1788। इस प्रकार, यह तर्क दिया जा सकता है कि वार्षिक बिक्री और स्टोर आकार के बीच सांख्यिकीय रूप से महत्वपूर्ण संबंध है।

जनसंख्या ढलानों के बारे में अनुमानों पर चर्चा करते समय, विश्वास अंतराल और परिकल्पना परीक्षण के मानदंड विनिमेय उपकरण हैं। हालाँकि, सहसंबंध गुणांक वाले विश्वास अंतराल की गणना अधिक कठिन हो जाती है, क्योंकि सांख्यिकीय के नमूनाकरण वितरण का रूप आरसही सहसंबंध गुणांक पर निर्भर करता है।

गणितीय अपेक्षा का अनुमान और व्यक्तिगत मूल्यों की भविष्यवाणी

यह खंड अपेक्षित प्रतिक्रिया का अनुमान लगाने के तरीकों पर चर्चा करता है वाईऔर व्यक्तिगत मूल्यों की भविष्यवाणी वाईचर के दिए गए मानों के लिए एक्स.

एक विश्वास अंतराल का निर्माण।उदाहरण 2 में (उपरोक्त अनुभाग देखें कम से कम वर्ग विधि) प्रतिगमन समीकरण ने चर के मान की भविष्यवाणी करना संभव बना दिया वाई एक्स. रिटेल आउटलेट के लिए स्थान चुनने की समस्या में, 4000 वर्ग मीटर के क्षेत्र वाले स्टोर में औसत वार्षिक बिक्री। फीट 7.644 मिलियन डॉलर के बराबर था। हालांकि, सामान्य आबादी की गणितीय अपेक्षा का यह अनुमान एक बिंदु है। सामान्य आबादी की गणितीय अपेक्षा का अनुमान लगाने के लिए, विश्वास अंतराल की अवधारणा प्रस्तावित की गई थी। इसी तरह, कोई अवधारणा पेश कर सकता है प्रतिक्रिया की गणितीय अपेक्षा के लिए विश्वास अंतरालएक चर के दिए गए मान के लिए एक्स:

कहाँ , = बी 0 + बी 1 एक्स मैं- अनुमानित मूल्य चर वाईपर एक्स = एक्स मैं, एस वाईएक्समाध्य वर्ग त्रुटि है, एननमूना आकार है, एक्समैं- चर का दिया गया मान एक्स, µ वाई|एक्स = एक्समैं- एक चर की गणितीय अपेक्षा वाईपर एक्स = मैं,एसएसएक्स=

सूत्र (13) के विश्लेषण से पता चलता है कि विश्वास अंतराल की चौड़ाई कई कारकों पर निर्भर करती है। महत्व के दिए गए स्तर पर, औसत वर्ग त्रुटि का उपयोग करके मापी गई प्रतिगमन रेखा के चारों ओर उतार-चढ़ाव के आयाम में वृद्धि, अंतराल की चौड़ाई में वृद्धि की ओर ले जाती है। दूसरी ओर, अपेक्षा के अनुरूप, नमूना आकार में वृद्धि अंतराल के संकुचन के साथ होती है। इसके अलावा, अंतराल की चौड़ाई मूल्यों के आधार पर बदलती है एक्समैं. यदि चर का मान वाईमात्रा के लिए भविष्यवाणी की एक्स, औसत मूल्य के करीब , माध्य से दूर मूल्यों के लिए प्रतिक्रिया की भविष्यवाणी करने की तुलना में विश्वास अंतराल संकीर्ण हो जाता है।

मान लीजिए कि किसी स्टोर के लिए स्थान चुनते समय, हम 4000 वर्ग मीटर के क्षेत्र वाले सभी स्टोरों में औसत वार्षिक बिक्री के लिए 95% विश्वास अंतराल बनाना चाहते हैं। पैर:

इसलिए, 4,000 वर्ग मीटर के क्षेत्र के साथ सभी दुकानों में औसत वार्षिक बिक्री की मात्रा। फुट, 95% संभावना के साथ 6.971 से 8.317 मिलियन डॉलर की सीमा में है।

अनुमानित मान के लिए कॉन्फिडेंस इंटरवल की गणना करें।चर के दिए गए मान के लिए प्रतिक्रिया की गणितीय अपेक्षा के लिए विश्वास अंतराल के अलावा एक्स, अक्सर अनुमानित मान के लिए कॉन्फिडेंस इंटरवल जानना आवश्यक होता है। हालांकि इस तरह के एक विश्वास अंतराल की गणना करने का सूत्र सूत्र (13) के समान है, इस अंतराल में एक अनुमानित मूल्य होता है और पैरामीटर का अनुमान नहीं होता है। अनुमानित प्रतिक्रिया के लिए अंतराल वाईएक्स = क्सीचर के एक विशिष्ट मूल्य के लिए एक्समैंसूत्र द्वारा निर्धारित किया जाता है:

मान लेते हैं कि रिटेल आउटलेट के लिए स्थान चुनते समय, हम 4000 वर्ग मीटर के क्षेत्रफल वाले स्टोर में अनुमानित वार्षिक बिक्री मात्रा के लिए 95% विश्वास अंतराल बनाना चाहते हैं। पैर:

इसलिए, 4,000 वर्ग फुट के लिए अनुमानित वार्षिक बिक्री की मात्रा। फुट, 95% संभावना के साथ 5.433 से 9.854 मिलियन डॉलर की सीमा में है। जैसा कि आप देख सकते हैं, अनुमानित प्रतिक्रिया मूल्य के लिए विश्वास अंतराल इसकी गणितीय अपेक्षा के लिए विश्वास अंतराल से बहुत व्यापक है। ऐसा इसलिए है क्योंकि अपेक्षित मूल्य का अनुमान लगाने की तुलना में व्यक्तिगत मूल्यों की भविष्यवाणी करने में परिवर्तनशीलता बहुत अधिक है।

प्रतिगमन के उपयोग से जुड़े नुकसान और नैतिक मुद्दे

प्रतिगमन विश्लेषण से जुड़ी कठिनाइयाँ:

  • कम से कम वर्गों की विधि की प्रयोज्यता की शर्तों की उपेक्षा करना।
  • कम से कम वर्गों की विधि की प्रयोज्यता के लिए शर्तों का एक गलत अनुमान।
  • कम से कम वर्ग विधि की प्रयोज्यता की शर्तों के उल्लंघन में वैकल्पिक तरीकों का गलत विकल्प।
  • अध्ययन के विषय के गहन ज्ञान के बिना प्रतिगमन विश्लेषण का अनुप्रयोग।
  • व्याख्यात्मक चर की सीमा से परे प्रतिगमन का एक्सट्रपलेशन।
  • सांख्यिकीय और कारण संबंधों के बीच भ्रम।

स्प्रैडशीट्स और सांख्यिकीय सॉफ़्टवेयर के व्यापक उपयोग ने कम्प्यूटेशनल समस्याओं को समाप्त कर दिया है जो प्रतिगमन विश्लेषण के उपयोग को रोकता है। हालाँकि, इससे यह तथ्य सामने आया कि प्रतिगमन विश्लेषण का उपयोग उन उपयोगकर्ताओं द्वारा किया जाने लगा जिनके पास पर्याप्त योग्यता और ज्ञान नहीं है। उपयोगकर्ताओं को वैकल्पिक तरीकों के बारे में कैसे पता चलेगा यदि उनमें से कई को कम से कम वर्ग विधि की प्रयोज्यता के लिए शर्तों के बारे में कोई जानकारी नहीं है और यह नहीं जानते कि उनके कार्यान्वयन की जांच कैसे करें?

शोधकर्ता को संख्याओं को पीसकर - शिफ्ट, ढलान और मिश्रित सहसंबंध गुणांक की गणना करके दूर नहीं किया जाना चाहिए। उसे गहन ज्ञान की आवश्यकता है। आइए इसे पाठ्यपुस्तकों से लिए गए एक उत्कृष्ट उदाहरण से स्पष्ट करें। Anscombe ने दिखाया कि सभी चार डेटासेट अंजीर में दिखाए गए हैं। 23 में समान प्रतिगमन पैरामीटर हैं (चित्र 24)।

चावल। 23. चार कृत्रिम डेटा सेट

चावल। 24. चार कृत्रिम डेटा सेटों का प्रतिगमन विश्लेषण; पूर्ण हो गया विश्लेषण पैकेज(चित्र को बड़ा करने के लिए चित्र पर क्लिक करें)

इसलिए, प्रतिगमन विश्लेषण के दृष्टिकोण से, ये सभी डेटा सेट पूरी तरह से समान हैं। यदि विश्लेषण वहीं समाप्त हो जाता है, तो हम बहुत सी उपयोगी जानकारी खो देंगे। यह इन डेटा सेटों के लिए निर्मित तितर बितर भूखंडों (चित्र 25) और अवशिष्ट भूखंडों (चित्र 26) से स्पष्ट है।

चावल। 25. चार डेटासेट के लिए स्कैटर प्लॉट

स्कैटर प्लॉट और अवशिष्ट प्लॉट दिखाते हैं कि ये डेटा एक दूसरे से अलग हैं। एक सीधी रेखा के साथ वितरित एकमात्र सेट सेट ए है। सेट ए से गणना किए गए अवशेषों के प्लॉट का कोई पैटर्न नहीं है। सेट बी, सी और डी के लिए ऐसा नहीं कहा जा सकता है। सेट बी के लिए प्लॉट किया गया स्कैटर प्लॉट एक स्पष्ट द्विघात पैटर्न दिखाता है। इस निष्कर्ष की पुष्टि अवशेषों के प्लॉट से होती है, जिसमें एक परवलयिक आकार होता है। स्कैटर प्लॉट और अवशिष्ट प्लॉट दिखाते हैं कि डेटासेट B में एक आउटलायर है। इस स्थिति में, डेटा सेट से बाहरी को बाहर करना और विश्लेषण को दोहराना आवश्यक है। प्रेक्षणों से बाहरी कारकों का पता लगाने और उन्हें दूर करने की तकनीक को प्रभाव विश्लेषण कहा जाता है। आउटलेयर को खत्म करने के बाद, मॉडल के पुनर्मूल्यांकन का परिणाम पूरी तरह से अलग हो सकता है। डेटा सेट डी से प्लॉट किया गया एक स्कैटरप्लॉट एक असामान्य स्थिति दिखाता है जिसमें अनुभवजन्य मॉडल एकल प्रतिक्रिया पर अत्यधिक निर्भर होता है ( एक्स 8 = 19, वाई 8 = 12.5)। ऐसे प्रतिगमन मॉडल की गणना विशेष रूप से सावधानीपूर्वक की जानी चाहिए। तो, बिखराव और अवशिष्ट भूखंड प्रतिगमन विश्लेषण के लिए एक आवश्यक उपकरण हैं और इसका एक अभिन्न अंग होना चाहिए। उनके बिना, प्रतिगमन विश्लेषण विश्वसनीय नहीं है।

चावल। 26. चार डेटासेट के लिए अवशिष्टों का प्लॉट

प्रतिगमन विश्लेषण में नुकसान से कैसे बचें:

  • चर के बीच संभावित संबंध का विश्लेषण एक्सऔर वाईहमेशा एक स्कैटरप्लॉट से शुरू करें।
  • प्रतिगमन विश्लेषण के परिणामों की व्याख्या करने से पहले, इसकी प्रयोज्यता के लिए शर्तों की जाँच करें।
  • अवशिष्ट बनाम स्वतंत्र चर प्लॉट करें। यह यह निर्धारित करने की अनुमति देगा कि अनुभवजन्य मॉडल अवलोकन के परिणामों से कैसे मेल खाता है, और विचरण की स्थिरता के उल्लंघन का पता लगाने के लिए।
  • त्रुटियों के सामान्य वितरण की धारणा का परीक्षण करने के लिए हिस्टोग्राम, स्टेम और लीफ प्लॉट, बॉक्स प्लॉट और सामान्य वितरण प्लॉट का उपयोग करें।
  • यदि कम से कम वर्ग विधि की प्रयोज्यता की शर्तें पूरी नहीं होती हैं, तो वैकल्पिक विधियों का उपयोग करें (उदाहरण के लिए, द्विघात या एकाधिक प्रतिगमन मॉडल)।
  • यदि कम से कम वर्ग विधि की प्रयोज्यता शर्तों को पूरा किया जाता है, तो प्रतिगमन गुणांक के सांख्यिकीय महत्व के बारे में परिकल्पना का परीक्षण करना और गणितीय अपेक्षा और अनुमानित प्रतिक्रिया मूल्य वाले विश्वास अंतराल का निर्माण करना आवश्यक है।
  • स्वतंत्र चर की सीमा के बाहर निर्भर चर के मूल्यों की भविष्यवाणी करने से बचें।
  • ध्यान रखें कि सांख्यिकीय निर्भरताएँ हमेशा कारणात्मक नहीं होती हैं। याद रखें कि चर के बीच संबंध का मतलब यह नहीं है कि उनके बीच एक कारण संबंध है।

सारांश।जैसा कि ब्लॉक आरेख (चित्र 27) में दिखाया गया है, नोट एक सरल रेखीय प्रतिगमन मॉडल, इसकी प्रयोज्यता की शर्तों और इन स्थितियों का परीक्षण करने के तरीकों का वर्णन करता है। माना टीप्रतिगमन के ढलान के सांख्यिकीय महत्व के परीक्षण के लिए मानदंड। निर्भर चर के मूल्यों की भविष्यवाणी करने के लिए एक प्रतिगमन मॉडल का उपयोग किया गया था। एक रिटेल आउटलेट के लिए जगह के चुनाव से संबंधित एक उदाहरण पर विचार किया जाता है, जिसमें स्टोर क्षेत्र पर वार्षिक बिक्री की मात्रा की निर्भरता का अध्ययन किया जाता है। प्राप्त जानकारी आपको स्टोर के लिए अधिक सटीक स्थान का चयन करने और इसकी वार्षिक बिक्री की भविष्यवाणी करने की अनुमति देती है। निम्नलिखित नोट्स में, प्रतिगमन विश्लेषण की चर्चा जारी रहेगी, साथ ही साथ कई प्रतिगमन मॉडल भी।

चावल। 27. नोट का ब्लॉक आरेख

पुस्तक लेविन एट अल की सामग्री प्रबंधकों के लिए सांख्यिकी का उपयोग किया जाता है। - एम .: विलियम्स, 2004. - पी। 792-872

यदि आश्रित चर स्पष्ट है, तो लॉजिस्टिक प्रतिगमन लागू किया जाना चाहिए।

ग्राफिकल विधि का उपयोग करना.
अध्ययन किए गए आर्थिक संकेतकों के बीच संचार के रूप की कल्पना करने के लिए इस पद्धति का उपयोग किया जाता है। ऐसा करने के लिए, एक आयताकार समन्वय प्रणाली में एक ग्राफ तैयार किया जाता है, परिणामी विशेषता Y के अलग-अलग मूल्यों को ऑर्डिनेट अक्ष के साथ प्लॉट किया जाता है, और कारक विशेषता X के अलग-अलग मानों को एब्सिस्सा अक्ष के साथ प्लॉट किया जाता है।
प्रभावी और कारक चिह्नों के बिंदुओं के समुच्चय को कहा जाता है सहसंबंध क्षेत्र.
सहसंबंध क्षेत्र के आधार पर, परिकल्पना (सामान्य जनसंख्या के लिए) की जा सकती है कि एक्स और वाई के सभी संभावित मूल्यों के बीच संबंध रैखिक है।

रैखिक प्रतिगमन समीकरणरूप y = bx + a + ε है
यहाँ ε एक यादृच्छिक त्रुटि (विचलन, गड़बड़ी) है।
यादृच्छिक त्रुटि के अस्तित्व के कारण:
1. प्रतिगमन मॉडल में महत्वपूर्ण व्याख्यात्मक चर शामिल नहीं;
2. चरों का एकत्रीकरण। उदाहरण के लिए, कुल उपभोग फलन व्यक्तियों के व्यक्तिगत व्यय निर्णयों की समग्रता की सामान्य अभिव्यक्ति का एक प्रयास है। यह केवल अलग-अलग रिश्तों का अनुमान है जिनके अलग-अलग पैरामीटर हैं।
3. मॉडल संरचना का गलत विवरण;
4. गलत कार्यात्मक विनिर्देश;
5. माप त्रुटियां।
चूंकि विचलन ε i प्रत्येक विशेष अवलोकन के लिए यादृच्छिक हैं और नमूने में उनके मूल्य अज्ञात हैं, फिर:
1) टिप्पणियों x i और y i के अनुसार, केवल पैरामीटर α और β का अनुमान प्राप्त किया जा सकता है
2) प्रतिगमन मॉडल के पैरामीटर α और β का अनुमान क्रमशः ए और बी के मान हैं, जो प्रकृति में यादृच्छिक हैं, क्योंकि एक यादृच्छिक नमूने के अनुरूप;
तब अनुमानित प्रतिगमन समीकरण (नमूना डेटा से निर्मित) y = bx + a + ε जैसा दिखेगा, जहां e i त्रुटियों के देखे गए मान (अनुमान) हैं ε i , और b, क्रमशः, के अनुमान प्रतिगमन मॉडल के पैरामीटर α और β जो पाए जाने चाहिए।
मापदंडों का अनुमान लगाने के लिए α और β - LSM (न्यूनतम वर्ग) का उपयोग करें।
सामान्य समीकरणों की प्रणाली।

हमारे डेटा के लिए, समीकरणों की प्रणाली का रूप है:

10ए + 356बी = 49
356ए + 2135बी = 9485

पहले समीकरण से a को व्यक्त करें और इसे दूसरे समीकरण में प्रतिस्थापित करें
हमें b = 68.16, a = 11.17 मिलता है

प्रतिगमन समीकरण:
वाई = 68.16 x - 11.17

1. प्रतिगमन समीकरण के पैरामीटर।
नमूना का अर्थ है।



नमूना विचलन।


मानक विचलन

1.1। सहसंबंध गुणांक
हम संचार की निकटता के संकेतक की गणना करते हैं। ऐसा संकेतक एक चयनात्मक रैखिक सहसंबंध गुणांक है, जिसकी गणना सूत्र द्वारा की जाती है:

रैखिक सहसंबंध गुणांक -1 से +1 तक मान लेता है।
सुविधाओं के बीच संबंध कमजोर या मजबूत (करीबी) हो सकते हैं। चाडॉक स्केल पर उनके मानदंड बनाए गए हैं:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
हमारे उदाहरण में, फ़ीचर Y कारक X के बीच संबंध बहुत उच्च और प्रत्यक्ष है।

1.2। प्रतिगमन समीकरण(प्रतिगमन समीकरण का मूल्यांकन)।

रैखिक प्रतिगमन समीकरण y = 68.16 x -11.17 है
एक रेखीय प्रतिगमन समीकरण के गुणांकों को आर्थिक अर्थ दिया जा सकता है। प्रतिगमन समीकरण गुणांकदिखाता है कि कितनी इकाइयाँ हैं परिणाम तब बदलेगा जब कारक 1 इकाई से बदल जाएगा।
गुणांक b = 68.16 प्रभावी सूचक (y की इकाइयों में) में औसत परिवर्तन को दर्शाता है, इसके माप के कारक x प्रति इकाई के मूल्य में वृद्धि या कमी के साथ। इस उदाहरण में, 1 इकाई की वृद्धि के साथ, y में औसतन 68.16 की वृद्धि होती है।
गुणांक a = -11.17 औपचारिक रूप से y का अनुमानित स्तर दिखाता है, लेकिन केवल तभी जब x=0 नमूना मूल्यों के करीब हो।
लेकिन अगर x = 0 x नमूना मूल्यों से दूर है, तो एक शाब्दिक व्याख्या से गलत परिणाम हो सकते हैं, और भले ही प्रतिगमन रेखा देखे गए नमूने के मूल्यों का सटीक वर्णन करती है, इस बात की कोई गारंटी नहीं है कि यह भी होगा मामला जब बाईं ओर या दाईं ओर एक्सट्रपलेशन करता है।
प्रतिगमन समीकरण में x के संबंधित मानों को प्रतिस्थापित करके, प्रत्येक अवलोकन के लिए प्रभावी सूचक y(x) के संरेखित (अनुमानित) मानों को निर्धारित करना संभव है।
Y और x के बीच का संबंध प्रतिगमन गुणांक b के चिह्न को निर्धारित करता है (यदि > 0 - प्रत्यक्ष संबंध, अन्यथा - व्युत्क्रम)। हमारे उदाहरण में, कनेक्शन प्रत्यक्ष है।

1.3। लोच गुणांक।
घटना में प्रभावी विशेषता पर कारकों के प्रभाव के प्रत्यक्ष मूल्यांकन के लिए प्रतिगमन गुणांक (उदाहरण के लिए बी) का उपयोग करना अवांछनीय है कि प्रभावी संकेतक y और कारक विशेषता x के माप की इकाइयों में अंतर है।
इन उद्देश्यों के लिए, लोच गुणांक और बीटा गुणांक की गणना की जाती है। लोच का गुणांक सूत्र द्वारा पाया जाता है:


यह दिखाता है कि प्रभावी गुण y में औसतन कितने प्रतिशत परिवर्तन होता है जब कारक गुण x में 1% परिवर्तन होता है। यह कारकों के उतार-चढ़ाव की डिग्री को ध्यान में नहीं रखता है।
हमारे उदाहरण में, लोच गुणांक 1 से अधिक है। इसलिए, यदि X 1% बदलता है, तो Y 1% से अधिक बदल जाएगा। दूसरे शब्दों में, X महत्वपूर्ण रूप से Y को प्रभावित करता है।
बीटा गुणांकअपने मानक विचलन के मूल्य के किस हिस्से से पता चलता है कि प्रभावी विशेषता का मूल्य औसत रूप से बदल जाएगा जब कारक विशेषता अपने मानक विचलन के मूल्य से एक स्थिर स्तर पर तय शेष स्वतंत्र चर के मूल्य के साथ बदलती है:

वे। इस सूचक के मानक विचलन के मान से x में वृद्धि से इस सूचक के मानक विचलन के औसत Y में 0.9796 की वृद्धि होगी।

1.4। अनुमान त्रुटि।
आइए हम निरपेक्ष सन्निकटन त्रुटि का उपयोग करके प्रतिगमन समीकरण की गुणवत्ता का मूल्यांकन करें।


चूंकि त्रुटि 15% से अधिक है, इसलिए यह समीकरण प्रतिगमन के रूप में उपयोग करने के लिए वांछनीय नहीं है।

1.6। निर्धारण गुणांक।
(बहु) सहसंबंध गुणांक के वर्ग को दृढ़ संकल्प का गुणांक कहा जाता है, जो कारक विशेषता की भिन्नता द्वारा समझाया गया परिणामी विशेषता की भिन्नता के अनुपात को दर्शाता है।
बहुधा, निर्धारण गुणांक की व्याख्या देते हुए, इसे प्रतिशत के रूप में व्यक्त किया जाता है।
आर2 = 0.982 = 0.9596
वे। 95.96% मामलों में, x में परिवर्तन से y में परिवर्तन होता है। दूसरे शब्दों में, प्रतिगमन समीकरण के चयन की सटीकता अधिक है। Y में शेष 4.04% परिवर्तन उन कारकों के कारण है जिन्हें मॉडल में ध्यान में नहीं रखा गया है।

एक्स वाई x2 y2 एक्स वाई वाई (एक्स) (वाई आई-वाई सीपी) 2 (वाई-वाई (एक्स)) 2 (एक्स आई-एक्स सीपी) 2 |y - y x |:y
0.371 15.6 0.1376 243.36 5.79 14.11 780.89 2.21 0.1864 0.0953
0.399 19.9 0.1592 396.01 7.94 16.02 559.06 15.04 0.163 0.1949
0.502 22.7 0.252 515.29 11.4 23.04 434.49 0.1176 0.0905 0.0151
0.572 34.2 0.3272 1169.64 19.56 27.81 87.32 40.78 0.0533 0.1867
0.607 44.5 .3684 1980.25 27.01 30.2 0.9131 204.49 0.0383 0.3214
0.655 26.8 0.429 718.24 17.55 33.47 280.38 44.51 0.0218 0.2489
0.763 35.7 0.5822 1274.49 27.24 40.83 61.54 26.35 0.0016 0.1438
0.873 30.6 0.7621 936.36 26.71 48.33 167.56 314.39 0.0049 0.5794
2.48 161.9 6.17 26211.61 402 158.07 14008.04 14.66 2.82 0.0236
7.23 391.9 9.18 33445.25 545.2 391.9 16380.18 662.54 3.38 1.81

2. समाश्रयण समीकरण के प्राचलों का अनुमान।
2.1। सहसंबंध गुणांक का महत्व।

महत्व स्तर α=0.05 और स्वतंत्रता की डिग्री k=7 के साथ छात्र की तालिका के अनुसार हम t crit पाते हैं:
टी क्रिट = (7; 0.05) = 1.895
जहाँ m = 1 व्याख्यात्मक चरों की संख्या है।
यदि t obs> t महत्वपूर्ण है, तो सहसंबंध गुणांक के प्राप्त मूल्य को महत्वपूर्ण माना जाता है (अशक्त परिकल्पना यह बताती है कि सहसंबंध गुणांक शून्य के बराबर है) अस्वीकार कर दिया गया है।
चूँकि t obl> t crit, हम इस परिकल्पना को अस्वीकार करते हैं कि सहसंबंध गुणांक 0 के बराबर है। दूसरे शब्दों में, सहसंबंध गुणांक सांख्यिकीय रूप से महत्वपूर्ण है
एक युग्मित रेखीय प्रतिगमन में, t 2 r = t 2 b, और फिर प्रतिगमन और सहसंबंध गुणांक के महत्व के बारे में परिकल्पना का परीक्षण रेखीय प्रतिगमन समीकरण के महत्व के बारे में परिकल्पना के परीक्षण के बराबर है।

2.3। प्रतिगमन गुणांकों के अनुमानों को निर्धारित करने की सटीकता का विश्लेषण।
गड़बड़ी के विचरण का निष्पक्ष अनुमान मूल्य है:


S 2 y = 94.6484 - अस्पष्टीकृत विचरण (प्रतिगमन रेखा के आसपास निर्भर चर के फैलाव का एक उपाय)।
एस वाई = 9.7287 - अनुमान की मानक त्रुटि (प्रतिगमन की मानक त्रुटि)।
एस ए - एक यादृच्छिक चर का मानक विचलन।


एस बी - यादृच्छिक चर बी का मानक विचलन।

2.4। आश्रित चर के लिए विश्वास अंतराल।
निर्मित मॉडल के आधार पर आर्थिक पूर्वानुमान मानता है कि चर के पूर्व-मौजूदा संबंध लीड अवधि के लिए भी संरक्षित हैं।
परिणामी विशेषता के आश्रित चर की भविष्यवाणी करने के लिए, मॉडल में शामिल सभी कारकों के अनुमानित मूल्यों को जानना आवश्यक है।
कारकों के अनुमानित मूल्यों को मॉडल में प्रतिस्थापित किया जाता है और अध्ययन के तहत संकेतक के अनुमानित अनुमान प्राप्त किए जाते हैं। (ए + बीएक्स पी ± ε)
कहाँ

आइए उस अंतराल की सीमाओं की गणना करें जिसमें Y के संभावित मूल्यों का 95% असीमित संख्या में टिप्पणियों और X p = 1 (-11.17 + 68.16*1 ± 6.4554) के साथ केंद्रित होगा।
(50.53;63.44)

के लिए व्यक्तिगत विश्वास अंतरालवाईकिसी दिए गए मूल्य परएक्स.
(ए + बीएक्स मैं ± ε)
कहाँ

एक्स मैं वाई = -11.17 + 68.16x मैं ε मैं हाँ ymax
0.371 14.11 19.91 -5.8 34.02
0.399 16.02 19.85 -3.83 35.87
0.502 23.04 19.67 3.38 42.71
0.572 27.81 19.57 8.24 47.38
0.607 30.2 19.53 10.67 49.73
0.655 33.47 19.49 13.98 52.96
0.763 40.83 19.44 21.4 60.27
0.873 48.33 19.45 28.88 67.78
2.48 158.07 25.72 132.36 183.79

95% की संभावना के साथ, यह गारंटी दी जा सकती है कि असीमित संख्या में प्रेक्षणों के साथ Y का मान पाए गए अंतरालों की सीमा से आगे नहीं जाएगा।

2.5। रेखीय समाश्रयण समीकरण के गुणांकों के संबंध में परिकल्पनाओं का परीक्षण करना।
1) टी-सांख्यिकी। छात्र की कसौटी।
आइए महत्व स्तर α=0.05 पर अलग-अलग प्रतिगमन गुणांकों की शून्य (वैकल्पिक एच 1 के बराबर नहीं है) की समानता के बारे में परिकल्पना एच 0 का परीक्षण करें।
टी क्रिट = (7; 0.05) = 1.895


चूंकि 12.8866 > 1.895, प्रतिगमन गुणांक b के सांख्यिकीय महत्व की पुष्टि की गई है (हम इस परिकल्पना को अस्वीकार करते हैं कि यह गुणांक शून्य के बराबर है)।


2.0914 > 1.895 के बाद से, प्रतिगमन गुणांक a के सांख्यिकीय महत्व की पुष्टि की जाती है (हम इस परिकल्पना को अस्वीकार करते हैं कि यह गुणांक शून्य के बराबर है)।

प्रतिगमन समीकरण के गुणांकों के लिए विश्वास अंतराल।
आइए हम प्रतिगमन गुणांकों के विश्वास अंतराल का निर्धारण करें, जो 95% विश्वसनीयता के साथ निम्नानुसार होगा:
(बी - टी क्रिट एस बी; बी + टी क्रिट एस बी)
(68.1618 - 1.895 5.2894; 68.1618 + 1.895 5.2894)
(58.1385;78.1852)
95% की संभावना के साथ, यह तर्क दिया जा सकता है कि इस पैरामीटर का मान पाया गया अंतराल में होगा।
(ए - टी ए)
(-11.1744 - 1.895 5.3429; -11.1744 + 1.895 5.3429)
(-21.2992;-1.0496)
95% की संभावना के साथ, यह तर्क दिया जा सकता है कि इस पैरामीटर का मान पाया गया अंतराल में होगा।

2) एफ-सांख्यिकी। फिशर की कसौटी।
फिशर एफ-टेस्ट का उपयोग करके प्रतिगमन मॉडल के महत्व की जाँच की जाती है, जिसका परिकलित मान अध्ययन किए गए संकेतक की टिप्पणियों की प्रारंभिक श्रृंखला के विचरण के अनुपात और अवशिष्ट अनुक्रम के विचरण के निष्पक्ष अनुमान के रूप में पाया जाता है। यह मॉडल।
यदि स्वतंत्रता की डिग्री lang=EN-US>n-m-1) के साथ परिकलित मान किसी दिए गए महत्व स्तर पर सारणीबद्ध मान से अधिक है, तो मॉडल को महत्वपूर्ण माना जाता है।

जहां एम मॉडल में कारकों की संख्या है।
युग्मित रेखीय प्रतिगमन के सांख्यिकीय महत्व का आकलन निम्नलिखित एल्गोरिथम के अनुसार किया जाता है:
1. एक अशक्त परिकल्पना सामने रखी गई है कि समग्र रूप से समीकरण सांख्यिकीय रूप से महत्वहीन है: H 0: R 2 = 0 महत्व स्तर α पर।
2. अगला, एफ-मानदंड का वास्तविक मूल्य निर्धारित करें:


जहाँ m = 1 जोड़ीदार प्रतिगमन के लिए।
3. किसी दिए गए महत्व स्तर के लिए फिशर वितरण तालिकाओं से तालिका मान निर्धारित किया जाता है, यह ध्यान में रखते हुए कि वर्गों के कुल योग (बड़ा विचरण) के लिए स्वतंत्रता की डिग्री की संख्या 1 है और अवशिष्ट योग के लिए स्वतंत्रता की डिग्री की संख्या रेखीय प्रतिगमन में वर्ग (निचला विचरण) n-2 है।
4. यदि एफ-मापदंड का वास्तविक मूल्य तालिका मूल्य से कम है, तो वे कहते हैं कि शून्य परिकल्पना को अस्वीकार करने का कोई कारण नहीं है।
अन्यथा, शून्य परिकल्पना को अस्वीकार कर दिया जाता है और समग्र रूप से समीकरण के सांख्यिकीय महत्व के बारे में वैकल्पिक परिकल्पना को संभाव्यता (1-α) के साथ स्वीकार कर लिया जाता है।
स्वतंत्रता की डिग्री के साथ मानदंड का तालिका मूल्य k1=1 और k2=7, Fkp = 5.59
चूंकि एफ> एफकेपी का वास्तविक मूल्य, निर्धारण का गुणांक सांख्यिकीय रूप से महत्वपूर्ण है (प्रतिगमन समीकरण का पाया गया अनुमान सांख्यिकीय रूप से विश्वसनीय है)।

अवशिष्टों के स्वतःसंबंध के लिए जाँच करें.
एलएसएम का उपयोग करके एक गुणात्मक प्रतिगमन मॉडल के निर्माण के लिए एक महत्वपूर्ण शर्त अन्य सभी अवलोकनों में विचलन के मूल्यों से यादृच्छिक विचलन के मूल्यों की स्वतंत्रता है। यह सुनिश्चित करता है कि किसी भी विचलन और विशेष रूप से आसन्न विचलन के बीच कोई संबंध नहीं है।
स्वत: सहसंबंध (सीरियल सहसंबंध)समय (समय श्रृंखला) या स्थान (क्रॉस श्रृंखला) में आदेशित उपायों के बीच संबंध के रूप में परिभाषित किया गया है। समय श्रृंखला डेटा का उपयोग करते समय और क्रॉस-सेक्शनल डेटा का उपयोग करते समय बहुत कम ही अवशिष्टों (आउटलेयर) का स्वत: संबंध आमतौर पर प्रतिगमन विश्लेषण में सामने आता है।
आर्थिक कार्यों में, यह बहुत अधिक सामान्य है सकारात्मक स्वसंबंधबजाय नकारात्मक स्वसंबंध. ज्यादातर मामलों में, मॉडल में ध्यान में नहीं रखे गए कुछ कारकों के दिशात्मक निरंतर प्रभाव के कारण सकारात्मक स्वसंबंध होता है।
नकारात्मक स्वसहसंबंधवास्तव में इसका मतलब है कि एक सकारात्मक विचलन के बाद एक नकारात्मक और इसके विपरीत होता है। ऐसी स्थिति तब हो सकती है जब शीतल पेय की मांग और आय के बीच समान संबंध को मौसमी डेटा (सर्दी-गर्मी) के अनुसार माना जाए।
के बीच स्वसंबंध पैदा करने वाले मुख्य कारण, निम्नलिखित को प्रतिष्ठित किया जा सकता है:
1. विशिष्टता त्रुटियां। मॉडल में किसी भी महत्वपूर्ण व्याख्यात्मक चर को ध्यान में रखने में विफलता या निर्भरता के रूप की गलत पसंद आमतौर पर प्रतिगमन रेखा से अवलोकन बिंदुओं के प्रणालीगत विचलन की ओर ले जाती है, जिससे स्वसंबंध हो सकता है।
2. जड़ता। कई आर्थिक संकेतक (मुद्रास्फीति, बेरोजगारी, जीएनपी, आदि) में एक निश्चित चक्रीयता होती है जो व्यावसायिक गतिविधि के उतार-चढ़ाव से जुड़ी होती है। इसलिए, संकेतकों में परिवर्तन तुरंत नहीं होता है, लेकिन एक निश्चित जड़ता होती है।
3. वेब प्रभाव। कई औद्योगिक और अन्य क्षेत्रों में, आर्थिक संकेतक देरी (समय अंतराल) के साथ आर्थिक स्थितियों में बदलाव पर प्रतिक्रिया करते हैं।
4. डेटा स्मूथिंग। अक्सर, एक निश्चित लंबी अवधि के लिए डेटा इसके घटक अंतरालों पर डेटा का औसत करके प्राप्त किया जाता है। यह विचाराधीन अवधि के भीतर मौजूद उतार-चढ़ाव के एक निश्चित चौरसाई का कारण बन सकता है, जो बदले में स्वतःसंबंध का कारण बन सकता है।
स्वसंबंध के परिणाम विषमलैंगिकता के समान हैं: टी- और एफ-सांख्यिकी पर निष्कर्ष जो प्रतिगमन गुणांक और निर्धारण के गुणांक के महत्व को निर्धारित करते हैं, गलत हो सकते हैं।

स्वतः सहसंबंध का पता लगाना

1. ग्राफिक विधि
स्वतःसंबंध की चित्रमय परिभाषा के लिए कई विकल्प हैं। उनमें से एक विचलन ई i को उनकी प्राप्ति के क्षणों i से संबंधित करता है। उसी समय, या तो सांख्यिकीय डेटा प्राप्त करने का समय या अवलोकन की क्रम संख्या को एब्सिस्सा अक्ष के साथ प्लॉट किया जाता है, और विचलन ई i (या विचलन का अनुमान) को ऑर्डिनेट अक्ष के साथ प्लॉट किया जाता है।
यह मान लेना स्वाभाविक है कि यदि विचलनों के बीच एक निश्चित संबंध है, तो स्वसंबंध होता है। निर्भरता की अनुपस्थिति सबसे अधिक संभावना स्वसंबंध की अनुपस्थिति का संकेत देगी।
यदि आप e i बनाम e i-1 प्लॉट करते हैं तो स्वत: सहसंबंध स्पष्ट हो जाता है।

डर्बिन-वाटसन परीक्षण.
यह कसौटी स्वसंबंध का पता लगाने के लिए सबसे अच्छी तरह से जाना जाता है।
प्रतिगमन समीकरणों के सांख्यिकीय विश्लेषण के दौरान, प्रारंभिक चरण में, अक्सर एक आधार की व्यवहार्यता की जांच की जाती है: एक दूसरे से विचलन की सांख्यिकीय स्वतंत्रता की शर्तें। इस मामले में, पड़ोसी मूल्यों ई i की असंबद्धता की जाँच की जाती है।

वाई वाई (एक्स) ई मैं = वाई-वाई (एक्स) ई 2 (ई आई - ई आई -1) 2
15.6 14.11 1.49 2.21 0
19.9 16.02 3.88 15.04 5.72
22.7 23.04 -0.3429 0.1176 17.81
34.2 27.81 6.39 40.78 45.28
44.5 30.2 14.3 204.49 62.64
26.8 33.47 -6.67 44.51 439.82
35.7 40.83 -5.13 26.35 2.37
30.6 48.33 -17.73 314.39 158.7
161.9 158.07 3.83 14.66 464.81
662.54 1197.14

विचलन के सहसंबंध का विश्लेषण करने के लिए डर्बिन-वाटसन सांख्यिकी का उपयोग किया जाता है:

महत्वपूर्ण मान d 1 और d 2 आवश्यक महत्व स्तर α के लिए विशेष तालिकाओं के आधार पर निर्धारित किए जाते हैं, टिप्पणियों की संख्या n = 9 और व्याख्यात्मक चर की संख्या m=1।
यदि निम्न स्थिति सत्य है तो कोई स्वत: संबंध नहीं है:
d1< DW и d 2 < DW < 4 - d 2 .
तालिकाओं का उल्लेख किए बिना, हम अनुमानित नियम का उपयोग कर सकते हैं और यह मान सकते हैं कि 1.5 होने पर अवशिष्टों का कोई स्वत: संबंध नहीं है< DW < 2.5. Для более надежного вывода целесообразно обращаться к табличным значениям.

प्रतिगमन समीकरण के गुणांकों की गणना

मौजूदा ईडी के आधार पर समीकरणों की प्रणाली (7.8) को अद्वितीय रूप से हल नहीं किया जा सकता है, क्योंकि अज्ञात की संख्या हमेशा समीकरणों की संख्या से अधिक होती है। इस समस्या को दूर करने के लिए अतिरिक्त मान्यताओं की आवश्यकता है। सामान्य ज्ञान बताता है कि ईडी के सन्निकटन में न्यूनतम त्रुटि सुनिश्चित करने के लिए बहुपद के गुणांकों को इस तरह से चुनना वांछनीय है। सन्निकटन त्रुटियों के मूल्यांकन के लिए विभिन्न उपायों को लागू किया जा सकता है। इस तरह के एक उपाय के रूप में, रूट-माध्य-स्क्वायर त्रुटि को व्यापक आवेदन मिला है। इसके आधार पर, प्रतिगमन समीकरणों के गुणांकों का आकलन करने के लिए एक विशेष विधि, कम से कम वर्गों की विधि (एलएसएम) विकसित की गई है। यह विधि आपको वेरिएंट के सामान्य वितरण के साथ प्रतिगमन समीकरण के अज्ञात गुणांक के अधिकतम संभावना अनुमान प्राप्त करने की अनुमति देती है, लेकिन इसे कारकों के किसी अन्य वितरण पर लागू किया जा सकता है।

एमएनसी निम्नलिखित प्रावधानों पर आधारित है:

· त्रुटि मूल्यों और कारकों के मूल्य स्वतंत्र हैं, और इसलिए असंबंधित हैं, अर्थात यह माना जाता है कि शोर उत्पादन के तंत्र कारक मूल्यों के गठन के तंत्र से संबंधित नहीं हैं;

त्रुटि ε की गणितीय अपेक्षा शून्य के बराबर होनी चाहिए (अचर घटक को गुणांक में शामिल किया गया है एक 0), दूसरे शब्दों में, त्रुटि एक केंद्रित मात्रा है;

· त्रुटि विचरण का नमूना अनुमान न्यूनतम होना चाहिए|

मानकीकृत मूल्यों के रैखिक प्रतिगमन के संबंध में कम से कम वर्गों के अनुप्रयोग पर विचार करें। केंद्रित मात्राओं के लिए यू जेगुणक एक 0शून्य है, तो रेखीय प्रतिगमन समीकरण

. (7.9)

यहां, एक विशेष चिह्न "^" पेश किया गया है, जो प्रतिगमन समीकरण द्वारा गणना किए गए संकेतक के मूल्यों को दर्शाता है, जो टिप्पणियों के परिणामों से प्राप्त मूल्यों के विपरीत है।

कम से कम वर्गों के अनुसार, प्रतिगमन समीकरण के गुणांक के ऐसे मान निर्धारित किए जाते हैं जो अभिव्यक्ति के लिए बिना शर्त न्यूनतम प्रदान करते हैं

अज्ञात गुणांकों के संबंध में अभिव्यक्ति (7.10) के सभी आंशिक डेरिवेटिव्स को शून्य के बराबर करके और समीकरणों की प्रणाली को हल करके न्यूनतम पाया जाता है

(7.11)

परिवर्तनों को क्रमिक रूप से अंजाम देने और सहसंबंध गुणांक के पहले से शुरू किए गए अनुमानों का उपयोग करने के बाद

. (7.12)

तो प्राप्त हुआ टी-1 रैखिक समीकरण, जो आपको विशिष्ट रूप से मानों की गणना करने की अनुमति देता है एक 2, एक 3, ..., एक टी.

यदि रैखिक मॉडल गलत है या मापदंडों को गलत तरीके से मापा जाता है, तो इस मामले में एलएसएम गुणांक के ऐसे मूल्यों को खोजने की अनुमति देता है जिसके लिए रैखिक मॉडल चुने हुए मानक विचलन मानदंड के अर्थ में वास्तविक वस्तु का सबसे अच्छा वर्णन करता है।

जब केवल एक पैरामीटर होता है, तो रेखीय प्रतिगमन समीकरण बन जाता है

गुणक एक 2समीकरण से प्राप्त होता है

फिर, उस पर विचार करना आर 2.2= 1, वांछित गुणांक

2 = आर वाई ,2 . (7.13)

संबंध (7.13) पहले बताए गए कथन की पुष्टि करता है कि सहसंबंध गुणांक दो मानकीकृत मापदंडों के रैखिक संबंध का एक उपाय है।

गुणांक के पाए गए मान को प्रतिस्थापित करना एक 2के लिए अभिव्यक्ति में डब्ल्यू, केंद्रित और सामान्यीकृत मात्रा के गुणों को ध्यान में रखते हुए, हम इस फ़ंक्शन का न्यूनतम मान 1 के बराबर प्राप्त करते हैं- r2y, 2। मान 1– आर2वाई,2यादृच्छिक चर का अवशिष्ट प्रसरण कहा जाता है वाईयादृच्छिक चर के सापेक्ष यू 2. यह पैरामीटर υ= के फ़ंक्शन के साथ संकेतक को बदलकर प्राप्त की गई त्रुटि को चिह्नित करता है ए 2 यू 2. केवल जब | आर वाई, 2| = 1, अवशिष्ट विचरण शून्य है, और इसलिए, जब संकेतक एक रैखिक फ़ंक्शन द्वारा अनुमानित होता है, तो कोई त्रुटि नहीं होती है।

सूचक और पैरामीटर के केंद्रित और सामान्यीकृत मूल्यों से आगे बढ़ना

प्रारंभिक मूल्यों के लिए प्राप्त किया जा सकता है

सहसंबंध गुणांक के संबंध में यह समीकरण भी रैखिक है। यह देखना आसान है कि रैखिक प्रतिगमन के लिए केंद्रीकरण और सामान्यीकरण एक व्यक्ति को समीकरणों की प्रणाली के आयाम को एक से कम करने की अनुमति देता है, अर्थात गुणांक निर्धारित करने की समस्या के समाधान को सरल बनाने के लिए, और गुणांकों को स्वयं स्पष्ट अर्थ देने के लिए।

गैर-रैखिक कार्यों के लिए एलएसएम का उपयोग व्यावहारिक रूप से विचार की गई योजना से भिन्न नहीं होता है (मूल समीकरण में केवल गुणांक a0 शून्य के बराबर नहीं है)।

उदाहरण के लिए, परवलयिक प्रतिगमन गुणांक निर्धारित करना आवश्यक है

नमूना त्रुटि विचरण

इसके आधार पर, समीकरणों की निम्नलिखित प्रणाली प्राप्त की जा सकती है

परिवर्तनों के बाद, समीकरणों की प्रणाली रूप लेती है

मानकीकृत मात्रा के क्षणों के गुणों को ध्यान में रखते हुए, हम लिखते हैं

गैर-रैखिक प्रतिगमन के गुणांक का निर्धारण रैखिक समीकरणों की एक प्रणाली के समाधान पर आधारित है। ऐसा करने के लिए, आप सांख्यिकीय डेटा को संसाधित करने के लिए संख्यात्मक विधियों के सार्वभौमिक पैकेज या विशेष पैकेज का उपयोग कर सकते हैं।

जैसे-जैसे प्रतिगमन समीकरण की डिग्री बढ़ती है, गुणांक निर्धारित करने के लिए उपयोग किए जाने वाले मापदंडों के वितरण क्षणों की डिग्री भी बढ़ती है। तो, दूसरी डिग्री के प्रतिगमन समीकरण के गुणांक को निर्धारित करने के लिए, चौथी डिग्री समावेशी तक के मापदंडों के वितरण के क्षणों का उपयोग किया जाता है। यह ज्ञात है कि डीई के सीमित नमूने से क्षणों का अनुमान लगाने की सटीकता और विश्वसनीयता बढ़ते क्रम के साथ तेजी से घट जाती है। प्रतिगमन समीकरणों में दूसरे से अधिक डिग्री के बहुपदों का उपयोग उचित नहीं है।

परिणामी प्रतिगमन समीकरण की गुणवत्ता का मूल्यांकन संकेतक के अवलोकनों के परिणामों और पैरामीटर स्थान में दिए गए बिंदुओं पर प्रतिगमन समीकरण द्वारा अनुमानित मूल्यों के बीच निकटता की डिग्री द्वारा किया जाता है। यदि परिणाम करीब हैं, तो प्रतिगमन विश्लेषण की समस्या को हल किया जा सकता है। अन्यथा, आपको प्रतिगमन समीकरण को बदलना चाहिए (बहुपद की एक अलग डिग्री या पूरी तरह से एक अलग प्रकार का समीकरण चुनें) और मापदंडों का अनुमान लगाने के लिए गणना को दोहराएं।

यदि कई संकेतक हैं, तो उनमें से प्रत्येक के लिए प्रतिगमन विश्लेषण की समस्या को स्वतंत्र रूप से हल किया जाता है।

प्रतिगमन समीकरण के सार का विश्लेषण करते हुए, निम्नलिखित प्रावधानों पर ध्यान दिया जाना चाहिए। माना गया दृष्टिकोण गुणांक का एक अलग (स्वतंत्र) मूल्यांकन प्रदान नहीं करता है - एक गुणांक के मूल्य में परिवर्तन से दूसरों के मूल्यों में परिवर्तन होता है। प्राप्त गुणांकों को संकेतक के मान के अनुरूप पैरामीटर के योगदान के रूप में नहीं माना जाना चाहिए। प्रतिगमन समीकरण उपलब्ध ईडी का सिर्फ एक अच्छा विश्लेषणात्मक विवरण है, न कि एक कानून जो मापदंडों और एक संकेतक के बीच संबंध का वर्णन करता है। इस समीकरण का उपयोग पैरामीटर परिवर्तनों की दी गई श्रेणी में संकेतक के मूल्यों की गणना करने के लिए किया जाता है। यह इस सीमा के बाहर की गणनाओं के लिए सीमित उपयोग है, अर्थात इसका उपयोग इंटरपोलेशन की समस्याओं को हल करने के लिए और एक सीमित सीमा तक एक्सट्रपलेशन के लिए किया जा सकता है।



पूर्वानुमान की अशुद्धि का मुख्य कारण प्रतिगमन रेखा के एक्सट्रपलेशन की इतनी अनिश्चितता नहीं है, लेकिन मॉडल में ध्यान में नहीं रखे गए कारकों के कारण सूचक की एक महत्वपूर्ण भिन्नता है। पूर्वानुमान की संभावना की सीमा मॉडल में ध्यान में रखे गए मापदंडों की स्थिरता और मॉडल में ध्यान में रखे गए कारकों के प्रभाव की प्रकृति की स्थिति है। यदि बाहरी वातावरण नाटकीय रूप से बदलता है, तो तैयार किया गया प्रतिगमन समीकरण अपना अर्थ खो देगा। प्रतिगमन समीकरण में ऐसे कारकों के मूल्यों को प्रतिस्थापित करना असंभव है जो ईडी में प्रस्तुत किए गए लोगों से काफी भिन्न हैं। यह अनुशंसा की जाती है कि कारक के अधिकतम और न्यूनतम मूल्यों दोनों के लिए पैरामीटर भिन्नता की सीमा के एक तिहाई से अधिक न जाएं।

प्रतिगमन समीकरण में पैरामीटर के अपेक्षित मूल्य को प्रतिस्थापित करके प्राप्त पूर्वानुमान एक बिंदु पूर्वानुमान है। इस तरह के पूर्वानुमान के सच होने की संभावना नगण्य है। पूर्वानुमान के विश्वास अंतराल को निर्धारित करना उचित है। संकेतक के अलग-अलग मूल्यों के लिए, अंतराल को प्रतिगमन रेखा की स्थिति में त्रुटियों और इस रेखा से अलग-अलग मूल्यों के विचलन को ध्यान में रखना चाहिए। कारक x के लिए संकेतक y की औसत पूर्वानुमान त्रुटि होगी

कहाँ सामान्य आबादी में प्रतिगमन रेखा की स्थिति में औसत त्रुटि है एक्स = एक्स के;

- सामान्य आबादी में प्रतिगमन रेखा से संकेतक के विचलन के विचलन का अनुमान;

एक्स केकारक का अपेक्षित मूल्य है।

पूर्वानुमान की विश्वास सीमा, उदाहरण के लिए, प्रतिगमन समीकरण (7.14) के लिए, अभिव्यक्ति द्वारा निर्धारित की जाती है

नकारात्मक अवरोधन मान एक 0मूल चर के लिए प्रतिगमन समीकरण में इसका मतलब है कि सूचक के अस्तित्व के क्षेत्र में मापदंडों के शून्य मान शामिल नहीं हैं। अगर और 0> 0, फिर संकेतक के अस्तित्व के क्षेत्र में मापदंडों के शून्य मान शामिल हैं, और गुणांक स्वयं मापदंडों के प्रभाव की अनुपस्थिति में संकेतक के औसत मूल्य की विशेषता है।

समस्या 7.2। तालिका में निर्दिष्ट नमूने के लिए चैनल क्षमता के लिए प्रतिगमन समीकरण बनाएँ। 7.1।

समाधान। निर्दिष्ट नमूने के संबंध में, इसके मुख्य भाग में विश्लेषणात्मक निर्भरता का निर्माण सहसंबंध विश्लेषण के ढांचे के भीतर किया गया था: थ्रूपुट केवल "सिग्नल-टू-शोर अनुपात" पैरामीटर पर निर्भर करता है। यह मापदंडों के पहले से गणना किए गए मानों को अभिव्यक्ति (7.14) में स्थानापन्न करने के लिए बना हुआ है। थ्रूपुट के लिए समीकरण रूप ले लेगा

ŷ = 26.47– 0.93×41.68×5.39/6.04+0.93×5.39/6.03× एक्स = – 8,121+0,830एक्स.

गणना के परिणाम तालिका में प्रस्तुत किए गए हैं। 7.5।

तालिका 7.5

एन पीपी चैनल क्षमता शोर अनुपात करने के लिए संकेत समारोह मूल्य गलती
वाई एक्स ŷ ε
26.37 41.98 26.72 -0.35
28.00 43.83 28.25 -0.25
27/83 42.83 27.42 0.41
31.67 47.28 31.12 0.55
23.50 38.75 24.04 -0.54
21.04 35.12 21.03 0.01
16.94 32.07 18.49 -1.55
37.56 54.25 36.90 0.66
18.84 32.70 19.02 -0.18
25.77 40.51 25.50 0.27
33.52 49.78 33.19 0.33
28.21 43.84 28.26 -0.05
28.76 44.03

सहसंबंध निर्भरता का अध्ययन चर के बीच ऐसे संबंधों के अध्ययन पर आधारित है, जिसमें एक चर के मान, इसे एक आश्रित चर के रूप में लिया जा सकता है, "औसत पर" परिवर्तन इस बात पर निर्भर करता है कि दूसरा चर क्या मान लेता है, आश्रित चर के संबंध में एक कारण के रूप में माना जाता है। इस कारण की कार्रवाई विभिन्न कारकों की एक जटिल बातचीत में की जाती है, जिसके परिणामस्वरूप एक पैटर्न की अभिव्यक्ति संभावना के प्रभाव से अस्पष्ट होती है। विशेषता-कारक के मूल्यों के दिए गए समूह के लिए परिणामी विशेषता के औसत मूल्यों की गणना करना, संभावना का प्रभाव आंशिक रूप से समाप्त हो गया है। सैद्धांतिक संचार लाइन के मापदंडों की गणना करते हुए, उन्हें आगे समाप्त कर दिया जाता है और कारक "x" में परिवर्तन के साथ एक असंदिग्ध (रूप में) परिवर्तन "y" प्राप्त होता है।

स्टोकेस्टिक संबंधों का अध्ययन करने के लिए, दो समानांतर श्रृंखलाओं की तुलना करने की विधि, विश्लेषणात्मक समूहों की विधि, सहसंबंध विश्लेषण, प्रतिगमन विश्लेषण और कुछ गैर-पैरामीट्रिक विधियों का व्यापक रूप से उपयोग किया जाता है। सामान्य तौर पर, संबंधों के अध्ययन के क्षेत्र में आंकड़ों का कार्य न केवल उनकी उपस्थिति, दिशा और संबंधों की ताकत को निर्धारित करना है, बल्कि परिणामी पर कारक विशेषताओं के प्रभाव के रूप (विश्लेषणात्मक अभिव्यक्ति) का निर्धारण करना भी है। इसे हल करने के लिए, सहसंबंध और प्रतिगमन विश्लेषण विधियों का उपयोग किया जाता है।

अध्याय 1. प्रतिगमन समीकरण: सैद्धांतिक नींव

1.1। प्रतिगमन समीकरण: सार और कार्यों के प्रकार

प्रतिगमन (अव्य। प्रतिगमन - रिवर्स मूवमेंट, विकास के अधिक जटिल रूपों से कम जटिल लोगों में संक्रमण) संभाव्यता सिद्धांत और गणितीय आँकड़ों में बुनियादी अवधारणाओं में से एक है, जो मूल्यों पर एक यादृच्छिक चर के औसत मूल्य की निर्भरता को व्यक्त करता है। अन्य यादृच्छिक चर या कई यादृच्छिक चर। यह अवधारणा 1886 में फ्रांसिस गैल्टन द्वारा पेश की गई थी।

सैद्धांतिक प्रतिगमन रेखा वह रेखा है जिसके चारों ओर सहसंबंध क्षेत्र के बिंदुओं को समूहीकृत किया जाता है और जो मुख्य दिशा, कनेक्शन की मुख्य प्रवृत्ति को इंगित करता है।

सैद्धांतिक प्रतिगमन रेखा को प्रभावी विशेषता "y" के औसत मूल्यों में परिवर्तन को प्रतिबिंबित करना चाहिए क्योंकि कारक विशेषता "x" परिवर्तन के मान, बशर्ते कि अन्य सभी - कारक "x" के संबंध में यादृच्छिक - कारणों को परस्पर रद्द कर दिया जाता है। इसलिए, इस रेखा को इस तरह से खींचा जाना चाहिए कि सैद्धांतिक प्रतिगमन रेखा के संगत बिंदुओं से सहसंबंध क्षेत्र के बिंदुओं के विचलन का योग शून्य के बराबर हो, और इन विचलनों के वर्गों का योग न्यूनतम हो कीमत।

y=f(x) - प्रतिगमन समीकरण चरों के बीच सांख्यिकीय संबंध के लिए एक सूत्र है।

एक विमान पर एक सीधी रेखा (दो आयामों की जगह में) समीकरण y=a+b*x द्वारा दी जाती है। अधिक विवरण में: चर y को एक स्थिरांक (a) और एक ढलान (b) के रूप में चर x से गुणा करके व्यक्त किया जा सकता है। स्थिरांक को कभी-कभी अवरोधन भी कहा जाता है, और ढलान को प्रतिगमन या बी-कारक भी कहा जाता है।

प्रतिगमन विश्लेषण में एक महत्वपूर्ण कदम फ़ंक्शन के प्रकार को निर्धारित करना है, जो सुविधाओं के बीच संबंध को दर्शाता है। मुख्य आधार अध्ययन के तहत निर्भरता की प्रकृति, उसके तंत्र का सार्थक विश्लेषण होना चाहिए। एक ही समय में, प्रदर्शन संकेतक के साथ प्रत्येक कारक के संबंध के रूप को सैद्धांतिक रूप से प्रमाणित करना हमेशा संभव नहीं होता है, क्योंकि अध्ययन की गई सामाजिक-आर्थिक घटनाएं बहुत जटिल होती हैं और उनके स्तर को बनाने वाले कारक आपस में जुड़े होते हैं और परस्पर क्रिया करते हैं एक दूसरे के साथ। इसलिए, सैद्धांतिक विश्लेषण के आधार पर, रिश्ते की दिशा, अध्ययन की गई आबादी में इसके परिवर्तन की संभावना, एक रैखिक संबंध का उपयोग करने की वैधता, चरम मूल्यों की संभावित उपस्थिति आदि के बारे में अक्सर सबसे सामान्य निष्कर्ष निकाले जा सकते हैं। . ऐसी धारणाओं के लिए एक आवश्यक अतिरिक्त विशिष्ट तथ्यात्मक डेटा का विश्लेषण होना चाहिए।

अनुभवजन्य प्रतिगमन रेखा के आधार पर लिंक लाइन का अनुमानित विचार प्राप्त किया जा सकता है। अनुभवजन्य प्रतिगमन रेखा आमतौर पर एक टूटी हुई रेखा होती है, जिसमें कम या ज्यादा महत्वपूर्ण विराम होता है। यह इस तथ्य से समझाया गया है कि प्रभावी विशेषताओं की भिन्नता को प्रभावित करने वाले अन्य बेहिसाब कारकों के प्रभाव की औसत में पूरी तरह से भरपाई नहीं की जाती है, अपर्याप्त रूप से बड़ी संख्या में टिप्पणियों के कारण, संचार की अनुभवजन्य रेखा का उपयोग किया जा सकता है सैद्धांतिक वक्र के प्रकार का चयन करें और उसका औचित्य सिद्ध करें, बशर्ते कि प्रेक्षणों की संख्या पर्याप्त रूप से अधिक हो।

प्रतिस्पर्धी मॉडलों द्वारा अनुभवजन्य डेटा के सन्निकटन के लिए गुणवत्ता मानदंडों के उपयोग के आधार पर विभिन्न निर्भरता समीकरणों की तुलना विशिष्ट अध्ययनों के तत्वों में से एक है। आर्थिक संकेतकों के संबंधों को चिह्नित करने के लिए निम्नलिखित प्रकार के कार्यों का सबसे अधिक उपयोग किया जाता है:

1. रैखिक:

2. अतिशयोक्तिपूर्ण:

3. प्रदर्शनकारी:

4. परवलयिक:

5. शक्ति:

6. लघुगणकीय:

7. रसद:

एक व्याख्यात्मक और एक व्याख्यात्मक चर वाला मॉडल एक युग्मित प्रतिगमन मॉडल है। यदि दो या अधिक व्याख्यात्मक (फैक्टोरियल) चर का उपयोग किया जाता है, तो एक बहु प्रतिगमन मॉडल का उपयोग करने की बात करता है। इस मामले में, इन चरों को जोड़ने वाले रैखिक, घातीय, अतिशयोक्तिपूर्ण, घातीय और अन्य प्रकार के कार्यों को विकल्प के रूप में चुना जा सकता है।

पैरामीटर ए और बी खोजने के लिए, प्रतिगमन समीकरण कम से कम वर्ग विधि का उपयोग करते हैं। ऐसे फ़ंक्शन को खोजने के लिए कम से कम वर्ग विधि का उपयोग करते समय जो अनुभवजन्य डेटा को सबसे अच्छा फिट करता है, यह माना जाता है कि सैद्धांतिक प्रतिगमन रेखा से अनुभवजन्य बिंदुओं के वर्ग विचलन का बैग न्यूनतम मान होना चाहिए।

न्यूनतम वर्ग विधि की कसौटी को इस प्रकार लिखा जा सकता है:

इसलिए, सीधी रेखा के पैरामीटर ए और बी को निर्धारित करने के लिए कम से कम वर्ग विधि का उपयोग जो अनुभवजन्य डेटा को सबसे अच्छी तरह से फिट करता है, एक चरम समस्या में कम हो जाता है।

रेटिंग के संबंध में, निम्नलिखित निष्कर्ष निकाले जा सकते हैं:

1. कम से कम वर्ग अनुमान नमूनाकरण कार्य हैं, जिससे उन्हें गणना करना आसान हो जाता है।

2. सबसे कम वर्ग अनुमान सैद्धांतिक प्रतिगमन गुणांक के बिंदु अनुमान हैं।

3. प्रतिगमन की अनुभवजन्य रेखा आवश्यक रूप से बिंदु x, y से होकर गुजरती है।

4. अनुभवजन्य प्रतिगमन समीकरण इस तरह से बनाया गया है कि विचलन का योग

.

अनुभवजन्य और सैद्धांतिक संचार रेखा का चित्रमय प्रतिनिधित्व चित्र 1 में दिखाया गया है।


समीकरण में पैरामीटर बी प्रतिगमन गुणांक है। यदि कोई सीधा संबंध है, तो प्रतिगमन गुणांक का मान सकारात्मक होता है, और व्युत्क्रम संबंध के मामले में, प्रतिगमन गुणांक ऋणात्मक होता है। प्रतिगमन गुणांक दिखाता है कि प्रभावी विशेषता "y" का मान औसतन कितना बदलता है जब कारक विशेषता "x" एक से बदल जाती है। ज्यामितीय रूप से, प्रतिगमन गुणांक सीधी रेखा का ढलान है जो एक्स-अक्ष के सापेक्ष सहसंबंध समीकरण को दर्शाता है (समीकरण के लिए)

).

निर्भरताओं को पुनर्प्राप्त करने के लिए समर्पित बहुभिन्नरूपी सांख्यिकीय विश्लेषण की शाखा को प्रतिगमन विश्लेषण कहा जाता है। "रैखिक प्रतिगमन विश्लेषण" शब्द का उपयोग तब किया जाता है जब विचाराधीन कार्य अनुमानित मापदंडों पर रैखिक रूप से निर्भर करता है (स्वतंत्र चर पर निर्भरता मनमानी हो सकती है)। मूल्यांकन का सिद्धांत

रैखिक प्रतिगमन विश्लेषण के मामले में अज्ञात पैरामीटर अच्छी तरह से विकसित होते हैं। यदि कोई रैखिकता नहीं है और एक रैखिक समस्या को पास करना असंभव है, तो, एक नियम के रूप में, किसी को अनुमानों से अच्छे गुणों की अपेक्षा नहीं करनी चाहिए। आइए हम विभिन्न प्रकार की निर्भरताओं के मामले में दृष्टिकोण प्रदर्शित करें। यदि निर्भरता एक बहुपद (बहुपद) का रूप है। यदि सहसंबंध गणना दो चर के बीच संबंध की ताकत को दर्शाती है, तो प्रतिगमन विश्लेषण इस संबंध के प्रकार को निर्धारित करने के लिए कार्य करता है और दूसरे (स्वतंत्र) चर के मूल्य के आधार पर एक (आश्रित) चर के मूल्य की भविष्यवाणी करना संभव बनाता है। एक रेखीय प्रतिगमन विश्लेषण करने के लिए, निर्भर चर में एक अंतराल (या क्रमसूचक) पैमाना होना चाहिए। इसी समय, बाइनरी लॉजिस्टिक रिग्रेशन किसी भी पैमाने से संबंधित कुछ अन्य चर पर एक द्विबीजपत्री चर की निर्भरता को प्रकट करता है। प्रोबिट विश्लेषण के लिए समान आवेदन शर्तें मान्य हैं। यदि आश्रित चर श्रेणीबद्ध है, लेकिन दो से अधिक श्रेणियां हैं, तो बहुराष्ट्रीय रसद प्रतिगमन यहां एक उपयुक्त विधि होगी, और अंतराल पैमाने से संबंधित चर के बीच गैर-रैखिक संबंधों का विश्लेषण किया जा सकता है। इसके लिए अरैखिक प्रतिगमन की विधि का इरादा है।

श्रेणियाँ

लोकप्रिय लेख

2023 "Kingad.ru" - मानव अंगों की अल्ट्रासाउंड परीक्षा