एमएस एक्सेल में बहु सहसंबंध गुणांक का निर्धारण।

प्रारंभ में मॉडल में परसभी मुख्य घटकों को शामिल करें (परिकलित मान कोष्ठक में दर्शाए गए हैं टी-मानदंड):

मॉडल की गुणवत्ता की विशेषता है: दृढ़ संकल्प के कई गुणांक आर = 0.517, औसत सापेक्ष सन्निकटन त्रुटि = 10.4%, अवशिष्ट विचरण एस 2= 1.79 और एफओ बीएस = 121. इस तथ्य को ध्यान में रखते हुए कि एफअवलोकन> एफसीआर = 2.85 पर α = 0.05, v1 = 6, वी 2= 14, प्रतिगमन समीकरण महत्वपूर्ण है और कम से कम एक प्रतिगमन गुणांक - β 1, β 2, β 3, β 4 - शून्य के बराबर नहीं है।

यदि प्रतिगमन समीकरण का महत्व (परिकल्पना एच 0:β 1 = β 2 = β 3 = β 4 = 0 को α = 0.05 पर चेक किया गया था, फिर प्रतिगमन गुणांक का महत्व, यानी परिकल्पना एच0: β जे = 0 (जे = 1, 2, 3, 4), 0.05 से अधिक महत्व स्तर पर जाँच की जानी चाहिए, उदाहरण के लिए, α पर = 0.1। फिर α = 0.1 के लिए, वि= 14 मान टीक्र = 1.76, और महत्वपूर्ण, समीकरण (53.41) के अनुसार, प्रतिगमन गुणांक β 1, β 2, β 3 हैं।

यह देखते हुए कि मुख्य घटक एक दूसरे के साथ सहसंबद्ध नहीं हैं, हम समीकरण से सभी महत्वहीन गुणांकों को तुरंत बाहर कर सकते हैं, और समीकरण रूप ले लेगा

(53.42)

समीकरणों (53.41) और (53.42) की तुलना करते हुए, हम देखते हैं कि महत्वहीन प्रमुख घटकों का उन्मूलन f4तथा f5, समीकरण के गुणांकों के मूल्यों को प्रभावित नहीं किया बी 0 = 9,52, बी 1 = 0,93, बी 2 = 0.66 और इसी टी जे (जे = 0, 1, 2, 3).

यह असंबद्ध प्रमुख घटकों के कारण है। यहां, प्रारंभिक संकेतकों (53.22), (53.23) और मुख्य घटकों (53.41), (53.42) के लिए प्रतिगमन समीकरणों के समानांतर दिलचस्प है।

समीकरण (53.42) महत्वपूर्ण है क्योंकि एफअवलोकन = 194 > एफक्र = 3.01 α = 0.05 पर मिला, v1 = 4, वी 2= 16। समीकरण के गुणांक भी महत्वपूर्ण हैं, क्योंकि टी जे> टीक्र . = 1.746 α = 0.01 के अनुरूप, वि= 16 के लिए जे= 0, 1, 2, 3. निर्धारण गुणांक आर= 0.486 इंगित करता है कि भिन्नता का 48.6% परपहले तीन प्रमुख घटकों के प्रभाव के कारण।

समीकरण (53.42) सन्निकटन = 9.99% और अवशिष्ट विचरण की एक औसत सापेक्ष त्रुटि की विशेषता है एस2 = 1,91.

प्रारंभिक संकेतकों के संदर्भ में प्रतिगमन मॉडल (53.23) की तुलना में प्रमुख घटकों (53.42) पर प्रतिगमन समीकरण में थोड़ा बेहतर अनुमानित गुण हैं: आर= 0,486 > आर= 0,469; = 9,99% < (एक्स) = 10.5% और एस 2 (एफ) = 1,91 < एस 2 (एक्स) = 1.97। इसके अलावा, समीकरण (53.42) में, प्रमुख घटक सभी इनपुट संकेतकों के रैखिक कार्य हैं, जबकि समीकरण (53.23) में केवल दो चर शामिल हैं ( एक्स 1तथा एक्स 4). कुछ मामलों में, किसी को यह ध्यान रखना होगा कि मॉडल (53.42) की व्याख्या करना मुश्किल है, क्योंकि इसमें तीसरा प्रमुख घटक शामिल है च 3, जिसकी हमने व्याख्या नहीं की है और प्रारंभिक संकेतकों के कुल विचरण में किसका योगदान है ( एक्स 1, ..., एक्स 5)केवल 8.6% है। हालाँकि, अपवाद च 3समीकरण से (53.42) मॉडल के अनुमानित गुणों को काफी खराब कर देता है: आर= 0.349; = 12.4% और एस 2(एफ) = 2.41। फिर उत्पादकता के प्रतिगमन मॉडल के रूप में समीकरण (53.23) को चुनना उचित है।

क्लस्टर विश्लेषण

सांख्यिकीय अनुसंधान में, प्राथमिक डेटा का समूहीकरण मुख्य निर्णय होता है वर्गीकरण कार्य,और इसलिए एकत्रित जानकारी के साथ आगे के सभी कार्यों का आधार।

परंपरागत रूप से, इस समस्या को निम्न तरीके से हल किया जाता है। ऑब्जेक्ट का वर्णन करने वाली सुविधाओं के सेट से, एक का चयन किया जाता है, जो शोधकर्ता के दृष्टिकोण से सबसे अधिक जानकारीपूर्ण होता है, और डेटा को इस सुविधा के मूल्यों के अनुसार समूहीकृत किया जाता है। यदि कई विशेषताओं के अनुसार वर्गीकृत करना आवश्यक है, महत्व के क्रम में आपस में रैंक किया गया है, तो पहले वर्गीकरण को पहली विशेषता के अनुसार किया जाता है, फिर परिणामी वर्गों में से प्रत्येक को दूसरी विशेषता के अनुसार उपवर्गों में विभाजित किया जाता है, और इसलिए पर। अधिकांश संयोजी सांख्यिकीय समूह एक समान तरीके से बनाए गए हैं।

ऐसे मामलों में जहां वर्गीकरण सुविधाओं को सुव्यवस्थित करना संभव नहीं है, बहुआयामी समूहीकरण की सबसे सरल विधि का उपयोग किया जाता है - एक अभिन्न संकेतक (सूचकांक) का निर्माण जो मूल विशेषताओं पर कार्यात्मक रूप से निर्भर है, इस सूचक के अनुसार वर्गीकरण के बाद।

इस दृष्टिकोण का विकास कारक या घटक विश्लेषण के तरीकों का उपयोग करके प्राप्त कई सामान्यीकरण संकेतकों (प्रमुख घटकों) के अनुसार वर्गीकरण का एक प्रकार है।

यदि कई सुविधाएँ (प्रारंभिक या सामान्यीकृत) हैं, तो वर्गीकरण समस्या को क्लस्टर विश्लेषण विधियों द्वारा हल किया जा सकता है, जो प्रशिक्षण नमूनों की अनुपस्थिति में अन्य बहुभिन्नरूपी वर्गीकरण विधियों से भिन्न होती हैं, अर्थात। सामान्य जनसंख्या के वितरण के बारे में प्राथमिक जानकारी।

वर्गीकरण की समस्या को हल करने के लिए योजनाओं के बीच अंतर काफी हद तक "समानता" और "समानता की डिग्री" की अवधारणाओं के अर्थ से निर्धारित होता है।

कार्य के लक्ष्य के तैयार होने के बाद, गुणवत्ता मानदंड, उद्देश्य कार्य निर्धारित करने का प्रयास करना स्वाभाविक है, जिसके मूल्य हमें विभिन्न वर्गीकरण योजनाओं की तुलना करने की अनुमति देंगे।

आर्थिक अध्ययनों में, वस्तुनिष्ठ कार्य, एक नियम के रूप में, वस्तुओं के एक सेट पर परिभाषित कुछ पैरामीटर को कम करना चाहिए (उदाहरण के लिए, वर्गीकरण उपकरण का उद्देश्य एक समूह हो सकता है जो मरम्मत कार्य के लिए समय और धन की कुल लागत को कम करता है)।

ऐसे मामलों में जहां समस्या के लक्ष्य को औपचारिक रूप देना संभव नहीं है, वर्गीकरण की गुणवत्ता की कसौटी समूहों की सार्थक व्याख्या की संभावना हो सकती है।

निम्नलिखित समस्या पर विचार करें। संग्रह करने दो पीवस्तुएं, जिनमें से प्रत्येक की विशेषता है मापा लक्षण। इस संग्रह को समूहों (वर्गों) में तोड़ना आवश्यक है जो एक निश्चित अर्थ में सजातीय हैं। इसी समय, वितरण की प्रकृति के बारे में व्यावहारिक रूप से कोई प्राथमिक जानकारी नहीं है -आयामी वेक्टर एक्सकक्षाओं के अंदर।

विभाजन के परिणामस्वरूप प्राप्त समूहों को आमतौर पर क्लस्टर * (टैक्सोन **, चित्र) कहा जाता है, उन्हें खोजने के तरीकों को क्लस्टर विश्लेषण (क्रमशः संख्यात्मक वर्गीकरण या स्व-शिक्षण के साथ पैटर्न पहचान) कहा जाता है।

* झुंड(अंग्रेज़ी) - कुछ सामान्य गुणों की विशेषता वाले तत्वों का समूह।

**tahop(अंग्रेजी) - किसी भी श्रेणी का व्यवस्थित समूह।

शुरुआत से ही यह स्पष्ट रूप से समझना आवश्यक है कि दो वर्गीकरण समस्याओं में से किसका समाधान किया जाना है। यदि सामान्य टंकण समस्या हल हो जाती है, तो प्रेक्षणों के समुच्चय को अपेक्षाकृत कम संख्या में समूहों के क्षेत्रों में विभाजित किया जाता है (उदाहरण के लिए, एक आयामी प्रेक्षणों के मामले में एक अंतराल भिन्नता श्रृंखला) ताकि एक ऐसे क्षेत्र के तत्व इस प्रकार हों जितना संभव हो एक दूसरे के करीब।

एक अन्य समस्या का समाधान एक दूसरे से कुछ दूरी पर स्थित अच्छी तरह से परिभाषित समूहों में अवलोकन के परिणामों के प्राकृतिक स्तरीकरण को निर्धारित करना है।

यदि पहली टाइपिंग समस्या का हमेशा समाधान होता है, तो दूसरे मामले में यह पता चल सकता है कि अवलोकनों का सेट क्लस्टर में प्राकृतिक स्तरीकरण नहीं दिखाता है, यानी। एक क्लस्टर बनाता है।

हालांकि क्लस्टर विश्लेषण के कई तरीके काफी प्रारंभिक हैं, अधिकांश कार्य जिनमें उन्हें प्रस्तावित किया गया है, वे पिछले दशक के हैं। यह इस तथ्य से समझाया गया है कि क्लस्टर खोज समस्याओं का कुशल समाधान, जिसके लिए बड़ी संख्या में अंकगणितीय और तार्किक संचालन की आवश्यकता होती है, कंप्यूटर प्रौद्योगिकी के आगमन और विकास के साथ ही संभव हो गया।

क्लस्टर विश्लेषण की समस्याओं में प्रारंभिक डेटा के प्रतिनिधित्व का सामान्य रूप मैट्रिक्स है

जिनमें से प्रत्येक पंक्ति माप परिणामों का प्रतिनिधित्व करती है जांच की गई वस्तुओं में से एक में माना जाता है। विशिष्ट स्थितियों में, वस्तुओं का समूहीकरण और सुविधाओं का समूहीकरण दोनों रुचि के हो सकते हैं। ऐसे मामलों में जहां इन दो कार्यों के बीच का अंतर महत्वपूर्ण नहीं है, उदाहरण के लिए, कुछ एल्गोरिदम का वर्णन करते समय, हम इस अवधारणा में "फीचर" शब्द सहित केवल "ऑब्जेक्ट" शब्द का उपयोग करेंगे।

आव्यूह एक्सक्लस्टर विश्लेषण समस्याओं में डेटा का प्रतिनिधित्व करने का एकमात्र तरीका नहीं है। कभी-कभी प्रारंभिक जानकारी वर्ग मैट्रिक्स के रूप में दी जाती है

तत्व रिजजो निकटता की डिग्री निर्धारित करता है मैं-वीं आपत्ति जे-मु।

अधिकांश क्लस्टर विश्लेषण एल्गोरिदम पूरी तरह से दूरी (या निकटता) मैट्रिक्स से आगे बढ़ते हैं या इसके अलग-अलग तत्वों की गणना की आवश्यकता होती है, इसलिए यदि डेटा फॉर्म में प्रस्तुत किया जाता है एक्स,तब क्लस्टर खोजने की समस्या को हल करने में पहला कदम वस्तुओं या सुविधाओं के बीच दूरी, या निकटता की गणना के लिए एक विधि का विकल्प होगा।

सुविधाओं के बीच निकटता का निर्धारण करने का प्रश्न हल करना कुछ आसान है। एक नियम के रूप में, सुविधाओं का क्लस्टर विश्लेषण कारक विश्लेषण के समान लक्ष्यों का पीछा करता है: इंटरकनेक्टेड सुविधाओं के समूहों का चयन जो अध्ययन के तहत वस्तुओं के एक निश्चित पहलू को दर्शाता है। इस मामले में, विभिन्न सांख्यिकीय युग्मन गुणांक निकटता के माप के रूप में कार्य करते हैं।


समान जानकारी।


परीक्षा संख्या 2

विकल्प संख्या 5

अभ्यास 1। कंप्यूटर प्रौद्योगिकी का उपयोग करते हुए, अध्ययन किए गए आर्थिक संकेतकों का एक सहसंबंध-प्रतिगमन विश्लेषण करें और एक प्रतिगमन मॉडल का निर्माण करें …………………………………..3

1.1 सहसंबंध क्षेत्र का निर्माण ………………………………………… 4

1.2 जोड़ी सहसंबंध गुणांक के एक मैट्रिक्स का निर्माण …………… 6

6

1.4 एक रेखीय एक-कारक प्रतिगमन मॉडल का निर्माण……….10

1.5 निष्कर्ष………………………………………………………………… 15

कार्य 2। कंप्यूटर प्रौद्योगिकी का उपयोग करना, रैखिक प्रोग्रामिंग समस्याओं को हल करना …………………………………………… 18

ए) इष्टतम उत्पादन योजना की समस्या ……………… 19

1. समस्या का गणितीय कथन …………………………………..19

2. एमएस एक्सेल टीपी वर्कशीट पर प्रारंभिक डेटा का प्लेसमेंट, बाधा मूल्यों की गणना, उद्देश्य समारोह मूल्यों की गणना ………19

3. एमएस एक्सेल टीपी वर्कशीट की कोशिकाओं के संदर्भ में समस्या के गणितीय मॉडल का निर्माण ……………………………………………………… 20

4. ऐड-ऑन "एक समाधान के लिए खोजें" के माध्यम से समस्या का इष्टतम समाधान खोजें ……………………………………………………… 20

5. परिणामों का विश्लेषण…………………………………………………….21

बी) परिवहन योजना (परिवहन कार्य) के अनुकूलन का कार्य ... 23

1. समस्या का गणितीय कथन………………………………..23

2. एमएस एक्सेल टीपी वर्कशीट पर डेटा का प्लेसमेंट ……………………………24

3. "एक समाधान के लिए खोज" उपयोगिता का उपयोग करने के लिए एक्सेल वर्कशीट के संदर्भ में समस्या का विवरण …………………………… 25

4. परिणामों का विश्लेषण…………………………………………………….26

प्रयुक्त साहित्य की सूची …………………………… ..28

कार्य 1। कंप्यूटर प्रौद्योगिकी का उपयोग करना, अध्ययन किए गए आर्थिक संकेतकों का सहसंबंध और प्रतिगमन विश्लेषण करना और एक प्रतिगमन मॉडल बनाना।

एक शोध उपकरण के रूप में, उपयोग करें:



ऐड-ऑन टूल्स टीपी एनालिसिस पैकेज एमएस एक्सेल;

आँकड़े (सांख्यिकी) सीकेएम मेपल लाइब्रेरी के अंतर्निहित कार्य।

टास्क 1 शर्तें:

नमूना डेटा के आधार पर, प्रभावी विशेषता Y पर कारकों X1, X2 और X3 के प्रभाव की जांच करें।

एक सहसंबंध क्षेत्र बनाएं और अध्ययन किए गए कारकों के बीच संबंधों की उपस्थिति और प्रकार के बारे में धारणा बनाएं;

अध्ययन के तहत कारकों के बीच संबंधों की निकटता का आकलन करने के बाद, एक बहुघटकीय (एकल-कारक) का निर्माण करें रैखिकफॉर्म Y=f(X1,X2 X3) या फॉर्म Y=f(X) का रिग्रेशन मॉडल।

आकलन:

नियतत्ववाद R 2 के गुणांक के मान द्वारा प्रतिगमन समीकरण की पर्याप्तता;

विश्वास संभाव्यता p=0.05 के दिए गए स्तर पर छात्र के t-परीक्षण के अनुसार प्रतिगमन समीकरण के गुणांकों का महत्व;

प्रत्येक कारक एक्स और साइन वाई (फिशर की कसौटी) के बीच संबंध की यादृच्छिकता की डिग्री;

अचल संपत्तियों के संकेतक X 1, X 2, X 3 और किसी एक उद्योग में किसी उद्यम के सकल उत्पादन की मात्रा के बीच संबंध निम्नलिखित आंकड़ों की विशेषता है:

विकल्प 5

x1 1.5 2.6 3.5 4.8 5.9 6.3 7.2 8.9 9.5 11.1 15.0
x2 10.2 15.3 18.4 20.5 24.7 25.6 27.3 28.3 29.6 30.1 31.0
x3 1.1 2.3 3.5 4.1 5.7 6.6 7.3 8.5 9.8 10.1 12.0
वाई

समस्या समाधान 1.

टास्क 1 का समाधान मानता है।

1. सहसंबंध क्षेत्र का निर्माण।

2. जोड़ी सहसंबंध गुणांक के मैट्रिक्स का निर्माण।

3. एमएस एक्सेल टीपी के अंतर्निहित कार्यों का उपयोग करके रैखिक और घातीय प्रकार के एकल-कारक प्रतिगमन मॉडल का निर्माण और विश्लेषण।

4. ऐड-इन "विश्लेषण पैकेज" का उपयोग करके रैखिक एक-कारक प्रतिगमन मॉडल का निर्माण।

5। निष्कर्ष।

सहसंबंध क्षेत्र का निर्माण।

आइए एक्सेल वर्कशीट के सेल A3:D15 में सोर्स डेटा के साथ टेबल रखें।

आवेदन 1.1
वाई X1 X2 X3
1,5 10,2 1,1
2,6 15,3 2,3
3,5 18,4 3,5
4,8 20,5 4,1
5,9 24,7 5,7
6,3 25,6 6,6
7,2 27,3 7,3
8,9 28,3 8,5
9,5 29,6 9,8
11,1 30,1 10,1
?

एमएस एक्सेल टीपी आरेख विज़ार्ड की क्षमताओं का उपयोग करते हुए, हम एक सहसंबंध क्षेत्र का निर्माण करेंगे, अर्थात, हम परिणामी विशेषता Y और प्रत्येक कारक X के बीच संबंध का रेखांकन करेंगे। रेखांकन दिखाते हैं कि परिणामी विशेषता Y और प्रत्येक के बीच कारकों X में एक सीधा आनुपातिक संबंध है जो एक रैखिक के निकट है।

.

.

हम कारकों के बीच संबंधों की निकटता और प्रकृति की जांच करते हैं।

जोड़ी सहसंबंध गुणांकों के मैट्रिक्स का निर्माण।

एमएस एक्सेल टीपी (सेवा - डेटा विश्लेषण - सहसंबंध) के "विश्लेषण पैकेज" ऐड-इन का उपयोग करके, हम जोड़ी सहसंबंध गुणांक का एक मैट्रिक्स बनाएंगे। "सहसंबंध" टूल की विंडो चित्र 1 में दिखाई गई है। जोड़ी सहसंबंध गुणांक का मैट्रिक्स चित्र 2 में दिखाया गया है।

चित्र एक। - सहसंबंध खिड़की

रेखा चित्र नम्बर 2। - जोड़ी सहसंबंध गुणांक का मैट्रिक्स।

इस मैट्रिक्स से यह देखा जा सकता है कि सभी माने गए कारक X1 - X3 का प्रभावी विशेषता Y के साथ घनिष्ठ संबंध है। इसके अलावा, सभी कारक X एक दूसरे के साथ बहुकोलिनियर हैं। इसलिए, Y=f(X1,X2,X3) के रूप के बहुक्रियात्मक मॉडल का निर्माण असंभव है।

सहसंबंध गुणांक दो संकेतकों के बीच संबंध की डिग्री को दर्शाता है। हमेशा -1 से 1 तक मान लेता है। यदि गुणांक 0 के पास स्थित है, तो वे कहते हैं कि चर के बीच कोई संबंध नहीं है।

यदि मान एक के करीब है (उदाहरण के लिए 0.9 से), तो देखी गई वस्तुओं के बीच एक मजबूत प्रत्यक्ष संबंध है। यदि गुणांक सीमा (-1) के दूसरे चरम बिंदु के करीब है, तो चर के बीच एक मजबूत व्युत्क्रम संबंध होता है। जब मान 0 से 1 या 0 से -1 के बीच में कहीं होता है, तो हम एक कमजोर संबंध (आगे या पीछे) के बारे में बात कर रहे हैं। इस संबंध पर आमतौर पर ध्यान नहीं दिया जाता है: ऐसा माना जाता है कि यह अस्तित्व में नहीं है।

एक्सेल में सहसंबंध गुणांक की गणना

उदाहरण के लिए, सहसंबंध गुणांक की गणना के तरीके, चर के बीच प्रत्यक्ष और व्युत्क्रम संबंध की विशेषताएं।

संकेतक x और y के मान:

Y स्वतंत्र चर है, x आश्रित चर है। उनके बीच संबंध की ताकत (मजबूत/कमजोर) और दिशा (आगे/पीछे) का पता लगाना जरूरी है। सहसंबंध गुणांक का सूत्र इस प्रकार है:


इसकी समझ को आसान बनाने के लिए, हम इसे कई सरल तत्वों में तोड़ देंगे।

चरों के बीच एक मजबूत सीधा संबंध है।

बिल्ट-इन CORREL फ़ंक्शन जटिल गणनाओं से बचा जाता है। आइए इसका उपयोग करके एक्सेल में जोड़ी सहसंबंध गुणांक की गणना करें। हम कार्यों के मास्टर कहते हैं। हमें वह मिल जाता है जिसकी हमें आवश्यकता होती है। फ़ंक्शन तर्क y मानों की एक सरणी और x मानों की एक सरणी है:

आइए चार्ट पर वेरिएबल्स के मान दिखाते हैं:


वाई और एक्स के बीच एक मजबूत संबंध है, क्योंकि रेखाएँ लगभग एक दूसरे के समानांतर चलती हैं। संबंध प्रत्यक्ष है: y बढ़ाना - x बढ़ाना, y घटाना - x घटाना।



एक्सेल में पेयरवाइज सहसंबंध गुणांक का मैट्रिक्स

सहसंबंध मैट्रिक्स एक तालिका है, जिसमें पंक्तियों और स्तंभों के चौराहे पर संबंधित मानों के बीच सहसंबंध गुणांक होते हैं। इसे कई चरों के लिए बनाना समझ में आता है।

एक्सेल में सहसंबंध गुणांक का मैट्रिक्स "डेटा विश्लेषण" पैकेज से "सहसंबंध" उपकरण का उपयोग करके बनाया गया है।


y और x1 के मानों के बीच एक मजबूत सीधा संबंध पाया गया। X1 और x2 के बीच एक मजबूत प्रतिक्रिया है। X3 कॉलम में मानों के साथ व्यावहारिक रूप से कोई संबंध नहीं है।

1. युग्मित सहसंबंध गुणांकों के मैट्रिक्स की गणना करें; परिणामी विशेषता के संबंध की जकड़न और दिशा का विश्लेषण करें वाईप्रत्येक कारक के साथ। एक्स; सहसंबंध गुणांकों के सांख्यिकीय महत्व का मूल्यांकन करें आर(वाई,एक्समैं); सबसे अधिक जानकारीपूर्ण कारक चुनें।

2. सबसे अधिक जानकारीपूर्ण कारक के साथ एक युग्मित प्रतिगमन मॉडल बनाएं; प्रतिगमन गुणांक की आर्थिक व्याख्या दें।

3. सन्निकटन की औसत सापेक्ष त्रुटि, दृढ़ संकल्प के गुणांक और F - फिशर की कसौटी (महत्व स्तर α = 0.05 लें) का उपयोग करके मॉडल की गुणवत्ता का मूल्यांकन करें।

4. संकेतक के औसत मूल्य की भविष्यवाणी करने के लिए आत्मविश्वास की संभावना γ=80% के साथ वाई(कारकों के पूर्वानुमान मान परिशिष्ट 6 में दिए गए हैं)। रेखांकन वास्तविक और मॉडल मान प्रस्तुत करें वाई, भविष्यवाणी परिणाम।

5. समावेशन विधि का उपयोग करते हुए, उनमें सबसे अधिक जानकारीपूर्ण कारक रखते हुए, दो-कारक मॉडल बनाएं; कारकों की पूरी सूची के साथ एक तीन-कारक मॉडल बनाएँ।

6. निर्मित एकाधिक मॉडलों में से सर्वश्रेष्ठ चुनें। इसके गुणांकों की आर्थिक व्याख्या दीजिए।

7. बहु समाश्रयण गुणांकों के महत्व की जाँच करें टी-विद्यार्थी का परीक्षण (महत्व स्तर α=0.05 स्वीकार करें)। क्या पेयर मॉडल की तुलना में मल्टीपल मॉडल की गुणवत्ता में सुधार हुआ है?

8. लोच गुणांक, बीटा और डेल्टा गुणांक का उपयोग करके परिणाम पर कारकों के प्रभाव का आकलन करें।

टास्क 2। एक आयामी समय श्रृंखला की मॉडलिंग करना

परिशिष्ट 7 समय श्रृंखला दिखाता है वाई (टी) 2000 से 2011 की अवधि के लिए अल्ताई क्षेत्र के लिए सामाजिक-आर्थिक संकेतक। कार्य संस्करण के अनुरूप संकेतक की गतिशीलता का अध्ययन करना आवश्यक है।

विकल्प पदनाम, नाम, सूचक के माप की इकाई
वाई1 प्रति व्यक्ति औसत उपभोक्ता खर्च (प्रति माह), घिसना।
वाई2 वायुमंडलीय हवा में प्रदूषकों का उत्सर्जन, हजार टन
वाई3 द्वितीयक आवास बाजार में औसत मूल्य (वर्ष के अंत में, कुल क्षेत्रफल का प्रति वर्ग मीटर), घिसना
वाई4 प्रति व्यक्ति भुगतान सेवाओं की मात्रा, रगड़
वाई5 अर्थव्यवस्था में कार्यरत लोगों की औसत वार्षिक संख्या, हज़ार लोग
वाई6 प्रति 1000 लोगों पर खुद की कारों की संख्या (वर्ष के अंत में), टुकड़े
वाई7 औसत प्रति व्यक्ति नकद आय (प्रति माह), रगड़
वाई8 उपभोक्ता मूल्य सूचकांक (पिछले वर्ष दिसंबर से दिसंबर), %
वाई9 अचल संपत्तियों में निवेश (वास्तविक कीमतों में), मिलियन रूबल
वाई10 प्रति व्यक्ति खुदरा व्यापार कारोबार (वास्तविक कीमतों में), रगड़


कार्य आदेश

1. समय श्रृंखला का एक रेखीय मॉडल बनाएं, जिसके मापदंडों का अनुमान सबसे कम वर्गों द्वारा लगाया जाता है। प्रतिगमन गुणांक का अर्थ समझाइए।

2. यादृच्छिकता, स्वतंत्रता, और सामान्य वितरण कानून के अवशिष्ट घटक के पत्राचार के गुणों का उपयोग करके निर्मित मॉडल की पर्याप्तता का आकलन करें।

3. औसत सापेक्ष सन्निकटन त्रुटि के उपयोग के आधार पर मॉडल की सटीकता का मूल्यांकन करें।

4. एक वर्ष के लिए विचाराधीन संकेतक का पूर्वानुमान लगाएं (70% के विश्वास स्तर के साथ पूर्वानुमान अंतराल की गणना करें)।

5. संकेतक के वास्तविक मूल्यों, मॉडलिंग और पूर्वानुमान के परिणामों को ग्राफिक रूप से प्रस्तुत करें।

6. लघुगणक, बहुपद (द्वितीय डिग्री का बहुपद), शक्ति, घातीय और अतिशयोक्तिपूर्ण प्रवृत्तियों के मापदंडों की गणना करें। ग्राफिक छवि और निर्धारण सूचकांक के मूल्य के आधार पर, सबसे उपयुक्त प्रकार की प्रवृत्ति का चयन करें।

7. सर्वश्रेष्ठ गैर-रैखिक मॉडल की मदद से, आने वाले वर्ष के लिए विचारित संकेतक का बिंदु पूर्वानुमान करें। रेखीय मॉडल का उपयोग करके बनाए गए पूर्वानुमानित विश्वास अंतराल के साथ प्राप्त परिणाम की तुलना करें।

उदाहरण

नियंत्रण कार्य करना

कार्य 1

कंपनी पुरानी कारें बेचती है। अर्थमितीय मॉडलिंग के संकेतक और प्रारंभिक डेटा के नाम तालिका में प्रस्तुत किए गए हैं:

प्राप्ति मूल्य, हजार सी.यू. ( वाई) एक नई कार की कीमत, हजार सी.यू. ( X1) सेवा जीवन, वर्ष ( x2) लेफ्ट हैंड ड्राइव - 1, राइट हैंड ड्राइव - 0, ( x3)
8,33 13,99 3,8
10,40 19,05 2,4
10,60 17,36 4,5
16,58 25,00 3,5
20,94 25,45 3,0
19,13 31,81 3,5
13,88 22,53 3,0
8,80 16,24 5,0
13,89 16,54 2,0
11,03 19,04 4,5
14,88 22,61 4,6
20,43 27,56 4,0
14,80 22,51 3,3
26,05 31,75 2,3

आवश्यक:

1. युग्मित सहसंबंध गुणांकों के मैट्रिक्स की गणना करें; प्रत्येक कारक X के साथ परिणामी विशेषता Y के संबंध की जकड़न और दिशा का विश्लेषण करें; सहसंबंध गुणांक r(Y, X i) के सांख्यिकीय महत्व का मूल्यांकन करें; सबसे अधिक जानकारीपूर्ण कारक चुनें।

एक्सेल (डेटा / डेटा विश्लेषण / सहसंबंध) का उपयोग करना:

आइए सभी उपलब्ध चरों के बीच जोड़ी सहसंबंध गुणांक का एक मैट्रिक्स प्राप्त करें:

पर X1 x2 x3
पर
X1 0,910987
x2 -0,4156 -0,2603
x3 0,190785 0,221927 -0,30308

आइए परिणामी विशेषता के बीच सहसंबंध गुणांक का विश्लेषण करें वाईऔर प्रत्येक कारक एक्सजे:

> 0, इसलिए, चर के बीच वाईतथा एक्स 1 में सीधा संबंध है: नई कार की कीमत जितनी अधिक होगी, विक्रय मूल्य उतना ही अधिक होगा।

> 0.7 - यह निर्भरता निकट है।

< 0, значит, между переменными वाईतथा एक्स 2 मनाया

उलटा सहसंबंध: ऑटो के लिए बिक्री मूल्य कम है-

लंबी सेवा जीवन वाले मोबाइल फोन।

– यह निर्भरता मध्यम है, कमजोर के करीब है।

> 0, तो चर के बीच वाईतथा एक्स 3 एक सीधा संबंध दिखाता है: लेफ्ट-हैंड ड्राइव कारों के लिए बिक्री मूल्य अधिक है।

< 0,4 – эта зависимость слабая.

पाए गए सहसंबंध गुणांकों के महत्व की जांच करने के लिए, हम छात्र के परीक्षण का उपयोग करते हैं।

प्रत्येक सहसंबंध गुणांक के लिए गणना करना टीसूत्र द्वारा सांख्यिकी और सहसंबंध तालिका के एक अतिरिक्त कॉलम में गणना परिणाम दर्ज करें:

पर X1 x2 x3 टी सांख्यिकी
पर
X1 0,910987 7,651524603
x2 -0,4156 -0,2603 1,582847988
x3 0,190785 0,221927 -0,30308 0,673265587

महत्व के स्तर पर छात्र के वितरण के महत्वपूर्ण बिंदुओं की तालिका के अनुसार और स्वतंत्रता की डिग्री की संख्या, हम महत्वपूर्ण मूल्य निर्धारित करते हैं (परिशिष्ट 1, या फ़ंक्शन STUDRASP)। Y और सेवा जीवन एक्स 2 विश्वसनीय है।

< , следовательно, коэффициент не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой реализации वाईऔर स्टीयरिंग व्हील की स्थिति एक्स 3 विश्वसनीय है।

इस प्रकार, बिक्री मूल्य के बीच निकटतम और सबसे महत्वपूर्ण संबंध देखा जाता है वाईऔर एक नई कार की कीमत एक्सएक ; कारक एक्स 1 सबसे अधिक जानकारीपूर्ण है।

युग्मित सहसंबंध गुणांकों के मैट्रिक्स के विश्लेषण से पता चलता है कि प्रदर्शन सूचक सूचक से सबसे निकट से संबंधित है एक्स(4) - 1 हेक्टेयर () में प्रयुक्त उर्वरकों की मात्रा।

साथ ही, सुविधाओं-तर्कों के बीच संबंध काफी करीब है। तो, पहिएदार ट्रैक्टरों की संख्या के बीच व्यावहारिक रूप से एक कार्यात्मक संबंध है ( एक्स(1)) और सतह जुताई के औजारों की संख्या
.

सहसंबंध गुणांकों द्वारा बहुसंरेखता की उपस्थिति का भी प्रमाण मिलता है
तथा
. संकेतकों के घनिष्ठ संबंध को देखते हुए एक्स (1) , एक्स(2) और एक्स(3) उनमें से केवल एक ही उपज प्रतिगमन मॉडल में प्रवेश कर सकता है।

बहुसंरेखता के नकारात्मक प्रभाव को प्रदर्शित करने के लिए, सभी इनपुट सहित उपज प्रतिगमन मॉडल पर विचार करें:


फोब्स = 121।

कोष्ठक में समीकरण के गुणांकों के अनुमानों के मानक विचलन के सही अनुमानों के मान हैं
.

प्रतिगमन समीकरण के तहत, निम्नलिखित पर्याप्तता पैरामीटर प्रस्तुत किए जाते हैं: दृढ़ संकल्प के कई गुणांक
; संशोधित अवशिष्ट विचरण अनुमान
, सन्निकटन की औसत सापेक्ष त्रुटि और परिकलित मान-मानदंड Fobs = 121।

प्रतिगमन समीकरण महत्वपूर्ण है क्योंकि टेबल से F obl = 121 > F kp = 2.85 मिला एफ-वितरण =0.05;  1 = 6 और  2 = 14।

इससे यह पता चलता है कि 0, यानी और समीकरण  के ​​गुणांकों में से कम से कम एक जे (जे= 0, 1, 2, ..., 5) शून्य के बराबर नहीं है।

व्यक्तिगत प्रतिगमन गुणांक H0 के महत्व के बारे में परिकल्पना का परीक्षण करने के लिए:  j = 0, जहां जे=1,2,3,4,5, क्रिटिकल वैल्यू की तुलना करें टीकेपी = 2.14, तालिका से मिला टीमहत्व स्तर पर वितरण=2 क्यू=0.05 और स्वतंत्रता की डिग्री की संख्या=14, गणना मूल्य के साथ . यह समीकरण से अनुसरण करता है कि प्रतिगमन गुणांक केवल तभी सांख्यिकीय रूप से महत्वपूर्ण होता है एक्स(4) चूंकि टी 4 =2.90 > टीकेपी=2.14।

प्रतिगमन गुणांक के नकारात्मक संकेत पर एक्स(1) और एक्स(5) । गुणांक के नकारात्मक मूल्यों से, यह इस प्रकार है कि पहिएदार ट्रैक्टरों के साथ कृषि की संतृप्ति में वृद्धि ( एक्स(1)) और पादप स्वास्थ्य उत्पाद ( एक्स(5)) उपज को नकारात्मक रूप से प्रभावित करता है। इस प्रकार, परिणामी प्रतिगमन समीकरण अस्वीकार्य है।

महत्वपूर्ण गुणांकों के साथ एक प्रतिगमन समीकरण प्राप्त करने के लिए, हम चरण-दर-चरण प्रतिगमन विश्लेषण एल्गोरिथ्म का उपयोग करते हैं। प्रारंभ में, हम चर के उन्मूलन के साथ चरण-दर-चरण एल्गोरिथम का उपयोग करते हैं।

मॉडल से एक चर को बाहर करें एक्स(1) , जो न्यूनतम निरपेक्ष मान से मेल खाता है टी 1 =0.01। शेष चरों के लिए, हम फिर से प्रतिगमन समीकरण का निर्माण करेंगे:

परिणामी समीकरण महत्वपूर्ण है, क्योंकि F obs = 155 > F kp = 2.90, एक महत्व स्तर पर पाया गया =0.05 और स्वतंत्रता की डिग्री की संख्या  1 = 5 और  2 = 15 तालिका के अनुसार एफ-वितरण, यानी वेक्टर0. हालाँकि, समीकरण में केवल प्रतिगमन गुणांक महत्वपूर्ण है एक्स(चार) । अनुमानित मान टीजे  अन्य गुणांक से कम के लिए टी kr = 2.131 तालिका में पाया गया टी-वितरण =2 पर क्यू=0.05 और =15।

मॉडल से एक चर को बाहर करना एक्स(3) , जो न्यूनतम मूल्य से मेल खाता है टी 3 = 0.35 और प्रतिगमन समीकरण प्राप्त करें:

(2.9)

परिणामी समीकरण में, यह सांख्यिकीय रूप से महत्वपूर्ण नहीं है और हम आर्थिक रूप से गुणांक की व्याख्या नहीं कर सकते हैं एक्स(5) । के सिवा एक्स(5) हमें प्रतिगमन समीकरण मिलता है:

(2.10)

हमने सार्थक और व्याख्यात्मक गुणांकों के साथ एक सार्थक प्रतिगमन समीकरण प्राप्त किया है।

हालाँकि, परिणामी समीकरण हमारे उदाहरण में केवल "अच्छा" या "सर्वश्रेष्ठ" उपज मॉडल नहीं है।

आइए दिखाते हैं मल्टीकोलिनियरिटी की स्थिति में, चरण-दर-चरण एल्गोरिदम चर के समावेश के साथ अधिक कुशल है।उपज मॉडल में पहला कदम वाईएक चर शामिल है एक्स(4) जिसके साथ उच्चतम सहसंबंध गुणांक है वाई, चर द्वारा समझाया गया आर(वाई,एक्स(4))=0.58। दूसरे चरण में, समीकरण सहित एक्स(4) चर एक्स(1) या एक्स(3) हमें ऐसे मॉडल मिलेंगे जो आर्थिक कारणों और सांख्यिकीय विशेषताओं के लिए (2.10) से बेहतर हैं:

(2.11)

(2.12)

समीकरण में शेष तीन चरों में से किसी को शामिल करने से इसके गुण बिगड़ जाते हैं। उदाहरण के लिए, समीकरण (2.9) देखें।

इस प्रकार, हमारे पास तीन "अच्छे" उपज मॉडल हैं, जिनमें से एक को आर्थिक और सांख्यिकीय कारणों से चुना जाना चाहिए।

सांख्यिकीय मानदंडों के अनुसार, मॉडल (2.11) सबसे पर्याप्त है। यह अवशिष्ट विचरण के न्यूनतम मूल्यों से मेल खाता है =2.26 और सन्निकटन की औसत सापेक्ष त्रुटि और सबसे बड़ा मान
और फोब्स = 273।

मॉडल (2.12) में पर्याप्तता के कुछ बदतर संकेतक हैं, और फिर मॉडल (2.10)।

अब हम सर्वश्रेष्ठ मॉडल (2.11) और (2.12) चुनेंगे। ये मॉडल चर में एक दूसरे से भिन्न होते हैं एक्स(1) और एक्स(3) । हालाँकि, उपज मॉडल में, चर एक्स(1) (प्रति 100 हेक्टेयर पहिएदार ट्रैक्टरों की संख्या) चर के लिए बेहतर है एक्स(3) (सतह जुताई की संख्या प्रति 100 हेक्टेयर), जो कुछ हद तक गौण है (या इससे प्राप्त)। एक्स (1)).

इस संबंध में आर्थिक कारणों से मॉडल (2.12) को वरीयता दी जानी चाहिए। इस प्रकार, चरणबद्ध प्रतिगमन विश्लेषण एल्गोरिथ्म को चर के समावेश के साथ लागू करने के बाद और इस तथ्य को ध्यान में रखते हुए कि तीन संबंधित चर में से केवल एक को समीकरण में प्रवेश करना चाहिए ( एक्स (1) ,एक्स(2) या एक्स(3)) अंतिम प्रतिगमन समीकरण चुनें:

समीकरण =0.05 पर महत्वपूर्ण है, क्योंकि तालिका से F obl = 266 > F kp = 3.20 प्राप्त हुआ एफ-वितरण पर = क्यू\u003d 0.05;  1 \u003d 3 और  2 \u003d 17। सभी प्रतिगमन गुणांक भी महत्वपूर्ण हैं। तथा समीकरण में टीज> टीकेपी (=2 क्यू\u003d 0.05;  \u003d 17) \u003d 2.11। प्रतिगमन गुणांक  1 को आर्थिक कारणों से महत्वपूर्ण ( 1  0) के रूप में पहचाना जाना चाहिए, जबकि टी 1 =2.09 केवल थोड़ा सा कम टीकेपी = 2.11।

प्रतिगमन समीकरण से यह पता चलता है कि प्रति 100 हेक्टेयर कृषि योग्य भूमि (एक निश्चित मूल्य के साथ) में ट्रैक्टरों की संख्या में प्रति इकाई वृद्धि एक्स(4)) अनाज की पैदावार में औसतन 0.345 सी / हेक्टेयर की वृद्धि होती है।

लोच के गुणांक की अनुमानित गणना ई 1  0.068 और ई 2  0.161 से पता चलता है कि संकेतकों में वृद्धि के साथ एक्स(1) और एक्स(4) 1% से, अनाज की उपज क्रमशः 0.068% और 0.161% की औसत से बढ़ जाती है।

दृढ़ संकल्प के एकाधिक गुणांक
इंगित करता है कि केवल 46.9% उपज भिन्नता को मॉडल में शामिल संकेतकों द्वारा समझाया गया है ( एक्स(1) और एक्स(4)), यानी ट्रैक्टर और उर्वरकों के साथ फसल उत्पादन की संतृप्ति। बाकी भिन्नता कारकों के लिए बेहिसाब कार्रवाई के कारण है ( एक्स (2) ,एक्स (3) ,एक्स(5), मौसम की स्थिति, आदि)। औसत सापेक्ष सन्निकटन त्रुटि मॉडल की पर्याप्तता, साथ ही अवशिष्ट विचरण के मूल्य की विशेषता है
. प्रतिगमन समीकरण की व्याख्या करते समय, सापेक्ष सन्निकटन त्रुटियों के मूल्य रुचि के होते हैं
. याद करें कि - परिणामी संकेतक का मॉडल मूल्य, विचार किए गए क्षेत्रों की समग्रता के लिए औसत उपज मूल्य की विशेषता है, बशर्ते कि व्याख्यात्मक चर के मान एक्स(1) और एक्स(4) समान स्तर पर निश्चित, अर्थात् एक्स (1) =एक्स मैं(1) और एक्स (4) = एक्स मैं(चार) । फिर मूल्यों से  मैंउपज की तुलना की जा सकती है। जिन क्षेत्रों के मान मिलते हैं मैं> 0, औसत से अधिक उपज है, a मैं <0 - ниже среднего.

हमारे उदाहरण में, उपज के मामले में, फसल उत्पादन उस क्षेत्र में सबसे प्रभावी है जो  के अनुरूप है 7 = 28%, जहां उपज क्षेत्र के लिए औसत से 28% अधिक है, और सबसे कम कुशल - c के क्षेत्र में 20 =27,3%.

श्रेणियाँ

लोकप्रिय लेख

2022 "Kingad.ru" - मानव अंगों की अल्ट्रासाउंड परीक्षा