गुणांकों के न्यूनतम वर्गों के निर्धारण की विधि। प्रयोगात्मक डेटा का अनुमान

3. विधि का उपयोग करके कार्यों का अनुमान

कम से कम वर्गों

प्रयोग के परिणामों को संसाधित करते समय कम से कम वर्ग विधि का उपयोग किया जाता है अनुमान (अनुमान) प्रयोगात्मक डेटा विश्लेषणात्मक सूत्र। सूत्र का विशिष्ट रूप, एक नियम के रूप में, भौतिक विचारों से चुना जाता है। ये सूत्र हो सकते हैं:

और दूसरे।

न्यूनतम वर्ग विधि का सार इस प्रकार है। माप परिणामों को तालिका में प्रस्तुत करने दें:

मेज 4

एक्स एन

Y n

(3.1)

जहां च एक ज्ञात कार्य है,ए 0, ए 1, …, एएम - अज्ञात निरंतर पैरामीटर, जिसका मान अवश्य पाया जाना चाहिए। कम से कम वर्ग विधि में, प्रयोगात्मक निर्भरता के लिए फ़ंक्शन (3.1) का अनुमान सबसे अच्छा माना जाता है यदि स्थिति

(3.2)

वह है मात्रा एक प्रायोगिक निर्भरता से वांछित विश्लेषणात्मक कार्य का वर्ग विचलन न्यूनतम होना चाहिए .

ध्यान दें कि समारोहक्यू बुलाया inviscid.


विसंगति के बाद से

तो यह एक न्यूनतम है। पैरामीटर के संबंध में इस फ़ंक्शन के सभी आंशिक डेरिवेटिव के शून्य की समानता कई चर के फ़ंक्शन के न्यूनतम के लिए एक आवश्यक शर्त है। इस प्रकार, सन्निकटन फ़ंक्शन (3.1) के मापदंडों के सर्वोत्तम मूल्यों का पता लगाना, अर्थात वे मान जिनके लिएक्यू = क्यू (ए 0, ए 1, …, एएम ) न्यूनतम है, समीकरणों की प्रणाली को हल करने के लिए कम करता है:

(3.3)

कम से कम वर्गों की विधि को निम्नलिखित ज्यामितीय व्याख्या दी जा सकती है: किसी दिए गए प्रकार की रेखाओं के एक अनंत परिवार के बीच, एक रेखा पाई जाती है, जिसके लिए प्रायोगिक बिंदुओं के निर्देशांक और बिंदुओं के संगत निर्देशांक में वर्ग अंतर का योग होता है। इस रेखा के समीकरण द्वारा पाया गया सबसे छोटा होगा।

एक रैखिक समारोह के पैरामीटर ढूँढना

प्रयोगात्मक डेटा को एक रैखिक फ़ंक्शन द्वारा प्रदर्शित करने दें:

ऐसे मूल्यों को चुनना आवश्यक हैए और बी , जिसके लिए समारोह

(3.4)

न्यूनतम होगा। न्यूनतम फ़ंक्शन (3.4) के लिए आवश्यक शर्तें समीकरणों की प्रणाली में कम हो जाती हैं:

परिवर्तनों के बाद, हम दो अज्ञात के साथ दो रैखिक समीकरणों की एक प्रणाली प्राप्त करते हैं:

(3.5)

जिसे हल करते हुए, हम मापदंडों के वांछित मान पाते हैंए और बी।

एक द्विघात समारोह के पैरामीटर ढूँढना

यदि सन्निकटन कार्य एक द्विघात निर्भरता है

फिर इसके पैरामीटर ए, बी, सी फ़ंक्शन की न्यूनतम स्थिति से खोजें:

(3.6)

फ़ंक्शन (3.6) के लिए न्यूनतम शर्तें समीकरणों की प्रणाली में कम हो जाती हैं:


परिवर्तनों के बाद, हम तीन अज्ञात के साथ तीन रैखिक समीकरणों की एक प्रणाली प्राप्त करते हैं:

(3.7)

पर जिसे हल करके हम मापदंडों के वांछित मान पाते हैंए, बी और सी।

उदाहरण . प्रयोग के परिणाम के रूप में मूल्यों की निम्न तालिका प्राप्त करेंएक्स और वाई :

मेज 5

यी

0,705

0,495

0,426

0,357

0,368

0,406

0,549

0,768

प्रयोगात्मक डेटा को रैखिक और द्विघात कार्यों द्वारा अनुमानित करना आवश्यक है।

समाधान। अनुमानित कार्यों के पैरामीटर ढूँढना रैखिक समीकरणों (3.5) और (3.7) की प्रणालियों को हल करने के लिए कम हो जाता है। समस्या को हल करने के लिए, हम एक स्प्रेडशीट प्रोसेसर का उपयोग करते हैंएक्सेल।

1. पहले हम शीट 1 और 2 को लिंक करते हैं। प्रयोगात्मक मान दर्ज करेंएक्स आई और यीस्तंभों में ए और बी, दूसरी पंक्ति से शुरू (पहली पंक्ति में हम कॉलम शीर्षक डालते हैं)। फिर हम इन स्तंभों के योगों की गणना करते हैं और उन्हें दसवीं पंक्ति में रखते हैं।

कॉलम सी-जी में गणना और योग क्रमशः रखें

2. शीट्स को अनहुक करें। आगे की गणना शीट 1 पर रैखिक निर्भरता के लिए और शीट 2 पर द्विघात निर्भरता के लिए समान तरीके से की जाएगी।

3. परिणामी तालिका के तहत, हम गुणांकों का एक मैट्रिक्स और मुक्त शर्तों का एक कॉलम वेक्टर बनाते हैं। निम्नलिखित एल्गोरिथम के अनुसार रैखिक समीकरणों की प्रणाली को हल करें:

व्युत्क्रम मैट्रिक्स की गणना करने और मैट्रिक्स को गुणा करने के लिए, हम उपयोग करते हैं मालिक कार्योंऔर कार्य करता है MOBRतथा ममनोज़.

4. सेल ब्लॉक H2 में:एच 9 प्राप्त गुणांक के आधार पर, हम गणना करते हैं अनुमानित के मूल्यबहुपदयी कैल्कब्लॉक I 2 में: I 9 - विचलन डी वाई आई = यी ऍक्स्प. - यी कैल्ककॉलम जे में - विसंगति:

तालिकाएँ प्राप्त की गईं और उनका उपयोग करके बनाया गया चार्ट विजार्ड्सग्राफ 6, 7, 8 में दिखाए गए हैं।


चावल। 6. एक रैखिक समारोह के गुणांकों की गणना के लिए तालिका,

अनुमान करने वालेप्रयोगात्मक डेटा।


चावल। 7. द्विघात फ़ंक्शन के गुणांक की गणना के लिए तालिका,

अनुमान करने वालेप्रयोगात्मक डेटा।


चावल। 8. सन्निकटन के परिणामों का चित्रमय प्रतिनिधित्व

प्रायोगिक डेटा रैखिक और द्विघात कार्य।

उत्तर। प्रायोगिक डेटा को रैखिक निर्भरता द्वारा अनुमानित किया गया था वाई = 0,07881 एक्स + 0,442262 अवशिष्ट के साथ क्यू = 0,165167 और द्विघात निर्भरता वाई = 3,115476 एक्स 2 – 5,2175 एक्स + 2,529631 अवशिष्ट के साथ क्यू = 0,002103 .

कार्य। सारणीबद्ध, रैखिक और द्विघात कार्यों द्वारा दिए गए फ़ंक्शन का अनुमान लगाएं।

तालिका 6

№0

एक्स

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

वाई

3,030

3,142

3,358

3,463

3,772

3,251

3,170

3,665

1

3,314

3,278

3,262

3,292

3,332

3,397

3,487

3,563

2

1,045

1,162

1,264

1,172

1,070

0,898

0,656

0,344

3

6,715

6,735

6,750

6,741

6,645

6,639

6,647

6,612

4

2,325

2,515

2,638

2,700

2,696

2,626

2,491

2,291

5

1.752

1,762

1,777

1,797

1,821

1,850

1,884

1,944

6

1,924

1,710

1,525

1,370

1,264

1,190

1,148

1,127

7

1,025

1,144

1,336

1,419

1,479

1,530

1,568

1,248

8

5,785

5,685

5,605

5,545

5,505

5,480

5,495

5,510

9

4,052

4,092

4,152

4,234

4,338

4,468

4,599

उदाहरण।

चर के मूल्यों पर प्रायोगिक डेटा एक्सतथा परतालिका में दिए गए हैं।

उनके संरेखण के परिणामस्वरूप, function

का उपयोग करते हुए न्यूनतम वर्ग विधि, इन आंकड़ों को एक रैखिक निर्भरता के साथ अनुमानित करें वाई = कुल्हाड़ी + ख(पैरामीटर खोजें एकतथा बी). पता करें कि दोनों में से कौन सी रेखा बेहतर है (न्यूनतम वर्ग विधि के अर्थ में) प्रयोगात्मक डेटा को संरेखित करती है। रेखाचित्र बनाओ।

कम से कम वर्ग (एलएसएम) की विधि का सार।

समस्या रैखिक निर्भरता गुणांक खोजने की है जिसके लिए दो चर का कार्य एकतथा बी सबसे छोटा मान लेता है। यानी डेटा दिया एकतथा बीपाई गई सीधी रेखा से प्रायोगिक डेटा के वर्ग विचलन का योग सबसे छोटा होगा। यह कम से कम वर्ग विधि का संपूर्ण बिंदु है।

इस प्रकार, उदाहरण का समाधान दो चरों के एक समारोह के चरम को खोजने के लिए कम हो गया है।

गुणांक खोजने के लिए सूत्रों की व्युत्पत्ति।

दो अज्ञात के साथ दो समीकरणों की एक प्रणाली संकलित और हल की जाती है। कार्यों के आंशिक डेरिवेटिव ढूँढना चर द्वारा एकतथा बी, हम इन डेरिवेटिव्स को शून्य के बराबर करते हैं।

हम समीकरणों की परिणामी प्रणाली को किसी भी विधि से हल करते हैं (उदाहरण के लिए प्रतिस्थापन विधिया क्रैमर की विधि) और न्यूनतम वर्ग विधि (LSM) का उपयोग करके गुणांक ज्ञात करने के लिए सूत्र प्राप्त करें।

डेटा के साथ एकतथा बीसमारोह सबसे छोटा मान लेता है। इस बात का प्रमाण दिया है पृष्ठ के अंत में पाठ के नीचे.

कम से कम वर्गों की पूरी विधि यही है। पैरामीटर खोजने का सूत्र एकइसमें योग,,, और पैरामीटर शामिल हैं एन- प्रयोगात्मक डेटा की मात्रा। इन राशियों के मूल्यों की अलग से गणना करने की सिफारिश की जाती है। गुणक बीगणना के बाद मिला एक.

यह मूल उदाहरण को याद करने का समय है।

समाधान।

हमारे उदाहरण में एन = 5. हम आवश्यक गुणांक के सूत्रों में शामिल राशियों की गणना की सुविधा के लिए तालिका भरते हैं।

तालिका की चौथी पंक्ति में मान प्रत्येक संख्या के लिए तीसरी पंक्ति के मानों द्वारा दूसरी पंक्ति के मानों को गुणा करके प्राप्त किया जाता है मैं.

तालिका की पाँचवीं पंक्ति में मान प्रत्येक संख्या के लिए दूसरी पंक्ति के मानों को चुकता करके प्राप्त किया जाता है मैं.

तालिका के अंतिम स्तंभ के मान पंक्तियों के मानों का योग हैं।

गुणांक ज्ञात करने के लिए हम न्यूनतम वर्ग विधि के सूत्रों का उपयोग करते हैं एकतथा बी. हम उनमें तालिका के अंतिम स्तंभ से संबंधित मानों को प्रतिस्थापित करते हैं:

फलस्वरूप, वाई = 0.165x + 2.184वांछित अनुमानित सीधी रेखा है।

यह पता लगाना बाकी है कि कौन सी रेखा है वाई = 0.165x + 2.184या बेहतर मूल डेटा का अनुमान लगाता है, यानी कम से कम वर्ग विधि का उपयोग करके अनुमान लगाने के लिए।

कम से कम वर्गों की विधि की त्रुटि का अनुमान।

ऐसा करने के लिए, आपको इन पंक्तियों से मूल डेटा के वर्ग विचलन की गणना करने की आवश्यकता है तथा , एक छोटा मान एक रेखा से मेल खाता है जो कम से कम वर्ग विधि के संदर्भ में मूल डेटा का बेहतर अनुमान लगाता है।

चूंकि, तब रेखा वाई = 0.165x + 2.184मूल डेटा का बेहतर अनुमान लगाता है।

कम से कम वर्ग विधि (LSM) का ग्राफिक चित्रण।

चार्ट पर सब कुछ अच्छा दिखता है। लाल रेखा पाई गई रेखा है वाई = 0.165x + 2.184, नीली रेखा है , गुलाबी बिंदु मूल डेटा हैं।

व्यवहार में, विभिन्न प्रक्रियाओं को मॉडलिंग करते समय - विशेष रूप से, आर्थिक, भौतिक, तकनीकी, सामाजिक - कुछ निश्चित बिंदुओं पर उनके ज्ञात मूल्यों से कार्यों के अनुमानित मूल्यों की गणना करने की एक या दूसरी विधि का व्यापक रूप से उपयोग किया जाता है।

इस प्रकार के कार्यों के सन्निकटन की समस्याएँ अक्सर उत्पन्न होती हैं:

    प्रयोग के परिणामस्वरूप प्राप्त सारणीबद्ध डेटा के अनुसार अध्ययन के तहत प्रक्रिया की चारित्रिक मात्रा के मूल्यों की गणना के लिए अनुमानित सूत्रों का निर्माण करते समय;

    संख्यात्मक एकीकरण, विभेदन, विभेदक समीकरणों को हल करने आदि में;

    यदि माना अंतराल के मध्यवर्ती बिंदुओं पर कार्यों के मूल्यों की गणना करना आवश्यक है;

    विचाराधीन अंतराल के बाहर प्रक्रिया की विशिष्ट मात्रा के मूल्यों का निर्धारण करते समय, विशेष रूप से, जब पूर्वानुमान लगाया जाता है।

यदि, किसी तालिका द्वारा निर्दिष्ट एक निश्चित प्रक्रिया को मॉडल करने के लिए, एक फ़ंक्शन का निर्माण किया जाता है जो कम से कम वर्ग विधि के आधार पर इस प्रक्रिया का लगभग वर्णन करता है, तो इसे अनुमानित फ़ंक्शन (प्रतिगमन) कहा जाएगा, और अनुमान लगाने वाले कार्यों के निर्माण का कार्य स्वयं होगा एक सन्निकटन समस्या हो।

यह लेख ऐसी समस्याओं को हल करने के लिए एमएस एक्सेल पैकेज की संभावनाओं पर चर्चा करता है, इसके अलावा, सारणीबद्ध रूप से दिए गए कार्यों (जो प्रतिगमन विश्लेषण का आधार है) के लिए प्रतिगमन (बनाने) के निर्माण (बनाने) के लिए तरीके और तकनीक दिए गए हैं।

एक्सेल में रिग्रेशन बनाने के लिए दो विकल्प हैं।

    अध्ययन की गई प्रक्रिया विशेषता के लिए डेटा तालिका के आधार पर निर्मित चार्ट में चयनित प्रतिगमन (ट्रेंडलाइन) जोड़ना (चार्ट बनने पर ही उपलब्ध);

    एक्सेल वर्कशीट के अंतर्निहित सांख्यिकीय कार्यों का उपयोग करना, जो आपको सीधे स्रोत डेटा तालिका से प्रतिगमन (ट्रेंड लाइन) प्राप्त करने की अनुमति देता है।

चार्ट में ट्रेंडलाइन जोड़ना

एक निश्चित प्रक्रिया का वर्णन करने वाली और आरेख द्वारा दर्शाए गए डेटा की तालिका के लिए, एक्सेल में एक प्रभावी प्रतिगमन विश्लेषण उपकरण है जो आपको इसकी अनुमति देता है:

    कम से कम वर्ग विधि के आधार पर निर्माण करें और आरेख में पांच प्रकार के प्रतिगमन जोड़ें जो सटीकता की अलग-अलग डिग्री के साथ अध्ययन के तहत प्रक्रिया को मॉडल करते हैं;

    आरेख में निर्मित प्रतिगमन का एक समीकरण जोड़ें;

    चार्ट पर प्रदर्शित डेटा के साथ चयनित प्रतिगमन के अनुपालन की डिग्री निर्धारित करें।

चार्ट डेटा के आधार पर, एक्सेल आपको रैखिक, बहुपद, लघुगणकीय, घातीय, घातीय प्रकार के प्रतिगमन प्राप्त करने की अनुमति देता है, जो समीकरण द्वारा दिए गए हैं:

वाई = वाई (एक्स)

जहाँ x एक स्वतंत्र चर है, जो अक्सर प्राकृतिक संख्याओं (1; 2; 3; ...) के अनुक्रम का मान लेता है और उत्पादन करता है, उदाहरण के लिए, अध्ययन के तहत प्रक्रिया के समय की उलटी गिनती (विशेषताएँ) .

1 . मॉडलिंग सुविधाओं में रैखिक प्रतिगमन अच्छा है जो निरंतर दर पर बढ़ता या घटता है। यह अध्ययन के तहत प्रक्रिया का सबसे सरल मॉडल है। यह समीकरण के अनुसार बनाया गया है:

वाई = एमएक्स + बी

जहाँ m, x-अक्ष पर रेखीय प्रतिगमन के ढलान की स्पर्शरेखा है; बी - वाई-अक्ष के साथ रैखिक प्रतिगमन के चौराहे के बिंदु का समन्वय।

2 . एक बहुपद ट्रेंडलाइन उन विशेषताओं का वर्णन करने के लिए उपयोगी है जिनमें कई अलग-अलग चरम सीमाएं (उच्च और चढ़ाव) हैं। बहुपद की डिग्री का चुनाव अध्ययन के तहत विशेषता के एक्स्ट्रेमा की संख्या से निर्धारित होता है। इस प्रकार, दूसरी डिग्री का एक बहुपद अच्छी तरह से एक ऐसी प्रक्रिया का वर्णन कर सकता है जिसमें केवल एक अधिकतम या न्यूनतम हो; तीसरी डिग्री का बहुपद - दो एक्स्ट्रेमा से अधिक नहीं; चौथी डिग्री का बहुपद - तीन एक्स्ट्रेमा आदि से अधिक नहीं।

इस मामले में, ट्रेंड लाइन समीकरण के अनुसार बनाई गई है:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

जहाँ गुणांक c0, c1, c2,... c6 स्थिरांक हैं जिनके मान निर्माण के दौरान निर्धारित किए जाते हैं।

3 . मॉडलिंग विशेषताओं में लॉगरिदमिक ट्रेंड लाइन का सफलतापूर्वक उपयोग किया जाता है, जिसके मान पहले तेजी से बदलते हैं, और फिर धीरे-धीरे स्थिर हो जाते हैं।

वाई = सी एलएन (एक्स) + बी

4 . पावर ट्रेंड लाइन अच्छे परिणाम देती है यदि अध्ययन की गई निर्भरता के मूल्यों को विकास दर में निरंतर परिवर्तन की विशेषता है। इस तरह की निर्भरता का एक उदाहरण कार की समान रूप से त्वरित गति के ग्राफ के रूप में काम कर सकता है। यदि डेटा में शून्य या नकारात्मक मान हैं, तो आप पावर ट्रेंडलाइन का उपयोग नहीं कर सकते।

यह समीकरण के अनुसार बनाया गया है:

वाई = सीएक्सबी

जहाँ गुणांक b, c स्थिरांक हैं।

5 . यदि डेटा में परिवर्तन की दर लगातार बढ़ रही है तो एक घातीय प्रवृत्ति रेखा का उपयोग किया जाना चाहिए। शून्य या ऋणात्मक मान वाले डेटा के लिए, इस प्रकार का सन्निकटन भी लागू नहीं होता है।

यह समीकरण के अनुसार बनाया गया है:

वाई = सीईबीएक्स

जहाँ गुणांक b, c स्थिरांक हैं।

ट्रेंड लाइन का चयन करते समय, एक्सेल स्वचालित रूप से R2 के मान की गणना करता है, जो सन्निकटन की सटीकता की विशेषता है: R2 मान एक के जितना करीब होता है, उतना ही मज़बूती से ट्रेंड लाइन अध्ययन के तहत प्रक्रिया का अनुमान लगाती है। यदि आवश्यक हो, तो R2 का मान हमेशा आरेख पर प्रदर्शित किया जा सकता है।

सूत्र द्वारा निर्धारित:

किसी डेटा सीरीज़ में ट्रेंड लाइन जोड़ने के लिए:

    डेटा श्रृंखला के आधार पर निर्मित चार्ट को सक्रिय करें, अर्थात चार्ट क्षेत्र के भीतर क्लिक करें। मुख्य मेनू में चार्ट आइटम दिखाई देगा;

    इस आइटम पर क्लिक करने के बाद, स्क्रीन पर एक मेनू दिखाई देगा, जिसमें आपको ऐड ट्रेंड लाइन कमांड का चयन करना चाहिए।

यदि आप डेटा श्रृंखला में से किसी एक से संबंधित ग्राफ़ पर होवर करते हैं और राइट-क्लिक करते हैं तो वही क्रियाएँ आसानी से लागू हो जाती हैं; दिखाई देने वाले संदर्भ मेनू में, ट्रेंड लाइन कमांड जोड़ें चुनें। स्क्रीन पर ट्रेंडलाइन डायलॉग बॉक्स खुले टाइप टैब के साथ दिखाई देगा (चित्र 1)।

उसके बाद आपको चाहिए:

प्रकार टैब पर, आवश्यक प्रवृत्ति रेखा प्रकार का चयन करें (रैखिक डिफ़ॉल्ट रूप से चयनित होता है)। बहुपद प्रकार के लिए, डिग्री क्षेत्र में, चयनित बहुपद की डिग्री निर्दिष्ट करें।

1 . बिल्ट ऑन सीरीज़ फ़ील्ड चार्ट में सभी डेटा श्रृंखलाओं को प्रश्न में सूचीबद्ध करता है। किसी विशिष्ट डेटा श्रृंखला में ट्रेंडलाइन जोड़ने के लिए, बिल्ट ऑन सीरीज़ फ़ील्ड में उसका नाम चुनें।

यदि आवश्यक हो, तो पैरामीटर्स टैब (चित्र 2) पर जाकर, आप ट्रेंड लाइन के लिए निम्नलिखित पैरामीटर सेट कर सकते हैं:

    अनुमानित (चिकना) वक्र क्षेत्र के नाम में ट्रेंड लाइन का नाम बदलें।

    पूर्वानुमान क्षेत्र में पूर्वानुमान के लिए अवधियों की संख्या (आगे या पीछे) निर्धारित करें;

    चार्ट क्षेत्र में ट्रेंड लाइन का समीकरण प्रदर्शित करें, जिसके लिए आपको चार्ट पर समीकरण दिखाने के लिए चेकबॉक्स को सक्षम करना चाहिए;

    आरेख क्षेत्र में सन्निकटन विश्वसनीयता R2 का मान प्रदर्शित करें, जिसके लिए आपको आरेख पर सन्निकटन विश्वसनीयता (R^2) का मान रखने के लिए चेकबॉक्स को सक्षम करना चाहिए;

    वाई-अक्ष के साथ ट्रेंड लाइन के चौराहे के बिंदु को सेट करें, जिसके लिए आपको एक बिंदु पर वाई-अक्ष के साथ वक्र के चौराहे के चेकबॉक्स को सक्षम करना चाहिए;

    डायलॉग बॉक्स को बंद करने के लिए ओके बटन पर क्लिक करें।

पहले से निर्मित ट्रेंडलाइन का संपादन शुरू करने के तीन तरीके हैं:

    ट्रेंड लाइन का चयन करने के बाद, फॉर्मेट मेन्यू से सेलेक्टेड ट्रेंड लाइन कमांड का उपयोग करें;

    संदर्भ मेनू से फ़ॉर्मेट ट्रेंडलाइन कमांड का चयन करें, जिसे ट्रेंडलाइन पर राइट-क्लिक करके कॉल किया जाता है;

    ट्रेंड लाइन पर डबल क्लिक करके।

फ़ॉर्मेट ट्रेंडलाइन डायलॉग बॉक्स स्क्रीन पर दिखाई देगा (चित्र 3), जिसमें तीन टैब हैं: दृश्य, प्रकार, पैरामीटर और अंतिम दो की सामग्री पूरी तरह से ट्रेंडलाइन संवाद बॉक्स के समान टैब के साथ मेल खाती है (चित्र 1-2)। ). व्यू टैब पर, आप लाइन का प्रकार, उसका रंग और मोटाई सेट कर सकते हैं।

पहले से निर्मित ट्रेंड लाइन को हटाने के लिए, डिलीट की जाने वाली ट्रेंड लाइन का चयन करें और डिलीट की दबाएं।

माना प्रतिगमन विश्लेषण उपकरण के लाभ हैं:

    इसके लिए डेटा टेबल बनाए बिना चार्ट पर ट्रेंड लाइन प्लॉट करने में सापेक्षिक आसानी;

    प्रस्तावित प्रवृत्ति रेखाओं के प्रकारों की एक काफी विस्तृत सूची, और इस सूची में सबसे अधिक उपयोग किए जाने वाले प्रकार के प्रतिगमन शामिल हैं;

    मनमाना (सामान्य ज्ञान के भीतर) कदमों की संख्या के साथ-साथ पीछे की ओर अध्ययन के तहत प्रक्रिया के व्यवहार की भविष्यवाणी करने की संभावना;

    विश्लेषणात्मक रूप में ट्रेंड लाइन के समीकरण को प्राप्त करने की संभावना;

    संभावना, यदि आवश्यक हो, सन्निकटन की विश्वसनीयता का आकलन प्राप्त करने की।

नुकसान में निम्नलिखित बिंदु शामिल हैं:

    ट्रेंड लाइन का निर्माण केवल तभी किया जाता है जब डेटा की एक श्रृंखला पर चार्ट बनाया गया हो;

    इसके लिए प्राप्त ट्रेंड लाइन समीकरणों के आधार पर अध्ययन के तहत विशेषता के लिए डेटा श्रृंखला बनाने की प्रक्रिया कुछ अव्यवस्थित है: वांछित प्रतिगमन समीकरण मूल डेटा श्रृंखला के मूल्यों में प्रत्येक परिवर्तन के साथ अद्यतन किए जाते हैं, लेकिन केवल चार्ट क्षेत्र के भीतर , जबकि पुरानी रेखा समीकरण प्रवृत्ति के आधार पर गठित डेटा श्रृंखला अपरिवर्तित बनी हुई है;

    PivotChart रिपोर्ट में, जब आप चार्ट दृश्य या संबंधित PivotTable रिपोर्ट बदलते हैं, तो मौजूदा ट्रेंडलाइन बरकरार नहीं रहती हैं, इसलिए आपको यह सुनिश्चित करना होगा कि रिपोर्ट का लेआउट आपकी आवश्यकताओं को पूरा करता है इससे पहले कि आप ट्रेंडलाइन बनाएं या अन्यथा PivotChart रिपोर्ट को प्रारूपित करें।

ग्राफ, हिस्टोग्राम, फ्लैट गैर-सामान्यीकृत क्षेत्र चार्ट, बार, स्कैटर, बबल और स्टॉक चार्ट जैसे चार्ट पर प्रस्तुत डेटा श्रृंखला में रुझान लाइनें जोड़ी जा सकती हैं।

आप 3-डी, मानक, रडार, पाई और डोनट चार्ट पर डेटा श्रृंखला में ट्रेंडलाइन नहीं जोड़ सकते।

बिल्ट-इन एक्सेल फ़ंक्शंस का उपयोग करना

एक्सेल चार्ट क्षेत्र के बाहर ट्रेंडलाइन की साजिश रचने के लिए एक प्रतिगमन विश्लेषण उपकरण भी प्रदान करता है। इस उद्देश्य के लिए कई सांख्यिकीय वर्कशीट फ़ंक्शंस का उपयोग किया जा सकता है, लेकिन वे सभी आपको केवल रैखिक या घातीय प्रतिगमन बनाने की अनुमति देते हैं।

एक्सेल में रैखिक प्रतिगमन के निर्माण के लिए विशेष रूप से कई कार्य हैं:

    रुझान;

  • ढलान और कट।

साथ ही विशेष रूप से एक घातीय प्रवृत्ति रेखा के निर्माण के लिए कई कार्य:

    एलजीआरएफ लगभग।

यह ध्यान दिया जाना चाहिए कि TREND और GROWTH फ़ंक्शन का उपयोग करके प्रतिगमन के निर्माण की तकनीकें व्यावहारिक रूप से समान हैं। LINEST और LGRFPRIBL के कार्यों की जोड़ी के बारे में भी यही कहा जा सकता है। इन चार कार्यों के लिए, मूल्यों की तालिका बनाते समय, एक्सेल सुविधाओं जैसे कि सरणी सूत्र का उपयोग किया जाता है, जो कुछ हद तक प्रतिगमन के निर्माण की प्रक्रिया को अव्यवस्थित करता है। हम यह भी ध्यान देते हैं कि एक रेखीय प्रतिगमन का निर्माण, हमारी राय में, SLOPE और INTERCEPT फ़ंक्शंस का उपयोग करके कार्यान्वित करना सबसे आसान है, जहाँ उनमें से पहला रैखिक प्रतिगमन की ढलान निर्धारित करता है, और दूसरा प्रतिगमन द्वारा काटे गए खंड को निर्धारित करता है। वाई-अक्ष पर।

प्रतिगमन विश्लेषण के लिए अंतर्निहित फ़ंक्शन टूल के लाभ हैं:

    ट्रेंड लाइन सेट करने वाले सभी अंतर्निहित सांख्यिकीय कार्यों के लिए अध्ययन के तहत विशेषता की डेटा श्रृंखला के एक ही प्रकार के गठन की एक काफी सरल प्रक्रिया;

    उत्पन्न डेटा श्रृंखला के आधार पर प्रवृत्ति लाइनों के निर्माण के लिए एक मानक तकनीक;

    आगे या पीछे कदमों की आवश्यक संख्या के लिए अध्ययन के तहत प्रक्रिया के व्यवहार की भविष्यवाणी करने की क्षमता।

और नुकसान में यह तथ्य शामिल है कि एक्सेल में अन्य (रैखिक और घातीय को छोड़कर) प्रकार की ट्रेंड लाइन बनाने के लिए अंतर्निहित कार्य नहीं हैं। यह परिस्थिति अक्सर अध्ययन के तहत प्रक्रिया के पर्याप्त सटीक मॉडल को चुनने की अनुमति नहीं देती है, साथ ही साथ वास्तविकता के करीब पूर्वानुमान प्राप्त करने की अनुमति नहीं देती है। इसके अलावा, TREND और GROW फ़ंक्शंस का उपयोग करते समय, ट्रेंड लाइनों के समीकरण ज्ञात नहीं होते हैं।

यह ध्यान दिया जाना चाहिए कि लेखकों ने पूर्णता की अलग-अलग डिग्री के साथ प्रतिगमन विश्लेषण के पाठ्यक्रम को प्रस्तुत करने के लिए लेख का लक्ष्य निर्धारित नहीं किया। इसका मुख्य कार्य विशिष्ट उदाहरणों का उपयोग करके सन्निकटन समस्याओं को हल करने में एक्सेल पैकेज की क्षमताओं को प्रदर्शित करना है; प्रदर्शित करें कि प्रतिगमन और पूर्वानुमान के निर्माण के लिए एक्सेल के पास कौन से प्रभावी उपकरण हैं; वर्णन करें कि कैसे अपेक्षाकृत आसानी से ऐसी समस्याओं को एक उपयोगकर्ता द्वारा भी हल किया जा सकता है, जिसे प्रतिगमन विश्लेषण का गहरा ज्ञान नहीं है।

विशिष्ट समस्याओं को हल करने के उदाहरण

एक्सेल पैकेज के सूचीबद्ध उपकरणों का उपयोग करके विशिष्ट समस्याओं के समाधान पर विचार करें।

कार्य 1

1995-2002 के लिए एक मोटर परिवहन उद्यम के लाभ पर डेटा की तालिका के साथ। आपको निम्नलिखित कार्य करने की आवश्यकता है।

    एक चार्ट बनाएँ।

    चार्ट में रैखिक और बहुपद (द्विघात और घन) प्रवृत्ति रेखाएँ जोड़ें।

    प्रवृत्ति रेखा समीकरणों का उपयोग करते हुए, 1995-2004 के लिए प्रत्येक प्रवृत्ति रेखा के लिए उद्यम के लाभ पर सारणीबद्ध डेटा प्राप्त करें।

    2003 और 2004 के लिए उद्यम के लिए लाभ का पूर्वानुमान बनाएं।

समस्या का समाधान

    एक्सेल वर्कशीट के सेल A4:C11 की श्रेणी में, हम चित्र में दिखाए गए वर्कशीट में प्रवेश करते हैं। चार।

    कक्षों की श्रेणी B4:C11 का चयन करने के बाद, हम एक चार्ट बनाते हैं।

    हम निर्मित चार्ट को सक्रिय करते हैं और ऊपर वर्णित विधि का उपयोग करते हुए, ट्रेंड लाइन डायलॉग बॉक्स में ट्रेंड लाइन के प्रकार का चयन करने के बाद (चित्र 1 देखें), हम बारी-बारी से चार्ट में रैखिक, द्विघात और क्यूबिक ट्रेंड लाइन जोड़ते हैं। उसी संवाद बॉक्स में, पैरामीटर्स टैब खोलें (चित्र 2 देखें), सन्निकटन (चिकनी) वक्र फ़ील्ड के नाम में, जोड़े जाने वाले रुझान का नाम दर्ज करें, और आगे के लिए पूर्वानुमान में: अवधि फ़ील्ड, सेट करें मूल्य 2, क्योंकि यह दो साल आगे के लिए लाभ का पूर्वानुमान लगाने की योजना है। आरेख क्षेत्र में प्रतिगमन समीकरण और सन्निकटन विश्वसनीयता R2 के मान को प्रदर्शित करने के लिए, चेक बॉक्स को सक्षम करें स्क्रीन पर समीकरण दिखाएं और आरेख पर सन्निकटन विश्वसनीयता (R^2) का मान रखें। बेहतर दृश्य धारणा के लिए, हम प्लॉट की गई ट्रेंड लाइनों के प्रकार, रंग और मोटाई को बदलते हैं, जिसके लिए हम ट्रेंड लाइन फॉर्मेट डायलॉग बॉक्स के व्यू टैब का उपयोग करते हैं (चित्र 3 देखें)। परिणामी चार्ट जोड़ा प्रवृत्ति लाइनों के साथ अंजीर में दिखाया गया है। 5.

    1995-2004 के लिए प्रत्येक प्रवृत्ति रेखा के लिए उद्यम के लाभ पर सारणीबद्ध डेटा प्राप्त करना। आइए अंजीर में प्रस्तुत प्रवृत्ति रेखाओं के समीकरणों का उपयोग करें। 5. ऐसा करने के लिए, D3:F3 श्रेणी के कक्षों में, चयनित रुझान रेखा के प्रकार के बारे में पाठ्य सूचना दर्ज करें: रेखीय रुझान, द्विघात रुझान, घन प्रवृत्ति। इसके बाद, कक्ष D4 में रेखीय प्रतिगमन सूत्र दर्ज करें और भरण मार्कर का उपयोग करके, इस सूत्र को कक्षों की श्रेणी D5:D13 के सापेक्ष संदर्भों के साथ कॉपी करें। यह ध्यान दिया जाना चाहिए कि कक्षों की श्रेणी D4:D13 से एक रेखीय प्रतिगमन सूत्र वाले प्रत्येक कक्ष में तर्क के रूप में श्रेणी A4:A13 से संगत कक्ष होता है। इसी तरह, द्विघात प्रतिगमन के लिए, कक्ष श्रेणी E4:E13 भरी जाती है, और घन प्रतिगमन के लिए, कक्ष श्रेणी F4:F13 भरी जाती है। इस प्रकार, 2003 और 2004 के लिए उद्यम के लाभ का पूर्वानुमान लगाया गया था। तीन प्रवृत्तियों के साथ। मूल्यों की परिणामी तालिका अंजीर में दिखाई गई है। 6.

कार्य 2

    एक चार्ट बनाएँ।

    चार्ट में लॉगरिदमिक, एक्सपोनेंशियल और एक्सपोनेंशियल ट्रेंड लाइनें जोड़ें।

    प्राप्त प्रवृत्ति रेखाओं के समीकरण, साथ ही उनमें से प्रत्येक के लिए सन्निकटन विश्वसनीयता R2 के मान प्राप्त करें।

    प्रवृत्ति रेखा समीकरणों का उपयोग करते हुए, 1995-2002 के लिए प्रत्येक प्रवृत्ति रेखा के लिए उद्यम के लाभ पर सारणीबद्ध डेटा प्राप्त करें।

    इन प्रवृत्ति रेखाओं का उपयोग करके 2003 और 2004 के लिए व्यवसाय के लिए लाभ का पूर्वानुमान लगाएं।

समस्या का समाधान

समस्या 1 को हल करने में दी गई पद्धति का पालन करते हुए, हम अतिरिक्त लॉगरिदमिक, एक्सपोनेंशियल और एक्सपोनेंशियल ट्रेंड लाइन्स (चित्र 7) के साथ एक आरेख प्राप्त करते हैं। इसके अलावा, प्राप्त ट्रेंड लाइन समीकरणों का उपयोग करते हुए, हम 2003 और 2004 के अनुमानित मूल्यों सहित उद्यम के लाभ के लिए मूल्यों की तालिका भरते हैं। (चित्र 8)।

अंजीर पर। 5 और अंजीर। यह देखा जा सकता है कि लॉगरिदमिक प्रवृत्ति वाला मॉडल सन्निकटन विश्वसनीयता के निम्नतम मूल्य से मेल खाता है

आर2 = 0.8659

R2 के उच्चतम मूल्य एक बहुपद प्रवृत्ति वाले मॉडल के अनुरूप हैं: द्विघात (R2 = 0.9263) और घन (R2 = 0.933)।

कार्य 3

टास्क 1 में दिए गए 1995-2002 के लिए एक मोटर परिवहन उद्यम के लाभ पर डेटा की तालिका के साथ, आपको निम्न चरणों का पालन करना होगा।

    TREND और GROW फ़ंक्शन का उपयोग करके रैखिक और घातीय ट्रेंडलाइन के लिए डेटा श्रृंखला प्राप्त करें।

    TREND और GROWTH कार्यों का उपयोग करते हुए, 2003 और 2004 के लिए उद्यम के लिए लाभ का पूर्वानुमान लगाएं।

    प्रारंभिक डेटा और प्राप्त डेटा श्रृंखला के लिए, आरेख बनाएं।

समस्या का समाधान

आइए कार्य 1 की वर्कशीट का उपयोग करें (चित्र 4 देखें)। आइए TREND फ़ंक्शन से शुरू करें:

    कक्षों की श्रेणी D4:D11 का चयन करें, जिसे उद्यम के लाभ पर ज्ञात डेटा के अनुरूप TREND फ़ंक्शन के मानों से भरा जाना चाहिए;

    इन्सर्ट मेन्यू से फंक्शन कमांड को कॉल करें। दिखाई देने वाले फ़ंक्शन विज़ार्ड संवाद बॉक्स में, सांख्यिकीय श्रेणी से TREND फ़ंक्शन का चयन करें और फिर OK बटन पर क्लिक करें। मानक टूलबार के बटन (इन्सर्ट फंक्शन) को दबाकर समान ऑपरेशन किया जा सकता है।

    दिखाई देने वाले फ़ंक्शन तर्क संवाद बॉक्स में, Known_values_y फ़ील्ड में C4:C11 कक्षों की श्रेणी दर्ज करें; ज्ञात_मान_x फ़ील्ड में - कक्षों की श्रेणी B4:B11;

    दर्ज किए गए सूत्र को एक सरणी सूत्र बनाने के लिए, कुंजी संयोजन + + का उपयोग करें।

फॉर्मूला बार में हमने जो फॉर्मूला डाला है वह इस तरह दिखेगा: =(TREND(C4:C11;B4:B11)).

परिणामस्वरूप, कोशिकाओं की श्रेणी D4:D11 TREND फ़ंक्शन (चित्र 9) के संबंधित मानों से भरी हुई है।

2003 और 2004 के लिए कंपनी के लाभ का पूर्वानुमान लगाने के लिए। ज़रूरी:

    कक्षों की श्रेणी D12:D13 का चयन करें, जहां TREND फ़ंक्शन द्वारा अनुमानित मान दर्ज किए जाएंगे।

    TREND फ़ंक्शन को कॉल करें और प्रकट होने वाले फ़ंक्शन तर्क संवाद बॉक्स में, Known_values_y फ़ील्ड में दर्ज करें - कक्षों की श्रेणी C4:C11; ज्ञात_मान_x फ़ील्ड में - कक्षों की श्रेणी B4:B11; और फ़ील्ड में New_values_x - कक्षों की श्रेणी B12:B13।

    कीबोर्ड शॉर्टकट Ctrl + Shift + Enter का उपयोग करके इस सूत्र को सरणी सूत्र में बदलें।

    दर्ज किया गया सूत्र इस तरह दिखेगा: =(TREND(C4:C11;B4:B11;B12:B13)), और कोशिकाओं की श्रेणी D12:D13 TREND फ़ंक्शन के अनुमानित मानों से भरी जाएगी (चित्र देखें। 9).

इसी तरह, GROWTH फ़ंक्शन का उपयोग करके एक डेटा श्रृंखला भरी जाती है, जिसका उपयोग गैर-रैखिक निर्भरता के विश्लेषण में किया जाता है और इसके रैखिक समकक्ष TREND के समान ही काम करता है।

चित्र 10 सूत्र प्रदर्शन मोड में तालिका दिखाता है।

प्रारंभिक डेटा और प्राप्त डेटा श्रृंखला के लिए, अंजीर में दिखाया गया चित्र। ग्यारह।

कार्य 4

चालू माह के 1 से 11 वें दिन की अवधि के लिए मोटर परिवहन उद्यम की प्रेषण सेवा द्वारा सेवाओं के लिए आवेदन प्राप्त करने पर डेटा की तालिका के साथ, निम्नलिखित क्रियाएं की जानी चाहिए।

    रेखीय प्रतिगमन के लिए डेटा श्रृंखला प्राप्त करें: स्लोप और इंटरसेप्ट फ़ंक्शंस का उपयोग करना; LINEST फ़ंक्शन का उपयोग करना।

    LYFFPRIB फ़ंक्शन का उपयोग करके घातीय प्रतिगमन के लिए डेटा श्रृंखला पुनर्प्राप्त करें।

    उपरोक्त कार्यों का उपयोग करते हुए, चालू माह के 12 वें से 14 वें दिन की अवधि के लिए प्रेषण सेवा को आवेदनों की प्राप्ति के बारे में पूर्वानुमान लगाएं।

    मूल और प्राप्त डेटा श्रृंखला के लिए, आरेख बनाएं।

समस्या का समाधान

ध्यान दें कि, TREND और GROW कार्यों के विपरीत, ऊपर सूचीबद्ध कार्यों में से कोई भी (SLOPE, INTERCEPTION, LINEST, LGRFPRIB) प्रतिगमन नहीं है। ये कार्य आवश्यक प्रतिगमन मापदंडों को निर्धारित करते हुए केवल एक सहायक भूमिका निभाते हैं।

SLOPE, INTERCEPT, LINEST, LGRFPRIB फ़ंक्शंस का उपयोग करके निर्मित रैखिक और घातीय प्रतिगमन के लिए, उनके समीकरणों की उपस्थिति हमेशा ज्ञात होती है, जो कि TREND और GROWTH कार्यों के अनुरूप रैखिक और घातीय प्रतिगमन के विपरीत होती है।

1 . आइए एक रेखीय प्रतिगमन का निर्माण करें जिसमें समीकरण हो:

वाई = एमएक्स + बी

SLOPE और INTERCEPT फ़ंक्शंस का उपयोग करते हुए, प्रतिगमन m की ढलान SLOPE फ़ंक्शन द्वारा निर्धारित की जा रही है, और निरंतर शब्द b - INTERCEPT फ़ंक्शन द्वारा निर्धारित किया जा रहा है।

ऐसा करने के लिए, हम निम्नलिखित क्रियाएं करते हैं:

    कक्ष A4:B14 की श्रेणी में स्रोत तालिका दर्ज करें;

    पैरामीटर m का मान सेल C19 में निर्धारित किया जाएगा। सांख्यिकीय श्रेणी से ढलान समारोह का चयन करें; ज्ञात_मान_y फ़ील्ड में कक्ष B4:B14 की श्रेणी और ज्ञात_मान_x फ़ील्ड में कक्ष A4:A14 की श्रेणी दर्ज करें। सूत्र कक्ष C19 में दर्ज किया जाएगा: =SLOPE(B4:B14;A4:A14);

    इसी तरह की विधि का उपयोग करते हुए, सेल D19 में पैरामीटर b का मान निर्धारित किया जाता है। और इसकी सामग्री इस तरह दिखेगी: = INTERCEPT(B4:B14;A4:A14). इस प्रकार, एक रैखिक प्रतिगमन के निर्माण के लिए आवश्यक पैरामीटर एम और बी के मान क्रमशः कोशिकाओं C19, D19 में संग्रहीत किए जाएंगे;

    फिर हम सेल C4 में रेखीय प्रतिगमन सूत्र को फॉर्म में दर्ज करते हैं: = $ C * A4 + $ D। इस सूत्र में, कक्ष C19 और D19 पूर्ण संदर्भों के साथ लिखे गए हैं (संभावित प्रतिलिपि के साथ कक्ष पता नहीं बदलना चाहिए)। सेल एड्रेस पर कर्सर रखने के बाद निरपेक्ष संदर्भ चिह्न $ को या तो कीबोर्ड से या F4 कुंजी का उपयोग करके टाइप किया जा सकता है। भरण हैंडल का उपयोग करते हुए, इस सूत्र को कक्षों की श्रेणी C4:C17 में कॉपी करें। हमें वांछित डेटा श्रृंखला मिलती है (चित्र 12)। इस तथ्य के कारण कि अनुरोधों की संख्या एक पूर्णांक है, आपको सेल फ़ॉर्मेट विंडो के नंबर टैब पर संख्या प्रारूप को दशमलव स्थानों की संख्या के साथ 0 पर सेट करना चाहिए।

2 . अब आइए समीकरण द्वारा दिए गए एक रेखीय प्रतिगमन का निर्माण करें:

वाई = एमएक्स + बी

LINEST फ़ंक्शन का उपयोग करना।

इसके लिए:

    कक्ष C20:D20: =(LINEST(B4:B14;A4:A14)) की श्रेणी में सरणी सूत्र के रूप में LINEST फ़ंक्शन दर्ज करें। परिणामस्वरूप, हमें सेल C20 में पैरामीटर m का मान और सेल D20 में पैरामीटर b का मान मिलता है;

    कक्ष D4 में सूत्र दर्ज करें: =$C*A4+$D;

    भरण मार्कर का उपयोग करके इस सूत्र को कक्षों की श्रेणी D4:D17 में कॉपी करें और वांछित डेटा श्रृंखला प्राप्त करें।

3 . हम एक घातीय प्रतिगमन का निर्माण करते हैं जिसमें समीकरण है:

LGRFPRIBL फ़ंक्शन की सहायता से, यह समान रूप से किया जाता है:

    सेल C21:D21 की श्रेणी में, एक सरणी सूत्र के रूप में LGRFPRIBL फ़ंक्शन दर्ज करें: =( LGRFPRIBL (B4:B14;A4:A14))। इस स्थिति में, पैरामीटर m का मान सेल C21 में निर्धारित किया जाएगा, और पैरामीटर b का मान सेल D21 में निर्धारित किया जाएगा;

    सूत्र सेल E4 में दर्ज किया गया है: =$D*$C^A4;

    भरण मार्कर का उपयोग करके, इस सूत्र को कक्ष E4:E17 की श्रेणी में कॉपी किया जाता है, जहां घातीय प्रतिगमन के लिए डेटा श्रृंखला स्थित होगी (चित्र 12 देखें)।

अंजीर पर। 13 एक तालिका दिखाता है जहां हम आवश्यक सेल श्रेणियों के साथ-साथ सूत्रों के साथ उपयोग किए जाने वाले कार्यों को देख सकते हैं।

मूल्य आर 2 बुलाया दृढ़ संकल्प गुणांक.

एक प्रतिगमन निर्भरता के निर्माण का कार्य मॉडल (1) के गुणांक m के वेक्टर को खोजना है, जिस पर गुणांक R अधिकतम मान लेता है।

आर के महत्व का आकलन करने के लिए, फिशर के एफ-परीक्षण का उपयोग किया जाता है, सूत्र द्वारा गणना की जाती है

कहाँ पे एन- नमूना आकार (प्रयोगों की संख्या);

k मॉडल गुणांकों की संख्या है।

यदि एफ डेटा के लिए कुछ महत्वपूर्ण मान से अधिक है एनतथा और स्वीकृत विश्वास स्तर, तो R का मान महत्वपूर्ण माना जाता है। गणितीय आँकड़ों पर संदर्भ पुस्तकों में F के महत्वपूर्ण मूल्यों की तालिकाएँ दी गई हैं।

इस प्रकार, आर का महत्व न केवल इसके मूल्य से, बल्कि प्रयोगों की संख्या और मॉडल के गुणांक (पैरामीटर) की संख्या के बीच के अनुपात से भी निर्धारित होता है। दरअसल, एक साधारण रैखिक मॉडल के लिए n = 2 के लिए सहसंबंध अनुपात 1 है (विमान पर 2 बिंदुओं के माध्यम से, आप हमेशा एक सीधी रेखा खींच सकते हैं)। हालाँकि, यदि प्रायोगिक डेटा यादृच्छिक चर हैं, तो R के ऐसे मान पर बहुत सावधानी से भरोसा किया जाना चाहिए। आमतौर पर, एक महत्वपूर्ण आर और विश्वसनीय प्रतिगमन प्राप्त करने के लिए, यह सुनिश्चित करने के उद्देश्य से है कि प्रयोगों की संख्या मॉडल गुणांक (एन>के) की संख्या से काफी अधिक है।

एक रेखीय प्रतिगमन मॉडल बनाने के लिए, आपको चाहिए:

1) n पंक्तियों और m स्तंभों की एक सूची तैयार करें जिसमें प्रयोगात्मक डेटा (आउटपुट मान वाले स्तंभ) हों वाईसूची में या तो प्रथम या अंतिम होना चाहिए); उदाहरण के लिए, पिछले कार्य का डेटा लेते हैं, "पीरियड नंबर" नामक एक कॉलम को जोड़ते हुए, 1 से 12 तक की अवधि की संख्या को क्रमांकित करते हैं। (ये मान होंगे एक्स)

2) मेनू डेटा/डेटा विश्लेषण/रिग्रेशन पर जाएं

यदि "टूल" मेनू में "डेटा विश्लेषण" आइटम गायब है, तो आपको उसी मेनू के "ऐड-इन्स" आइटम पर जाना चाहिए और "विश्लेषण पैकेज" बॉक्स को चेक करना चाहिए।

3) "प्रतिगमन" संवाद बॉक्स में, सेट करें:

इनपुट अंतराल वाई;

इनपुट अंतराल एक्स;

आउटपुट अंतराल - अंतराल के ऊपरी बाएँ सेल जिसमें गणना के परिणाम रखे जाएंगे (इसे एक नई वर्कशीट पर रखने की अनुशंसा की जाती है);

4) "ओके" पर क्लिक करें और परिणामों का विश्लेषण करें।

विधि का सार इस तथ्य में निहित है कि विचाराधीन समाधान की गुणवत्ता का मानदंड चुकता त्रुटियों का योग है, जिसे कम से कम करने की कोशिश की जाती है। इसे लागू करने के लिए, संभव के रूप में एक अज्ञात यादृच्छिक चर के कई मापों को पूरा करना आवश्यक है (अधिक - समाधान की उच्च सटीकता) और अपेक्षित समाधानों का एक निश्चित सेट, जिसमें से सबसे अच्छा चुनना आवश्यक है . यदि समाधान के सेट को पैरामिट्रीकृत किया जाता है, तो पैरामीटर का इष्टतम मान अवश्य मिलना चाहिए।

त्रुटि वर्गों को कम से कम क्यों किया जाता है, न कि स्वयं त्रुटियों को? तथ्य यह है कि ज्यादातर मामलों में त्रुटियां दोनों दिशाओं में होती हैं: अनुमान माप से अधिक या उससे कम हो सकता है। यदि हम विभिन्न संकेतों के साथ त्रुटियां जोड़ते हैं, तो वे एक दूसरे को रद्द कर देंगे, और परिणामस्वरूप, योग हमें अनुमान की गुणवत्ता का गलत विचार देगा। अक्सर, अंतिम अनुमान के लिए मापा मूल्यों के समान आयाम होने के लिए, वर्गमूल को चुकता त्रुटियों के योग से लिया जाता है।


एक छवि:

LSM का उपयोग गणित में, विशेष रूप से संभाव्यता सिद्धांत और गणितीय आँकड़ों में किया जाता है। फ़िल्टरिंग समस्याओं में इस पद्धति का सबसे बड़ा अनुप्रयोग है, जब उस पर लगाए गए शोर से उपयोगी संकेत को अलग करना आवश्यक होता है।

इसका उपयोग गणितीय विश्लेषण में सरल कार्यों द्वारा दिए गए फ़ंक्शन के अनुमानित प्रतिनिधित्व के लिए भी किया जाता है। एलएसएम के आवेदन का एक अन्य क्षेत्र समीकरणों की संख्या की तुलना में कम अज्ञात वाले समीकरणों की प्रणालियों का समाधान है।

मैं एलएसएम के कुछ और बहुत ही अनपेक्षित अनुप्रयोगों के साथ आया, जिनके बारे में मैं इस लेख में बात करना चाहूंगा।

बहुराष्ट्रीय कंपनियां और टाइपो

टाइपो और वर्तनी की त्रुटियाँ स्वचालित अनुवादकों और खोज इंजनों का संकट हैं। वास्तव में, यदि शब्द केवल 1 अक्षर से भिन्न होता है, तो प्रोग्राम इसे दूसरे शब्द के रूप में मानता है और गलत तरीके से इसका अनुवाद/खोज करता है या इसका अनुवाद नहीं करता/बिल्कुल नहीं पाता है।

मुझे एक समान समस्या थी: मास्को के घरों के पते के साथ दो डेटाबेस थे, और उन्हें एक में जोड़ा जाना था। लेकिन पते अलग अंदाज में लिखे गए थे। एक डेटाबेस में KLADR मानक (ऑल-रशियन एड्रेस क्लासिफायरियर) था, उदाहरण के लिए: "BABUSHKINA PILOT UL।, D10K3"। और दूसरे डेटाबेस में एक डाक शैली थी, उदाहरण के लिए: “सेंट। पायलट बबुश्किन, हाउस 10 बिल्डिंग 3। ऐसा लगता है कि दोनों मामलों में कोई त्रुटि नहीं है, और प्रक्रिया को स्वचालित करना अविश्वसनीय रूप से कठिन है (प्रत्येक डेटाबेस में 40,000 रिकॉर्ड हैं!) हालाँकि वहाँ भी पर्याप्त टाइपो थे ... कंप्यूटर को कैसे समझा जाए कि ऊपर दिए गए 2 पते एक ही घर के हैं? यहीं पर एमएनसी मेरे काम आई।

मैने क्या किया है? पहले पते में अगला पत्र मिलने के बाद, मैंने दूसरे पते में उसी पत्र की तलाश की। यदि वे दोनों एक ही स्थान पर थे, तो मैंने मान लिया था कि उस अक्षर के लिए त्रुटि 0 थी। यदि वे आसन्न स्थितियों में थे, तो त्रुटि 1 थी। यदि दूसरे पते में ऐसा कोई पत्र नहीं था, तो त्रुटि को n+1 माना गया था, जहां n पहले पते में अक्षरों की संख्या है। इस प्रकार, मैंने चुकता त्रुटियों के योग की गणना की और उन अभिलेखों को जोड़ा जिनमें यह योग न्यूनतम था।

बेशक, घरों और इमारतों की संख्या अलग-अलग संसाधित की गई थी। मुझे नहीं पता कि मैंने एक और "साइकिल" का आविष्कार किया है या यह वास्तव में था, लेकिन समस्या जल्दी और कुशलता से हल हो गई। मुझे आश्चर्य है कि क्या इस पद्धति का उपयोग खोज इंजनों में किया जाता है? शायद इसका उपयोग किया जाता है, क्योंकि प्रत्येक स्वाभिमानी खोज इंजन, जब एक अपरिचित शब्द मिलते हैं, परिचित शब्दों से प्रतिस्थापन प्रदान करते हैं ("शायद आपका मतलब ...")। हालाँकि, वे इस विश्लेषण को किसी तरह अलग तरीके से कर सकते हैं।

OLS और चित्रों, चेहरों और नक्शों द्वारा खोजें

इस पद्धति को चित्रों, रेखाचित्रों, नक्शों, और यहां तक ​​कि लोगों के चेहरों द्वारा खोजने के लिए भी लागू किया जा सकता है।

एक छवि:

अब सभी सर्च इंजन, छवियों द्वारा खोज करने के बजाय, वास्तव में छवि कैप्शन द्वारा खोज का उपयोग करते हैं। यह निस्संदेह एक उपयोगी और सुविधाजनक सेवा है, लेकिन मैं इसे वास्तविक छवि खोज के साथ पूरक करने का प्रस्ताव करता हूं।

एक नमूना तस्वीर पेश की जाती है और विशेषता बिंदुओं के वर्ग विचलन के योग द्वारा सभी छवियों के लिए एक रेटिंग बनाई जाती है। इन विशिष्ट बिंदुओं को निर्धारित करना अपने आप में एक गैर-तुच्छ कार्य है। हालाँकि, यह काफी हल करने योग्य है: उदाहरण के लिए, चेहरे के लिए, ये आँखों के कोने, होंठ, नाक की नोक, नथुने, किनारों और भौंहों के केंद्र, पुतलियाँ आदि हैं।

इन मापदंडों की तुलना करके, आप एक ऐसा चेहरा पा सकते हैं जो नमूने के समान है। मैंने पहले ही ऐसी साइटें देखी हैं जहां ऐसी सेवा काम करती है, और आप एक सेलिब्रिटी ढूंढ सकते हैं जो आपके द्वारा सुझाई गई तस्वीर के समान है, और यहां तक ​​कि एक एनीमेशन भी बना सकते हैं जो आपको एक सेलिब्रिटी और बैक में बदल देता है। निश्चित रूप से एक ही विधि आंतरिक मामलों के मंत्रालय के ठिकानों में काम करती है, जिसमें अपराधियों की पहचान वाली छवियां होती हैं।

फोटो: pixabay.com

हाँ, और उंगलियों के निशान उसी तरह खोजे जा सकते हैं। मानचित्र खोज भौगोलिक वस्तुओं की प्राकृतिक अनियमितताओं पर केंद्रित है - नदियों, पर्वत श्रृंखलाओं, तटों, जंगलों और खेतों की रूपरेखा।

यहाँ इस तरह की एक अद्भुत और बहुमुखी OLS विधि है। मुझे यकीन है कि आप, प्रिय पाठकों, अपने लिए इस पद्धति के कई असामान्य और अप्रत्याशित अनुप्रयोग खोजने में सक्षम होंगे।

इसके कई अनुप्रयोग हैं, क्योंकि यह अन्य सरल कार्यों द्वारा दिए गए फ़ंक्शन के अनुमानित प्रतिनिधित्व की अनुमति देता है। एलएसएम अवलोकनों को संसाधित करने में बेहद उपयोगी हो सकता है, और यह यादृच्छिक त्रुटियों वाले अन्य के मापन के परिणामों से कुछ मात्राओं का अनुमान लगाने के लिए सक्रिय रूप से उपयोग किया जाता है। इस लेख में, आप सीखेंगे कि एक्सेल में कम से कम वर्गों की गणना कैसे करें।

एक विशिष्ट उदाहरण पर समस्या का विवरण

मान लीजिए कि दो संकेतक X और Y हैं। इसके अलावा, Y X पर निर्भर करता है। चूंकि प्रतिगमन विश्लेषण के दृष्टिकोण से OLS हमारे लिए रुचि रखता है (एक्सेल में, इसके तरीकों को अंतर्निहित कार्यों का उपयोग करके लागू किया जाता है), हमें तुरंत आगे बढ़ना चाहिए एक विशिष्ट समस्या पर विचार करने के लिए।

तो, X को एक किराने की दुकान का विक्रय क्षेत्र होने दें, जिसे वर्ग मीटर में मापा जाता है, और Y वार्षिक कारोबार हो, जिसे लाखों रूबल में परिभाषित किया गया हो।

यह अनुमान लगाना आवश्यक है कि स्टोर में एक या दूसरे रिटेल स्पेस होने पर टर्नओवर (Y) क्या होगा। जाहिर है, फ़ंक्शन वाई = एफ (एक्स) बढ़ रहा है, क्योंकि हायपरमार्केट स्टॉल से ज्यादा सामान बेचता है।

भविष्यवाणी के लिए प्रयुक्त प्रारंभिक डेटा की शुद्धता के बारे में कुछ शब्द

मान लें कि हमारे पास एन स्टोर्स के डेटा के साथ एक टेबल बनाया गया है।

गणितीय आँकड़ों के अनुसार, यदि कम से कम 5-6 वस्तुओं के डेटा की जाँच की जाए तो परिणाम कमोबेश सही होंगे। साथ ही, "विषम" परिणामों का उपयोग नहीं किया जा सकता है। विशेष रूप से, एक संभ्रांत छोटे बुटीक का टर्नओवर "मास्मार्केट" वर्ग के बड़े आउटलेट्स के टर्नओवर से कई गुना अधिक हो सकता है।

विधि का सार

तालिका डेटा को कार्तीय तल पर बिंदु M 1 (x 1, y 1), ... M n (x n, y n) के रूप में प्रदर्शित किया जा सकता है। अब समस्या का समाधान एक अनुमानित फ़ंक्शन y = f (x) के चयन के लिए कम हो जाएगा, जिसका एक ग्राफ जितना संभव हो सके बिंदु M 1, M 2, .. M n के पास से गुजरता है।

बेशक, आप एक उच्च डिग्री बहुपद का उपयोग कर सकते हैं, लेकिन यह विकल्प न केवल लागू करना मुश्किल है, बल्कि गलत भी है, क्योंकि यह उस मुख्य प्रवृत्ति को प्रतिबिंबित नहीं करेगा जिसका पता लगाने की आवश्यकता है। सबसे उचित समाधान एक सीधी रेखा y = ax + b की खोज करना है, जो प्रायोगिक डेटा का सबसे अच्छा अनुमान लगाता है, और अधिक सटीक रूप से, गुणांक - a और b।

सटीकता स्कोर

किसी भी अनुमान के लिए, इसकी सटीकता का आकलन विशेष महत्व रखता है। बिंदु x i के लिए कार्यात्मक और प्रायोगिक मानों के बीच e i अंतर (विचलन) को निरूपित करें, अर्थात e i = y i - f (x i)।

जाहिर है, सन्निकटन की सटीकता का आकलन करने के लिए, आप विचलन के योग का उपयोग कर सकते हैं, अर्थात, Y पर X की निर्भरता के अनुमानित प्रतिनिधित्व के लिए एक सीधी रेखा का चयन करते समय, वरीयता उसी को दी जानी चाहिए जिसका सबसे छोटा मूल्य हो योग ई मैं विचाराधीन सभी बिंदुओं पर। हालांकि, सब कुछ इतना सरल नहीं है, क्योंकि सकारात्मक विचलन के साथ-साथ व्यावहारिक रूप से नकारात्मक भी होंगे।

आप विचलन मॉड्यूल या उनके वर्गों का उपयोग करके समस्या का समाधान कर सकते हैं। बाद की विधि सबसे व्यापक रूप से उपयोग की जाती है। इसका उपयोग कई क्षेत्रों में किया जाता है, जिसमें प्रतिगमन विश्लेषण भी शामिल है (एक्सेल में, इसका कार्यान्वयन दो अंतर्निहित कार्यों का उपयोग करके किया जाता है), और यह लंबे समय से प्रभावी साबित हुआ है।

कम से कम वर्ग विधि

एक्सेल में, जैसा कि आप जानते हैं, एक अंतर्निहित ऑटोसम फ़ंक्शन है जो आपको चयनित सीमा में स्थित सभी मानों के मूल्यों की गणना करने की अनुमति देता है। इस प्रकार, कुछ भी हमें अभिव्यक्ति के मूल्य की गणना करने से नहीं रोकेगा (ई 1 2 + ई 2 2 + ई 3 2 + ... ई एन 2)।

गणितीय संकेतन में, ऐसा दिखता है:

चूंकि निर्णय शुरू में एक सीधी रेखा का उपयोग करके अनुमानित किया गया था, हमारे पास:

इस प्रकार, एक सीधी रेखा खोजने का कार्य जो एक्स और वाई के बीच एक विशिष्ट संबंध का सबसे अच्छा वर्णन करता है, दो चर के न्यूनतम फ़ंक्शन की गणना करने के लिए:

इसके लिए नए चर ए और बी के संबंध में शून्य आंशिक डेरिवेटिव के बराबर होने की आवश्यकता है, और फॉर्म के 2 अज्ञात के साथ दो समीकरणों वाली एक प्रारंभिक प्रणाली को हल करना:

सरल परिवर्तनों के बाद, 2 से विभाजित करने और योगों में हेरफेर करने सहित, हम प्राप्त करते हैं:

इसे हल करते हुए, उदाहरण के लिए, क्रैमर की विधि द्वारा, हम निश्चित गुणांक a * और b * के साथ एक स्थिर बिंदु प्राप्त करते हैं। यह न्यूनतम है, यानी यह अनुमान लगाने के लिए कि एक निश्चित क्षेत्र के लिए स्टोर का टर्नओवर क्या होगा, सीधी रेखा y = a * x + b * उपयुक्त है, जो प्रश्न में उदाहरण के लिए एक प्रतिगमन मॉडल है। बेशक, यह आपको सटीक परिणाम खोजने की अनुमति नहीं देगा, लेकिन इससे आपको यह अंदाजा लगाने में मदद मिलेगी कि क्या किसी विशेष क्षेत्र के लिए क्रेडिट पर स्टोर खरीदना बंद हो जाएगा।

एक्सेल में कम से कम वर्ग विधि कैसे लागू करें

एक्सेल में कम से कम वर्गों के मान की गणना के लिए एक फ़ंक्शन है। इसका निम्न रूप है: TREND (ज्ञात Y मान; ज्ञात X मान; नए X मान; स्थिर)। आइए एक्सेल में ओएलएस की गणना के लिए सूत्र को हमारी तालिका में लागू करें।

ऐसा करने के लिए, उस सेल में जिसमें एक्सेल में कम से कम वर्ग विधि का उपयोग करके गणना का परिणाम प्रदर्शित किया जाना चाहिए, "=" चिन्ह दर्ज करें और "ट्रेंड" फ़ंक्शन का चयन करें। खुलने वाली विंडो में, हाइलाइट करते हुए उपयुक्त फ़ील्ड भरें:

  • वाई के लिए ज्ञात मूल्यों की सीमा (इस मामले में टर्नओवर के लिए डेटा);
  • रेंज x 1 , …x n , यानी रिटेल स्पेस का आकार;
  • और एक्स के ज्ञात और अज्ञात मान, जिसके लिए आपको टर्नओवर के आकार का पता लगाने की आवश्यकता है (कार्यपत्रक पर उनके स्थान के बारे में जानकारी के लिए, नीचे देखें)।

इसके अलावा, सूत्र में एक तार्किक चर "कॉन्स्ट" है। यदि आप इसके अनुरूप क्षेत्र में 1 दर्ज करते हैं, तो इसका मतलब यह होगा कि बी \u003d 0 मानकर गणना की जानी चाहिए।

यदि आपको एक से अधिक x मान के लिए पूर्वानुमान जानने की आवश्यकता है, तो सूत्र दर्ज करने के बाद, आपको "एंटर" नहीं दबाना चाहिए, लेकिन आपको संयोजन "Shift" + "Control" + "Enter" ("Enter") टाइप करना होगा ) कीबोर्ड पर।

कुछ सुविधाएं

प्रतिगमन विश्लेषण डमी के लिए भी सुलभ हो सकता है। अज्ञात चरों की एक सरणी के मान की भविष्यवाणी करने के लिए एक्सेल फॉर्मूला - "ट्रेंड" - का उपयोग उन लोगों द्वारा भी किया जा सकता है जिन्होंने कभी कम वर्ग विधि के बारे में नहीं सुना है। इसके काम की कुछ विशेषताओं को जानना ही काफी है। विशेष रूप से:

  • यदि आप चर y के ज्ञात मानों की श्रेणी को एक पंक्ति या स्तंभ में रखते हैं, तो x के ज्ञात मानों वाली प्रत्येक पंक्ति (स्तंभ) को कार्यक्रम द्वारा एक अलग चर के रूप में माना जाएगा।
  • यदि TREND विंडो में ज्ञात x के साथ सीमा निर्दिष्ट नहीं है, तो एक्सेल में फ़ंक्शन का उपयोग करने के मामले में, प्रोग्राम इसे पूर्णांक से मिलकर एक सरणी के रूप में मानेगा, जिसकी संख्या दिए गए मानों के साथ सीमा से मेल खाती है चर y का।
  • "अनुमानित" मानों की एक सरणी को आउटपुट करने के लिए, प्रवृत्ति अभिव्यक्ति को एक सरणी सूत्र के रूप में दर्ज किया जाना चाहिए।
  • यदि कोई नया x मान निर्दिष्ट नहीं किया गया है, तो TREND फ़ंक्शन उन्हें ज्ञात के बराबर मानता है। यदि वे निर्दिष्ट नहीं हैं, तो सरणी 1 को तर्क के रूप में लिया जाता है; 2; 3; 4;…, जो पहले से दिए गए पैरामीटर y के साथ सीमा के अनुरूप है।
  • नए x मानों वाली श्रेणी में दिए गए y मानों वाली श्रेणी के समान या अधिक पंक्तियाँ या स्तंभ होने चाहिए। दूसरे शब्दों में, यह स्वतंत्र चर के अनुपात में होना चाहिए।
  • ज्ञात x मान वाले सरणी में एकाधिक चर हो सकते हैं। हालाँकि, यदि हम केवल एक के बारे में बात कर रहे हैं, तो यह आवश्यक है कि x और y के दिए गए मान वाली श्रेणियाँ समानुपाती हों। कई चर के मामले में, यह आवश्यक है कि दिए गए y मान वाली सीमा एक स्तंभ या एक पंक्ति में फिट हो।

पूर्वानुमान समारोह

यह कई कार्यों का उपयोग करके कार्यान्वित किया जाता है। उनमें से एक को "भविष्यवाणी" कहा जाता है। यह TREND के समान है, अर्थात यह कम से कम वर्ग विधि का उपयोग करके गणना का परिणाम देता है। हालाँकि, केवल एक X के लिए, जिसके लिए Y का मान अज्ञात है।

अब आप डमी के लिए एक्सेल फ़ार्मुलों को जानते हैं जो आपको एक रेखीय प्रवृत्ति के अनुसार एक संकेतक के भविष्य के मूल्य के मूल्य की भविष्यवाणी करने की अनुमति देता है।

कम से कम वर्ग एक रेखीय समीकरण के निर्माण के लिए एक गणितीय प्रक्रिया है जो ए और बी के मूल्यों को खोजने के द्वारा क्रमबद्ध जोड़े के एक सेट को सबसे अच्छी तरह से फिट करता है, सीधी रेखा समीकरण में गुणांक। कम से कम वर्ग विधि का लक्ष्य y और ŷ मानों के बीच कुल वर्ग त्रुटि को कम करना है। यदि प्रत्येक बिंदु के लिए हम त्रुटि ŷ निर्धारित करते हैं, तो कम से कम वर्ग विधि न्यूनतम करती है:

जहाँ n = रेखा के चारों ओर क्रमित युग्मों की संख्या। डेटा के लिए सबसे अधिक प्रासंगिक।

यह अवधारणा चित्र में सचित्र है

आंकड़े को देखते हुए, वह रेखा जो डेटा को सबसे अच्छी तरह से फिट करती है, प्रतिगमन रेखा, ग्राफ पर चार बिंदुओं की कुल चुकता त्रुटि को कम करती है। मैं आपको दिखाऊंगा कि निम्न उदाहरण में न्यूनतम वर्ग विधि का उपयोग करके इसे कैसे निर्धारित किया जाए।

एक युवा जोड़े की कल्पना करें जो हाल ही में एक साथ रहते हैं और एक बाथरूम वैनिटी टेबल साझा करते हैं। युवक ने ध्यान देना शुरू किया कि उसकी मेज का आधा हिस्सा लगातार सिकुड़ रहा था, बालों के मूस और सोया कॉम्प्लेक्स के लिए जमीन खो रही थी। पिछले कुछ महीनों में, लड़का उस दर पर बारीकी से नजर रख रहा है जिस पर टेबल के उसके हिस्से की वस्तुओं की संख्या बढ़ रही है। नीचे दी गई तालिका में दिखाया गया है कि लड़की के पास बाथरूम की मेज पर पिछले कुछ महीनों में जमा की गई वस्तुओं की संख्या कितनी है।

चूँकि हमारा लक्ष्य यह पता लगाना है कि क्या समय के साथ वस्तुओं की संख्या बढ़ती है, "महीना" स्वतंत्र चर होगा, और "वस्तुओं की संख्या" आश्रित चर होगा।

कम से कम वर्गों की विधि का उपयोग करते हुए, हम उस समीकरण को निर्धारित करते हैं जो डेटा को सबसे अच्छा फिट करता है, ए के मूल्यों की गणना करके, वाई-अक्ष पर खंड, और बी, रेखा की ढलान:

ए = वाई सीएफ - बीएक्स सीएफ

जहाँ x cf स्वतंत्र चर x का माध्य मान है, y cf स्वतंत्र चर y का माध्य मान है।

नीचे दी गई तालिका इन समीकरणों के लिए आवश्यक गणनाओं को सारांशित करती है।

हमारे बाथटब उदाहरण के लिए प्रभाव वक्र निम्नलिखित समीकरण द्वारा दिया जाएगा:

चूंकि हमारे समीकरण में 0.976 की सकारात्मक ढलान है, लड़के के पास सबूत है कि टेबल पर वस्तुओं की संख्या समय के साथ प्रति माह 1 आइटम की औसत दर से बढ़ रही है। ग्राफ क्रमित जोड़े के साथ प्रभाव वक्र दिखाता है।

अगले छमाही (16 महीने) के लिए मदों की अपेक्षित संख्या की गणना निम्नानुसार की जाएगी:

ŷ = 5.13 + 0.976x = 5.13 + 0.976(16) ~ 20.7 = 21 आइटम

इसलिए हमारे नायक के लिए कुछ कार्रवाई करने का समय आ गया है।

एक्सेल में ट्रेंड फ़ंक्शन

जैसा कि आपने अनुमान लगाया होगा, एक्सेल के पास मूल्य की गणना करने के लिए एक फ़ंक्शन है न्यूनतम वर्ग विधि।इस सुविधा को TREND कहा जाता है। इसका सिंटैक्स निम्न है:

TREND (ज्ञात Y मान; ज्ञात X मान; नए X मान; स्थिरांक)

Y के ज्ञात मान - आश्रित चर की एक सरणी, हमारे मामले में, तालिका में वस्तुओं की संख्या

एक्स के ज्ञात मूल्य - स्वतंत्र चर की एक सरणी, हमारे मामले में यह एक महीना है

नए एक्स मान – नए एक्स (माह) मान जिसके लिए रुझान समारोहआश्रित चरों का अपेक्षित मान लौटाता है (आइटमों की संख्या)

स्थिरांक - वैकल्पिक। एक बूलियन मान जो निर्दिष्ट करता है कि स्थिरांक b को 0 होना आवश्यक है या नहीं।

उदाहरण के लिए, यह आंकड़ा 16वें महीने के लिए बाथरूम की मेज पर वस्तुओं की अपेक्षित संख्या निर्धारित करने के लिए उपयोग किए जाने वाले TREND फ़ंक्शन को दिखाता है।

श्रेणियाँ

लोकप्रिय लेख

2022 "Kingad.ru" - मानव अंगों की अल्ट्रासाउंड परीक्षा