कम से कम वर्ग विधि का उपयोग करके डेटा विश्लेषण। एक्सेल में कम से कम वर्ग

कम से कम वर्ग विधि

विषय के अंतिम पाठ में, हम सबसे प्रसिद्ध एप्लिकेशन से परिचित होंगे एफएनपी, जो विज्ञान और अभ्यास के विभिन्न क्षेत्रों में व्यापक आवेदन पाता है। यह भौतिकी, रसायन विज्ञान, जीव विज्ञान, अर्थशास्त्र, समाजशास्त्र, मनोविज्ञान आदि हो सकता है। भाग्य की इच्छा से, मुझे अक्सर अर्थव्यवस्था से निपटना पड़ता है, और इसलिए आज मैं आपके लिए एक अद्भुत देश के टिकट की व्यवस्था करूंगा जिसे कहा जाता है अर्थमिति=) ... आप ऐसा कैसे नहीं चाहते?! यह वहां बहुत अच्छा है - आपको बस फैसला करना है! ...लेकिन आप जो निश्चित रूप से चाहते हैं वह यह है कि समस्याओं को हल करना सीखना है कम से कम वर्गों. और विशेष रूप से मेहनती पाठक उन्हें न केवल सटीक रूप से हल करना सीखेंगे, बल्कि बहुत तेज़ ;-) लेकिन पहले समस्या का सामान्य विवरण+ संबंधित उदाहरण:

कुछ विषय क्षेत्र में संकेतकों का अध्ययन करने दें जिनकी मात्रात्मक अभिव्यक्ति है। साथ ही, यह मानने का हर कारण है कि संकेतक संकेतक पर निर्भर करता है। यह धारणा वैज्ञानिक परिकल्पना और प्राथमिक सामान्य ज्ञान दोनों पर आधारित हो सकती है। आइए विज्ञान को एक तरफ छोड़ दें, और अधिक स्वादिष्ट क्षेत्रों का पता लगाएं - अर्थात्, किराना स्टोर। द्वारा निरूपित करें:

- किराने की दुकान का खुदरा स्थान, वर्गमीटर,
- किराने की दुकान का वार्षिक कारोबार, मिलियन रूबल।

यह बिल्कुल स्पष्ट है कि स्टोर का क्षेत्रफल जितना बड़ा होगा, ज्यादातर मामलों में उसका कारोबार उतना ही अधिक होगा।

मान लीजिए कि एक डफ के साथ अवलोकन / प्रयोग / गणना / नृत्य करने के बाद, हमारे पास हमारे निपटान में संख्यात्मक डेटा है:

किराने की दुकानों के साथ, मुझे लगता है कि सब कुछ स्पष्ट है: - यह पहली दुकान का क्षेत्र है, - इसका वार्षिक कारोबार, - दूसरी दुकान का क्षेत्र, - इसका वार्षिक कारोबार, आदि। वैसे, वर्गीकृत सामग्रियों तक पहुंच होना बिल्कुल भी आवश्यक नहीं है - इसका उपयोग करके टर्नओवर का काफी सटीक मूल्यांकन प्राप्त किया जा सकता है गणितीय सांख्यिकी. हालांकि, विचलित न हों, वाणिज्यिक जासूसी का कोर्स पहले ही भुगतान किया जा चुका है =)

सारणीबद्ध डेटा को बिंदुओं के रूप में भी लिखा जा सकता है और हमारे लिए सामान्य तरीके से दर्शाया जा सकता है। कार्तीय प्रणाली .

आइए एक महत्वपूर्ण प्रश्न का उत्तर दें: गुणात्मक अध्ययन के लिए कितने अंक चाहिए?

जितना बड़ा उतना अच्छा। न्यूनतम स्वीकार्य सेट में 5-6 अंक होते हैं। इसके अलावा, डेटा की एक छोटी मात्रा के साथ, "असामान्य" परिणामों को नमूने में शामिल नहीं किया जाना चाहिए। इसलिए, उदाहरण के लिए, एक छोटा संभ्रांत स्टोर "उनके सहयोगियों" से अधिक परिमाण के आदेशों की मदद कर सकता है, जिससे सामान्य पैटर्न को खोजने की आवश्यकता होती है!



यदि यह काफी सरल है, तो हमें एक फ़ंक्शन चुनना होगा, अनुसूचीजो जितना संभव हो उतना करीब से गुजरता है . इस तरह के एक समारोह कहा जाता है अनुमान करने वाले (सन्निकटन - सन्निकटन)या सैद्धांतिक कार्य . सामान्यतया, यहाँ तुरंत एक स्पष्ट "दिखावा" दिखाई देता है - उच्च डिग्री का एक बहुपद, जिसका ग्राफ सभी बिंदुओं से होकर गुजरता है। लेकिन यह विकल्प जटिल है, और अक्सर बस गलत है। (क्योंकि चार्ट हर समय "हवा" देगा और मुख्य प्रवृत्ति को खराब रूप से प्रतिबिंबित करेगा).

इस प्रकार, वांछित कार्य पर्याप्त रूप से सरल होना चाहिए और साथ ही साथ निर्भरता को पर्याप्त रूप से प्रतिबिंबित करना चाहिए। जैसा कि आप अनुमान लगा सकते हैं, ऐसे कार्यों को खोजने के तरीकों में से एक को कहा जाता है कम से कम वर्गों. सबसे पहले, आइए इसके सार का सामान्य तरीके से विश्लेषण करें। कुछ फ़ंक्शन को प्रयोगात्मक डेटा का अनुमान लगाने दें:


इस सन्निकटन की सटीकता का मूल्यांकन कैसे करें? आइए हम प्रयोगात्मक और कार्यात्मक मूल्यों के बीच अंतर (विचलन) की गणना करें (हम ड्राइंग का अध्ययन करते हैं). पहला विचार जो दिमाग में आता है वह यह अनुमान लगाना है कि राशि कितनी बड़ी है, लेकिन समस्या यह है कि मतभेद नकारात्मक हो सकते हैं। (उदाहरण के लिए, ) और इस तरह के योग के परिणामस्वरूप विचलन एक दूसरे को रद्द कर देंगे। इसलिए, सन्निकटन की सटीकता के अनुमान के रूप में, यह खुद को योग लेने का सुझाव देता है मॉड्यूलविचलन:

या मुड़े हुए रूप में: (उन लोगों के लिए जो नहीं जानते: योग चिह्न है, और - सहायक चर - "काउंटर", जो 1 से . तक मान लेता है ) .

विभिन्न कार्यों के साथ प्रयोगात्मक बिंदुओं का अनुमान लगाते हुए, हमें अलग-अलग मान प्राप्त होंगे, और यह स्पष्ट है कि यह योग कहां कम है - वह कार्य अधिक सटीक है।

ऐसी विधि मौजूद है और कहा जाता है कम से कम मापांक विधि. हालाँकि, व्यवहार में यह बहुत अधिक व्यापक हो गया है। कम से कम वर्ग विधि, जिसमें संभावित नकारात्मक मूल्यों को मापांक द्वारा समाप्त नहीं किया जाता है, लेकिन विचलन को चुकता करके:



, जिसके बाद प्रयासों को ऐसे फ़ंक्शन के चयन के लिए निर्देशित किया जाता है कि वर्ग विचलन का योग जितना संभव हो उतना छोटा था। दरअसल, इसलिए विधि का नाम।

और अब हम एक और महत्वपूर्ण बिंदु पर लौटते हैं: जैसा कि ऊपर उल्लेख किया गया है, चयनित फ़ंक्शन काफी सरल होना चाहिए - लेकिन ऐसे कई कार्य भी हैं: रैखिक , अतिपरवलिक , घातीय , लघुगणक , द्विघात आदि। और, ज़ाहिर है, यहाँ मैं तुरंत "गतिविधि के क्षेत्र को कम करना" चाहूंगा। अनुसंधान के लिए किस वर्ग के कार्यों का चयन करना है? आदिम लेकिन प्रभावी तकनीक:

- अंक आकर्षित करने का सबसे आसान तरीका ड्राइंग पर और उनके स्थान का विश्लेषण करें। यदि वे एक सीधी रेखा में होते हैं, तो आपको देखना चाहिए सीधी रेखा समीकरण इष्टतम मूल्यों के साथ और . दूसरे शब्दों में, कार्य ऐसे गुणांकों को खोजना है - ताकि वर्ग विचलनों का योग सबसे छोटा हो।

यदि बिंदु स्थित हैं, उदाहरण के लिए, साथ में अतिशयोक्ति, तो यह स्पष्ट है कि रैखिक फलन खराब सन्निकटन देगा। इस मामले में, हम अतिपरवलय समीकरण के लिए सबसे अधिक "अनुकूल" गुणांकों की तलाश कर रहे हैं - वे जो वर्गों का न्यूनतम योग देते हैं .

अब ध्यान दें कि दोनों ही मामलों में हम बात कर रहे हैं दो चर के कार्य, जिनके तर्क हैं खोज निर्भरता विकल्प:

और संक्षेप में, हमें एक मानक समस्या को हल करने की आवश्यकता है - खोजने के लिए दो चर के एक समारोह का न्यूनतम.

हमारे उदाहरण को याद करें: मान लीजिए कि "दुकान" बिंदु एक सीधी रेखा में स्थित हैं और उपस्थिति पर विश्वास करने का हर कारण है रैखिक निर्भरताव्यापार क्षेत्र से कारोबार। आइए ऐसे गुणांक "ए" और "बी" खोजें ताकि वर्ग विचलन का योग हो सबसे छोटा था। सब कुछ हमेशा की तरह - पहले 1 क्रम के आंशिक व्युत्पन्न. के अनुसार रैखिकता नियमआप योग आइकन के ठीक नीचे अंतर कर सकते हैं:

यदि आप इस जानकारी का उपयोग निबंध या शोध कार्य के लिए करना चाहते हैं, तो मैं स्रोतों की सूची में लिंक के लिए बहुत आभारी रहूंगा, आपको ऐसी विस्तृत गणना कहीं नहीं मिलेगी:

आइए एक मानक प्रणाली बनाएं:

हम प्रत्येक समीकरण को "दो" से कम करते हैं और, इसके अलावा, "अलग" रकम:

टिप्पणी : स्वतंत्र रूप से विश्लेषण करें कि "ए" और "बी" को योग आइकन से क्यों निकाला जा सकता है। वैसे, औपचारिक रूप से यह योग के साथ किया जा सकता है

आइए सिस्टम को "लागू" रूप में फिर से लिखें:

जिसके बाद हमारी समस्या को हल करने के लिए एल्गोरिदम तैयार करना शुरू होता है:

क्या हम बिंदुओं के निर्देशांक जानते हैं? हम जानते है। रकम क्या हम ढूंढ सकते हैं? सरलता। हम सबसे सरल रचना करते हैं दो अज्ञात के साथ दो रैखिक समीकरणों की प्रणाली("ए" और "बीएच")। हम सिस्टम को हल करते हैं, उदाहरण के लिए, क्रैमर की विधि, जिसके परिणामस्वरूप एक स्थिर बिंदु होता है। चेकिंग एक चरम के लिए पर्याप्त स्थिति, हम सत्यापित कर सकते हैं कि इस बिंदु पर फ़ंक्शन ठीक पहुँचता है न्यूनतम. सत्यापन अतिरिक्त गणनाओं से जुड़ा है और इसलिए हम इसे पर्दे के पीछे छोड़ देंगे। (यदि आवश्यक हो, लापता फ्रेम देखा जा सकता हैयहां ) . हम अंतिम निष्कर्ष निकालते हैं:

समारोह सबसे अच्छा तरीका (कम से कम किसी अन्य रैखिक कार्य की तुलना में)प्रयोगात्मक बिंदुओं को करीब लाता है . मोटे तौर पर, इसका ग्राफ इन बिंदुओं के जितना करीब हो सके गुजरता है। परंपरा में अर्थमितिपरिणामी सन्निकटन फलन को भी कहा जाता है युग्मित रैखिक समाश्रयण समीकरण .

विचाराधीन समस्या बहुत व्यावहारिक महत्व की है। हमारे उदाहरण के साथ स्थिति में, समीकरण आपको यह अनुमान लगाने की अनुमति देता है कि किस प्रकार का टर्नओवर ("यिग")बिक्री क्षेत्र के एक या दूसरे मूल्य के साथ स्टोर पर होगा ("एक्स" का एक या दूसरा अर्थ). हां, परिणामी पूर्वानुमान केवल एक पूर्वानुमान होगा, लेकिन कई मामलों में यह काफी सटीक साबित होगा।

मैं "वास्तविक" संख्याओं के साथ केवल एक समस्या का विश्लेषण करूंगा, क्योंकि इसमें कोई कठिनाइयां नहीं हैं - सभी गणनाएं 7-8 ग्रेड में स्कूली पाठ्यक्रम के स्तर पर हैं। 95 प्रतिशत मामलों में, आपको केवल एक रैखिक फ़ंक्शन खोजने के लिए कहा जाएगा, लेकिन लेख के अंत में मैं दिखाऊंगा कि इष्टतम हाइपरबोला, घातांक और कुछ अन्य कार्यों के लिए समीकरणों को खोजना अधिक कठिन नहीं है।

वास्तव में, यह वादा किए गए उपहारों को वितरित करने के लिए बनी हुई है - ताकि आप सीखें कि ऐसे उदाहरणों को न केवल सटीक रूप से हल करना है, बल्कि जल्दी से भी। हम मानक का ध्यानपूर्वक अध्ययन करते हैं:

एक कार्य

दो संकेतकों के बीच संबंध का अध्ययन करने के परिणामस्वरूप, संख्याओं के निम्नलिखित जोड़े प्राप्त हुए:

कम से कम वर्ग विधि का उपयोग करते हुए, उस रैखिक फ़ंक्शन को खोजें जो अनुभवजन्य का सबसे अच्छा अनुमान लगाता है (अनुभव)जानकारी। एक ऐसा चित्र बनाइए जिस पर कार्तीय आयताकार निर्देशांक प्रणाली में प्रायोगिक बिंदुओं को आलेखित करें और सन्निकट फलन का आलेख तैयार करें। . अनुभवजन्य और सैद्धांतिक मूल्यों के बीच वर्ग विचलन का योग ज्ञात कीजिए। पता करें कि क्या फ़ंक्शन बेहतर है (न्यूनतम वर्ग विधि के संदर्भ में)अनुमानित प्रयोगात्मक बिंदु।

ध्यान दें कि "x" मान प्राकृतिक मूल्य हैं, और इसका एक विशिष्ट अर्थपूर्ण अर्थ है, जिसके बारे में मैं थोड़ी देर बाद बात करूंगा; लेकिन वे, निश्चित रूप से, भिन्नात्मक हो सकते हैं। इसके अलावा, किसी विशेष कार्य की सामग्री के आधार पर, "X" और "G" दोनों मान पूर्ण या आंशिक रूप से नकारात्मक हो सकते हैं। खैर, हमें एक "फेसलेस" टास्क दिया गया है, और हम इसे शुरू करते हैं समाधान:

हम सिस्टम के समाधान के रूप में इष्टतम फ़ंक्शन के गुणांक पाते हैं:

अधिक कॉम्पैक्ट नोटेशन के प्रयोजनों के लिए, "काउंटर" चर को छोड़ा जा सकता है, क्योंकि यह पहले से ही स्पष्ट है कि योग 1 से .

सारणीबद्ध रूप में आवश्यक राशियों की गणना करना अधिक सुविधाजनक है:


गणना एक माइक्रोकैलकुलेटर पर की जा सकती है, लेकिन एक्सेल का उपयोग करना बहुत बेहतर है - दोनों तेज और त्रुटियों के बिना; एक छोटा वीडियो देखें:

इस प्रकार, हम निम्नलिखित प्राप्त करते हैं: व्यवस्था:

यहां आप दूसरे समीकरण को 3 और . से गुणा कर सकते हैं पहले समीकरण पद से दूसरे को पद द्वारा घटाएं. लेकिन यह भाग्य है - व्यवहार में, सिस्टम अक्सर उपहार में नहीं होते हैं, और ऐसे मामलों में यह बचाता है क्रैमर की विधि:
, इसलिए सिस्टम के पास एक अनूठा समाधान है।

चलो एक चेक करते हैं। मैं समझता हूं कि मैं नहीं करना चाहता, लेकिन गलतियों को क्यों छोड़ें जहां आप उन्हें बिल्कुल याद नहीं कर सकते? सिस्टम के प्रत्येक समीकरण के बाईं ओर पाए गए समाधान को प्रतिस्थापित करें:

संबंधित समीकरणों के सही हिस्से प्राप्त होते हैं, जिसका अर्थ है कि सिस्टम सही ढंग से हल हो गया है।

इस प्रकार, वांछित सन्निकटन फलन: - from सभी रैखिक कार्यप्रयोगात्मक डेटा इसके द्वारा सबसे अच्छा अनुमानित है।

भिन्न सीधा अपने क्षेत्र पर स्टोर के कारोबार की निर्भरता, मिली निर्भरता है उल्टा (सिद्धांत "अधिक - कम"), और यह तथ्य तुरंत नकारात्मक द्वारा प्रकट होता है कोणीय गुणांक. समारोह हमें सूचित करता है कि एक निश्चित संकेतक में 1 इकाई की वृद्धि के साथ, आश्रित संकेतक का मूल्य घट जाता है औसत 0.65 इकाइयों द्वारा। जैसा कि वे कहते हैं, एक प्रकार का अनाज की कीमत जितनी अधिक होगी, उतना ही कम बेचा जाएगा।

सन्निकटन फलन को आलेखित करने के लिए, हमें इसके दो मान मिलते हैं:

और ड्राइंग निष्पादित करें:

निर्मित रेखा कहलाती है प्रवृत्ति रेखा (अर्थात्, एक रेखीय प्रवृत्ति रेखा, अर्थात सामान्य स्थिति में, एक प्रवृत्ति आवश्यक रूप से एक सीधी रेखा नहीं होती है). हर कोई "प्रवृत्ति में होना" अभिव्यक्ति से परिचित है, और मुझे लगता है कि इस शब्द को अतिरिक्त टिप्पणियों की आवश्यकता नहीं है।

वर्ग विचलन के योग की गणना करें अनुभवजन्य और सैद्धांतिक मूल्यों के बीच। ज्यामितीय रूप से, यह "क्रिमसन" खंडों की लंबाई के वर्गों का योग है (जिनमें से दो इतने छोटे हैं कि आप उन्हें देख भी नहीं सकते).

आइए एक तालिका में गणनाओं को संक्षेप में प्रस्तुत करें:


उन्हें फिर से मैन्युअल रूप से किया जा सकता है, बस अगर मैं पहले बिंदु के लिए एक उदाहरण दूंगा:

लेकिन यह पहले से ज्ञात तरीके से करने के लिए और अधिक कुशल है:

आइए दोहराएं: परिणाम का अर्थ क्या है?से सभी रैखिक कार्यसमारोह घातांक सबसे छोटा है, अर्थात यह अपने परिवार में सबसे अच्छा सन्निकटन है। और यहाँ, वैसे, समस्या का अंतिम प्रश्न आकस्मिक नहीं है: क्या होगा यदि प्रस्तावित घातीय कार्य प्रयोगात्मक बिंदुओं को बेहतर ढंग से अनुमानित करेगा?

आइए वर्ग विचलन के संगत योग का पता लगाएं - उन्हें अलग करने के लिए, मैं उन्हें "एप्सिलॉन" अक्षर से नामित करूंगा। तकनीक बिल्कुल समान है:

और फिर से 1 बिंदु के लिए हर आग की गणना के लिए:

एक्सेल में, हम मानक फ़ंक्शन का उपयोग करते हैं ऍक्स्प (सिंटेक्स एक्सेल सहायता में पाया जा सकता है).

निष्कर्ष: , इसलिए घातांकीय फलन सीधी रेखा से भी बदतर प्रयोगात्मक बिंदुओं का अनुमान लगाता है .

लेकिन यहां यह ध्यान दिया जाना चाहिए कि "बदतर" है इसका मतलब अभी तक नहीं है, गलत क्या है। अब मैंने इस एक्सपोनेंशियल फंक्शन का एक ग्राफ बनाया - और यह पॉइंट्स के करीब भी जाता है - इतना अधिक कि एक विश्लेषणात्मक अध्ययन के बिना यह कहना मुश्किल है कि कौन सा कार्य अधिक सटीक है।

यह समाधान को पूरा करता है, और मैं तर्क के प्राकृतिक मूल्यों के प्रश्न पर लौटता हूं। विभिन्न अध्ययनों में, एक नियम के रूप में, आर्थिक या सामाजिक, महीनों, वर्षों या अन्य समान समय अंतरालों को प्राकृतिक "X" के साथ गिना जाता है। उदाहरण के लिए, निम्नलिखित समस्या पर विचार करें:

वर्ष की पहली छमाही के लिए हमारे पास स्टोर के खुदरा कारोबार पर निम्नलिखित डेटा है:

सीधी रेखा विश्लेषणात्मक संरेखण का उपयोग करते हुए, जुलाई के लिए बिक्री की मात्रा पाएं.

हां, कोई बात नहीं: हम महीनों की संख्या 1, 2, 3, 4, 5, 6 करते हैं और सामान्य एल्गोरिथम का उपयोग करते हैं, जिसके परिणामस्वरूप हमें एक समीकरण मिलता है - जब समय की बात आती है तो आमतौर पर "ते" अक्षर होता है " (हालांकि यह महत्वपूर्ण नहीं है). परिणामी समीकरण से पता चलता है कि वर्ष की पहली छमाही में, कारोबार में औसतन 27.74 सीयू की वृद्धि हुई। प्रति महीने। जुलाई के लिए पूर्वानुमान प्राप्त करें (महीना #7): यूरोपीय संघ।

और इसी तरह के कार्य - अंधेरा अंधेरा है। जो लोग चाहते हैं वे एक अतिरिक्त सेवा का उपयोग कर सकते हैं, अर्थात् my एक्सेल कैलकुलेटर (प्रदर्शन के लिए संस्करण), के जो समस्या को लगभग तुरंत हल करता है!कार्यक्रम का कार्यशील संस्करण उपलब्ध है बदले मेंया के लिए प्रतीकात्मक भुगतान.

पाठ के अंत में, कुछ अन्य प्रकार की निर्भरता को खोजने के बारे में एक संक्षिप्त जानकारी। दरअसल, बताने के लिए कुछ खास नहीं है, क्योंकि मौलिक दृष्टिकोण और समाधान एल्गोरिदम समान रहता है।

आइए मान लें कि प्रयोगात्मक बिंदुओं का स्थान हाइपरबोला जैसा दिखता है। फिर, सर्वोत्तम हाइपरबोला के गुणांकों को खोजने के लिए, आपको न्यूनतम फ़ंक्शन खोजने की आवश्यकता है - जो लोग चाहते हैं वे विस्तृत गणना कर सकते हैं और एक समान प्रणाली में आ सकते हैं:

औपचारिक तकनीकी दृष्टिकोण से, इसे "रैखिक" प्रणाली से प्राप्त किया जाता है (आइए इसे तारांकन के साथ चिह्नित करें)"x" के स्थान पर . खैर, रकम गणना करें, जिसके बाद इष्टतम गुणांक "ए" और "बी" उपलब्ध.

अगर यह मानने का हर कारण है कि अंक एक लघुगणकीय वक्र के साथ व्यवस्थित किया जाता है, फिर इष्टतम मूल्यों की खोज करने के लिए और न्यूनतम फ़ंक्शन का पता लगाने के लिए . औपचारिक रूप से, सिस्टम में (*) को इसके द्वारा प्रतिस्थापित किया जाना चाहिए:

एक्सेल में गणना करते समय, फ़ंक्शन का उपयोग करें एलएन. मैं स्वीकार करता हूं कि मेरे लिए विचाराधीन प्रत्येक मामले के लिए कैलकुलेटर बनाना मुश्किल नहीं होगा, लेकिन यह तब भी बेहतर होगा यदि आप गणनाओं को स्वयं "प्रोग्राम" करते हैं। वीडियो ट्यूटोरियल मदद करने के लिए।

घातीय निर्भरता के साथ, स्थिति थोड़ी अधिक जटिल है। मामले को रैखिक मामले में कम करने के लिए, हम फ़ंक्शन का लघुगणक लेते हैं और उपयोग करते हैं लघुगणक के गुण:

अब, प्राप्त फलन की रैखिक फलन से तुलना करते हुए, हम इस निष्कर्ष पर पहुँचते हैं कि निकाय में (*) को , और - द्वारा प्रतिस्थापित किया जाना चाहिए। सुविधा के लिए, हम निरूपित करते हैं:

कृपया ध्यान दें कि सिस्टम को और के संबंध में हल किया गया है, और इसलिए, जड़ों को खोजने के बाद, आपको गुणांक को स्वयं खोजना नहीं भूलना चाहिए।

प्रयोगात्मक बिंदुओं का अनुमान लगाने के लिए इष्टतम परवलय , पाया जाना चाहिए तीन चर के एक समारोह का न्यूनतम. मानक क्रियाएं करने के बाद, हमें निम्नलिखित "काम" मिलता है व्यवस्था:

हां, बेशक, यहां अधिक मात्रा में हैं, लेकिन आपके पसंदीदा एप्लिकेशन का उपयोग करते समय कोई कठिनाई नहीं है। और अंत में, मैं आपको बताऊंगा कि एक्सेल का उपयोग करके जल्दी से कैसे जांच करें और वांछित ट्रेंड लाइन बनाएं: स्कैटर चार्ट बनाएं, माउस के साथ किसी भी बिंदु का चयन करें और राइट क्लिक सेलेक्ट ऑप्शन "ट्रेंडलाइन जोड़ें". इसके बाद, चार्ट के प्रकार का चयन करें और टैब पर "विकल्प"विकल्प को सक्रिय करें "चार्ट पर समीकरण दिखाएं". ठीक है

हमेशा की तरह, मैं लेख को कुछ सुंदर वाक्यांशों के साथ समाप्त करना चाहता हूं, और मैंने लगभग "प्रवृत्ति में रहो!" टाइप किया। लेकिन समय के साथ उन्होंने अपना इरादा बदल दिया। और इसलिए नहीं कि यह फार्मूलाबद्ध है। मैं नहीं जानता कि कोई कैसे, लेकिन मैं प्रचारित अमेरिकी और विशेष रूप से यूरोपीय प्रवृत्ति का बिल्कुल भी पालन नहीं करना चाहता =) इसलिए, मैं चाहता हूं कि आप में से प्रत्येक अपनी लाइन से चिपके रहें!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

कम से कम वर्ग विधि सबसे आम में से एक है और इसकी वजह से सबसे विकसित है रैखिक अर्थमितीय मॉडल के मापदंडों के आकलन के लिए विधियों की सादगी और दक्षता. उसी समय, इसका उपयोग करते समय कुछ सावधानी बरतनी चाहिए, क्योंकि इसका उपयोग करके बनाए गए मॉडल अपने मापदंडों की गुणवत्ता के लिए कई आवश्यकताओं को पूरा नहीं कर सकते हैं और परिणामस्वरूप, "अच्छी तरह से" प्रक्रिया विकास के पैटर्न को प्रतिबिंबित नहीं करते हैं।

आइए हम कम से कम वर्ग विधि का उपयोग करके एक रैखिक अर्थमितीय मॉडल के मापदंडों के आकलन की प्रक्रिया पर अधिक विस्तार से विचार करें। सामान्य रूप में इस तरह के एक मॉडल को समीकरण (1.2) द्वारा दर्शाया जा सकता है:

y t = a 0 + a 1 x 1t +...+ a n x nt + ε t ।

मापदंडों का आकलन करते समय प्रारंभिक डेटा a 0 , a 1 ,..., a n आश्रित चर के मूल्यों का वेक्टर है आप= (y 1 , y 2 , ... , y T)" और स्वतंत्र चर के मानों का मैट्रिक्स

जिसमें पहला कॉलम मॉडल के गुणांक से मेल खाता है।

कम से कम वर्गों की विधि को इसका नाम मूल सिद्धांत के आधार पर मिला है कि इसके आधार पर प्राप्त पैरामीटर अनुमानों को संतुष्ट करना चाहिए: मॉडल त्रुटि के वर्गों का योग न्यूनतम होना चाहिए।

कम से कम वर्ग विधि द्वारा समस्याओं को हल करने के उदाहरण

उदाहरण 2.1.व्यापारिक उद्यम का एक नेटवर्क है जिसमें 12 स्टोर होते हैं, जिसकी गतिविधियों की जानकारी तालिका में प्रस्तुत की जाती है। 2.1.

कंपनी का प्रबंधन जानना चाहेगा कि वार्षिक कारोबार का आकार स्टोर के खुदरा स्थान पर कैसे निर्भर करता है।

तालिका 2.1

दुकान संख्या वार्षिक कारोबार, मिलियन रूबल व्यापार क्षेत्र, हजार एम 2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

कम से कम वर्ग समाधान।आइए हम नामित करें - स्टोर का वार्षिक कारोबार, मिलियन रूबल; - वें स्टोर का विक्रय क्षेत्र, हजार मी 2।

चित्र.2.1. उदाहरण 2.1 . के लिए स्कैटरप्लॉट

चरों के बीच कार्यात्मक संबंध के रूप को निर्धारित करने के लिए और एक स्कैटरप्लॉट (चित्र। 2.1) का निर्माण करें।

स्कैटर आरेख के आधार पर, हम यह निष्कर्ष निकाल सकते हैं कि वार्षिक कारोबार बिक्री क्षेत्र पर सकारात्मक रूप से निर्भर है (यानी, y की वृद्धि के साथ वृद्धि होगी)। कार्यात्मक कनेक्शन का सबसे उपयुक्त रूप है रैखिक.

आगे की गणना के लिए जानकारी तालिका में प्रस्तुत की गई है। 2.2. कम से कम वर्ग विधि का उपयोग करके, हम रैखिक एक-कारक अर्थमितीय मॉडल के मापदंडों का अनुमान लगाते हैं

तालिका 2.2

टी आप x 1t वाई टी 2 x1t2 एक्स 1टी वाई टी
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
एस 819,52 10,68 65008,554 11,4058 858,3991
औसत 68,29 0,89

इस तरह,

इसलिए, व्यापार क्षेत्र में 1 हजार मीटर 2 की वृद्धि के साथ, अन्य चीजें समान होने पर, औसत वार्षिक कारोबार में 67.8871 मिलियन रूबल की वृद्धि होती है।

उदाहरण 2.2.उद्यम के प्रबंधन ने देखा कि वार्षिक कारोबार न केवल स्टोर के बिक्री क्षेत्र (उदाहरण 2.1 देखें) पर निर्भर करता है, बल्कि आगंतुकों की औसत संख्या पर भी निर्भर करता है। प्रासंगिक जानकारी तालिका में प्रस्तुत की गई है। 2.3.

तालिका 2.3

समाधान।निरूपित करें - प्रति दिन वें स्टोर पर आगंतुकों की औसत संख्या, हजार लोग।

चरों के बीच कार्यात्मक संबंध के रूप को निर्धारित करने के लिए और एक स्कैटरप्लॉट (चित्र। 2.2) का निर्माण करें।

स्कैटर आरेख के आधार पर, हम यह निष्कर्ष निकाल सकते हैं कि वार्षिक कारोबार सकारात्मक रूप से प्रति दिन आगंतुकों की औसत संख्या से संबंधित है (यानी, y की वृद्धि के साथ वृद्धि होगी)। कार्यात्मक निर्भरता का रूप रैखिक है।

चावल। 2.2. स्कैटरप्लॉट उदाहरण के लिए 2.2

तालिका 2.4

टी एक्स 2टी एक्स 2टी 2 वाईटी एक्स 2टी x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
एस 127,83 1410,44 9160,9934 118,9728
औसत 10,65

सामान्य तौर पर, दो-कारक अर्थमितीय मॉडल के मापदंडों को निर्धारित करना आवश्यक है

y t \u003d a 0 + a 1 x 1t + a 2 x 2t + t

आगे की गणना के लिए आवश्यक जानकारी तालिका में प्रस्तुत की गई है। 2.4.

आइए हम कम से कम वर्ग विधि का उपयोग करके एक रैखिक दो-कारक अर्थमितीय मॉडल के मापदंडों का अनुमान लगाएं।

इस तरह,

गुणांक का मूल्यांकन = 61.6583 से पता चलता है कि, अन्य सभी चीजें समान होने पर, बिक्री क्षेत्र में 1 हजार मीटर 2 की वृद्धि के साथ, वार्षिक कारोबार में औसतन 61.6583 मिलियन रूबल की वृद्धि होगी।

गुणांक = 2.2748 का अनुमान दर्शाता है कि, प्रति 1 हजार लोगों पर आगंतुकों की औसत संख्या में वृद्धि के साथ, अन्य चीजें समान हैं। प्रति दिन, वार्षिक कारोबार में औसतन 2.2748 मिलियन रूबल की वृद्धि होगी।

उदाहरण 2.3।तालिका में प्रस्तुत जानकारी का उपयोग करना। 2.2 और 2.4, एकल-कारक अर्थमितीय मॉडल के पैरामीटर का अनुमान लगाएं

-वें स्टोर के वार्षिक कारोबार का केंद्रित मूल्य कहां है, मिलियन रूबल; - टी-वें स्टोर पर आने वालों की औसत दैनिक संख्या का केंद्रित मूल्य, हजार लोग। (उदाहरण 2.1-2.2 देखें)।

समाधान।गणना के लिए आवश्यक अतिरिक्त जानकारी तालिका में प्रस्तुत की गई है। 2.5.

तालिका 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
जोड़ 48,4344 431,0566

सूत्र (2.35) का उपयोग करते हुए, हम प्राप्त करते हैं

इस तरह,

http://www.cleverstudents.ru/articles/mnk.html

उदाहरण।

चर के मूल्यों पर प्रायोगिक डेटा एक्सतथा परतालिका में दिए गए हैं।

उनके संरेखण के परिणामस्वरूप, फ़ंक्शन

का उपयोग करते हुए कम से कम वर्ग विधि, इन आंकड़ों को एक रैखिक निर्भरता के साथ अनुमानित करें वाई = कुल्हाड़ी + बी(पैरामीटर खोजें एकतथा बी) पता लगाएँ कि दोनों में से कौन सी रेखा बेहतर है (न्यूनतम वर्ग विधि के अर्थ में) प्रयोगात्मक डेटा को संरेखित करती है। एक चित्र बनाओ।

समाधान।

हमारे उदाहरण में एन = 5. हम आवश्यक गुणांक के सूत्रों में शामिल राशियों की गणना की सुविधा के लिए तालिका में भरते हैं।

तालिका की चौथी पंक्ति के मान दूसरी पंक्ति के मानों को प्रत्येक संख्या के लिए तीसरी पंक्ति के मानों से गुणा करके प्राप्त किए जाते हैं मैं.

तालिका की पाँचवीं पंक्ति के मान प्रत्येक संख्या के लिए दूसरी पंक्ति के मानों को चुकता करके प्राप्त किए जाते हैं मैं.

तालिका के अंतिम स्तंभ के मान पंक्तियों के मानों का योग हैं।

हम गुणांक ज्ञात करने के लिए अल्पतम वर्ग विधि के सूत्रों का उपयोग करते हैं एकतथा बी. हम उनमें तालिका के अंतिम कॉलम से संबंधित मानों को प्रतिस्थापित करते हैं:

फलस्वरूप, वाई=0.165x+2.184वांछित सन्निकटन सीधी रेखा है।

यह पता लगाना बाकी है कि कौन सी पंक्तियाँ वाई=0.165x+2.184या मूल डेटा का बेहतर अनुमान लगाता है, यानी कम से कम वर्ग विधि का उपयोग करके अनुमान लगाने के लिए।

सबूत।

ताकि जब मिले एकतथा बीफ़ंक्शन सबसे छोटा मान लेता है, यह आवश्यक है कि इस बिंदु पर फ़ंक्शन के लिए दूसरे क्रम के अंतर के द्विघात रूप का मैट्रिक्स सकारात्मक निश्चित था। आइए इसे दिखाते हैं।

दूसरे क्रम के अंतर का रूप है:

वह है

इसलिए, द्विघात रूप के मैट्रिक्स का रूप है

और तत्वों का मान निर्भर नहीं करता एकतथा बी.

आइए हम दिखाते हैं कि मैट्रिक्स सकारात्मक निश्चित है। इसके लिए आवश्यक है कि कोण अवयस्क सकारात्मक हों।

पहले क्रम का कोणीय नाबालिग . असमानता सख्त है, क्योंकि अंक

  • ट्यूटोरियल

परिचय

मैं एक कंप्यूटर प्रोग्रामर हूं. मैंने अपने करियर में सबसे बड़ी छलांग लगाई जब मैंने यह कहना सीखा: "मुझे कुछ भी समझ में नहीं आता!"अब मुझे विज्ञान के प्रकाशक को यह बताने में कोई शर्म नहीं है कि वह मुझे व्याख्यान दे रहा है, कि मुझे समझ नहीं आ रहा है कि वह, प्रकाशमान, मुझसे क्या बात कर रहा है। और यह बहुत मुश्किल है। हां, यह स्वीकार करना कठिन और शर्मनाक है कि आप नहीं जानते। कौन यह स्वीकार करना पसंद करता है कि वह किसी चीज की मूल बातें नहीं जानता है। अपने पेशे के कारण, मुझे बड़ी संख्या में प्रस्तुतियों और व्याख्यानों में भाग लेना पड़ता है, जहाँ मैं स्वीकार करता हूँ, अधिकांश मामलों में मुझे नींद आती है, क्योंकि मुझे कुछ भी समझ में नहीं आता है। और मुझे समझ में नहीं आता क्योंकि विज्ञान की वर्तमान स्थिति की बड़ी समस्या गणित में है। यह मानता है कि सभी छात्र गणित के सभी क्षेत्रों से परिचित हैं (जो कि बेतुका है)। यह स्वीकार करने के लिए कि आप नहीं जानते कि व्युत्पन्न क्या है (कि यह थोड़ी देर बाद है) शर्म की बात है।

लेकिन मैंने यह कहना सीख लिया है कि मैं नहीं जानता कि गुणन क्या है। हाँ, मैं नहीं जानता कि लाई बीजगणित के ऊपर उप-बीजगणित क्या है। हाँ, मुझे नहीं पता कि जीवन में द्विघात समीकरणों की आवश्यकता क्यों है। वैसे, यदि आप सुनिश्चित हैं कि आप जानते हैं, तो हमारे पास बात करने के लिए कुछ है! गणित चालों की एक श्रृंखला है। गणितज्ञ जनता को भ्रमित करने और डराने की कोशिश करते हैं; जहां कोई भ्रम नहीं, कोई प्रतिष्ठा नहीं, कोई अधिकार नहीं। हां, सबसे अमूर्त भाषा में बोलना प्रतिष्ठित है, जो अपने आप में पूरी तरह बकवास है।

क्या आप जानते हैं कि व्युत्पन्न क्या है? सबसे अधिक संभावना है कि आप मुझे अंतर संबंध की सीमा के बारे में बताएंगे। सेंट पीटर्सबर्ग स्टेट यूनिवर्सिटी में गणित के पहले वर्ष में, विक्टर पेट्रोविच खविन मे परिभाषितबिंदु पर फ़ंक्शन के टेलर श्रृंखला के पहले पद के गुणांक के रूप में व्युत्पन्न (यह डेरिवेटिव के बिना टेलर श्रृंखला निर्धारित करने के लिए एक अलग जिम्नास्टिक था)। मैं इस परिभाषा पर लंबे समय तक हंसता रहा, जब तक कि मैं अंत में समझ नहीं पाया कि यह किस बारे में है। व्युत्पन्न केवल एक माप से ज्यादा कुछ नहीं है कि हम कितने फ़ंक्शन को अलग कर रहे हैं, फ़ंक्शन y=x, y=x^2, y=x^3 के समान है।

मुझे अब उन छात्रों को व्याख्यान देने का सम्मान मिला है जो डरअंक शास्त्र। यदि आप गणित से डरते हैं - हम रास्ते में हैं। जैसे ही आप कुछ पाठ पढ़ने की कोशिश करते हैं और आपको लगता है कि यह अत्यधिक जटिल है, तो जान लें कि यह बुरी तरह लिखा गया है। मेरा तर्क है कि गणित का एक भी क्षेत्र ऐसा नहीं है जिसे सटीकता खोए बिना "उंगलियों पर" के बारे में बात नहीं की जा सकती है।

निकट भविष्य के लिए चुनौती: मैंने अपने छात्रों को यह समझने का निर्देश दिया कि रैखिक-द्विघात नियंत्रक क्या है। शरमाओ मत, अपने जीवन के तीन मिनट बर्बाद करो, लिंक का पालन करें। अगर आपको कुछ समझ नहीं आ रहा है, तो हम रास्ते में हैं। मुझे (पेशेवर गणितज्ञ-प्रोग्रामर) भी कुछ समझ नहीं आया। और मैं आपको विश्वास दिलाता हूं, इसे "उंगलियों पर" सुलझाया जा सकता है। फिलहाल मैं नहीं जानता कि यह क्या है, लेकिन मैं आपको विश्वास दिलाता हूं कि हम इसका पता लगाने में सक्षम होंगे।

इसलिए, पहला व्याख्यान जो मैं अपने छात्रों को देने जा रहा हूं, जब वे डरावने शब्दों के साथ मेरे पास दौड़ते हैं कि एक रैखिक-द्विघात नियंत्रक एक भयानक बग है जिसे आप अपने जीवन में कभी भी मास्टर नहीं करेंगे कम से कम वर्ग विधियां. क्या आप रैखिक समीकरणों को हल कर सकते हैं? यदि आप इस पाठ को पढ़ रहे हैं, तो शायद नहीं।

इसलिए, दो बिंदुओं (x0, y0), (x1, y1), उदाहरण के लिए, (1,1) और (3,2) दिए गए, इन दो बिंदुओं से गुजरने वाली एक सीधी रेखा के समीकरण को खोजने का कार्य है:

चित्रण

इस सीधी रेखा में निम्न जैसा समीकरण होना चाहिए:

यहाँ अल्फा और बीटा हमारे लिए अज्ञात हैं, लेकिन इस रेखा के दो बिंदु ज्ञात हैं:

आप इस समीकरण को मैट्रिक्स रूप में लिख सकते हैं:

यहां हमें एक गेय विषयांतर करना चाहिए: मैट्रिक्स क्या है? एक मैट्रिक्स एक द्वि-आयामी सरणी के अलावा और कुछ नहीं है। यह डेटा स्टोर करने का एक तरीका है, इसमें और कोई वैल्यू नहीं दी जानी चाहिए। यह हम पर निर्भर करता है कि किसी निश्चित मैट्रिक्स की व्याख्या कैसे की जाए। समय-समय पर, मैं इसे एक रैखिक मानचित्रण के रूप में, समय-समय पर द्विघात रूप के रूप में और कभी-कभी बस वैक्टर के एक सेट के रूप में व्याख्या करूंगा। यह सब संदर्भ में स्पष्ट किया जाएगा।

आइए विशिष्ट मैट्रिक्स को उनके प्रतीकात्मक प्रतिनिधित्व से बदलें:

तब (अल्फा, बीटा) आसानी से पाया जा सकता है:

अधिक विशेष रूप से हमारे पिछले डेटा के लिए:

जो बिंदुओं (1,1) और (3,2) से गुजरने वाली एक सीधी रेखा के निम्नलिखित समीकरण की ओर ले जाता है:

ठीक है, यहाँ सब कुछ स्पष्ट है। और आइए से गुजरने वाली एक सीधी रेखा का समीकरण ज्ञात करें तीनअंक: (x0,y0), (x1,y1) और (x2,y2):

ओह-ओह-ओह, लेकिन हमारे पास दो अज्ञात के लिए तीन समीकरण हैं! मानक गणितज्ञ कहेगा कि कोई हल नहीं है। प्रोग्रामर क्या कहेगा? और वह पहले समीकरणों की पिछली प्रणाली को निम्नलिखित रूप में फिर से लिखेंगे:

हमारे मामले में, सदिश i, j, b त्रि-आयामी हैं, इसलिए, (सामान्य स्थिति में) इस प्रणाली का कोई हल नहीं है। कोई भी सदिश (alpha\*i + beta\*j) सदिशों (i, j) द्वारा फैले हुए तल में होता है। यदि b इस तल से संबंधित नहीं है, तो कोई हल नहीं है (समीकरण में समानता प्राप्त नहीं की जा सकती)। क्या करें? आइए एक समझौता देखें। आइए द्वारा निरूपित करें ई (अल्फा, बीटा)हमने वास्तव में समानता कैसे हासिल नहीं की:

और हम इस त्रुटि को कम करने का प्रयास करेंगे:

एक वर्ग क्यों?

हम न केवल न्यूनतम मानदंड की तलाश कर रहे हैं, बल्कि मानदंड के न्यूनतम वर्ग की भी तलाश कर रहे हैं। क्यों? न्यूनतम बिंदु स्वयं मेल खाता है, और वर्ग एक सुचारू कार्य देता है (तर्कों का एक द्विघात कार्य (अल्फा, बीटा)), जबकि केवल लंबाई एक शंकु के रूप में एक फ़ंक्शन देती है, जो न्यूनतम बिंदु पर गैर-भिन्न है। भाई स्क्वायर अधिक सुविधाजनक है।

जाहिर है, त्रुटि कम हो जाती है जब वेक्टर सदिशों द्वारा फैलाए गए समतल के लिए ओर्थोगोनल मैंतथा जे.

चित्रण

दूसरे शब्दों में: हम एक ऐसी रेखा की तलाश कर रहे हैं, जिसमें सभी बिंदुओं से इस रेखा तक की दूरी की चुकता लंबाई का योग न्यूनतम हो:

अद्यतन: यहां मेरे पास एक जंब है, रेखा की दूरी को लंबवत रूप से मापा जाना चाहिए, न कि ऑर्थोग्राफिक प्रोजेक्शन। यह टिप्पणीकार सही है।

चित्रण

पूरी तरह से अलग शब्दों में (ध्यान से, खराब औपचारिक रूप से, लेकिन यह उंगलियों पर स्पष्ट होना चाहिए): हम सभी जोड़ी बिंदुओं के बीच सभी संभावित रेखाएं लेते हैं और सभी के बीच औसत रेखा की तलाश करते हैं:

चित्रण

उंगलियों पर एक और स्पष्टीकरण: हम सभी डेटा बिंदुओं (यहां हमारे पास तीन हैं) और उस रेखा के बीच एक वसंत संलग्न करते हैं जिसे हम ढूंढ रहे हैं, और संतुलन स्थिति की रेखा ठीक वही है जिसे हम ढूंढ रहे हैं।

द्विघात रूप न्यूनतम

तो, वेक्टर दिया गया बीऔर मैट्रिक्स के कॉलम-वैक्टर द्वारा फैला हुआ विमान (इस मामले में (x0,x1,x2) और (1,1,1)), हम एक वेक्टर की तलाश कर रहे हैं न्यूनतम वर्ग लंबाई के साथ। जाहिर है, न्यूनतम केवल वेक्टर के लिए प्राप्त करने योग्य है , मैट्रिक्स के कॉलम-वैक्टर द्वारा फैले विमान के लिए ऑर्थोगोनल :

दूसरे शब्दों में, हम एक सदिश x=(alpha, beta) की तलाश कर रहे हैं जैसे:

मैं आपको याद दिलाता हूं कि यह वेक्टर x=(alpha, beta) द्विघात फलन का न्यूनतम है ||e(alpha, beta)||^2:

यहां यह याद रखना उपयोगी है कि मैट्रिक्स की व्याख्या द्विघात रूप के साथ-साथ की जा सकती है, उदाहरण के लिए, पहचान मैट्रिक्स ((1,0),(0,1)) को x^2 + y के एक फ़ंक्शन के रूप में व्याख्या किया जा सकता है ^2:

द्विघात रूप

यह सभी जिम्नास्टिक रैखिक प्रतिगमन के रूप में जाना जाता है।

डिरिचलेट सीमा शर्त के साथ लाप्लास समीकरण

अब सबसे सरल वास्तविक समस्या: एक निश्चित त्रिकोणीय सतह है, इसे चिकना करना आवश्यक है। उदाहरण के लिए, आइए मेरा चेहरा मॉडल लोड करें:

मूल प्रतिबद्धता उपलब्ध है। बाहरी निर्भरता को कम करने के लिए, मैंने अपने सॉफ़्टवेयर रेंडरर का कोड लिया, जो पहले से ही हैब्रे पर है। रैखिक प्रणाली को हल करने के लिए, मैं ओपनएनएल का उपयोग करता हूं, यह एक महान सॉल्वर है, लेकिन इसे स्थापित करना बहुत मुश्किल है: आपको दो फाइलों (.h + .c) को अपने प्रोजेक्ट फ़ोल्डर में कॉपी करने की आवश्यकता है। सभी चौरसाई निम्नलिखित कोड द्वारा किया जाता है:

के लिए (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; iऔर चेहरा = चेहरे [i]; के लिए (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

X, Y और Z निर्देशांक वियोज्य हैं, मैं उन्हें अलग से चिकना करता हूं। यही है, मैं रैखिक समीकरणों की तीन प्रणालियों को हल करता हूं, जिनमें से प्रत्येक में समान संख्या में चर होते हैं जैसे कि मेरे मॉडल में शिखर की संख्या। मैट्रिक्स ए की पहली एन पंक्तियों में प्रति पंक्ति केवल एक 1 है, और वेक्टर बी की पहली एन पंक्तियों में मूल मॉडल निर्देशांक हैं। यही है, मैं नई शीर्ष स्थिति और पुरानी शीर्ष स्थिति के बीच वसंत-टाई करता हूं - नए लोगों को पुराने से बहुत दूर नहीं होना चाहिए।

मैट्रिक्स ए की सभी बाद की पंक्तियों (faces.size()*3 = ग्रिड में सभी त्रिकोणों के किनारों की संख्या) में 1 की एक घटना और -1 की एक घटना होती है, जबकि वेक्टर बी में शून्य घटक विपरीत होते हैं। इसका मतलब है कि मैंने अपने त्रिकोणीय जाल के प्रत्येक किनारे पर एक वसंत लगाया: सभी किनारों को उनके शुरुआती और अंत बिंदुओं के समान शीर्ष प्राप्त करने का प्रयास किया गया।

एक बार फिर: सभी कोने चर हैं, और वे अपनी मूल स्थिति से दूर नहीं जा सकते हैं, लेकिन साथ ही वे एक दूसरे के समान बनने की कोशिश करते हैं।

यहाँ परिणाम है:

सब कुछ ठीक हो जाएगा, मॉडल वास्तव में चिकना है, लेकिन यह अपने मूल किनारे से दूर चला गया। आइए कोड को थोड़ा बदलें:

के लिए (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

हमारे मैट्रिक्स ए में, किनारे पर स्थित कोने के लिए, मैं श्रेणी से एक पंक्ति नहीं जोड़ता v_i = verts[i][d], लेकिन 1000*v_i = 1000*verts[i][d]। यह क्या बदलता है? और यह त्रुटि के हमारे द्विघात रूप को बदल देता है। अब किनारे पर ऊपर से एक भी विचलन पहले की तरह एक इकाई नहीं, बल्कि 1000 * 1000 इकाइयों का खर्च आएगा। यही है, हमने चरम शिखर पर एक मजबूत वसंत लटका दिया, समाधान दूसरों को और अधिक मजबूती से फैलाना पसंद करता है। यहाँ परिणाम है:

आइए शिखरों के बीच स्प्रिंग्स की ताकत को दोगुना करें:
एनएल गुणांक (चेहरा [जे], 2); एनएल गुणांक (चेहरा [(जे + 1)% 3], -2);

यह तर्कसंगत है कि सतह चिकनी हो गई है:

और अब सौ गुना मजबूत:

यह क्या है? कल्पना कीजिए कि हमने एक तार के छल्ले को साबुन के पानी में डुबोया है। नतीजतन, परिणामी साबुन फिल्म कम से कम वक्रता रखने की कोशिश करेगी, उसी सीमा को छूते हुए - हमारे तार की अंगूठी। ठीक यही हमें सीमा तय करने और अंदर एक चिकनी सतह की मांग करने से मिला है। बधाई हो, हमने हाल ही में डिरिचलेट सीमा शर्तों के साथ लाप्लास समीकरण को हल किया है। ठीक लगता है? लेकिन वास्तव में, हल करने के लिए रैखिक समीकरणों की सिर्फ एक प्रणाली।

पॉइसन समीकरण

चलिए एक और अच्छा नाम लेते हैं।

मान लें कि मेरे पास इस तरह की एक छवि है:

सब अच्छे हैं, लेकिन मुझे कुर्सी पसंद नहीं है।

मैंने चित्र को आधा में काट दिया:



और मैं अपने हाथों से एक कुर्सी चुनूंगा:

फिर मैं तस्वीर के बाईं ओर मुखौटा में सफेद सब कुछ खींचूंगा, और साथ ही मैं पूरी तस्वीर में कहूंगा कि दो पड़ोसी पिक्सल के बीच का अंतर दो पड़ोसी पिक्सल के बीच के अंतर के बराबर होना चाहिए सही छवि:

के लिए (int i=0; i

यहाँ परिणाम है:

कोड और चित्र उपलब्ध हैं

कम से कम वर्ग विधि (ओएलएस, इंजी। साधारण कम वर्ग, ओएलएस)- वांछित चर से कुछ कार्यों के वर्ग विचलन के योग को कम करने के आधार पर विभिन्न समस्याओं को हल करने के लिए उपयोग की जाने वाली गणितीय विधि। इसका उपयोग समीकरणों की अतिनिर्धारित प्रणालियों को "हल" करने के लिए किया जा सकता है (जब समीकरणों की संख्या अज्ञात की संख्या से अधिक हो जाती है), सामान्य (अतिनिर्धारित नहीं) समीकरणों के गैर-रेखीय सिस्टम के मामले में समाधान खोजने के लिए, बिंदु मानों को अनुमानित करने के लिए। किसी समारोह का। ओएलएस नमूना डेटा से प्रतिगमन मॉडल के अज्ञात मापदंडों का अनुमान लगाने के लिए प्रतिगमन विश्लेषण के बुनियादी तरीकों में से एक है।

विश्वकोश YouTube

    1 / 5

    कम से कम वर्ग विधि। विषय

    Mitin I. V. - भौतिक के परिणामों को संसाधित करना। प्रयोग - कम से कम वर्ग विधि (व्याख्यान 4)

    ✪ कम से कम वर्ग, पाठ 1/2। रैखिक प्रकार्य

    अर्थमिति। व्याख्यान 5. कम से कम वर्ग विधि

    कम से कम वर्ग विधि। जवाब

    उपशीर्षक

कहानी

XIX सदी की शुरुआत तक। वैज्ञानिकों के पास समीकरणों की एक प्रणाली को हल करने के लिए कुछ नियम नहीं थे जिसमें अज्ञात की संख्या समीकरणों की संख्या से कम हो; उस समय तक, समीकरणों के प्रकार और कैलकुलेटर की सरलता के आधार पर, विशेष विधियों का उपयोग किया जाता था, और इसलिए एक ही अवलोकन डेटा से शुरू होने वाले विभिन्न कैलकुलेटर अलग-अलग निष्कर्ष पर आते थे। गॉस (1795) को विधि के पहले आवेदन का श्रेय दिया जाता है, और लीजेंड्रे (1805) ने स्वतंत्र रूप से इसे अपने आधुनिक नाम (fr। मेथोड डेस मोइन्ड्रेस क्वारेस) . लाप्लास ने इस विधि को प्रायिकता के सिद्धांत से जोड़ा और अमेरिकी गणितज्ञ एड्रेन (1808) ने इसके संभाव्य अनुप्रयोगों पर विचार किया। Encke, Bessel, Hansen और अन्य द्वारा आगे के शोध द्वारा विधि व्यापक और बेहतर है।

कम से कम वर्गों की विधि का सार

होने देना x (\displaystyle x)- किट n (\displaystyle n)अज्ञात चर (पैरामीटर), एफ मैं (एक्स) (\displaystyle f_(i)(x)), , एम > एन (\displaystyle एम>एन)- चर के इस सेट से कार्यों का सेट। समस्या ऐसे मूल्यों को चुनने की है x (\displaystyle x)ताकि इन कार्यों के मूल्य कुछ मूल्यों के जितना करीब हो सके y मैं (\displaystyle y_(i)). संक्षेप में, हम समीकरणों की अतिनिर्धारित प्रणाली के "समाधान" के बारे में बात कर रहे हैं f i (x) = y i (\displaystyle f_(i)(x)=y_(i)), i = 1 ,… , m (\displaystyle i=1,\ldots ,m)संकेतित अर्थ में, सिस्टम के बाएँ और दाएँ भागों की अधिकतम निकटता। एलएसएम का सार "निकटता के माप" के रूप में बाएं और दाएं भागों के वर्ग विचलन के योग को चुनना है | एफ मैं (एक्स) - वाई मैं | (\displaystyle |f_(i)(x)-y_(i)|). इस प्रकार, एलएसएम का सार निम्नानुसार व्यक्त किया जा सकता है:

∑ i e i 2 = ∑ i (y i - f i (x)) 2 → min x (\displaystyle \sum _(i)e_(i)^(2)=\sum _(i)(y_(i)-f_( i)(x))^(2)\rightarrow \min _(x)).

यदि समीकरणों की प्रणाली में एक समाधान है, तो वर्गों का न्यूनतम योग शून्य के बराबर होगा और समीकरणों की प्रणाली के सटीक समाधान विश्लेषणात्मक रूप से या, उदाहरण के लिए, विभिन्न संख्यात्मक अनुकूलन विधियों द्वारा पाए जा सकते हैं। यदि प्रणाली अतिनिर्धारित है, अर्थात्, कम से कम, स्वतंत्र समीकरणों की संख्या अज्ञात चर की संख्या से अधिक है, तो सिस्टम का सटीक समाधान नहीं होता है और कम से कम वर्ग विधि हमें कुछ "इष्टतम" वेक्टर खोजने की अनुमति देती है x (\displaystyle x)वैक्टर की अधिकतम निकटता के अर्थ में y (\displaystyle y)तथा f (x) (\displaystyle f(x))या विचलन वेक्टर की अधिकतम निकटता ई (\ डिस्प्लेस्टाइल ई)शून्य से (निकटता को यूक्लिडियन दूरी के अर्थ में समझा जाता है)।

उदाहरण - रैखिक समीकरणों का निकाय

विशेष रूप से, कम से कम वर्ग विधि का उपयोग रैखिक समीकरणों की प्रणाली को "हल" करने के लिए किया जा सकता है

A x = b (\displaystyle Ax=b),

कहाँ पे ए (\ डिस्प्लेस्टाइल ए)आयताकार आकार मैट्रिक्स m × n , m > n (\displaystyle m\times n,m>n)(अर्थात मैट्रिक्स A की पंक्तियों की संख्या आवश्यक चरों की संख्या से अधिक है)।

समीकरणों की ऐसी प्रणाली का आमतौर पर कोई हल नहीं होता है। इसलिए, इस प्रणाली को केवल ऐसे वेक्टर को चुनने के अर्थ में "हल" किया जा सकता है x (\displaystyle x)वैक्टर के बीच "दूरी" को कम करने के लिए एक एक्स (\displaystyle कुल्हाड़ी)तथा बी (\ डिस्प्लेस्टाइल बी). ऐसा करने के लिए, आप सिस्टम के समीकरणों के बाएँ और दाएँ भागों के वर्ग अंतरों के योग को न्यूनतम करने के लिए मानदंड लागू कर सकते हैं, अर्थात् (A x - b) T (A x - b) → मिनट (\displaystyle (Ax-b)^(T)(Ax-b)\rightarrow \min ). यह दिखाना आसान है कि इस न्यूनीकरण समस्या का समाधान समीकरणों की निम्नलिखित प्रणाली के समाधान की ओर ले जाता है

ए टी ए एक्स = ए टी बी ⇒ एक्स = (ए टी ए) - 1 ए टी बी (\displaystyle A^(T)Ax=A^(T)b\Rightarrow x=(A^(T)A)^(-1)A^ (टी)बी).

प्रतिगमन विश्लेषण में OLS (डेटा सन्निकटन)

उसको रहनो दो n (\displaystyle n)कुछ चर के मान y (\displaystyle y)(यह टिप्पणियों, प्रयोगों आदि के परिणाम हो सकते हैं) और संबंधित चर x (\displaystyle x). के बीच संबंध बनाने की चुनौती है y (\displaystyle y)तथा x (\displaystyle x)कुछ अज्ञात पैरामीटर तक ज्ञात कुछ फ़ंक्शन द्वारा अनुमानित बी (\ डिस्प्लेस्टाइल बी), अर्थात, वास्तव में मापदंडों के सर्वोत्तम मूल्यों का पता लगाएं बी (\ डिस्प्लेस्टाइल बी), मूल्यों का अधिकतम अनुमान लगाना f (x , b) (\displaystyle f(x,b))वास्तविक मूल्यों के लिए y (\displaystyle y). वास्तव में, यह समीकरणों की एक अतिनिर्धारित प्रणाली के "समाधान" के मामले में कम हो जाता है बी (\ डिस्प्लेस्टाइल बी):

F (x t , b) = y t , t = 1 ,… , n (\displaystyle f(x_(t),b)=y_(t),t=1,\ldots ,n).

प्रतिगमन विश्लेषण में, और विशेष रूप से अर्थमिति में, चर के बीच संबंध के संभाव्य मॉडल का उपयोग किया जाता है।

वाई टी = एफ (एक्स टी, बी) + ε टी (\displaystyle y_(t)=f(x_(t),b)+\varepsilon _(t)),

कहाँ पे टी (\displaystyle \varepsilon _(t))- तथाकथित यादृच्छिक त्रुटियांमॉडल।

तदनुसार, प्रेक्षित मानों का विचलन y (\displaystyle y)मॉडल से f (x , b) (\displaystyle f(x,b))पहले से ही मॉडल में ही माना जाता है। एलएसएम (साधारण, शास्त्रीय) का सार ऐसे मापदंडों को खोजना है बी (\ डिस्प्लेस्टाइल बी), जिस पर वर्ग विचलन का योग (त्रुटियों, प्रतिगमन मॉडल के लिए उन्हें अक्सर प्रतिगमन अवशिष्ट कहा जाता है) ई टी (\displaystyle ई_(टी))न्यूनतम होगा:

b ^ O L S = arg ⁡ min b R S S (b) (\displaystyle (\hat (b))_(OLS)=\arg \min _(b)RSS(b)),

कहाँ पे आर एस एस (\displaystyle आरएसएस)- अंग्रेज़ी। वर्गों के अवशिष्ट योग को इस प्रकार परिभाषित किया गया है:

आर एस एस (बी) = ई टी ई = ∑ टी = 1 एन ई टी 2 = ∑ टी = 1 एन (वाई टी - एफ (एक्स टी, बी)) 2 (\displaystyle आरएसएस(बी)=ई^(टी)ई=\sum _ (t=1)^(n)e_(t)^(2)=\sum _(t=1)^(n)(y_(t)-f(x_(t),b))^(2) ).

सामान्य स्थिति में, इस समस्या को अनुकूलन (न्यूनतमीकरण) के संख्यात्मक तरीकों से हल किया जा सकता है। इस मामले में, कोई बोलता है अरेखीय कम से कम वर्ग(एनएलएस या एनएलएलएस - इंजी। गैर-रैखिक कम से कम वर्ग)। कई मामलों में, एक विश्लेषणात्मक समाधान प्राप्त किया जा सकता है। न्यूनीकरण समस्या को हल करने के लिए, फ़ंक्शन के स्थिर बिंदुओं को खोजना आवश्यक है आर एस एस (बी) (\displaystyle आरएसएस(बी)), अज्ञात मापदंडों के संबंध में इसे अलग करना बी (\ डिस्प्लेस्टाइल बी), व्युत्पन्न को शून्य के बराबर करना और समीकरणों की परिणामी प्रणाली को हल करना:

t = 1 n (y t - f (x t , b)) ∂ f (x t , b) b = 0 (\displaystyle \sum _(t=1)^(n)(y_(t)-f(x_) (टी),बी))(\frac (\आंशिक f(x_(t),b))(\partial b))=0).

रैखिक (प्रतिगमन) के मामले में एलएसएम

प्रतिगमन निर्भरता को रैखिक होने दें:

y t = ∑ j = 1 k b j x t j + ε = x t T b + t (\displaystyle y_(t)=\sum _(j=1)^(k)b_(j)x_(tj)+\varepsilon =x_( t)^(T)b+\varepsilon _(t)).

होने देना आपचर के प्रेक्षणों का स्तंभ वेक्टर समझाया जा रहा है, और एक्स (\डिस्प्लेस्टाइल एक्स)- ये है (n × k) (\displaystyle ((n\times k)))- कारकों की टिप्पणियों का मैट्रिक्स (मैट्रिक्स की पंक्तियाँ - किसी दिए गए अवलोकन में कारक मूल्यों के वैक्टर, स्तंभों द्वारा - सभी टिप्पणियों में दिए गए कारक के मूल्यों के वेक्टर)। रैखिक मॉडल के मैट्रिक्स-प्रतिनिधित्व का रूप है:

y = Xb + (\displaystyle y=Xb+\varepsilon ).

फिर समझाया गया चर के अनुमानों का वेक्टर और प्रतिगमन अवशिष्ट के वेक्टर के बराबर होगा

y ^ = X b , e = y - y ^ = y - X b (\displaystyle (\hat (y))=Xb,\quad e=y-(\hat (y))=y-Xb).

तदनुसार, प्रतिगमन अवशेषों के वर्गों का योग बराबर होगा

आर एस एस = ई टी ई = (वाई - एक्स बी) टी (वाई - एक्स बी) (\displaystyle आरएसएस=ई^(टी)ई=(y-Xb)^(T)(y-Xb)).

पैरामीटर वेक्टर के संबंध में इस फ़ंक्शन को अलग करना बी (\ डिस्प्लेस्टाइल बी)और डेरिवेटिव को शून्य के बराबर करते हुए, हम समीकरणों की एक प्रणाली प्राप्त करते हैं (मैट्रिक्स रूप में):

(X T X) b = X T y (\displaystyle (X^(T)X)b=X^(T)y).

गूढ़ मैट्रिक्स रूप में, समीकरणों की यह प्रणाली इस तरह दिखती है:

(∑ x t 1 2 x t 1 x t 2 x t 1 x t 3 … x t 1 x t k x t 2 x t 1 x t 2 2 x t 2 x t 3 … x t 2 x t k x t 3 x t 1 x t x t 3 2 ... x t 3 x t k x t k x t 1 x t k x t 2 ∑ x t k x t 3 … x t k 2) (b 1 b 2 b 3 b k) = (∑ x t 1 y x प्रदर्शन शैली 3 y t y t) (\begin(pmatrix)\sum x_(t1)^(2)&\sum x_(t1)x_(t2)&\sum x_(t1)x_(t3)&\ldots &\sum x_(t1)x_( tk)\\\sum x_(t2)x_(t1)&\sum x_(t2)^(2)&\sum x_(t2)x_(t3)&\ldots &\ sum x_(t2)x_(tk) \\\योग x_(t3)x_(t1)&\sum x_(t3)x_(t2)&\sum x_(t3)^(2)&\ldots &\sum x_ (t3)x_(tk)\\ \vdots &\vdots &\vdots &\ddots &\vdots \\\sum x_(tk)x_(t1)&\sum x_(tk)x_(t2)&\sum x_ (tk)x_(t3)&\ ldots &\sum x_(tk)^(2)\\\end(pmatrix))(\begin(pmatrix)b_(1)\\b_(2)\\b_(3 )\\\vdots \\b_( k)\\\end(pmatrix))=(\begin(pmatrix)\sum x_(t1)y_(t)\\\sum x_(t2)y_(t)\\ \sum x_(t3)y_(t )\\\vdots \\\योग x_(tk)y_(t)\\\end(pmatrix)))जहां सभी राशियों को सभी स्वीकार्य मूल्यों पर लिया जाता है टी (\ डिस्प्लेस्टाइल टी).

यदि मॉडल में एक स्थिरांक शामिल है (हमेशा की तरह), तो एक्स टी 1 = 1 (\displaystyle x_(t1)=1)सभी के लिए टी (\ डिस्प्लेस्टाइल टी), इसलिए, समीकरणों की प्रणाली के मैट्रिक्स के ऊपरी बाएं कोने में अवलोकनों की संख्या है n (\displaystyle n), और पहली पंक्ति और पहले कॉलम के शेष तत्वों में - चर के मूल्यों का योग: x t j (\displaystyle \sum x_(tj))और सिस्टम के दायीं ओर का पहला तत्व - y t (\displaystyle \sum y_(t)).

समीकरणों की इस प्रणाली का समाधान रैखिक मॉडल के लिए कम से कम वर्ग अनुमानों के लिए सामान्य सूत्र देता है:

बी ^ ओ एल एस = (एक्स टी एक्स) - 1 एक्स टी वाई = (1 एन एक्स टी एक्स) - 1 1 एन एक्स टी वाई = वी एक्स - 1 सी एक्स वाई (\displaystyle (\hat (बी))_(OLS)=(X^(T) )X)^(-1)X^(T)y=\left((\frac (1)(n))X^(T)X\right)^(-1)(\frac (1)(n) ))X^(T)y=V_(x)^(-1)C_(xy)).

विश्लेषणात्मक उद्देश्यों के लिए, इस सूत्र का अंतिम प्रतिनिधित्व उपयोगी साबित होता है (समीकरणों की प्रणाली में जब n से विभाजित किया जाता है, तो अंकगणितीय साधन योग के बजाय दिखाई देते हैं)। यदि प्रतिगमन मॉडल में डेटा केंद्रित, तो इस निरूपण में पहले मैट्रिक्स में कारकों के नमूना सहप्रसरण मैट्रिक्स का अर्थ है, और दूसरा एक आश्रित चर वाले कारकों के सहप्रसरणों का वेक्टर है। यदि, इसके अतिरिक्त, डेटा भी है सामान्यीकृत SKO में (अर्थात, अंततः मानकीकृत), तो पहले मैट्रिक्स में कारकों के नमूना सहसंबंध मैट्रिक्स का अर्थ है, दूसरा वेक्टर - आश्रित चर के साथ कारकों के नमूना सहसंबंधों का वेक्टर।

मॉडल के लिए एलएलएस अनुमानों की एक महत्वपूर्ण संपत्ति स्थिरांक के साथ- निर्मित प्रतिगमन की रेखा नमूना डेटा के गुरुत्वाकर्षण के केंद्र से होकर गुजरती है, अर्थात समानता पूरी होती है:

y ¯ = b 1 ^ + ∑ j = 2 k b ^ j x j (\displaystyle (\bar (y))=(\hat (b_(1)))+\sum _(j=2)^(k) (\टोपी (बी))_(जे)(\बार (एक्स))_(जे)).

विशेष रूप से, चरम मामले में, जब एकमात्र प्रतिगामी स्थिर होता है, तो हम पाते हैं कि एकल पैरामीटर (स्थिर स्वयं) का ओएलएस अनुमान चर के औसत मूल्य के बराबर है। अर्थात्, बड़ी संख्याओं के नियमों से अपने अच्छे गुणों के लिए जाना जाने वाला अंकगणितीय माध्य भी एक न्यूनतम वर्ग अनुमान है - यह इससे वर्ग विचलन के न्यूनतम योग के मानदंड को पूरा करता है।

सबसे सरल विशेष मामले

जोड़ीदार रैखिक प्रतिगमन के मामले में y t = a + b x t + ε t (\displaystyle y_(t)=a+bx_(t)+\varepsilon _(t)), जब एक चर की दूसरे पर रैखिक निर्भरता का अनुमान लगाया जाता है, तो गणना सूत्र सरल हो जाते हैं (आप मैट्रिक्स बीजगणित के बिना कर सकते हैं)। समीकरणों की प्रणाली का रूप है:

(1 x ¯ x ¯ x 2 ) (a b) = (y ¯ x y ) (\displaystyle (\begin(pmatrix)1&(\bar (x))\\(\bar (x))&(\bar) (x^(2)))\\\end(pmatrix))(\begin(pmatrix)a\\b\\\end(pmatrix))=(\begin(pmatrix)(\bar (y))\\ (\overline(xy))\\\end(pmatrix))).

यहाँ से गुणांकों का अनुमान लगाना आसान है:

( b ^ = Cov (x , y) Var ⁡ (x) = x y - x y ¯ x 2 ¯ - x ¯ 2 , a ^ = y ¯ - b x । (\displaystyle (\begin(cases)) (\ Hat (b))=(\frac (\mathop (\textrm (Cov)) (x,y))(\mathop (\textrm (Var)) (x)))=(\frac ((\overline) (xy))-(\bar (x))(\bar (y)))((\overline (x^(2)))-(\overline (x))^(2))),\\( \टोपी (ए))=(\bar (y))-b(\bar (x)).\end(cases)))

इस तथ्य के बावजूद कि, सामान्य तौर पर, स्थिरांक वाले मॉडल बेहतर होते हैं, कुछ मामलों में सैद्धांतिक विचारों से यह ज्ञात होता है कि स्थिरांक ए (\ डिस्प्लेस्टाइल ए)शून्य के बराबर होना चाहिए। उदाहरण के लिए, भौतिकी में, वोल्टेज और करंट के बीच संबंध का रूप है U = I R (\displaystyle U=I\cdot R); वोल्टेज और करंट को मापने के लिए, प्रतिरोध का अनुमान लगाना आवश्यक है। इस मामले में, हम एक मॉडल के बारे में बात कर रहे हैं y = b x (\displaystyle y=bx). इस मामले में, समीकरणों की एक प्रणाली के बजाय, हमारे पास एक ही समीकरण है

(∑ x t 2) b = ∑ x t y t (\displaystyle \left(\sum x_(t)^(2)\right)b=\sum x_(t)y_(t)).

इसलिए, एकल गुणांक के आकलन के सूत्र का रूप है

बी ^ = ∑ टी = 1 एन एक्स टी वाई टी ∑ टी = 1 एन एक्स टी 2 = एक्स वाई एक्स 2 ¯ (\displaystyle (\टोपी (बी))=(\frac (\sum _(t=1)^(n)x_(टी) )y_(t))(\sum _(t=1)^(n)x_(t)^(2)))=(\frac (\overline (xy))(\overline (x^(2)) ))).

एक बहुपद मॉडल का मामला

यदि डेटा को एक चर के बहुपद प्रतिगमन फ़ंक्शन द्वारा फिट किया जाता है f (x) = b 0 + ∑ i = 1 k b i x i (\displaystyle f(x)=b_(0)+\sum \limits _(i=1)^(k)b_(i)x^(i)), फिर, डिग्री समझना x i (\displaystyle x^(i))प्रत्येक के लिए स्वतंत्र कारकों के रूप में मैं (\ डिस्प्लेस्टाइल मैं)रैखिक मॉडल के मापदंडों के आकलन के लिए सामान्य सूत्र के आधार पर मॉडल के मापदंडों का अनुमान लगाना संभव है। ऐसा करने के लिए, सामान्य सूत्र को ध्यान में रखना पर्याप्त है कि इस तरह की व्याख्या के साथ x t i x t j = x t i x t j = x t i + j (\displaystyle x_(ti)x_(tj)=x_(t)^(i)x_(t)^(j)=x_(t)^(i+j))तथा x t j t = x t j y t (\displaystyle x_(tj)y_(t)=x_(t)^(j)y_(t)). इसलिए, इस मामले में मैट्रिक्स समीकरण रूप लेंगे:

(एन एन एक्स टी ... ∑ एन एक्स टी के एन एक्स टी ∑ एन एक्स आई 2 ... ∑ एम एक्स आई के + 1 एन एक्स टी के ∑ एन एक्स टी के + 1 ... ∑ एन एक्स टी 2 के) [बी 0 बी 1 ⋮ बी के] = [∑ एन वाई टी एन एक्स टी वाई टी ⋮ एन एक्स टी के वाई टी]। (\displaystyle (\begin(pmatrix)n&\sum \limits _(n)x_(t)&\ldots &\sum \limits _(n)x_(t)^(k)\\\sum \limits _( n)x_(t)&\sum \limits _(n)x_(i)^(2)&\ldots &\sum \limits _(m)x_(i)^(k+1)\\\vdots & \vdots &\ddots &\vdots \\\sum \limits _(n)x_(t)^(k)&\sum \limits _(n)x_(t)^(k+1)&\ldots &\ योग \सीमा _(n)x_(t)^(2k)\end(pmatrix))(\begin(bmatrix)b_(0)\\b_(1)\\\vdots \\b_(k)\end( bmatrix))=(\begin(bmatrix)\sum \limits _(n)y_(t)\\\sum \limits _(n)x_(t)y_(t)\\\vdots \\\sum \limits _(n)x_(t)^(k)y_(t)\end(bmatrix))।)

ओएलएस अनुमानों के सांख्यिकीय गुण

सबसे पहले, हम ध्यान दें कि रैखिक मॉडल के लिए, कम से कम वर्ग अनुमान रैखिक अनुमान हैं, जैसा कि उपरोक्त सूत्र से निम्नानुसार है। कम से कम वर्गों के अनुमानों की निष्पक्षता के लिए, प्रतिगमन विश्लेषण की सबसे महत्वपूर्ण शर्त को पूरा करना आवश्यक और पर्याप्त है: कारकों पर सशर्त यादृच्छिक त्रुटि की गणितीय अपेक्षा शून्य के बराबर होनी चाहिए। यह शर्त संतुष्ट है, विशेष रूप से, यदि

  1. यादृच्छिक त्रुटियों की गणितीय अपेक्षा शून्य है, और
  2. कारक और यादृच्छिक त्रुटियां स्वतंत्र-यादृच्छिक-मान हैं।

दूसरी शर्त - बहिर्जात कारकों की स्थिति - मौलिक है। यदि यह संपत्ति संतुष्ट नहीं है, तो हम मान सकते हैं कि लगभग कोई भी अनुमान बेहद असंतोषजनक होगा: वे सुसंगत भी नहीं होंगे (अर्थात, बहुत बड़ी मात्रा में डेटा भी इस मामले में गुणात्मक अनुमान प्राप्त करने की अनुमति नहीं देता है)। शास्त्रीय मामले में, एक यादृच्छिक त्रुटि के विपरीत, कारकों के नियतत्ववाद के बारे में एक मजबूत धारणा बनाई जाती है, जिसका स्वचालित रूप से मतलब है कि बहिर्जात स्थिति संतुष्ट है। सामान्य मामले में, अनुमानों की स्थिरता के लिए, मैट्रिक्स के अभिसरण के साथ-साथ बहिर्जात स्थिति को संतुष्ट करने के लिए पर्याप्त है वी एक्स (\displaystyle वी_(एक्स))कुछ nondegenerate मैट्रिक्स के लिए नमूना आकार अनंत तक बढ़ जाता है।

निरंतरता और निष्पक्षता के अलावा, (साधारण) कम से कम वर्ग अनुमान भी प्रभावी (रैखिक निष्पक्ष अनुमानों के वर्ग में सर्वश्रेष्ठ) होने के लिए, एक यादृच्छिक त्रुटि के अतिरिक्त गुणों को संतुष्ट किया जाना चाहिए:

इन मान्यताओं को यादृच्छिक त्रुटियों के वेक्टर के सहप्रसरण (मैट्रिक्स) के लिए तैयार किया जा सकता है वी (ε) = σ 2 मैं (\displaystyle वी(\varepsilon)=\sigma ^(2)I).

एक रैखिक मॉडल जो इन शर्तों को पूरा करता है, कहलाता है क्लासिक. शास्त्रीय रैखिक प्रतिगमन के लिए ओएलएस अनुमान सभी रैखिक निष्पक्ष अनुमानों के वर्ग में निष्पक्ष, सुसंगत और सबसे कुशल अनुमान हैं (अंग्रेजी साहित्य में, संक्षेप में कभी-कभी उपयोग किया जाता है नीला (सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक) सबसे अच्छा रैखिक निष्पक्ष अनुमान है; घरेलू साहित्य में, गाऊसी-  मार्कोव प्रमेय को अधिक बार उद्धृत किया जाता है)। जैसा कि यह दिखाना आसान है, गुणांक अनुमान वेक्टर का सहप्रसरण मैट्रिक्स इसके बराबर होगा:

वी (बी ^ ओ एल एस) = σ 2 (एक्स टी एक्स) − 1 (\displaystyle वी((\टोपी (बी))_(OLS))=\sigma ^(2)(X^(T)X)^(-1 )).

दक्षता का अर्थ है कि यह सहप्रसरण मैट्रिक्स "न्यूनतम" है (गुणांक का कोई भी रैखिक संयोजन, और विशेष रूप से स्वयं गुणांक, एक न्यूनतम विचरण है), यानी रैखिक निष्पक्ष अनुमानों के वर्ग में, ओएलएस अनुमान सबसे अच्छे हैं। इस मैट्रिक्स के विकर्ण तत्व - गुणांक के अनुमानों के भिन्न - प्राप्त अनुमानों की गुणवत्ता के महत्वपूर्ण पैरामीटर हैं। हालाँकि, सहप्रसरण मैट्रिक्स की गणना करना संभव नहीं है क्योंकि यादृच्छिक त्रुटि विचरण अज्ञात है। यह साबित किया जा सकता है कि यादृच्छिक त्रुटियों के विचरण का निष्पक्ष और सुसंगत (शास्त्रीय रैखिक मॉडल के लिए) अनुमान मूल्य है:

एस 2 = आर एस एस / (एन - के) (\displaystyle s^(2)=RSS/(n-k)).

इस मान को सहप्रसरण मैट्रिक्स के सूत्र में प्रतिस्थापित करते हुए, हम सहप्रसरण मैट्रिक्स का एक अनुमान प्राप्त करते हैं। परिणामी अनुमान भी निष्पक्ष और सुसंगत हैं। यह भी महत्वपूर्ण है कि त्रुटि विचरण का अनुमान (और इसलिए गुणांकों के प्रसरण) और मॉडल मापदंडों के अनुमान स्वतंत्र यादृच्छिक चर हैं, जो मॉडल गुणांक के बारे में परिकल्पना के परीक्षण के लिए परीक्षण के आंकड़े प्राप्त करना संभव बनाता है।

यह ध्यान दिया जाना चाहिए कि यदि शास्त्रीय मान्यताओं को पूरा नहीं किया जाता है, तो कम से कम वर्ग पैरामीटर अनुमान सबसे कुशल नहीं होते हैं और जहां डब्ल्यू (\ डिस्प्लेस्टाइल डब्ल्यू)कुछ सममित धनात्मक निश्चित भार मैट्रिक्स है। साधारण कम से कम वर्ग इस दृष्टिकोण का एक विशेष मामला है, जब वजन मैट्रिक्स पहचान मैट्रिक्स के समानुपाती होता है। जैसा कि ज्ञात है, सममित मैट्रिक्स (या ऑपरेटरों) के लिए एक अपघटन होता है W = P T P (\displaystyle W=P^(T)P). इसलिए, इस कार्यात्मक को निम्नानुसार दर्शाया जा सकता है e T P T P e = (P e) T P e = e T e ∗ (\displaystyle e^(T)P^(T)Pe=(Pe)^(T)Pe=e_(*)^(T)e_( *)), अर्थात्, इस कार्यात्मक को कुछ रूपांतरित "अवशिष्ट" के वर्गों के योग के रूप में दर्शाया जा सकता है। इस प्रकार, हम कम से कम वर्ग विधियों के एक वर्ग को अलग कर सकते हैं - एलएस-विधियां (कम से कम वर्ग)।

यह साबित होता है (ऐटकेन का प्रमेय) कि एक सामान्यीकृत रैखिक प्रतिगमन मॉडल के लिए (जिसमें यादृच्छिक त्रुटियों के सहप्रसरण मैट्रिक्स पर कोई प्रतिबंध नहीं लगाया जाता है), सबसे प्रभावी (रैखिक निष्पक्ष अनुमानों के वर्ग में) तथाकथित के अनुमान हैं। सामान्यीकृत ओएलएस (ओएमएनके, जीएलएस - सामान्यीकृत कम वर्ग)- यादृच्छिक त्रुटियों के व्युत्क्रम सहप्रसरण मैट्रिक्स के बराबर भार मैट्रिक्स के साथ एलएस-विधि: डब्ल्यू = वी ε - 1 (\displaystyle W=V_(\varepsilon )^(-1)).

यह दिखाया जा सकता है कि रैखिक मॉडल के मापदंडों के जीएलएस-अनुमानों के सूत्र का रूप है

बी ^ जी एल एस = (एक्स टी वी - 1 एक्स) - 1 एक्स टी वी - 1 y (\displaystyle (\टोपी (बी))_(जीएलएस)=(X^(T)V^(-1)X)^(-1) एक्स^(टी)वी^(-1)y).

इन अनुमानों का सहप्रसरण मैट्रिक्स, क्रमशः, के बराबर होगा

वी (बी ^ जी एल एस) = (एक्स टी वी - 1 एक्स) - 1 (\displaystyle वी((\टोपी (बी))_(जीएलएस))=(X^(T)V^(-1)X)^(- एक)).

वास्तव में, ओएलएस का सार मूल डेटा के एक निश्चित (रैखिक) परिवर्तन (पी) और रूपांतरित डेटा के लिए सामान्य न्यूनतम वर्गों के अनुप्रयोग में निहित है। इस परिवर्तन का उद्देश्य यह है कि रूपांतरित डेटा के लिए, यादृच्छिक त्रुटियां पहले से ही शास्त्रीय मान्यताओं को संतुष्ट करती हैं।

भारित न्यूनतम वर्ग

एक विकर्ण भार मैट्रिक्स (और इसलिए यादृच्छिक त्रुटियों के सहप्रसरण मैट्रिक्स) के मामले में, हमारे पास तथाकथित भारित न्यूनतम वर्ग (WLS - भारित कम से कम वर्ग) हैं। इस मामले में, मॉडल के अवशेषों के वर्गों का भारित योग कम से कम होता है, अर्थात, प्रत्येक अवलोकन को एक "वजन" प्राप्त होता है जो इस अवलोकन में यादृच्छिक त्रुटि के विचरण के विपरीत आनुपातिक होता है: e T W e = ∑ t = 1 n e t 2 t 2 (\displaystyle e^(T)We=\sum _(t=1)^(n)(\frac (e_(t)^(2))(\ सिग्मा _(टी)^(2)))). वास्तव में, डेटा को प्रेक्षणों को भारित करके (यादृच्छिक त्रुटियों के कल्पित मानक विचलन के अनुपात में विभाजित करके) रूपांतरित किया जाता है, और भारित डेटा पर सामान्य न्यूनतम वर्ग लागू होते हैं।

आईएसबीएन 978-5-7749-0473-0।

  • अर्थमिति। पाठ्यपुस्तक / एड। एलिसेवा आई। आई। - दूसरा संस्करण। - एम।: वित्त और सांख्यिकी, 2006. - 576 पी। - आईएसबीएन 5-279-02786-3।
  • अलेक्जेंड्रोवा एन.वी.गणितीय शब्दों, अवधारणाओं, पदनामों का इतिहास: एक शब्दकोश-संदर्भ पुस्तक। - तीसरा संस्करण। - एम।: एलकेआई, 2008। - 248 पी। - आईएसबीएन 978-5-382-00839-4।आई.वी. मितिन, रुसाकोव वी.एस. प्रयोगात्मक डेटा का विश्लेषण और प्रसंस्करण - 5 वां संस्करण - 24p।
  • हम फ़ंक्शन को दूसरी डिग्री के बहुपद द्वारा अनुमानित करते हैं। ऐसा करने के लिए, हम समीकरणों की सामान्य प्रणाली के गुणांक की गणना करते हैं:

    , ,

    आइए हम कम से कम वर्गों की एक सामान्य प्रणाली की रचना करें, जिसका रूप है:

    सिस्टम का समाधान खोजना आसान है:,,।

    इस प्रकार, दूसरी डिग्री का बहुपद पाया जाता है: .

    सैद्धांतिक संदर्भ

    पृष्ठ पर वापस जाएं<Введение в вычислительную математику. Примеры>

    उदाहरण 2. एक बहुपद की इष्टतम घात ज्ञात करना।

    पृष्ठ पर वापस जाएं<Введение в вычислительную математику. Примеры>

    उदाहरण 3. एक अनुभवजन्य निर्भरता के मापदंडों को खोजने के लिए समीकरणों की एक सामान्य प्रणाली की व्युत्पत्ति।

    आइए हम गुणांकों और कार्यों को निर्धारित करने के लिए समीकरणों की एक प्रणाली प्राप्त करें , जो अंकों के संबंध में दिए गए फ़ंक्शन का मूल-माध्य-वर्ग सन्निकटन करता है। एक समारोह लिखें और इसके लिए आवश्यक चरम शर्त लिखिए:

    तब सामान्य प्रणाली रूप लेगी:

    हमने अज्ञात मापदंडों के लिए समीकरणों की एक रैखिक प्रणाली प्राप्त की है, जिसे आसानी से हल किया जा सकता है।

    सैद्धांतिक संदर्भ

    पृष्ठ पर वापस जाएं<Введение в вычислительную математику. Примеры>

    उदाहरण।

    चर के मूल्यों पर प्रायोगिक डेटा एक्सतथा परतालिका में दिए गए हैं।

    उनके संरेखण के परिणामस्वरूप, फ़ंक्शन

    का उपयोग करते हुए कम से कम वर्ग विधि, इन आंकड़ों को एक रैखिक निर्भरता के साथ अनुमानित करें वाई = कुल्हाड़ी + बी(पैरामीटर खोजें एकतथा बी) पता लगाएँ कि दोनों में से कौन सी रेखा बेहतर है (न्यूनतम वर्ग विधि के अर्थ में) प्रयोगात्मक डेटा को संरेखित करती है। एक चित्र बनाओ।

    कम से कम वर्गों (LSM) की विधि का सार।

    समस्या रैखिक निर्भरता गुणांक खोजने की है जिसके लिए दो चर का कार्य एकतथा बीसबसे छोटा मान लेता है। यानी डेटा दिया गया है एकतथा बीपाई गई सीधी रेखा से प्रयोगात्मक डेटा के वर्ग विचलन का योग सबसे छोटा होगा। यह न्यूनतम वर्ग विधि का संपूर्ण बिंदु है।

    इस प्रकार, उदाहरण का समाधान दो चरों के एक फ़ंक्शन के चरम को खोजने के लिए कम हो गया है।

    गुणांक खोजने के लिए सूत्रों की व्युत्पत्ति।

    दो अज्ञात के साथ दो समीकरणों की एक प्रणाली संकलित और हल की जाती है। कार्यों के आंशिक व्युत्पन्न ढूँढना चर द्वारा एकतथा बी, हम इन व्युत्पन्नों को शून्य के बराबर करते हैं।

    हम समीकरणों की परिणामी प्रणाली को किसी भी विधि से हल करते हैं (उदाहरण के लिए प्रतिस्थापन विधिया क्रैमर की विधि) और कम से कम वर्ग विधि (एलएसएम) का उपयोग करके गुणांक खोजने के लिए सूत्र प्राप्त करें।

    डेटा के साथ एकतथा बीसमारोह सबसे छोटा मान लेता है। इस तथ्य का प्रमाण पृष्ठ के अंत में पाठ में नीचे दिया गया है।

    यह कम से कम वर्गों की पूरी विधि है। पैरामीटर खोजने के लिए सूत्र एकइसमें रकम , , , और पैरामीटर शामिल हैं एनप्रयोगात्मक डेटा की मात्रा है। इन राशियों के मूल्यों की अलग से गणना करने की अनुशंसा की जाती है।

    गुणक बीगणना के बाद पाया गया एक.

    मूल उदाहरण को याद करने का समय आ गया है।

    समाधान।

    हमारे उदाहरण में एन = 5. हम आवश्यक गुणांक के सूत्रों में शामिल राशियों की गणना की सुविधा के लिए तालिका में भरते हैं।

    तालिका की चौथी पंक्ति के मान दूसरी पंक्ति के मानों को प्रत्येक संख्या के लिए तीसरी पंक्ति के मानों से गुणा करके प्राप्त किए जाते हैं मैं.

    तालिका की पाँचवीं पंक्ति के मान प्रत्येक संख्या के लिए दूसरी पंक्ति के मानों को चुकता करके प्राप्त किए जाते हैं मैं.

    तालिका के अंतिम स्तंभ के मान पंक्तियों के मानों का योग हैं।

    हम गुणांक ज्ञात करने के लिए अल्पतम वर्ग विधि के सूत्रों का उपयोग करते हैं एकतथा बी. हम उनमें तालिका के अंतिम कॉलम से संबंधित मानों को प्रतिस्थापित करते हैं:

    फलस्वरूप, वाई=0.165x+2.184वांछित सन्निकटन सीधी रेखा है।

    यह पता लगाना बाकी है कि कौन सी पंक्तियाँ वाई=0.165x+2.184या मूल डेटा का बेहतर अनुमान लगाता है, यानी कम से कम वर्ग विधि का उपयोग करके अनुमान लगाने के लिए।

    कम से कम वर्गों की विधि की त्रुटि का अनुमान।

    ऐसा करने के लिए, आपको इन पंक्तियों से मूल डेटा के वर्ग विचलन के योग की गणना करने की आवश्यकता है तथा , एक छोटा मान उस रेखा से मेल खाता है जो कम से कम वर्ग विधि के संदर्भ में मूल डेटा का बेहतर अनुमान लगाती है।

    तब से , तब रेखा वाई=0.165x+2.184मूल डेटा का बेहतर अनुमान लगाता है।

    कम से कम वर्ग विधि (LSM) का ग्राफिक चित्रण।

    चार्ट पर सब कुछ बहुत अच्छा लग रहा है। लाल रेखा पाई गई रेखा है वाई=0.165x+2.184, नीली रेखा है , गुलाबी बिंदु मूल डेटा हैं।

    यह किस लिए है, ये सभी अनुमान किस लिए हैं?

    मैं व्यक्तिगत रूप से डेटा स्मूथिंग समस्याओं, इंटरपोलेशन और एक्सट्रपलेशन समस्याओं को हल करने के लिए उपयोग करता हूं (मूल उदाहरण में, आपको देखे गए मूल्य का मूल्य खोजने के लिए कहा जा सकता है आपपर एक्स = 3या जब एक्स = 6बहुराष्ट्रीय कंपनी विधि के अनुसार)। लेकिन हम इसके बारे में साइट के दूसरे भाग में बाद में बात करेंगे।

    पृष्ठ के सबसे ऊपर

    सबूत।

    ताकि जब मिले एकतथा बीफ़ंक्शन सबसे छोटा मान लेता है, यह आवश्यक है कि इस बिंदु पर फ़ंक्शन के लिए दूसरे क्रम के अंतर के द्विघात रूप का मैट्रिक्स सकारात्मक निश्चित था। आइए इसे दिखाते हैं।

    दूसरे क्रम के अंतर का रूप है:

    वह है

    इसलिए, द्विघात रूप के मैट्रिक्स का रूप है

    और तत्वों का मान निर्भर नहीं करता एकतथा बी.

    आइए हम दिखाते हैं कि मैट्रिक्स सकारात्मक निश्चित है। इसके लिए आवश्यक है कि कोण अवयस्क सकारात्मक हों।

    पहले क्रम का कोणीय नाबालिग . असमानता सख्त है, क्योंकि अंक मेल नहीं खाते। यह निम्नलिखित में निहित होगा।

    दूसरे क्रम का कोणीय नाबालिग

    आइए साबित करें कि गणितीय प्रेरण की विधि।

    निष्कर्ष: पाया मान एकतथा बीफ़ंक्शन के सबसे छोटे मान के अनुरूप हों इसलिए, कम से कम वर्ग विधि के लिए वांछित पैरामीटर हैं।

    कभी समझे?
    समाधान का आदेश दें

    पृष्ठ के सबसे ऊपर

    कम से कम वर्ग विधि का उपयोग करके पूर्वानुमान का विकास। समस्या समाधान उदाहरण

    एक्सट्रपलेशन - यह वैज्ञानिक अनुसंधान की एक विधि है, जो भविष्यवाणी की वस्तु के भविष्य के विकास के लिए अतीत और वर्तमान प्रवृत्तियों, पैटर्न, संबंधों के प्रसार पर आधारित है। एक्सट्रपलेशन विधियों में शामिल हैं चलती औसत विधि, घातीय चौरसाई विधि, कम से कम वर्ग विधि।

    सार कम से कम वर्ग विधि प्रेक्षित और परिकलित मानों के बीच वर्ग विचलन के योग को न्यूनतम करना शामिल है। परिकलित मान चयनित समीकरण के अनुसार पाए जाते हैं - प्रतिगमन समीकरण। वास्तविक मानों और परिकलित मानों के बीच की दूरी जितनी छोटी होगी, प्रतिगमन समीकरण के आधार पर पूर्वानुमान उतना ही सटीक होगा।

    अध्ययन के तहत घटना के सार का सैद्धांतिक विश्लेषण, जिसमें परिवर्तन एक समय श्रृंखला द्वारा प्रदर्शित किया जाता है, वक्र चुनने के आधार के रूप में कार्य करता है। श्रृंखला के स्तरों की वृद्धि की प्रकृति के बारे में विचार कभी-कभी ध्यान में रखा जाता है। इसलिए, यदि अंकगणितीय प्रगति में उत्पादन की वृद्धि अपेक्षित है, तो एक सीधी रेखा में चौरसाई का प्रदर्शन किया जाता है। यदि यह पता चलता है कि वृद्धि घातीय है, तो घातीय कार्य के अनुसार चौरसाई किया जाना चाहिए।

    कम से कम वर्गों की विधि का कार्य सूत्र : वाई टी+1 = ए*एक्स + बी, जहां t + 1 पूर्वानुमान अवधि है; t+1 - अनुमानित संकेतक; ए और बी गुणांक हैं; X समय का प्रतीक है।

    गुणांक ए और बी की गणना निम्न सूत्रों के अनुसार की जाती है:

    जहाँ, Uf - गतिकी की श्रृंखला के वास्तविक मान; n समय श्रृंखला में स्तरों की संख्या है;

    अध्ययन के तहत घटना के विकास के पैटर्न को प्रतिबिंबित करने के लिए कम से कम वर्ग विधि द्वारा समय श्रृंखला को चौरसाई करना कार्य करता है। एक प्रवृत्ति की विश्लेषणात्मक अभिव्यक्ति में, समय को एक स्वतंत्र चर माना जाता है, और श्रृंखला के स्तर इस स्वतंत्र चर के कार्य के रूप में कार्य करते हैं।

    किसी घटना का विकास इस बात पर निर्भर नहीं करता है कि प्रारंभिक बिंदु से कितने वर्ष बीत चुके हैं, बल्कि इस बात पर निर्भर करता है कि उसके विकास को किन कारकों ने प्रभावित किया, किस दिशा में और किस तीव्रता से। इससे यह स्पष्ट होता है कि समय में किसी घटना का विकास इन कारकों की क्रिया के परिणामस्वरूप प्रकट होता है।

    वक्र के प्रकार को सही ढंग से निर्धारित करना, समय पर विश्लेषणात्मक निर्भरता का प्रकार पूर्व-पूर्वानुमान विश्लेषण के सबसे कठिन कार्यों में से एक है। .

    प्रवृत्ति का वर्णन करने वाले फ़ंक्शन के प्रकार का चुनाव, जिनमें से पैरामीटर कम से कम वर्ग विधि द्वारा निर्धारित किए जाते हैं, ज्यादातर मामलों में अनुभवजन्य है, कई कार्यों का निर्माण करके और रूट के मूल्य के अनुसार उनकी एक दूसरे के साथ तुलना करके- माध्य-वर्ग त्रुटि, सूत्र द्वारा परिकलित:

    जहाँ Uf - गतिकी की श्रृंखला के वास्तविक मूल्य; उर - समय श्रृंखला के परिकलित (चिकना) मान; n समय श्रृंखला में स्तरों की संख्या है; p प्रवृत्ति (विकास की प्रवृत्ति) का वर्णन करने वाले सूत्रों में परिभाषित मापदंडों की संख्या है।

    कम से कम वर्ग विधि के नुकसान :

    • गणितीय समीकरण का उपयोग करके अध्ययन के तहत आर्थिक घटना का वर्णन करने का प्रयास करते समय, पूर्वानुमान थोड़े समय के लिए सटीक होगा और नई जानकारी उपलब्ध होने पर प्रतिगमन समीकरण की पुनर्गणना की जानी चाहिए;
    • प्रतिगमन समीकरण के चयन की जटिलता, जिसे मानक कंप्यूटर प्रोग्राम का उपयोग करके हल किया जा सकता है।

    पूर्वानुमान विकसित करने के लिए कम से कम वर्ग विधि का उपयोग करने का एक उदाहरण

    एक कार्य . इस क्षेत्र में बेरोजगारी के स्तर को दर्शाने वाले आंकड़े हैं, %

    • इन तरीकों का इस्तेमाल करके नवंबर, दिसंबर, जनवरी के महीनों के लिए क्षेत्र में बेरोजगारी दर का पूर्वानुमान बनाएं: मूविंग एवरेज, एक्सपोनेंशियल स्मूथिंग, कम से कम वर्ग।
    • प्रत्येक विधि का उपयोग करके परिणामी पूर्वानुमानों में त्रुटियों की गणना करें।
    • प्राप्त परिणामों की तुलना करें, निष्कर्ष निकालें।

    कम से कम वर्ग समाधान

    समाधान के लिए, हम एक तालिका संकलित करेंगे जिसमें हम आवश्यक गणना करेंगे:

    = 28.63/10 = 2.86% पूर्वानुमान सटीकताउच्च।

    निष्कर्ष : गणना में प्राप्त परिणामों की तुलना चलती औसत विधि , एक्स्पोनेंशियल स्मूदिंग और कम से कम वर्ग विधि, हम कह सकते हैं कि घातीय चौरसाई विधि द्वारा गणना में औसत सापेक्ष त्रुटि 20-50% के भीतर आती है। इसका मतलब है कि इस मामले में भविष्यवाणी की सटीकता केवल संतोषजनक है।

    पहले और तीसरे मामलों में, पूर्वानुमान सटीकता अधिक है, क्योंकि औसत सापेक्ष त्रुटि 10% से कम है। लेकिन चलती औसत विधि ने अधिक विश्वसनीय परिणाम प्राप्त करना संभव बना दिया (नवंबर के लिए पूर्वानुमान - 1.52%, दिसंबर के लिए पूर्वानुमान - 1.53%, जनवरी के लिए पूर्वानुमान - 1.49%), क्योंकि इस पद्धति का उपयोग करते समय औसत सापेक्ष त्रुटि सबसे छोटी है - 1 , 13%।

    कम से कम वर्ग विधि

    अन्य संबंधित लेख:

    प्रयुक्त स्रोतों की सूची

    1. सामाजिक जोखिमों के निदान और चुनौतियों, खतरों और सामाजिक परिणामों की भविष्यवाणी करने के मुद्दों पर वैज्ञानिक और पद्धति संबंधी सिफारिशें। रूसी राज्य सामाजिक विश्वविद्यालय। मास्को। 2010;
    2. व्लादिमीरोवा एल.पी. बाजार की स्थितियों में पूर्वानुमान और योजना: प्रोक। भत्ता। एम।: पब्लिशिंग हाउस "दशकोव एंड कंपनी", 2001;
    3. नोविकोवा एन.वी., पॉज़्डीवा ओ.जी. राष्ट्रीय अर्थव्यवस्था का पूर्वानुमान: शैक्षिक और पद्धति संबंधी गाइड। येकातेरिनबर्ग: पब्लिशिंग हाउस यूराल। राज्य अर्थव्यवस्था विश्वविद्यालय, 2007;
    4. स्लटस्किन एल.एन. बिजनेस फोरकास्टिंग में एमबीए कोर्स। मॉस्को: एल्पिना बिजनेस बुक्स, 2006।

    एमएनई कार्यक्रम

    डेटा दर्ज करें

    डेटा और अनुमान वाई = ए + बी एक्स

    मैं- प्रयोगात्मक बिंदु की संख्या;
    एक्स मैं- बिंदु पर निश्चित पैरामीटर का मान मैं;
    यी- बिंदु पर मापा पैरामीटर का मान मैं;
    मैं- बिंदु पर माप वजन मैं;
    वाई मैं, कैल्क।- मापा मूल्य और प्रतिगमन से गणना मूल्य के बीच का अंतर आपबिंदु पर मैं;
    एस एक्स मैं (एक्स मैं)- त्रुटि अनुमान एक्स मैंमापते समय आपबिंदु पर मैं.

    डेटा और अनुमान वाई = केएक्स

    मैं एक्स मैं यी मैं वाई मैं, कैल्क। मैं एस एक्स मैं (एक्स मैं)

    चार्ट पर क्लिक करें

    बहुराष्ट्रीय कंपनी ऑनलाइन कार्यक्रम के लिए उपयोगकर्ता पुस्तिका।

    डेटा फ़ील्ड में, प्रत्येक अलग लाइन पर एक प्रयोगात्मक बिंदु पर `x` और `y` के मान दर्ज करें। मानों को खाली जगह (स्पेस या टैब) से अलग किया जाना चाहिए.

    तीसरा मान `w` का बिंदु भार हो सकता है। यदि बिंदु भार निर्दिष्ट नहीं है, तो यह एक के बराबर है। अधिकांश मामलों में, प्रयोगात्मक बिंदुओं के वजन अज्ञात हैं या गणना नहीं की गई है; सभी प्रयोगात्मक डेटा को समकक्ष माना जाता है। कभी-कभी मूल्यों की अध्ययन सीमा में वजन निश्चित रूप से समकक्ष नहीं होते हैं और सैद्धांतिक रूप से भी गणना की जा सकती है। उदाहरण के लिए, स्पेक्ट्रोफोटोमेट्री में, वजन की गणना सरल सूत्रों का उपयोग करके की जा सकती है, हालांकि मूल रूप से हर कोई श्रम लागत को कम करने के लिए इसकी उपेक्षा करता है।

    डेटा को ऑफिस सूट स्प्रेडशीट से क्लिपबोर्ड के माध्यम से चिपकाया जा सकता है, जैसे कि माइक्रोसॉफ्ट ऑफिस से एक्सेल या ओपन ऑफिस से कैल्क। ऐसा करने के लिए, स्प्रैडशीट में, कॉपी करने के लिए डेटा की श्रेणी का चयन करें, क्लिपबोर्ड पर कॉपी करें और डेटा को इस पृष्ठ पर डेटा फ़ील्ड में पेस्ट करें।

    कम से कम वर्ग विधि द्वारा गणना करने के लिए, दो गुणांक निर्धारित करने के लिए कम से कम दो बिंदुओं की आवश्यकता होती है `बी` - सीधी रेखा के झुकाव के कोण के स्पर्शक और `ए` - मूल्य को सीधी रेखा से काट दिया जाता है। `अक्ष.

    गणना किए गए प्रतिगमन गुणांक की त्रुटि का अनुमान लगाने के लिए, प्रयोगात्मक बिंदुओं की संख्या को दो से अधिक पर सेट करना आवश्यक है।

    कम से कम वर्ग विधि (LSM)।

    प्रायोगिक बिंदुओं की संख्या जितनी अधिक होगी, गुणांकों का सांख्यिकीय अनुमान उतना ही सटीक होगा (छात्र के गुणांक में कमी के कारण) और सामान्य नमूने के अनुमान के करीब अनुमान।

    प्रत्येक प्रायोगिक बिंदु पर मूल्य प्राप्त करना अक्सर महत्वपूर्ण श्रम लागतों से जुड़ा होता है, इसलिए, प्रयोगों की एक समझौता संख्या अक्सर की जाती है, जो एक सुपाच्य अनुमान देता है और अत्यधिक श्रम लागत का कारण नहीं बनता है। एक नियम के रूप में, दो गुणांक वाले रैखिक न्यूनतम वर्ग निर्भरता के लिए प्रायोगिक बिंदुओं की संख्या 5-7 अंकों के क्षेत्र में चुनी जाती है।

    रैखिक निर्भरता के लिए कम से कम वर्गों का एक संक्षिप्त सिद्धांत

    मान लीजिए कि हमारे पास प्रयोगात्मक डेटा का एक सेट है जो मूल्यों के जोड़े के रूप में है [`y_i`, `x_i`], जहां `i` 1 से `n` तक एक प्रयोगात्मक माप की संख्या है; `y_i` - बिंदु `i` पर मापे गए मान का मान; `x_i` - उस पैरामीटर का मान जिसे हम `i` बिंदु पर सेट करते हैं।

    एक उदाहरण ओम के नियम का संचालन है। विद्युत परिपथ के वर्गों के बीच वोल्टेज (संभावित अंतर) को बदलकर, हम इस खंड से गुजरने वाली धारा की मात्रा को मापते हैं। भौतिकी हमें प्रयोगात्मक रूप से मिली निर्भरता देता है:

    `मैं = यू/आर`,
    जहां `मैं` - वर्तमान ताकत; `आर` - प्रतिरोध; `यू` - वोल्टेज।

    इस मामले में, `y_i` मापा गया वर्तमान मान है, और `x_i` वोल्टेज मान है।

    एक अन्य उदाहरण के रूप में, विलयन में किसी पदार्थ के विलयन द्वारा प्रकाश के अवशोषण पर विचार करें। रसायन विज्ञान हमें सूत्र देता है:

    `ए = एल सी`,
    जहाँ `A` विलयन का प्रकाशिक घनत्व है; `ε` - विलेय संप्रेषण; `एल` - पथ की लंबाई जब प्रकाश एक क्यूवेट के माध्यम से एक समाधान के साथ गुजरता है; `C` विलेय की सांद्रता है।

    इस मामले में, `y_i` मापा ऑप्टिकल घनत्व है `ए`, और `x_i` उस पदार्थ की एकाग्रता है जिसे हम सेट करते हैं।

    हम उस मामले पर विचार करेंगे जब `x_i` की स्थापना में सापेक्ष त्रुटि `y_i` को मापने में सापेक्ष त्रुटि से बहुत कम है। हम यह भी मानेंगे कि `y_i` के सभी मापा मूल्य यादृच्छिक हैं और सामान्य रूप से वितरित हैं, अर्थात। सामान्य वितरण कानून का पालन करें।

    `x` पर `y` की रैखिक निर्भरता के मामले में, हम सैद्धांतिक निर्भरता लिख ​​सकते हैं:
    `वाई = ए + बीएक्स`।

    ज्यामितीय दृष्टिकोण से, गुणांक `बी` रेखा के झुकाव के कोण के स्पर्शरेखा को `एक्स` अक्ष और गुणांक `ए` - के प्रतिच्छेदन बिंदु पर `y` के मान को दर्शाता है। `y` अक्ष के साथ रेखा (`x = 0` के लिए)।

    प्रतिगमन रेखा के मापदंडों का पता लगाना।

    एक प्रयोग में, माप त्रुटियों के कारण `y_i` के मापा मूल्य सैद्धांतिक रेखा पर बिल्कुल नहीं हो सकते हैं, जो हमेशा वास्तविक जीवन में निहित होते हैं। इसलिए, समीकरणों की एक प्रणाली द्वारा एक रैखिक समीकरण का प्रतिनिधित्व किया जाना चाहिए:
    `y_i = a + b x_i + _i` (1),
    जहां `ε_i` `i`वें प्रयोग में `y` की अज्ञात माप त्रुटि है।

    निर्भरता (1) को भी कहते हैं वापसी, अर्थात। सांख्यिकीय महत्व के साथ एक दूसरे पर दो मात्राओं की निर्भरता।

    निर्भरता को बहाल करने का कार्य प्रायोगिक बिंदुओं [`y_i`, `x_i`] से गुणांक `ए` और `बी` को खोजना है।

    गुणांक खोजने के लिए `a` और `b` आमतौर पर प्रयोग किया जाता है कम से कम वर्ग विधि(एमएनके)। यह अधिकतम संभावना सिद्धांत का एक विशेष मामला है।

    आइए (1) को `ε_i = y_i - a - b x_i` के रूप में फिर से लिखें।

    तब चुकता त्रुटियों का योग होगा
    `Φ = sum_(i=1)^(n) ε_i^2 = sum_(i=1)^(n) (y_i - a - b x_i)^2`। (2)

    कम से कम वर्ग विधि का सिद्धांत योग (2) को पैरामीटर `ए` और `बी` . के संबंध में कम करना है.

    न्यूनतम तक पहुँच जाता है जब गुणांक के संबंध में योग (2) के आंशिक व्युत्पन्न `a` तथा `b` शून्य के बराबर हैं:
    `frac(आंशिक Φ)(आंशिक a) = frac(आंशिक योग_(i=1)^(n) (y_i - a - b x_i)^2)(आंशिक a) = 0`
    `फ्रैक(आंशिक Φ)(आंशिक बी) = फ़्रेक(आंशिक योग_(i=1)^(n) (y_i - a - b x_i)^2)(आंशिक b) = 0`

    डेरिवेटिव का विस्तार करते हुए, हम दो अज्ञात के साथ दो समीकरणों की एक प्रणाली प्राप्त करते हैं:
    `sum_(i=1)^(n) (2a + 2bx_i - 2y_i) = sum_(i=1)^(n) (a + bx_i - y_i) = 0`
    `sum_(i=1)^(n) (2bx_i^2 + 2ax_i - 2x_iy_i) = sum_(i=1)^(n) (bx_i^2 + ax_i - x_iy_i) = 0`

    हम कोष्ठक खोलते हैं और वांछित गुणांक से स्वतंत्र राशि को दूसरी छमाही में स्थानांतरित करते हैं, हमें रैखिक समीकरणों की एक प्रणाली मिलती है:
    `sum_(i=1)^(n) y_i = a n + b sum_(i=1)^(n) bx_i`
    `sum_(i=1)^(n) x_iy_i = a sum_(i=1)^(n) x_i + b sum_(i=1)^(n) x_i^2`

    परिणामी प्रणाली को हल करते हुए, हम गुणांक `ए` और `बी` के लिए सूत्र ढूंढते हैं:

    `a = frac(sum_(i=1)^(n) y_i sum_(i=1)^(n) x_i^2 - sum_(i=1)^(n) x_i sum_(i=1)^(n) ) x_iy_i) (n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2)` (3.1)

    `बी = फ़्रेक (एन योग_(i=1)^(एन) x_iy_i - sum_(i=1)^(n) x_i sum_(i=1)^(n) y_i) (n sum_(i=1)^ (एन) x_i^2 - (sum_(i=1)^(n) x_i)^2)` (3.2)

    इन सूत्रों का समाधान तब होता है जब `n > 1` (कम से कम 2 बिंदुओं का उपयोग करके रेखा खींची जा सकती है) और जब निर्धारक `D = n sum_(i=1)^(n) x_i^2 — (sum_(i= 1) )^(n) x_i)^2 != 0`, अर्थात। जब प्रयोग में `x_i` बिंदु भिन्न हों (अर्थात जब रेखा लंबवत न हो)।

    प्रतीपगमन रेखा के गुणांकों में त्रुटियों का अनुमान

    गुणांक `ए` और `बी` की गणना में त्रुटि के अधिक सटीक अनुमान के लिए, बड़ी संख्या में प्रयोगात्मक बिंदु वांछनीय हैं। जब `n = 2`, गुणांकों की त्रुटि का अनुमान लगाना असंभव है, क्योंकि सन्निकटन रेखा विशिष्ट रूप से दो बिंदुओं से होकर गुजरेगी।

    यादृच्छिक चर `V` की त्रुटि निर्धारित की जाती है त्रुटि संचय कानून
    `S_V^2 = sum_(i=1)^p (frac(आंशिक f)(आंशिक z_i))^2 S_(z_i)^2`,
    जहां `p` `S_(z_i)` त्रुटि के साथ `z_i` पैरामीटर की संख्या है जो `S_V` त्रुटि को प्रभावित करती है;
    `f` `z_i` पर `वी` का एक निर्भरता कार्य है।

    आइए गुणांक `a` और `b` . की त्रुटि के लिए त्रुटियों के संचय का नियम लिखें
    `S_a^2 = sum_(i=1)^(n)(frac(आंशिक a)(आंशिक y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(आंशिक a) )(आंशिक x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(आंशिक a)(आंशिक y_i))^2 `,
    `S_b^2 = sum_(i=1)^(n)(frac(आंशिक ख)(आंशिक y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(आंशिक ख) )(आंशिक x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(आंशिक ख)(आंशिक y_i))^2 `,
    इसलिये `S_(x_i)^2 = 0` (हमने पहले आरक्षण किया था कि `x` की त्रुटि नगण्य है)।

    `S_y^2 = S_(y_i)^2` - `y` आयाम में त्रुटि (विचरण, वर्ग मानक विचलन), यह मानते हुए कि त्रुटि सभी `y` मानों के लिए एक समान है।

    परिणामी व्यंजकों में `a` और `b` की गणना के लिए सूत्रों को प्रतिस्थापित करने पर, हम प्राप्त करते हैं

    `S_a^2 = S_y^2 frac(sum_(i=1)^(n) (sum_(i=1)^(n) x_i^2 - x_i sum_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n sum_(i=1)^(n) x_i^2 - (sum_(i=1)^(n) x_i)^2) sum_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frac(sum_(i=1)^(n) x_i^2) (डी)` (4.1)

    `S_b^2 = S_y^2 frac(sum_(i=1)^(n) (n x_i - sum_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n sum_(i=1)^(n) x_i^2 - (sum_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) ` (4.2)

    अधिकांश वास्तविक प्रयोगों में, `Sy` का मान नहीं मापा जाता है। ऐसा करने के लिए, योजना के एक या कई बिंदुओं पर कई समानांतर माप (प्रयोग) करना आवश्यक है, जिससे प्रयोग का समय (और संभवतः लागत) बढ़ जाता है। इसलिए, आमतौर पर यह माना जाता है कि प्रतिगमन रेखा से `y` के विचलन को यादृच्छिक माना जा सकता है। इस मामले में विचरण अनुमान `y` की गणना सूत्र द्वारा की जाती है।

    `S_y^2 = S_(y,rest)^2 = frac(sum_(i=1)^n (y_i - a - b x_i)^2) (n-2)`।

    भाजक `n-2` प्रकट होता है क्योंकि हमने प्रयोगात्मक डेटा के एक ही नमूने के लिए दो गुणांकों की गणना के कारण स्वतंत्रता की डिग्री की संख्या कम कर दी है।

    इस अनुमान को समाश्रयण रेखा `S_(y,rest)^2` के सापेक्ष अवशिष्ट विचरण भी कहा जाता है।

    गुणांक के महत्व का आकलन छात्र की कसौटी के अनुसार किया जाता है

    `t_a = frac(|a|) (S_a)`, `t_b = frac(|b|) (S_b)`

    यदि परिकलित मानदंड `t_a`, `t_b` तालिका मानदंड `t(P, n-2)` से कम हैं, तो यह माना जाता है कि संबंधित गुणांक किसी दिए गए प्रायिकता `P` के साथ शून्य से महत्वपूर्ण रूप से भिन्न नहीं है।

    एक रैखिक संबंध के विवरण की गुणवत्ता का आकलन करने के लिए, आप फिशर मानदंड का उपयोग करके माध्य के सापेक्ष `S_(y,rest)^2` और `S_(bar y)` की तुलना कर सकते हैं।

    `S_(bar y) = frac(sum_(i=1)^n (y_i - bar y)^2) (n-1) = frac(sum_(i=1)^n (y_i - (sum_(i=) 1)^n y_i) /n)^2) (n-1) - माध्य के सापेक्ष `y` के प्रसरण का नमूना अनुमान।

    निर्भरता का वर्णन करने के लिए प्रतिगमन समीकरण की प्रभावशीलता का मूल्यांकन करने के लिए, फिशर गुणांक की गणना की जाती है
    `एफ = एस_(बार वाई) / एस_(वाई, आराम)^2`,
    जिसकी तुलना सारणीबद्ध फिशर गुणांक F(p, n-1, n-2) से की जाती है।

    यदि `F > F(P, n-1, n-2)`, निर्भरता के विवरण के बीच अंतर `y = f(x)` प्रतिगमन समीकरण का उपयोग करते हुए और माध्य का उपयोग करने वाले विवरण को संभाव्यता के साथ सांख्यिकीय रूप से महत्वपूर्ण माना जाता है `प`। वे। प्रतिगमन माध्य के आसपास `y` के प्रसार से बेहतर निर्भरता का वर्णन करता है।

    चार्ट पर क्लिक करें
    तालिका में मान जोड़ने के लिए

    कम से कम वर्ग विधि। कम से कम वर्गों की विधि का अर्थ है अज्ञात मापदंडों का निर्धारण a, b, c, स्वीकृत कार्यात्मक निर्भरता

    कम से कम वर्गों की विधि का अर्थ है अज्ञात मापदंडों का निर्धारण ए, बी, सी,…स्वीकृत कार्यात्मक निर्भरता

    वाई = एफ (एक्स, ए, बी, सी,…),

    जो त्रुटि का न्यूनतम माध्य वर्ग (विचरण) प्रदान करेगा

    , (24)

    जहाँ x i, y i - प्रयोग से प्राप्त संख्याओं के युग्मों का समुच्चय।

    चूंकि कई चर के एक फ़ंक्शन के चरम के लिए शर्त यह है कि इसके आंशिक डेरिवेटिव शून्य के बराबर हैं, फिर पैरामीटर ए, बी, सी,…समीकरणों की प्रणाली से निर्धारित होते हैं:

    ; ; ; … (25)

    यह याद रखना चाहिए कि फ़ंक्शन के रूप के बाद पैरामीटर का चयन करने के लिए कम से कम वर्ग विधि का उपयोग किया जाता है वाई = एफ (एक्स)परिभाषित।

    यदि सैद्धांतिक विचारों से कोई निष्कर्ष निकालना असंभव है कि अनुभवजन्य सूत्र क्या होना चाहिए, तो किसी को दृश्य प्रतिनिधित्व द्वारा निर्देशित किया जाना चाहिए, मुख्य रूप से देखे गए डेटा का ग्राफिकल प्रतिनिधित्व।

    व्यवहार में, अक्सर निम्न प्रकार के कार्यों तक सीमित होता है:

    1) रैखिक ;

    2) द्विघात a.

    कम से कम वर्ग विधि का सार है प्रवृत्ति मॉडल के मापदंडों को खोजने में जो समय या स्थान में किसी भी यादृच्छिक घटना के विकास की प्रवृत्ति का सबसे अच्छा वर्णन करता है (एक प्रवृत्ति एक ऐसी रेखा है जो इस विकास की प्रवृत्ति को दर्शाती है)। कम से कम वर्ग विधि (ओएलएस) का कार्य न केवल कुछ प्रवृत्ति मॉडल ढूंढना है, बल्कि सबसे अच्छा या इष्टतम मॉडल ढूंढना है। यह मॉडल इष्टतम होगा यदि देखे गए वास्तविक मूल्यों और संबंधित परिकलित प्रवृत्ति मूल्यों के बीच चुकता विचलन का योग न्यूनतम (सबसे छोटा) है:

    प्रेक्षित वास्तविक मान के बीच मानक विचलन कहाँ है

    और संगत परिकलित प्रवृत्ति मूल्य,

    अध्ययन के तहत घटना का वास्तविक (मनाया) मूल्य,

    ट्रेंड मॉडल का अनुमानित मूल्य,

    अध्ययन के तहत घटना की टिप्पणियों की संख्या।

    MNC का उपयोग शायद ही कभी अपने आप होता है। एक नियम के रूप में, अक्सर इसका उपयोग केवल सहसंबंध अध्ययन में एक आवश्यक तकनीक के रूप में किया जाता है। यह याद रखना चाहिए कि एलएसएम का सूचना आधार केवल एक विश्वसनीय सांख्यिकीय श्रृंखला हो सकती है, और टिप्पणियों की संख्या 4 से कम नहीं होनी चाहिए, अन्यथा, एलएसएम की चौरसाई प्रक्रियाएं अपना सामान्य ज्ञान खो सकती हैं।

    OLS टूलकिट को निम्न प्रक्रियाओं में घटाया गया है:

    पहली प्रक्रिया। यह पता चलता है कि क्या चयनित कारक-तर्क में परिवर्तन होने पर परिणामी विशेषता को बदलने की कोई प्रवृत्ति है, या दूसरे शब्दों में, क्या "के बीच कोई संबंध है" पर " तथा " एक्स ».

    दूसरी प्रक्रिया। यह निर्धारित किया जाता है कि कौन सी रेखा (प्रक्षेपवक्र) इस प्रवृत्ति का वर्णन या वर्णन करने में सबसे अच्छी है।

    तीसरी प्रक्रिया।

    उदाहरण. मान लीजिए हमारे पास अध्ययनाधीन खेत के लिए सूरजमुखी की औसत उपज के बारे में जानकारी है (सारणी 9.1)।

    तालिका 9.1

    अवलोकन संख्या

    उत्पादकता, सी/हे

    चूंकि हमारे देश में सूरजमुखी के उत्पादन में प्रौद्योगिकी का स्तर पिछले 10 वर्षों में ज्यादा नहीं बदला है, इसका मतलब है कि, सबसे अधिक संभावना है, विश्लेषण की अवधि में उपज में उतार-चढ़ाव मौसम और जलवायु परिस्थितियों में उतार-चढ़ाव पर निर्भर करता है। क्या यह सच है?

    पहली बहुराष्ट्रीय कंपनी प्रक्रिया। विश्लेषण किए गए 10 वर्षों में मौसम और जलवायु परिस्थितियों में परिवर्तन के आधार पर सूरजमुखी की उपज में बदलाव की प्रवृत्ति के अस्तित्व के बारे में परिकल्पना का परीक्षण किया जा रहा है।

    इस उदाहरण में, के लिए " आप » सूरजमुखी की उपज लेने की सलाह दी जाती है, और « एक्स » विश्लेषण की गई अवधि में देखे गए वर्ष की संख्या है। के बीच किसी भी संबंध के अस्तित्व के बारे में परिकल्पना का परीक्षण करना " एक्स " तथा " आप » दो तरीकों से किया जा सकता है: मैन्युअल रूप से और कंप्यूटर प्रोग्राम की मदद से। बेशक, कंप्यूटर प्रौद्योगिकी की उपलब्धता के साथ, यह समस्या अपने आप हल हो जाती है। लेकिन, ओएलएस टूलकिट को बेहतर ढंग से समझने के लिए, "के बीच संबंध के अस्तित्व के बारे में परिकल्पना का परीक्षण करना उचित है" एक्स " तथा " आप » मैन्युअल रूप से, जब केवल एक पेन और एक साधारण कैलकुलेटर हाथ में हों। ऐसे मामलों में, एक प्रवृत्ति के अस्तित्व की परिकल्पना को विश्लेषण की गई समय श्रृंखला की ग्राफिक छवि के स्थान से दृष्टिगत रूप से सर्वोत्तम रूप से जांचा जाता है - सहसंबंध क्षेत्र:

    हमारे उदाहरण में सहसंबंध क्षेत्र धीरे-धीरे बढ़ती हुई रेखा के आसपास स्थित है। यह अपने आप में सूरजमुखी की उपज में परिवर्तन में एक निश्चित प्रवृत्ति के अस्तित्व को इंगित करता है। किसी भी प्रवृत्ति की उपस्थिति के बारे में केवल तभी बोलना असंभव है जब सहसंबंध क्षेत्र एक वृत्त, एक वृत्त, एक कड़ाई से लंबवत या कड़ाई से क्षैतिज बादल जैसा दिखता है, या इसमें बेतरतीब ढंग से बिखरे हुए बिंदु होते हैं। अन्य सभी मामलों में, "के बीच संबंध के अस्तित्व की परिकल्पना की पुष्टि करना आवश्यक है" एक्स " तथा " आप और अनुसंधान जारी रखें।

    दूसरी बहुराष्ट्रीय कंपनी प्रक्रिया। यह निर्धारित किया जाता है कि कौन सी रेखा (प्रक्षेपवक्र) विश्लेषण की गई अवधि के लिए सूरजमुखी की उपज में परिवर्तन की प्रवृत्ति का वर्णन या विशेषता बताने में सक्षम है।

    कंप्यूटर प्रौद्योगिकी की उपलब्धता के साथ, इष्टतम प्रवृत्ति का चयन स्वचालित रूप से होता है। "मैनुअल" प्रसंस्करण के साथ, इष्टतम फ़ंक्शन का चुनाव, एक नियम के रूप में, दृश्य तरीके से - सहसंबंध क्षेत्र के स्थान से किया जाता है। यही है, चार्ट के प्रकार के अनुसार, रेखा के समीकरण का चयन किया जाता है, जो अनुभवजन्य प्रवृत्ति (वास्तविक प्रक्षेपवक्र के लिए) के लिए सबसे उपयुक्त है।

    जैसा कि आप जानते हैं, प्रकृति में कार्यात्मक निर्भरता की एक विशाल विविधता है, इसलिए उनमें से एक छोटे से हिस्से का भी नेत्रहीन विश्लेषण करना बेहद मुश्किल है। सौभाग्य से, वास्तविक आर्थिक व्यवहार में, अधिकांश संबंधों को या तो एक परवलय, या एक अतिपरवलय, या एक सीधी रेखा द्वारा सटीक रूप से वर्णित किया जा सकता है। इस संबंध में, सर्वोत्तम फ़ंक्शन का चयन करने के लिए "मैनुअल" विकल्प के साथ, आप स्वयं को केवल इन तीन मॉडलों तक सीमित कर सकते हैं।

    अतिपरवलय:

    दूसरे क्रम का परवलय: :

    यह देखना आसान है कि हमारे उदाहरण में, विश्लेषण किए गए 10 वर्षों में सूरजमुखी की उपज में बदलाव की प्रवृत्ति एक सीधी रेखा द्वारा सबसे अच्छी विशेषता है, इसलिए प्रतिगमन समीकरण एक सीधी रेखा समीकरण होगा।

    तीसरी प्रक्रिया। इस रेखा की विशेषता वाले प्रतिगमन समीकरण के मापदंडों की गणना की जाती है, या दूसरे शब्दों में, एक विश्लेषणात्मक सूत्र निर्धारित किया जाता है जो सर्वोत्तम प्रवृत्ति मॉडल का वर्णन करता है।

    प्रतिगमन समीकरण के मापदंडों के मूल्यों को खोजना, हमारे मामले में, पैरामीटर और , एलएसएम का मूल है। यह प्रक्रिया सामान्य समीकरणों की एक प्रणाली को हल करने के लिए कम हो जाती है।

    (9.2)

    गॉस विधि द्वारा समीकरणों की यह प्रणाली काफी आसानी से हल हो जाती है। याद रखें कि समाधान के परिणामस्वरूप, हमारे उदाहरण में, मापदंडों के मूल्य और पाए जाते हैं। इस प्रकार, पाया गया प्रतिगमन समीकरण का निम्न रूप होगा:

    श्रेणियाँ

    लोकप्रिय लेख

    2022 "kingad.ru" - मानव अंगों की अल्ट्रासाउंड परीक्षा