कम से कम वर्ग विधि का उपयोग करके डेटा विश्लेषण। एक्सेल में कम से कम वर्ग

कम से कम वर्ग विधि

विषय के अंतिम पाठ में, हम सबसे प्रसिद्ध एप्लिकेशन से परिचित होंगे एफएनपी, जो विज्ञान और अभ्यास के विभिन्न क्षेत्रों में व्यापक आवेदन पाता है। यह भौतिकी, रसायन विज्ञान, जीव विज्ञान, अर्थशास्त्र, समाजशास्त्र, मनोविज्ञान आदि हो सकता है। भाग्य की इच्छा से, मुझे अक्सर अर्थव्यवस्था से निपटना पड़ता है, और इसलिए आज मैं आपके लिए एक अद्भुत देश के टिकट की व्यवस्था करूंगा जिसे कहा जाता है अर्थमिति=) ... आप ऐसा कैसे नहीं चाहते?! यह वहां बहुत अच्छा है - आपको बस फैसला करना है! ...लेकिन आप जो निश्चित रूप से चाहते हैं वह यह है कि समस्याओं को हल करना सीखना है कम से कम वर्गों. और विशेष रूप से मेहनती पाठक उन्हें न केवल सटीक रूप से हल करना सीखेंगे, बल्कि बहुत तेज़ ;-) लेकिन पहले समस्या का सामान्य विवरण+ संबंधित उदाहरण:

कुछ विषय क्षेत्र में संकेतकों का अध्ययन करने दें जिनकी मात्रात्मक अभिव्यक्ति है। साथ ही, यह मानने का हर कारण है कि संकेतक संकेतक पर निर्भर करता है। यह धारणा वैज्ञानिक परिकल्पना और प्राथमिक सामान्य ज्ञान दोनों पर आधारित हो सकती है। आइए विज्ञान को एक तरफ छोड़ दें, और अधिक स्वादिष्ट क्षेत्रों का पता लगाएं - अर्थात्, किराना स्टोर। द्वारा निरूपित करें:

- किराने की दुकान का खुदरा स्थान, वर्गमीटर,
- किराने की दुकान का वार्षिक कारोबार, मिलियन रूबल।

यह बिल्कुल स्पष्ट है कि स्टोर का क्षेत्रफल जितना बड़ा होगा, ज्यादातर मामलों में उसका कारोबार उतना ही अधिक होगा।

मान लीजिए कि एक डफ के साथ अवलोकन / प्रयोग / गणना / नृत्य करने के बाद, हमारे पास हमारे निपटान में संख्यात्मक डेटा है:

किराने की दुकानों के साथ, मुझे लगता है कि सब कुछ स्पष्ट है: - यह पहली दुकान का क्षेत्र है, - इसका वार्षिक कारोबार, - दूसरी दुकान का क्षेत्र, - इसका वार्षिक कारोबार, आदि। वैसे, वर्गीकृत सामग्रियों तक पहुंच होना बिल्कुल भी आवश्यक नहीं है - इसका उपयोग करके टर्नओवर का काफी सटीक मूल्यांकन प्राप्त किया जा सकता है गणितीय सांख्यिकी. हालांकि, विचलित न हों, वाणिज्यिक जासूसी का कोर्स पहले ही भुगतान किया जा चुका है =)

सारणीबद्ध डेटा को बिंदुओं के रूप में भी लिखा जा सकता है और हमारे लिए सामान्य तरीके से दर्शाया जा सकता है। कार्तीय प्रणाली .

आइए एक महत्वपूर्ण प्रश्न का उत्तर दें: गुणात्मक अध्ययन के लिए कितने अंक चाहिए?

जितना बड़ा उतना अच्छा। न्यूनतम स्वीकार्य सेट में 5-6 अंक होते हैं। इसके अलावा, डेटा की एक छोटी मात्रा के साथ, "असामान्य" परिणामों को नमूने में शामिल नहीं किया जाना चाहिए। इसलिए, उदाहरण के लिए, एक छोटा संभ्रांत स्टोर "उनके सहयोगियों" से अधिक परिमाण के आदेशों की मदद कर सकता है, जिससे सामान्य पैटर्न को खोजने की आवश्यकता होती है!

यदि यह काफी सरल है, तो हमें एक फ़ंक्शन चुनना होगा, अनुसूचीजो जितना संभव हो उतना करीब से गुजरता है . इस तरह के एक समारोह कहा जाता है अनुमान करने वाले (सन्निकटन - सन्निकटन)या सैद्धांतिक कार्य . सामान्यतया, यहाँ तुरंत एक स्पष्ट "दिखावा" दिखाई देता है - उच्च डिग्री का एक बहुपद, जिसका ग्राफ सभी बिंदुओं से होकर गुजरता है। लेकिन यह विकल्प जटिल है, और अक्सर बस गलत है। (क्योंकि चार्ट हर समय "हवा" देगा और मुख्य प्रवृत्ति को खराब रूप से प्रतिबिंबित करेगा).

इस प्रकार, वांछित कार्य पर्याप्त रूप से सरल होना चाहिए और साथ ही साथ निर्भरता को पर्याप्त रूप से प्रतिबिंबित करना चाहिए। जैसा कि आप अनुमान लगा सकते हैं, ऐसे कार्यों को खोजने के तरीकों में से एक को कहा जाता है कम से कम वर्गों. सबसे पहले, आइए इसके सार का सामान्य तरीके से विश्लेषण करें। कुछ फ़ंक्शन को प्रयोगात्मक डेटा का अनुमान लगाने दें:

इस सन्निकटन की सटीकता का मूल्यांकन कैसे करें? आइए हम प्रयोगात्मक और कार्यात्मक मूल्यों के बीच अंतर (विचलन) की गणना करें (हम ड्राइंग का अध्ययन करते हैं). पहला विचार जो दिमाग में आता है वह यह अनुमान लगाना है कि राशि कितनी बड़ी है, लेकिन समस्या यह है कि मतभेद नकारात्मक हो सकते हैं। (उदाहरण के लिए, ) और इस तरह के योग के परिणामस्वरूप विचलन एक दूसरे को रद्द कर देंगे। इसलिए, सन्निकटन की सटीकता के अनुमान के रूप में, यह खुद को योग लेने का सुझाव देता है मॉड्यूलविचलन:

या मुड़े हुए रूप में: (उन लोगों के लिए जो नहीं जानते: योग चिह्न है, और - सहायक चर - "काउंटर", जो 1 से . तक मान लेता है ) .

विभिन्न कार्यों के साथ प्रयोगात्मक बिंदुओं का अनुमान लगाते हुए, हमें अलग-अलग मान प्राप्त होंगे, और यह स्पष्ट है कि यह योग कहां कम है - वह कार्य अधिक सटीक है।

ऐसी विधि मौजूद है और कहा जाता है कम से कम मापांक विधि. हालाँकि, व्यवहार में यह बहुत अधिक व्यापक हो गया है। कम से कम वर्ग विधि, जिसमें संभावित नकारात्मक मूल्यों को मापांक द्वारा समाप्त नहीं किया जाता है, लेकिन विचलन को चुकता करके:

, जिसके बाद प्रयासों को ऐसे फ़ंक्शन के चयन के लिए निर्देशित किया जाता है कि वर्ग विचलन का योग जितना संभव हो उतना छोटा था। दरअसल, इसलिए विधि का नाम।

और अब हम एक और महत्वपूर्ण बिंदु पर लौटते हैं: जैसा कि ऊपर उल्लेख किया गया है, चयनित फ़ंक्शन काफी सरल होना चाहिए - लेकिन ऐसे कई कार्य भी हैं: रैखिक , अतिपरवलिक , घातीय , लघुगणक , द्विघात आदि। और, ज़ाहिर है, यहाँ मैं तुरंत "गतिविधि के क्षेत्र को कम करना" चाहूंगा। अनुसंधान के लिए किस वर्ग के कार्यों का चयन करना है? आदिम लेकिन प्रभावी तकनीक:

- अंक आकर्षित करने का सबसे आसान तरीका ड्राइंग पर और उनके स्थान का विश्लेषण करें। यदि वे एक सीधी रेखा में होते हैं, तो आपको देखना चाहिए सीधी रेखा समीकरण इष्टतम मूल्यों के साथ और . दूसरे शब्दों में, कार्य ऐसे गुणांकों को खोजना है - ताकि वर्ग विचलनों का योग सबसे छोटा हो।

यदि बिंदु स्थित हैं, उदाहरण के लिए, साथ में अतिशयोक्ति, तो यह स्पष्ट है कि रैखिक फलन खराब सन्निकटन देगा। इस मामले में, हम अतिपरवलय समीकरण के लिए सबसे अधिक "अनुकूल" गुणांकों की तलाश कर रहे हैं - वे जो वर्गों का न्यूनतम योग देते हैं .

अब ध्यान दें कि दोनों ही मामलों में हम बात कर रहे हैं दो चर के कार्य, जिनके तर्क हैं खोज निर्भरता विकल्प:

और संक्षेप में, हमें एक मानक समस्या को हल करने की आवश्यकता है - खोजने के लिए दो चर के एक समारोह का न्यूनतम.

हमारे उदाहरण को याद करें: मान लीजिए कि "दुकान" बिंदु एक सीधी रेखा में स्थित हैं और उपस्थिति पर विश्वास करने का हर कारण है रैखिक निर्भरताव्यापार क्षेत्र से कारोबार। आइए ऐसे गुणांक "ए" और "बी" खोजें ताकि वर्ग विचलन का योग हो सबसे छोटा था। सब कुछ हमेशा की तरह - पहले 1 क्रम के आंशिक व्युत्पन्न. के अनुसार रैखिकता नियमआप योग आइकन के ठीक नीचे अंतर कर सकते हैं:

यदि आप इस जानकारी का उपयोग निबंध या शोध कार्य के लिए करना चाहते हैं, तो मैं स्रोतों की सूची में लिंक के लिए बहुत आभारी रहूंगा, आपको ऐसी विस्तृत गणना कहीं नहीं मिलेगी:

आइए एक मानक प्रणाली बनाएं:

हम प्रत्येक समीकरण को "दो" से कम करते हैं और, इसके अलावा, "अलग" रकम:

टिप्पणी : स्वतंत्र रूप से विश्लेषण करें कि "ए" और "बी" को योग आइकन से क्यों निकाला जा सकता है। वैसे, औपचारिक रूप से यह योग के साथ किया जा सकता है

आइए सिस्टम को "लागू" रूप में फिर से लिखें:

जिसके बाद हमारी समस्या को हल करने के लिए एल्गोरिदम तैयार करना शुरू होता है:

क्या हम बिंदुओं के निर्देशांक जानते हैं? हम जानते है। रकम क्या हम ढूंढ सकते हैं? सरलता। हम सबसे सरल रचना करते हैं दो अज्ञात के साथ दो रैखिक समीकरणों की प्रणाली("ए" और "बीएच")। हम सिस्टम को हल करते हैं, उदाहरण के लिए, क्रैमर की विधि, जिसके परिणामस्वरूप एक स्थिर बिंदु होता है। चेकिंग एक चरम के लिए पर्याप्त स्थिति, हम सत्यापित कर सकते हैं कि इस बिंदु पर फ़ंक्शन ठीक पहुँचता है न्यूनतम. सत्यापन अतिरिक्त गणनाओं से जुड़ा है और इसलिए हम इसे पर्दे के पीछे छोड़ देंगे। (यदि आवश्यक हो, लापता फ्रेम देखा जा सकता हैयहां ) . हम अंतिम निष्कर्ष निकालते हैं:

समारोह सबसे अच्छा तरीका (कम से कम किसी अन्य रैखिक कार्य की तुलना में)प्रयोगात्मक बिंदुओं को करीब लाता है . मोटे तौर पर, इसका ग्राफ इन बिंदुओं के जितना करीब हो सके गुजरता है। परंपरा में अर्थमितिपरिणामी सन्निकटन फलन को भी कहा जाता है युग्मित रैखिक समाश्रयण समीकरण .

विचाराधीन समस्या बहुत व्यावहारिक महत्व की है। हमारे उदाहरण के साथ स्थिति में, समीकरण आपको यह अनुमान लगाने की अनुमति देता है कि किस प्रकार का टर्नओवर ("यिग")बिक्री क्षेत्र के एक या दूसरे मूल्य के साथ स्टोर पर होगा ("एक्स" का एक या दूसरा अर्थ). हां, परिणामी पूर्वानुमान केवल एक पूर्वानुमान होगा, लेकिन कई मामलों में यह काफी सटीक साबित होगा।

मैं "वास्तविक" संख्याओं के साथ केवल एक समस्या का विश्लेषण करूंगा, क्योंकि इसमें कोई कठिनाइयां नहीं हैं - सभी गणनाएं 7-8 ग्रेड में स्कूली पाठ्यक्रम के स्तर पर हैं। 95 प्रतिशत मामलों में, आपको केवल एक रैखिक फ़ंक्शन खोजने के लिए कहा जाएगा, लेकिन लेख के अंत में मैं दिखाऊंगा कि इष्टतम हाइपरबोला, घातांक और कुछ अन्य कार्यों के लिए समीकरणों को खोजना अधिक कठिन नहीं है।

वास्तव में, यह वादा किए गए उपहारों को वितरित करने के लिए बनी हुई है - ताकि आप सीखें कि ऐसे उदाहरणों को न केवल सटीक रूप से हल करना है, बल्कि जल्दी से भी। हम मानक का ध्यानपूर्वक अध्ययन करते हैं:

एक कार्य

दो संकेतकों के बीच संबंध का अध्ययन करने के परिणामस्वरूप, संख्याओं के निम्नलिखित जोड़े प्राप्त हुए:

कम से कम वर्ग विधि का उपयोग करते हुए, उस रैखिक फ़ंक्शन को खोजें जो अनुभवजन्य का सबसे अच्छा अनुमान लगाता है (अनुभव)जानकारी। एक ऐसा चित्र बनाइए जिस पर कार्तीय आयताकार निर्देशांक प्रणाली में प्रायोगिक बिंदुओं को आलेखित करें और सन्निकट फलन का आलेख तैयार करें। . अनुभवजन्य और सैद्धांतिक मूल्यों के बीच वर्ग विचलन का योग ज्ञात कीजिए। पता करें कि क्या फ़ंक्शन बेहतर है (न्यूनतम वर्ग विधि के संदर्भ में)अनुमानित प्रयोगात्मक बिंदु।

ध्यान दें कि "x" मान प्राकृतिक मूल्य हैं, और इसका एक विशिष्ट अर्थपूर्ण अर्थ है, जिसके बारे में मैं थोड़ी देर बाद बात करूंगा; लेकिन वे, निश्चित रूप से, भिन्नात्मक हो सकते हैं। इसके अलावा, किसी विशेष कार्य की सामग्री के आधार पर, "X" और "G" दोनों मान पूर्ण या आंशिक रूप से नकारात्मक हो सकते हैं। खैर, हमें एक "फेसलेस" टास्क दिया गया है, और हम इसे शुरू करते हैं समाधान:

हम सिस्टम के समाधान के रूप में इष्टतम फ़ंक्शन के गुणांक पाते हैं:

अधिक कॉम्पैक्ट नोटेशन के प्रयोजनों के लिए, "काउंटर" चर को छोड़ा जा सकता है, क्योंकि यह पहले से ही स्पष्ट है कि योग 1 से .

सारणीबद्ध रूप में आवश्यक राशियों की गणना करना अधिक सुविधाजनक है:

गणना एक माइक्रोकैलकुलेटर पर की जा सकती है, लेकिन एक्सेल का उपयोग करना बहुत बेहतर है - दोनों तेज और त्रुटियों के बिना; एक छोटा वीडियो देखें:

इस प्रकार, हम निम्नलिखित प्राप्त करते हैं: व्यवस्था:

यहां आप दूसरे समीकरण को 3 और . से गुणा कर सकते हैं पहले समीकरण पद से दूसरे को पद द्वारा घटाएं. लेकिन यह भाग्य है - व्यवहार में, सिस्टम अक्सर उपहार में नहीं होते हैं, और ऐसे मामलों में यह बचाता है क्रैमर की विधि:
, इसलिए सिस्टम के पास एक अनूठा समाधान है।

चलो एक चेक करते हैं। मैं समझता हूं कि मैं नहीं करना चाहता, लेकिन गलतियों को क्यों छोड़ें जहां आप उन्हें बिल्कुल याद नहीं कर सकते? सिस्टम के प्रत्येक समीकरण के बाईं ओर पाए गए समाधान को प्रतिस्थापित करें:

संबंधित समीकरणों के सही हिस्से प्राप्त होते हैं, जिसका अर्थ है कि सिस्टम सही ढंग से हल हो गया है।

इस प्रकार, वांछित सन्निकटन फलन: - from सभी रैखिक कार्यप्रयोगात्मक डेटा इसके द्वारा सबसे अच्छा अनुमानित है।

भिन्न सीधा अपने क्षेत्र पर स्टोर के कारोबार की निर्भरता, मिली निर्भरता है उल्टा (सिद्धांत "अधिक - कम"), और यह तथ्य तुरंत नकारात्मक द्वारा प्रकट होता है कोणीय गुणांक. समारोह हमें सूचित करता है कि एक निश्चित संकेतक में 1 इकाई की वृद्धि के साथ, आश्रित संकेतक का मूल्य घट जाता है औसत 0.65 इकाइयों द्वारा। जैसा कि वे कहते हैं, एक प्रकार का अनाज की कीमत जितनी अधिक होगी, उतना ही कम बेचा जाएगा।

सन्निकटन फलन को आलेखित करने के लिए, हमें इसके दो मान मिलते हैं:

और ड्राइंग निष्पादित करें:

निर्मित रेखा कहलाती है प्रवृत्ति रेखा (अर्थात्, एक रेखीय प्रवृत्ति रेखा, अर्थात सामान्य स्थिति में, एक प्रवृत्ति आवश्यक रूप से एक सीधी रेखा नहीं होती है). हर कोई "प्रवृत्ति में होना" अभिव्यक्ति से परिचित है, और मुझे लगता है कि इस शब्द को अतिरिक्त टिप्पणियों की आवश्यकता नहीं है।

वर्ग विचलन के योग की गणना करें अनुभवजन्य और सैद्धांतिक मूल्यों के बीच। ज्यामितीय रूप से, यह "क्रिमसन" खंडों की लंबाई के वर्गों का योग है (जिनमें से दो इतने छोटे हैं कि आप उन्हें देख भी नहीं सकते).

आइए एक तालिका में गणनाओं को संक्षेप में प्रस्तुत करें:

उन्हें फिर से मैन्युअल रूप से किया जा सकता है, बस अगर मैं पहले बिंदु के लिए एक उदाहरण दूंगा:

लेकिन यह पहले से ज्ञात तरीके से करने के लिए और अधिक कुशल है:

आइए दोहराएं: परिणाम का अर्थ क्या है?से सभी रैखिक कार्यसमारोह घातांक सबसे छोटा है, अर्थात यह अपने परिवार में सबसे अच्छा सन्निकटन है। और यहाँ, वैसे, समस्या का अंतिम प्रश्न आकस्मिक नहीं है: क्या होगा यदि प्रस्तावित घातीय कार्य प्रयोगात्मक बिंदुओं को बेहतर ढंग से अनुमानित करेगा?

आइए वर्ग विचलन के संगत योग का पता लगाएं - उन्हें अलग करने के लिए, मैं उन्हें "एप्सिलॉन" अक्षर से नामित करूंगा। तकनीक बिल्कुल समान है:

और फिर से 1 बिंदु के लिए हर आग की गणना के लिए:

एक्सेल में, हम मानक फ़ंक्शन का उपयोग करते हैं ऍक्स्प (सिंटेक्स एक्सेल सहायता में पाया जा सकता है).

निष्कर्ष: , इसलिए घातांकीय फलन सीधी रेखा से भी बदतर प्रयोगात्मक बिंदुओं का अनुमान लगाता है .

लेकिन यहां यह ध्यान दिया जाना चाहिए कि "बदतर" है इसका मतलब अभी तक नहीं है, गलत क्या है। अब मैंने इस एक्सपोनेंशियल फंक्शन का एक ग्राफ बनाया - और यह पॉइंट्स के करीब भी जाता है - इतना अधिक कि एक विश्लेषणात्मक अध्ययन के बिना यह कहना मुश्किल है कि कौन सा कार्य अधिक सटीक है।

यह समाधान को पूरा करता है, और मैं तर्क के प्राकृतिक मूल्यों के प्रश्न पर लौटता हूं। विभिन्न अध्ययनों में, एक नियम के रूप में, आर्थिक या सामाजिक, महीनों, वर्षों या अन्य समान समय अंतरालों को प्राकृतिक "X" के साथ गिना जाता है। उदाहरण के लिए, निम्नलिखित समस्या पर विचार करें:

वर्ष की पहली छमाही के लिए हमारे पास स्टोर के खुदरा कारोबार पर निम्नलिखित डेटा है:

सीधी रेखा विश्लेषणात्मक संरेखण का उपयोग करते हुए, जुलाई के लिए बिक्री की मात्रा पाएं.

हां, कोई बात नहीं: हम महीनों की संख्या 1, 2, 3, 4, 5, 6 करते हैं और सामान्य एल्गोरिथम का उपयोग करते हैं, जिसके परिणामस्वरूप हमें एक समीकरण मिलता है - जब समय की बात आती है तो आमतौर पर "ते" अक्षर होता है " (हालांकि यह महत्वपूर्ण नहीं है). परिणामी समीकरण से पता चलता है कि वर्ष की पहली छमाही में, कारोबार में औसतन 27.74 सीयू की वृद्धि हुई। प्रति महीने। जुलाई के लिए पूर्वानुमान प्राप्त करें (महीना #7): यूरोपीय संघ।

और इसी तरह के कार्य - अंधेरा अंधेरा है। जो लोग चाहते हैं वे एक अतिरिक्त सेवा का उपयोग कर सकते हैं, अर्थात् my एक्सेल कैलकुलेटर (प्रदर्शन के लिए संस्करण), के जो समस्या को लगभग तुरंत हल करता है!कार्यक्रम का कार्यशील संस्करण उपलब्ध है बदले मेंया के लिए प्रतीकात्मक भुगतान.

पाठ के अंत में, कुछ अन्य प्रकार की निर्भरता को खोजने के बारे में एक संक्षिप्त जानकारी। दरअसल, बताने के लिए कुछ खास नहीं है, क्योंकि मौलिक दृष्टिकोण और समाधान एल्गोरिदम समान रहता है।

आइए मान लें कि प्रयोगात्मक बिंदुओं का स्थान हाइपरबोला जैसा दिखता है। फिर, सर्वोत्तम हाइपरबोला के गुणांकों को खोजने के लिए, आपको न्यूनतम फ़ंक्शन खोजने की आवश्यकता है - जो लोग चाहते हैं वे विस्तृत गणना कर सकते हैं और एक समान प्रणाली में आ सकते हैं:

औपचारिक तकनीकी दृष्टिकोण से, इसे "रैखिक" प्रणाली से प्राप्त किया जाता है (आइए इसे तारांकन के साथ चिह्नित करें)"x" के स्थान पर . खैर, रकम गणना करें, जिसके बाद इष्टतम गुणांक "ए" और "बी" उपलब्ध.

अगर यह मानने का हर कारण है कि अंक एक लघुगणकीय वक्र के साथ व्यवस्थित किया जाता है, फिर इष्टतम मूल्यों की खोज करने के लिए और न्यूनतम फ़ंक्शन का पता लगाने के लिए . औपचारिक रूप से, सिस्टम में (*) को इसके द्वारा प्रतिस्थापित किया जाना चाहिए:

एक्सेल में गणना करते समय, फ़ंक्शन का उपयोग करें एलएन. मैं स्वीकार करता हूं कि मेरे लिए विचाराधीन प्रत्येक मामले के लिए कैलकुलेटर बनाना मुश्किल नहीं होगा, लेकिन यह तब भी बेहतर होगा यदि आप गणनाओं को स्वयं "प्रोग्राम" करते हैं। वीडियो ट्यूटोरियल मदद करने के लिए।

घातीय निर्भरता के साथ, स्थिति थोड़ी अधिक जटिल है। मामले को रैखिक मामले में कम करने के लिए, हम फ़ंक्शन का लघुगणक लेते हैं और उपयोग करते हैं लघुगणक के गुण:

अब, प्राप्त फलन की रैखिक फलन से तुलना करते हुए, हम इस निष्कर्ष पर पहुँचते हैं कि निकाय में (*) को , और - द्वारा प्रतिस्थापित किया जाना चाहिए। सुविधा के लिए, हम निरूपित करते हैं:

कृपया ध्यान दें कि सिस्टम को और के संबंध में हल किया गया है, और इसलिए, जड़ों को खोजने के बाद, आपको गुणांक को स्वयं खोजना नहीं भूलना चाहिए।

प्रयोगात्मक बिंदुओं का अनुमान लगाने के लिए इष्टतम परवलय , पाया जाना चाहिए तीन चर के एक समारोह का न्यूनतम. मानक क्रियाएं करने के बाद, हमें निम्नलिखित "काम" मिलता है व्यवस्था:

हां, बेशक, यहां अधिक मात्रा में हैं, लेकिन आपके पसंदीदा एप्लिकेशन का उपयोग करते समय कोई कठिनाई नहीं है। और अंत में, मैं आपको बताऊंगा कि एक्सेल का उपयोग करके जल्दी से कैसे जांच करें और वांछित ट्रेंड लाइन बनाएं: स्कैटर चार्ट बनाएं, माउस के साथ किसी भी बिंदु का चयन करें और राइट क्लिक सेलेक्ट ऑप्शन "ट्रेंडलाइन जोड़ें". इसके बाद, चार्ट के प्रकार का चयन करें और टैब पर "विकल्प"विकल्प को सक्रिय करें "चार्ट पर समीकरण दिखाएं". ठीक है

हमेशा की तरह, मैं लेख को कुछ सुंदर वाक्यांशों के साथ समाप्त करना चाहता हूं, और मैंने लगभग "प्रवृत्ति में रहो!" टाइप किया। लेकिन समय के साथ उन्होंने अपना इरादा बदल दिया। और इसलिए नहीं कि यह फार्मूलाबद्ध है। मैं नहीं जानता कि कोई कैसे, लेकिन मैं प्रचारित अमेरिकी और विशेष रूप से यूरोपीय प्रवृत्ति का बिल्कुल भी पालन नहीं करना चाहता =) इसलिए, मैं चाहता हूं कि आप में से प्रत्येक अपनी लाइन से चिपके रहें!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

कम से कम वर्ग विधि सबसे आम में से एक है और इसकी वजह से सबसे विकसित है रैखिक अर्थमितीय मॉडल के मापदंडों के आकलन के लिए विधियों की सादगी और दक्षता. उसी समय, इसका उपयोग करते समय कुछ सावधानी बरतनी चाहिए, क्योंकि इसका उपयोग करके बनाए गए मॉडल अपने मापदंडों की गुणवत्ता के लिए कई आवश्यकताओं को पूरा नहीं कर सकते हैं और परिणामस्वरूप, "अच्छी तरह से" प्रक्रिया विकास के पैटर्न को प्रतिबिंबित नहीं करते हैं।

आइए हम कम से कम वर्ग विधि का उपयोग करके एक रैखिक अर्थमितीय मॉडल के मापदंडों के आकलन की प्रक्रिया पर अधिक विस्तार से विचार करें। सामान्य रूप में इस तरह के एक मॉडल को समीकरण (1.2) द्वारा दर्शाया जा सकता है:

y t = a 0 + a 1 x 1t +...+ a n x nt + ε t ।

मापदंडों का आकलन करते समय प्रारंभिक डेटा a 0 , a 1 ,..., a n आश्रित चर के मूल्यों का वेक्टर है आप= (y 1 , y 2 , ... , y T)" और स्वतंत्र चर के मानों का मैट्रिक्स

जिसमें पहला कॉलम मॉडल के गुणांक से मेल खाता है।

कम से कम वर्गों की विधि को इसका नाम मूल सिद्धांत के आधार पर मिला है कि इसके आधार पर प्राप्त पैरामीटर अनुमानों को संतुष्ट करना चाहिए: मॉडल त्रुटि के वर्गों का योग न्यूनतम होना चाहिए।

कम से कम वर्ग विधि द्वारा समस्याओं को हल करने के उदाहरण

उदाहरण 2.1.व्यापारिक उद्यम का एक नेटवर्क है जिसमें 12 स्टोर होते हैं, जिसकी गतिविधियों की जानकारी तालिका में प्रस्तुत की जाती है। 2.1.

कंपनी का प्रबंधन जानना चाहेगा कि वार्षिक कारोबार का आकार स्टोर के खुदरा स्थान पर कैसे निर्भर करता है।

तालिका 2.1

दुकान संख्या	वार्षिक कारोबार, मिलियन रूबल	व्यापार क्षेत्र, हजार एम 2
	19,76	0,24
	38,09	0,31
	40,95	0,55
	41,08	0,48
	56,29	0,78
	68,51	0,98
	75,01	0,94
	89,05	1,21
	91,13	1,29
	91,26	1,12
	99,84	1,29
	108,55	1,49

कम से कम वर्ग समाधान।आइए हम नामित करें - स्टोर का वार्षिक कारोबार, मिलियन रूबल; - वें स्टोर का विक्रय क्षेत्र, हजार मी 2।

चित्र.2.1. उदाहरण 2.1 . के लिए स्कैटरप्लॉट

चरों के बीच कार्यात्मक संबंध के रूप को निर्धारित करने के लिए और एक स्कैटरप्लॉट (चित्र। 2.1) का निर्माण करें।

स्कैटर आरेख के आधार पर, हम यह निष्कर्ष निकाल सकते हैं कि वार्षिक कारोबार बिक्री क्षेत्र पर सकारात्मक रूप से निर्भर है (यानी, y की वृद्धि के साथ वृद्धि होगी)। कार्यात्मक कनेक्शन का सबसे उपयुक्त रूप है रैखिक.

आगे की गणना के लिए जानकारी तालिका में प्रस्तुत की गई है। 2.2. कम से कम वर्ग विधि का उपयोग करके, हम रैखिक एक-कारक अर्थमितीय मॉडल के मापदंडों का अनुमान लगाते हैं

तालिका 2.2

टी	आप	x 1t	वाई टी 2	x1t2	एक्स 1टी वाई टी

	19,76	0,24	390,4576	0,0576	4,7424
	38,09	0,31	1450,8481	0,0961	11,8079
	40,95	0,55	1676,9025	0,3025	22,5225
	41,08	0,48	1687,5664	0,2304	19,7184
	56,29	0,78	3168,5641	0,6084	43,9062
	68,51	0,98	4693,6201	0,9604	67,1398
	75,01	0,94	5626,5001	0,8836	70,5094
	89,05	1,21	7929,9025	1,4641	107,7505
	91,13	1,29	8304,6769	1,6641	117,5577
	91,26	1,12	8328,3876	1,2544	102,2112
	99,84	1,29	9968,0256	1,6641	128,7936
	108,55	1,49	11783,1025	2,2201	161,7395
एस	819,52	10,68	65008,554	11,4058	858,3991
औसत	68,29	0,89

इस तरह,

इसलिए, व्यापार क्षेत्र में 1 हजार मीटर 2 की वृद्धि के साथ, अन्य चीजें समान होने पर, औसत वार्षिक कारोबार में 67.8871 मिलियन रूबल की वृद्धि होती है।

उदाहरण 2.2.उद्यम के प्रबंधन ने देखा कि वार्षिक कारोबार न केवल स्टोर के बिक्री क्षेत्र (उदाहरण 2.1 देखें) पर निर्भर करता है, बल्कि आगंतुकों की औसत संख्या पर भी निर्भर करता है। प्रासंगिक जानकारी तालिका में प्रस्तुत की गई है। 2.3.

तालिका 2.3

समाधान।निरूपित करें - प्रति दिन वें स्टोर पर आगंतुकों की औसत संख्या, हजार लोग।

चरों के बीच कार्यात्मक संबंध के रूप को निर्धारित करने के लिए और एक स्कैटरप्लॉट (चित्र। 2.2) का निर्माण करें।

स्कैटर आरेख के आधार पर, हम यह निष्कर्ष निकाल सकते हैं कि वार्षिक कारोबार सकारात्मक रूप से प्रति दिन आगंतुकों की औसत संख्या से संबंधित है (यानी, y की वृद्धि के साथ वृद्धि होगी)। कार्यात्मक निर्भरता का रूप रैखिक है।

चावल। 2.2. स्कैटरप्लॉट उदाहरण के लिए 2.2

तालिका 2.4

टी	एक्स 2टी	एक्स 2टी 2	वाईटी एक्स 2टी	x 1t x 2t

	8,25	68,0625	163,02	1,98
	10,24	104,8575	390,0416	3,1744
	9,31	86,6761	381,2445	5,1205
	11,01	121,2201	452,2908	5,2848
	8,54	72,9316	480,7166	6,6612
	7,51	56,4001	514,5101	7,3598
	12,36	152,7696	927,1236	11,6184
	10,81	116,8561	962,6305	13,0801
	9,89	97,8121	901,2757	12,7581
	13,72	188,2384	1252,0872	15,3664
	12,27	150,5529	1225,0368	15,8283
	13,92	193,7664	1511,016	20,7408
एस	127,83	1410,44	9160,9934	118,9728
औसत	10,65

सामान्य तौर पर, दो-कारक अर्थमितीय मॉडल के मापदंडों को निर्धारित करना आवश्यक है

y t \u003d a 0 + a 1 x 1t + a 2 x 2t + t

आगे की गणना के लिए आवश्यक जानकारी तालिका में प्रस्तुत की गई है। 2.4.

आइए हम कम से कम वर्ग विधि का उपयोग करके एक रैखिक दो-कारक अर्थमितीय मॉडल के मापदंडों का अनुमान लगाएं।

इस तरह,

गुणांक का मूल्यांकन = 61.6583 से पता चलता है कि, अन्य सभी चीजें समान होने पर, बिक्री क्षेत्र में 1 हजार मीटर 2 की वृद्धि के साथ, वार्षिक कारोबार में औसतन 61.6583 मिलियन रूबल की वृद्धि होगी।

गुणांक = 2.2748 का अनुमान दर्शाता है कि, प्रति 1 हजार लोगों पर आगंतुकों की औसत संख्या में वृद्धि के साथ, अन्य चीजें समान हैं। प्रति दिन, वार्षिक कारोबार में औसतन 2.2748 मिलियन रूबल की वृद्धि होगी।

उदाहरण 2.3।तालिका में प्रस्तुत जानकारी का उपयोग करना। 2.2 और 2.4, एकल-कारक अर्थमितीय मॉडल के पैरामीटर का अनुमान लगाएं

-वें स्टोर के वार्षिक कारोबार का केंद्रित मूल्य कहां है, मिलियन रूबल; - टी-वें स्टोर पर आने वालों की औसत दैनिक संख्या का केंद्रित मूल्य, हजार लोग। (उदाहरण 2.1-2.2 देखें)।

समाधान।गणना के लिए आवश्यक अतिरिक्त जानकारी तालिका में प्रस्तुत की गई है। 2.5.

तालिका 2.5



	-48,53	-2,40	5,7720	116,6013
	-30,20	-0,41	0,1702	12,4589
	-27,34	-1,34	1,8023	36,7084
	-27,21	0,36	0,1278	-9,7288
	-12,00	-2,11	4,4627	25,3570
	0,22	-3,14	9,8753	-0,6809
	6,72	1,71	2,9156	11,4687
	20,76	0,16	0,0348	3,2992
	22,84	-0,76	0,5814	-17,413
	22,97	3,07	9,4096	70,4503
	31,55	1,62	2,6163	51,0267
	40,26	3,27	10,6766	131,5387
जोड़			48,4344	431,0566

सूत्र (2.35) का उपयोग करते हुए, हम प्राप्त करते हैं

इस तरह,

http://www.cleverstudents.ru/articles/mnk.html

उदाहरण।

चर के मूल्यों पर प्रायोगिक डेटा एक्सतथा परतालिका में दिए गए हैं।

उनके संरेखण के परिणामस्वरूप, फ़ंक्शन

का उपयोग करते हुए कम से कम वर्ग विधि, इन आंकड़ों को एक रैखिक निर्भरता के साथ अनुमानित करें वाई = कुल्हाड़ी + बी(पैरामीटर खोजें एकतथा बी) पता लगाएँ कि दोनों में से कौन सी रेखा बेहतर है (न्यूनतम वर्ग विधि के अर्थ में) प्रयोगात्मक डेटा को संरेखित करती है। एक चित्र बनाओ।

समाधान।

हमारे उदाहरण में एन = 5. हम आवश्यक गुणांक के सूत्रों में शामिल राशियों की गणना की सुविधा के लिए तालिका में भरते हैं।

तालिका की चौथी पंक्ति के मान दूसरी पंक्ति के मानों को प्रत्येक संख्या के लिए तीसरी पंक्ति के मानों से गुणा करके प्राप्त किए जाते हैं मैं.

तालिका की पाँचवीं पंक्ति के मान प्रत्येक संख्या के लिए दूसरी पंक्ति के मानों को चुकता करके प्राप्त किए जाते हैं मैं.

तालिका के अंतिम स्तंभ के मान पंक्तियों के मानों का योग हैं।

हम गुणांक ज्ञात करने के लिए अल्पतम वर्ग विधि के सूत्रों का उपयोग करते हैं एकतथा बी. हम उनमें तालिका के अंतिम कॉलम से संबंधित मानों को प्रतिस्थापित करते हैं:

फलस्वरूप, वाई=0.165x+2.184वांछित सन्निकटन सीधी रेखा है।

यह पता लगाना बाकी है कि कौन सी पंक्तियाँ वाई=0.165x+2.184या मूल डेटा का बेहतर अनुमान लगाता है, यानी कम से कम वर्ग विधि का उपयोग करके अनुमान लगाने के लिए।

सबूत।

ताकि जब मिले एकतथा बीफ़ंक्शन सबसे छोटा मान लेता है, यह आवश्यक है कि इस बिंदु पर फ़ंक्शन के लिए दूसरे क्रम के अंतर के द्विघात रूप का मैट्रिक्स सकारात्मक निश्चित था। आइए इसे दिखाते हैं।

दूसरे क्रम के अंतर का रूप है:

वह है

इसलिए, द्विघात रूप के मैट्रिक्स का रूप है

और तत्वों का मान निर्भर नहीं करता एकतथा बी.

आइए हम दिखाते हैं कि मैट्रिक्स सकारात्मक निश्चित है। इसके लिए आवश्यक है कि कोण अवयस्क सकारात्मक हों।

पहले क्रम का कोणीय नाबालिग . असमानता सख्त है, क्योंकि अंक

ट्यूटोरियल

परिचय

मैं एक कंप्यूटर प्रोग्रामर हूं. मैंने अपने करियर में सबसे बड़ी छलांग लगाई जब मैंने यह कहना सीखा: "मुझे कुछ भी समझ में नहीं आता!"अब मुझे विज्ञान के प्रकाशक को यह बताने में कोई शर्म नहीं है कि वह मुझे व्याख्यान दे रहा है, कि मुझे समझ नहीं आ रहा है कि वह, प्रकाशमान, मुझसे क्या बात कर रहा है। और यह बहुत मुश्किल है। हां, यह स्वीकार करना कठिन और शर्मनाक है कि आप नहीं जानते। कौन यह स्वीकार करना पसंद करता है कि वह किसी चीज की मूल बातें नहीं जानता है। अपने पेशे के कारण, मुझे बड़ी संख्या में प्रस्तुतियों और व्याख्यानों में भाग लेना पड़ता है, जहाँ मैं स्वीकार करता हूँ, अधिकांश मामलों में मुझे नींद आती है, क्योंकि मुझे कुछ भी समझ में नहीं आता है। और मुझे समझ में नहीं आता क्योंकि विज्ञान की वर्तमान स्थिति की बड़ी समस्या गणित में है। यह मानता है कि सभी छात्र गणित के सभी क्षेत्रों से परिचित हैं (जो कि बेतुका है)। यह स्वीकार करने के लिए कि आप नहीं जानते कि व्युत्पन्न क्या है (कि यह थोड़ी देर बाद है) शर्म की बात है।

लेकिन मैंने यह कहना सीख लिया है कि मैं नहीं जानता कि गुणन क्या है। हाँ, मैं नहीं जानता कि लाई बीजगणित के ऊपर उप-बीजगणित क्या है। हाँ, मुझे नहीं पता कि जीवन में द्विघात समीकरणों की आवश्यकता क्यों है। वैसे, यदि आप सुनिश्चित हैं कि आप जानते हैं, तो हमारे पास बात करने के लिए कुछ है! गणित चालों की एक श्रृंखला है। गणितज्ञ जनता को भ्रमित करने और डराने की कोशिश करते हैं; जहां कोई भ्रम नहीं, कोई प्रतिष्ठा नहीं, कोई अधिकार नहीं। हां, सबसे अमूर्त भाषा में बोलना प्रतिष्ठित है, जो अपने आप में पूरी तरह बकवास है।

क्या आप जानते हैं कि व्युत्पन्न क्या है? सबसे अधिक संभावना है कि आप मुझे अंतर संबंध की सीमा के बारे में बताएंगे। सेंट पीटर्सबर्ग स्टेट यूनिवर्सिटी में गणित के पहले वर्ष में, विक्टर पेट्रोविच खविन मे परिभाषितबिंदु पर फ़ंक्शन के टेलर श्रृंखला के पहले पद के गुणांक के रूप में व्युत्पन्न (यह डेरिवेटिव के बिना टेलर श्रृंखला निर्धारित करने के लिए एक अलग जिम्नास्टिक था)। मैं इस परिभाषा पर लंबे समय तक हंसता रहा, जब तक कि मैं अंत में समझ नहीं पाया कि यह किस बारे में है। व्युत्पन्न केवल एक माप से ज्यादा कुछ नहीं है कि हम कितने फ़ंक्शन को अलग कर रहे हैं, फ़ंक्शन y=x, y=x^2, y=x^3 के समान है।

मुझे अब उन छात्रों को व्याख्यान देने का सम्मान मिला है जो डरअंक शास्त्र। यदि आप गणित से डरते हैं - हम रास्ते में हैं। जैसे ही आप कुछ पाठ पढ़ने की कोशिश करते हैं और आपको लगता है कि यह अत्यधिक जटिल है, तो जान लें कि यह बुरी तरह लिखा गया है। मेरा तर्क है कि गणित का एक भी क्षेत्र ऐसा नहीं है जिसे सटीकता खोए बिना "उंगलियों पर" के बारे में बात नहीं की जा सकती है।

निकट भविष्य के लिए चुनौती: मैंने अपने छात्रों को यह समझने का निर्देश दिया कि रैखिक-द्विघात नियंत्रक क्या है। शरमाओ मत, अपने जीवन के तीन मिनट बर्बाद करो, लिंक का पालन करें। अगर आपको कुछ समझ नहीं आ रहा है, तो हम रास्ते में हैं। मुझे (पेशेवर गणितज्ञ-प्रोग्रामर) भी कुछ समझ नहीं आया। और मैं आपको विश्वास दिलाता हूं, इसे "उंगलियों पर" सुलझाया जा सकता है। फिलहाल मैं नहीं जानता कि यह क्या है, लेकिन मैं आपको विश्वास दिलाता हूं कि हम इसका पता लगाने में सक्षम होंगे।

इसलिए, पहला व्याख्यान जो मैं अपने छात्रों को देने जा रहा हूं, जब वे डरावने शब्दों के साथ मेरे पास दौड़ते हैं कि एक रैखिक-द्विघात नियंत्रक एक भयानक बग है जिसे आप अपने जीवन में कभी भी मास्टर नहीं करेंगे कम से कम वर्ग विधियां. क्या आप रैखिक समीकरणों को हल कर सकते हैं? यदि आप इस पाठ को पढ़ रहे हैं, तो शायद नहीं।

इसलिए, दो बिंदुओं (x0, y0), (x1, y1), उदाहरण के लिए, (1,1) और (3,2) दिए गए, इन दो बिंदुओं से गुजरने वाली एक सीधी रेखा के समीकरण को खोजने का कार्य है:

चित्रण

इस सीधी रेखा में निम्न जैसा समीकरण होना चाहिए:

यहाँ अल्फा और बीटा हमारे लिए अज्ञात हैं, लेकिन इस रेखा के दो बिंदु ज्ञात हैं:

आप इस समीकरण को मैट्रिक्स रूप में लिख सकते हैं:

यहां हमें एक गेय विषयांतर करना चाहिए: मैट्रिक्स क्या है? एक मैट्रिक्स एक द्वि-आयामी सरणी के अलावा और कुछ नहीं है। यह डेटा स्टोर करने का एक तरीका है, इसमें और कोई वैल्यू नहीं दी जानी चाहिए। यह हम पर निर्भर करता है कि किसी निश्चित मैट्रिक्स की व्याख्या कैसे की जाए। समय-समय पर, मैं इसे एक रैखिक मानचित्रण के रूप में, समय-समय पर द्विघात रूप के रूप में और कभी-कभी बस वैक्टर के एक सेट के रूप में व्याख्या करूंगा। यह सब संदर्भ में स्पष्ट किया जाएगा।

आइए विशिष्ट मैट्रिक्स को उनके प्रतीकात्मक प्रतिनिधित्व से बदलें:

तब (अल्फा, बीटा) आसानी से पाया जा सकता है:

अधिक विशेष रूप से हमारे पिछले डेटा के लिए:

जो बिंदुओं (1,1) और (3,2) से गुजरने वाली एक सीधी रेखा के निम्नलिखित समीकरण की ओर ले जाता है:

ठीक है, यहाँ सब कुछ स्पष्ट है। और आइए से गुजरने वाली एक सीधी रेखा का समीकरण ज्ञात करें तीनअंक: (x0,y0), (x1,y1) और (x2,y2):

ओह-ओह-ओह, लेकिन हमारे पास दो अज्ञात के लिए तीन समीकरण हैं! मानक गणितज्ञ कहेगा कि कोई हल नहीं है। प्रोग्रामर क्या कहेगा? और वह पहले समीकरणों की पिछली प्रणाली को निम्नलिखित रूप में फिर से लिखेंगे:

हमारे मामले में, सदिश i, j, b त्रि-आयामी हैं, इसलिए, (सामान्य स्थिति में) इस प्रणाली का कोई हल नहीं है। कोई भी सदिश (alpha\*i + beta\*j) सदिशों (i, j) द्वारा फैले हुए तल में होता है। यदि b इस तल से संबंधित नहीं है, तो कोई हल नहीं है (समीकरण में समानता प्राप्त नहीं की जा सकती)। क्या करें? आइए एक समझौता देखें। आइए द्वारा निरूपित करें ई (अल्फा, बीटा)हमने वास्तव में समानता कैसे हासिल नहीं की:

और हम इस त्रुटि को कम करने का प्रयास करेंगे:

एक वर्ग क्यों?

हम न केवल न्यूनतम मानदंड की तलाश कर रहे हैं, बल्कि मानदंड के न्यूनतम वर्ग की भी तलाश कर रहे हैं। क्यों? न्यूनतम बिंदु स्वयं मेल खाता है, और वर्ग एक सुचारू कार्य देता है (तर्कों का एक द्विघात कार्य (अल्फा, बीटा)), जबकि केवल लंबाई एक शंकु के रूप में एक फ़ंक्शन देती है, जो न्यूनतम बिंदु पर गैर-भिन्न है। भाई स्क्वायर अधिक सुविधाजनक है।

जाहिर है, त्रुटि कम हो जाती है जब वेक्टर इसदिशों द्वारा फैलाए गए समतल के लिए ओर्थोगोनल मैंतथा जे.

चित्रण

दूसरे शब्दों में: हम एक ऐसी रेखा की तलाश कर रहे हैं, जिसमें सभी बिंदुओं से इस रेखा तक की दूरी की चुकता लंबाई का योग न्यूनतम हो:

अद्यतन: यहां मेरे पास एक जंब है, रेखा की दूरी को लंबवत रूप से मापा जाना चाहिए, न कि ऑर्थोग्राफिक प्रोजेक्शन। यह टिप्पणीकार सही है।

चित्रण

पूरी तरह से अलग शब्दों में (ध्यान से, खराब औपचारिक रूप से, लेकिन यह उंगलियों पर स्पष्ट होना चाहिए): हम सभी जोड़ी बिंदुओं के बीच सभी संभावित रेखाएं लेते हैं और सभी के बीच औसत रेखा की तलाश करते हैं:

चित्रण

उंगलियों पर एक और स्पष्टीकरण: हम सभी डेटा बिंदुओं (यहां हमारे पास तीन हैं) और उस रेखा के बीच एक वसंत संलग्न करते हैं जिसे हम ढूंढ रहे हैं, और संतुलन स्थिति की रेखा ठीक वही है जिसे हम ढूंढ रहे हैं।

द्विघात रूप न्यूनतम

तो, वेक्टर दिया गया बीऔर मैट्रिक्स के कॉलम-वैक्टर द्वारा फैला हुआ विमान ए(इस मामले में (x0,x1,x2) और (1,1,1)), हम एक वेक्टर की तलाश कर रहे हैं इन्यूनतम वर्ग लंबाई के साथ। जाहिर है, न्यूनतम केवल वेक्टर के लिए प्राप्त करने योग्य है इ, मैट्रिक्स के कॉलम-वैक्टर द्वारा फैले विमान के लिए ऑर्थोगोनल ए:

दूसरे शब्दों में, हम एक सदिश x=(alpha, beta) की तलाश कर रहे हैं जैसे:

मैं आपको याद दिलाता हूं कि यह वेक्टर x=(alpha, beta) द्विघात फलन का न्यूनतम है ||e(alpha, beta)||^2:

यहां यह याद रखना उपयोगी है कि मैट्रिक्स की व्याख्या द्विघात रूप के साथ-साथ की जा सकती है, उदाहरण के लिए, पहचान मैट्रिक्स ((1,0),(0,1)) को x^2 + y के एक फ़ंक्शन के रूप में व्याख्या किया जा सकता है ^2:

द्विघात रूप

यह सभी जिम्नास्टिक रैखिक प्रतिगमन के रूप में जाना जाता है।

डिरिचलेट सीमा शर्त के साथ लाप्लास समीकरण

अब सबसे सरल वास्तविक समस्या: एक निश्चित त्रिकोणीय सतह है, इसे चिकना करना आवश्यक है। उदाहरण के लिए, आइए मेरा चेहरा मॉडल लोड करें:

मूल प्रतिबद्धता उपलब्ध है। बाहरी निर्भरता को कम करने के लिए, मैंने अपने सॉफ़्टवेयर रेंडरर का कोड लिया, जो पहले से ही हैब्रे पर है। रैखिक प्रणाली को हल करने के लिए, मैं ओपनएनएल का उपयोग करता हूं, यह एक महान सॉल्वर है, लेकिन इसे स्थापित करना बहुत मुश्किल है: आपको दो फाइलों (.h + .c) को अपने प्रोजेक्ट फ़ोल्डर में कॉपी करने की आवश्यकता है। सभी चौरसाई निम्नलिखित कोड द्वारा किया जाता है:

के लिए (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; iऔर चेहरा = चेहरे [i]; के लिए (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

X, Y और Z निर्देशांक वियोज्य हैं, मैं उन्हें अलग से चिकना करता हूं। यही है, मैं रैखिक समीकरणों की तीन प्रणालियों को हल करता हूं, जिनमें से प्रत्येक में समान संख्या में चर होते हैं जैसे कि मेरे मॉडल में शिखर की संख्या। मैट्रिक्स ए की पहली एन पंक्तियों में प्रति पंक्ति केवल एक 1 है, और वेक्टर बी की पहली एन पंक्तियों में मूल मॉडल निर्देशांक हैं। यही है, मैं नई शीर्ष स्थिति और पुरानी शीर्ष स्थिति के बीच वसंत-टाई करता हूं - नए लोगों को पुराने से बहुत दूर नहीं होना चाहिए।

मैट्रिक्स ए की सभी बाद की पंक्तियों (faces.size()*3 = ग्रिड में सभी त्रिकोणों के किनारों की संख्या) में 1 की एक घटना और -1 की एक घटना होती है, जबकि वेक्टर बी में शून्य घटक विपरीत होते हैं। इसका मतलब है कि मैंने अपने त्रिकोणीय जाल के प्रत्येक किनारे पर एक वसंत लगाया: सभी किनारों को उनके शुरुआती और अंत बिंदुओं के समान शीर्ष प्राप्त करने का प्रयास किया गया।

एक बार फिर: सभी कोने चर हैं, और वे अपनी मूल स्थिति से दूर नहीं जा सकते हैं, लेकिन साथ ही वे एक दूसरे के समान बनने की कोशिश करते हैं।

यहाँ परिणाम है:

सब कुछ ठीक हो जाएगा, मॉडल वास्तव में चिकना है, लेकिन यह अपने मूल किनारे से दूर चला गया। आइए कोड को थोड़ा बदलें:

के लिए (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

हमारे मैट्रिक्स ए में, किनारे पर स्थित कोने के लिए, मैं श्रेणी से एक पंक्ति नहीं जोड़ता v_i = verts[i][d], लेकिन 1000*v_i = 1000*verts[i][d]। यह क्या बदलता है? और यह त्रुटि के हमारे द्विघात रूप को बदल देता है। अब किनारे पर ऊपर से एक भी विचलन पहले की तरह एक इकाई नहीं, बल्कि 1000 * 1000 इकाइयों का खर्च आएगा। यही है, हमने चरम शिखर पर एक मजबूत वसंत लटका दिया, समाधान दूसरों को और अधिक मजबूती से फैलाना पसंद करता है। यहाँ परिणाम है:

आइए शिखरों के बीच स्प्रिंग्स की ताकत को दोगुना करें:
एनएल गुणांक (चेहरा [जे], 2); एनएल गुणांक (चेहरा [(जे + 1)% 3], -2);

यह तर्कसंगत है कि सतह चिकनी हो गई है:

और अब सौ गुना मजबूत:

यह क्या है? कल्पना कीजिए कि हमने एक तार के छल्ले को साबुन के पानी में डुबोया है। नतीजतन, परिणामी साबुन फिल्म कम से कम वक्रता रखने की कोशिश करेगी, उसी सीमा को छूते हुए - हमारे तार की अंगूठी। ठीक यही हमें सीमा तय करने और अंदर एक चिकनी सतह की मांग करने से मिला है। बधाई हो, हमने हाल ही में डिरिचलेट सीमा शर्तों के साथ लाप्लास समीकरण को हल किया है। ठीक लगता है? लेकिन वास्तव में, हल करने के लिए रैखिक समीकरणों की सिर्फ एक प्रणाली।

पॉइसन समीकरण

चलिए एक और अच्छा नाम लेते हैं।

मान लें कि मेरे पास इस तरह की एक छवि है:

सब अच्छे हैं, लेकिन मुझे कुर्सी पसंद नहीं है।

मैंने चित्र को आधा में काट दिया:

और मैं अपने हाथों से एक कुर्सी चुनूंगा:

फिर मैं तस्वीर के बाईं ओर मुखौटा में सफेद सब कुछ खींचूंगा, और साथ ही मैं पूरी तस्वीर में कहूंगा कि दो पड़ोसी पिक्सल के बीच का अंतर दो पड़ोसी पिक्सल के बीच के अंतर के बराबर होना चाहिए सही छवि:

के लिए (int i=0; i

यहाँ परिणाम है:

कोड और चित्र उपलब्ध हैं

कम से कम वर्ग विधि (ओएलएस, इंजी। साधारण कम वर्ग, ओएलएस)- वांछित चर से कुछ कार्यों के वर्ग विचलन के योग को कम करने के आधार पर विभिन्न समस्याओं को हल करने के लिए उपयोग की जाने वाली गणितीय विधि। इसका उपयोग समीकरणों की अतिनिर्धारित प्रणालियों को "हल" करने के लिए किया जा सकता है (जब समीकरणों की संख्या अज्ञात की संख्या से अधिक हो जाती है), सामान्य (अतिनिर्धारित नहीं) समीकरणों के गैर-रेखीय सिस्टम के मामले में समाधान खोजने के लिए, बिंदु मानों को अनुमानित करने के लिए। किसी समारोह का। ओएलएस नमूना डेटा से प्रतिगमन मॉडल के अज्ञात मापदंडों का अनुमान लगाने के लिए प्रतिगमन विश्लेषण के बुनियादी तरीकों में से एक है।

विश्वकोश YouTube

1 / 5

कम से कम वर्ग विधि। विषय

Mitin I. V. - भौतिक के परिणामों को संसाधित करना। प्रयोग - कम से कम वर्ग विधि (व्याख्यान 4)

✪ कम से कम वर्ग, पाठ 1/2। रैखिक प्रकार्य

अर्थमिति। व्याख्यान 5. कम से कम वर्ग विधि

कम से कम वर्ग विधि। जवाब

उपशीर्षक

कहानी

XIX सदी की शुरुआत तक। वैज्ञानिकों के पास समीकरणों की एक प्रणाली को हल करने के लिए कुछ नियम नहीं थे जिसमें अज्ञात की संख्या समीकरणों की संख्या से कम हो; उस समय तक, समीकरणों के प्रकार और कैलकुलेटर की सरलता के आधार पर, विशेष विधियों का उपयोग किया जाता था, और इसलिए एक ही अवलोकन डेटा से शुरू होने वाले विभिन्न कैलकुलेटर अलग-अलग निष्कर्ष पर आते थे। गॉस (1795) को विधि के पहले आवेदन का श्रेय दिया जाता है, और लीजेंड्रे (1805) ने स्वतंत्र रूप से इसे अपने आधुनिक नाम (fr। मेथोड डेस मोइन्ड्रेस क्वारेस) . लाप्लास ने इस विधि को प्रायिकता के सिद्धांत से जोड़ा और अमेरिकी गणितज्ञ एड्रेन (1808) ने इसके संभाव्य अनुप्रयोगों पर विचार किया। Encke, Bessel, Hansen और अन्य द्वारा आगे के शोध द्वारा विधि व्यापक और बेहतर है।

कम से कम वर्गों की विधि का सार

होने देना x (\displaystyle x)- किट n (\displaystyle n)अज्ञात चर (पैरामीटर), एफ मैं (एक्स) (\displaystyle f_(i)(x)), , एम > एन (\displaystyle एम>एन)- चर के इस सेट से कार्यों का सेट। समस्या ऐसे मूल्यों को चुनने की है x (\displaystyle x)ताकि इन कार्यों के मूल्य कुछ मूल्यों के जितना करीब हो सके y मैं (\displaystyle y_(i)). संक्षेप में, हम समीकरणों की अतिनिर्धारित प्रणाली के "समाधान" के बारे में बात कर रहे हैं f i (x) = y i (\displaystyle f_(i)(x)=y_(i)), i = 1 ,… , m (\displaystyle i=1,\ldots ,m)संकेतित अर्थ में, सिस्टम के बाएँ और दाएँ भागों की अधिकतम निकटता। एलएसएम का सार "निकटता के माप" के रूप में बाएं और दाएं भागों के वर्ग विचलन के योग को चुनना है | एफ मैं (एक्स) - वाई मैं | (\displaystyle |f_(i)(x)-y_(i)|). इस प्रकार, एलएसएम का सार निम्नानुसार व्यक्त किया जा सकता है:

∑ i e i 2 = ∑ i (y i - f i (x)) 2 → min x (\displaystyle \sum _(i)e_(i)^(2)=\sum _(i)(y_(i)-f_( i)(x))^(2)\rightarrow \min _(x)).

यदि समीकरणों की प्रणाली में एक समाधान है, तो वर्गों का न्यूनतम योग शून्य के बराबर होगा और समीकरणों की प्रणाली के सटीक समाधान विश्लेषणात्मक रूप से या, उदाहरण के लिए, विभिन्न संख्यात्मक अनुकूलन विधियों द्वारा पाए जा सकते हैं। यदि प्रणाली अतिनिर्धारित है, अर्थात्, कम से कम, स्वतंत्र समीकरणों की संख्या अज्ञात चर की संख्या से अधिक है, तो सिस्टम का सटीक समाधान नहीं होता है और कम से कम वर्ग विधि हमें कुछ "इष्टतम" वेक्टर खोजने की अनुमति देती है x (\displaystyle x)वैक्टर की अधिकतम निकटता के अर्थ में y (\displaystyle y)तथा f (x) (\displaystyle f(x))या विचलन वेक्टर की अधिकतम निकटता ई (\ डिस्प्लेस्टाइल ई)शून्य से (निकटता को यूक्लिडियन दूरी के अर्थ में समझा जाता है)।

उदाहरण - रैखिक समीकरणों का निकाय

विशेष रूप से, कम से कम वर्ग विधि का उपयोग रैखिक समीकरणों की प्रणाली को "हल" करने के लिए किया जा सकता है

A x = b (\displaystyle Ax=b),

कहाँ पे ए (\ डिस्प्लेस्टाइल ए)आयताकार आकार मैट्रिक्स m × n , m > n (\displaystyle m\times n,m>n)(अर्थात मैट्रिक्स A की पंक्तियों की संख्या आवश्यक चरों की संख्या से अधिक है)।

समीकरणों की ऐसी प्रणाली का आमतौर पर कोई हल नहीं होता है। इसलिए, इस प्रणाली को केवल ऐसे वेक्टर को चुनने के अर्थ में "हल" किया जा सकता है x (\displaystyle x)वैक्टर के बीच "दूरी" को कम करने के लिए एक एक्स (\displaystyle कुल्हाड़ी)तथा बी (\ डिस्प्लेस्टाइल बी). ऐसा करने के लिए, आप सिस्टम के समीकरणों के बाएँ और दाएँ भागों के वर्ग अंतरों के योग को न्यूनतम करने के लिए मानदंड लागू कर सकते हैं, अर्थात् (A x - b) T (A x - b) → मिनट (\displaystyle (Ax-b)^(T)(Ax-b)\rightarrow \min ). यह दिखाना आसान है कि इस न्यूनीकरण समस्या का समाधान समीकरणों की निम्नलिखित प्रणाली के समाधान की ओर ले जाता है

ए टी ए एक्स = ए टी बी ⇒ एक्स = (ए टी ए) - 1 ए टी बी (\displaystyle A^(T)Ax=A^(T)b\Rightarrow x=(A^(T)A)^(-1)A^ (टी)बी).

प्रतिगमन विश्लेषण में OLS (डेटा सन्निकटन)

उसको रहनो दो n (\displaystyle n)कुछ चर के मान y (\displaystyle y)(यह टिप्पणियों, प्रयोगों आदि के परिणाम हो सकते हैं) और संबंधित चर x (\displaystyle x). के बीच संबंध बनाने की चुनौती है y (\displaystyle y)तथा x (\displaystyle x)कुछ अज्ञात पैरामीटर तक ज्ञात कुछ फ़ंक्शन द्वारा अनुमानित बी (\ डिस्प्लेस्टाइल बी), अर्थात, वास्तव में मापदंडों के सर्वोत्तम मूल्यों का पता लगाएं बी (\ डिस्प्लेस्टाइल बी), मूल्यों का अधिकतम अनुमान लगाना f (x , b) (\displaystyle f(x,b))वास्तविक मूल्यों के लिए y (\displaystyle y). वास्तव में, यह समीकरणों की एक अतिनिर्धारित प्रणाली के "समाधान" के मामले में कम हो जाता है बी (\ डिस्प्लेस्टाइल बी):

F (x t , b) = y t , t = 1 ,… , n (\displaystyle f(x_(t),b)=y_(t),t=1,\ldots ,n).

प्रतिगमन विश्लेषण में, और विशेष रूप से अर्थमिति में, चर के बीच संबंध के संभाव्य मॉडल का उपयोग किया जाता है।

वाई टी = एफ (एक्स टी, बी) + ε टी (\displaystyle y_(t)=f(x_(t),b)+\varepsilon _(t)),

कहाँ पे टी (\displaystyle \varepsilon _(t))- तथाकथित यादृच्छिक त्रुटियांमॉडल।

तदनुसार, प्रेक्षित मानों का विचलन y (\displaystyle y)मॉडल से f (x , b) (\displaystyle f(x,b))पहले से ही मॉडल में ही माना जाता है। एलएसएम (साधारण, शास्त्रीय) का सार ऐसे मापदंडों को खोजना है बी (\ डिस्प्लेस्टाइल बी), जिस पर वर्ग विचलन का योग (त्रुटियों, प्रतिगमन मॉडल के लिए उन्हें अक्सर प्रतिगमन अवशिष्ट कहा जाता है) ई टी (\displaystyle ई_(टी))न्यूनतम होगा:

b ^ O L S = arg ⁡ min b R S S (b) (\displaystyle (\hat (b))_(OLS)=\arg \min _(b)RSS(b)),

कहाँ पे आर एस एस (\displaystyle आरएसएस)- अंग्रेज़ी। वर्गों के अवशिष्ट योग को इस प्रकार परिभाषित किया गया है:

आर एस एस (बी) = ई टी ई = ∑ टी = 1 एन ई टी 2 = ∑ टी = 1 एन (वाई टी - एफ (एक्स टी, बी)) 2 (\displaystyle आरएसएस(बी)=ई^(टी)ई=\sum _ (t=1)^(n)e_(t)^(2)=\sum _(t=1)^(n)(y_(t)-f(x_(t),b))^(2) ).

सामान्य स्थिति में, इस समस्या को अनुकूलन (न्यूनतमीकरण) के संख्यात्मक तरीकों से हल किया जा सकता है। इस मामले में, कोई बोलता है अरेखीय कम से कम वर्ग(एनएलएस या एनएलएलएस - इंजी। गैर-रैखिक कम से कम वर्ग)। कई मामलों में, एक विश्लेषणात्मक समाधान प्राप्त किया जा सकता है। न्यूनीकरण समस्या को हल करने के लिए, फ़ंक्शन के स्थिर बिंदुओं को खोजना आवश्यक है आर एस एस (बी) (\displaystyle आरएसएस(बी)), अज्ञात मापदंडों के संबंध में इसे अलग करना बी (\ डिस्प्लेस्टाइल बी), व्युत्पन्न को शून्य के बराबर करना और समीकरणों की परिणामी प्रणाली को हल करना:

t = 1 n (y t - f (x t , b)) ∂ f (x t , b) b = 0 (\displaystyle \sum _(t=1)^(n)(y_(t)-f(x_) (टी),बी))(\frac (\आंशिक f(x_(t),b))(\partial b))=0).

रैखिक (प्रतिगमन) के मामले में एलएसएम

प्रतिगमन निर्भरता को रैखिक होने दें:

y t = ∑ j = 1 k b j x t j + ε = x t T b + t (\displaystyle y_(t)=\sum _(j=1)^(k)b_(j)x_(tj)+\varepsilon =x_( t)^(T)b+\varepsilon _(t)).

होने देना आपचर के प्रेक्षणों का स्तंभ वेक्टर समझाया जा रहा है, और एक्स (\डिस्प्लेस्टाइल एक्स)- ये है (n × k) (\displaystyle ((n\times k)))- कारकों की टिप्पणियों का मैट्रिक्स (मैट्रिक्स की पंक्तियाँ - किसी दिए गए अवलोकन में कारक मूल्यों के वैक्टर, स्तंभों द्वारा - सभी टिप्पणियों में दिए गए कारक के मूल्यों के वेक्टर)। रैखिक मॉडल के मैट्रिक्स-प्रतिनिधित्व का रूप है:

y = Xb + (\displaystyle y=Xb+\varepsilon ).

फिर समझाया गया चर के अनुमानों का वेक्टर और प्रतिगमन अवशिष्ट के वेक्टर के बराबर होगा

y ^ = X b , e = y - y ^ = y - X b (\displaystyle (\hat (y))=Xb,\quad e=y-(\hat (y))=y-Xb).

तदनुसार, प्रतिगमन अवशेषों के वर्गों का योग बराबर होगा

आर एस एस = ई टी ई = (वाई - एक्स बी) टी (वाई - एक्स बी) (\displaystyle आरएसएस=ई^(टी)ई=(y-Xb)^(T)(y-Xb)).

पैरामीटर वेक्टर के संबंध में इस फ़ंक्शन को अलग करना बी (\ डिस्प्लेस्टाइल बी)और डेरिवेटिव को शून्य के बराबर करते हुए, हम समीकरणों की एक प्रणाली प्राप्त करते हैं (मैट्रिक्स रूप में):

(X T X) b = X T y (\displaystyle (X^(T)X)b=X^(T)y).

गूढ़ मैट्रिक्स रूप में, समीकरणों की यह प्रणाली इस तरह दिखती है:

(∑ x t 1 2 x t 1 x t 2 x t 1 x t 3 … x t 1 x t k x t 2 x t 1 x t 2 2 x t 2 x t 3 … x t 2 x t k x t 3 x t 1 x t x t 3 2 ... x t 3 x t k x t k x t 1 x t k x t 2 ∑ x t k x t 3 … x t k 2) (b 1 b 2 b 3 b k) = (∑ x t 1 y x प्रदर्शन शैली 3 y t y t) (\begin(pmatrix)\sum x_(t1)^(2)&\sum x_(t1)x_(t2)&\sum x_(t1)x_(t3)&\ldots &\sum x_(t1)x_( tk)\\\sum x_(t2)x_(t1)&\sum x_(t2)^(2)&\sum x_(t2)x_(t3)&\ldots &\ sum x_(t2)x_(tk) \\\योग x_(t3)x_(t1)&\sum x_(t3)x_(t2)&\sum x_(t3)^(2)&\ldots &\sum x_ (t3)x_(tk)\\ \vdots &\vdots &\vdots &\ddots &\vdots \\\sum x_(tk)x_(t1)&\sum x_(tk)x_(t2)&\sum x_ (tk)x_(t3)&\ ldots &\sum x_(tk)^(2)\\\end(pmatrix))(\begin(pmatrix)b_(1)\\b_(2)\\b_(3 )\\\vdots \\b_( k)\\\end(pmatrix))=(\begin(pmatrix)\sum x_(t1)y_(t)\\\sum x_(t2)y_(t)\\ \sum x_(t3)y_(t )\\\vdots \\\योग x_(tk)y_(t)\\\end(pmatrix)))जहां सभी राशियों को सभी स्वीकार्य मूल्यों पर लिया जाता है टी (\ डिस्प्लेस्टाइल टी).

यदि मॉडल में एक स्थिरांक शामिल है (हमेशा की तरह), तो एक्स टी 1 = 1 (\displaystyle x_(t1)=1)सभी के लिए टी (\ डिस्प्लेस्टाइल टी), इसलिए, समीकरणों की प्रणाली के मैट्रिक्स के ऊपरी बाएं कोने में अवलोकनों की संख्या है n (\displaystyle n), और पहली पंक्ति और पहले कॉलम के शेष तत्वों में - चर के मूल्यों का योग: x t j (\displaystyle \sum x_(tj))और सिस्टम के दायीं ओर का पहला तत्व - y t (\displaystyle \sum y_(t)).

समीकरणों की इस प्रणाली का समाधान रैखिक मॉडल के लिए कम से कम वर्ग अनुमानों के लिए सामान्य सूत्र देता है:

बी ^ ओ एल एस = (एक्स टी एक्स) - 1 एक्स टी वाई = (1 एन एक्स टी एक्स) - 1 1 एन एक्स टी वाई = वी एक्स - 1 सी एक्स वाई (\displaystyle (\hat (बी))_(OLS)=(X^(T) )X)^(-1)X^(T)y=\left((\frac (1)(n))X^(T)X\right)^(-1)(\frac (1)(n) ))X^(T)y=V_(x)^(-1)C_(xy)).

विश्लेषणात्मक उद्देश्यों के लिए, इस सूत्र का अंतिम प्रतिनिधित्व उपयोगी साबित होता है (समीकरणों की प्रणाली में जब n से विभाजित किया जाता है, तो अंकगणितीय साधन योग के बजाय दिखाई देते हैं)। यदि प्रतिगमन मॉडल में डेटा केंद्रित, तो इस निरूपण में पहले मैट्रिक्स में कारकों के नमूना सहप्रसरण मैट्रिक्स का अर्थ है, और दूसरा एक आश्रित चर वाले कारकों के सहप्रसरणों का वेक्टर है। यदि, इसके अतिरिक्त, डेटा भी है सामान्यीकृत SKO में (अर्थात, अंततः मानकीकृत), तो पहले मैट्रिक्स में कारकों के नमूना सहसंबंध मैट्रिक्स का अर्थ है, दूसरा वेक्टर - आश्रित चर के साथ कारकों के नमूना सहसंबंधों का वेक्टर।

मॉडल के लिए एलएलएस अनुमानों की एक महत्वपूर्ण संपत्ति स्थिरांक के साथ- निर्मित प्रतिगमन की रेखा नमूना डेटा के गुरुत्वाकर्षण के केंद्र से होकर गुजरती है, अर्थात समानता पूरी होती है:

y ¯ = b 1 ^ + ∑ j = 2 k b ^ j x j (\displaystyle (\bar (y))=(\hat (b_(1)))+\sum _(j=2)^(k) (\टोपी (बी))_(जे)(\बार (एक्स))_(जे)).

विशेष रूप से, चरम मामले में, जब एकमात्र प्रतिगामी स्थिर होता है, तो हम पाते हैं कि एकल पैरामीटर (स्थिर स्वयं) का ओएलएस अनुमान चर के औसत मूल्य के बराबर है। अर्थात्, बड़ी संख्याओं के नियमों से अपने अच्छे गुणों के लिए जाना जाने वाला अंकगणितीय माध्य भी एक न्यूनतम वर्ग अनुमान है - यह इससे वर्ग विचलन के न्यूनतम योग के मानदंड को पूरा करता है।

सबसे सरल विशेष मामले

जोड़ीदार रैखिक प्रतिगमन के मामले में y t = a + b x t + ε t (\displaystyle y_(t)=a+bx_(t)+\varepsilon _(t)), जब एक चर की दूसरे पर रैखिक निर्भरता का अनुमान लगाया जाता है, तो गणना सूत्र सरल हो जाते हैं (आप मैट्रिक्स बीजगणित के बिना कर सकते हैं)। समीकरणों की प्रणाली का रूप है:

(1 x ¯ x ¯ x 2 ) (a b) = (y ¯ x y ) (\displaystyle (\begin(pmatrix)1&(\bar (x))\\(\bar (x))&(\bar) (x^(2)))\\\end(pmatrix))(\begin(pmatrix)a\\b\\\end(pmatrix))=(\begin(pmatrix)(\bar (y))\\ (\overline(xy))\\\end(pmatrix))).

यहाँ से गुणांकों का अनुमान लगाना आसान है:

( b ^ = Cov (x , y) Var ⁡ (x) = x y - x y ¯ x 2 ¯ - x ¯ 2 , a ^ = y ¯ - b x । (\displaystyle (\begin(cases)) (\ Hat (b))=(\frac (\mathop (\textrm (Cov)) (x,y))(\mathop (\textrm (Var)) (x)))=(\frac ((\overline) (xy))-(\bar (x))(\bar (y)))((\overline (x^(2)))-(\overline (x))^(2))),\\( \टोपी (ए))=(\bar (y))-b(\bar (x)).\end(cases)))

इस तथ्य के बावजूद कि, सामान्य तौर पर, स्थिरांक वाले मॉडल बेहतर होते हैं, कुछ मामलों में सैद्धांतिक विचारों से यह ज्ञात होता है कि स्थिरांक ए (\ डिस्प्लेस्टाइल ए)शून्य के बराबर होना चाहिए। उदाहरण के लिए, भौतिकी में, वोल्टेज और करंट के बीच संबंध का रूप है U = I R (\displaystyle U=I\cdot R); वोल्टेज और करंट को मापने के लिए, प्रतिरोध का अनुमान लगाना आवश्यक है। इस मामले में, हम एक मॉडल के बारे में बात कर रहे हैं y = b x (\displaystyle y=bx). इस मामले में, समीकरणों की एक प्रणाली के बजाय, हमारे पास एक ही समीकरण है

(∑ x t 2) b = ∑ x t y t (\displaystyle \left(\sum x_(t)^(2)\right)b=\sum x_(t)y_(t)).

इसलिए, एकल गुणांक के आकलन के सूत्र का रूप है

बी ^ = ∑ टी = 1 एन एक्स टी वाई टी ∑ टी = 1 एन एक्स टी 2 = एक्स वाई एक्स 2 ¯ (\displaystyle (\टोपी (बी))=(\frac (\sum _(t=1)^(n)x_(टी) )y_(t))(\sum _(t=1)^(n)x_(t)^(2)))=(\frac (\overline (xy))(\overline (x^(2)) ))).

एक बहुपद मॉडल का मामला

यदि डेटा को एक चर के बहुपद प्रतिगमन फ़ंक्शन द्वारा फिट किया जाता है f (x) = b 0 + ∑ i = 1 k b i x i (\displaystyle f(x)=b_(0)+\sum \limits _(i=1)^(k)b_(i)x^(i)), फिर, डिग्री समझना x i (\displaystyle x^(i))प्रत्येक के लिए स्वतंत्र कारकों के रूप में मैं (\ डिस्प्लेस्टाइल मैं)रैखिक मॉडल के मापदंडों के आकलन के लिए सामान्य सूत्र के आधार पर मॉडल के मापदंडों का अनुमान लगाना संभव है। ऐसा करने के लिए, सामान्य सूत्र को ध्यान में रखना पर्याप्त है कि इस तरह की व्याख्या के साथ x t i x t j = x t i x t j = x t i + j (\displaystyle x_(ti)x_(tj)=x_(t)^(i)x_(t)^(j)=x_(t)^(i+j))तथा x t j t = x t j y t (\displaystyle x_(tj)y_(t)=x_(t)^(j)y_(t)). इसलिए, इस मामले में मैट्रिक्स समीकरण रूप लेंगे:

(एन एन एक्स टी ... ∑ एन एक्स टी के एन एक्स टी ∑ एन एक्स आई 2 ... ∑ एम एक्स आई के + 1 एन एक्स टी के ∑ एन एक्स टी के + 1 ... ∑ एन एक्स टी 2 के) [बी 0 बी 1 ⋮ बी के] = [∑ एन वाई टी एन एक्स टी वाई टी ⋮ एन एक्स टी के वाई टी]। (\displaystyle (\begin(pmatrix)n&\sum \limits _(n)x_(t)&\ldots &\sum \limits _(n)x_(t)^(k)\\\sum \limits _( n)x_(t)&\sum \limits _(n)x_(i)^(2)&\ldots &\sum \limits _(m)x_(i)^(k+1)\\\vdots & \vdots &\ddots &\vdots \\\sum \limits _(n)x_(t)^(k)&\sum \limits _(n)x_(t)^(k+1)&\ldots &\ योग \सीमा _(n)x_(t)^(2k)\end(pmatrix))(\begin(bmatrix)b_(0)\\b_(1)\\\vdots \\b_(k)\end( bmatrix))=(\begin(bmatrix)\sum \limits _(n)y_(t)\\\sum \limits _(n)x_(t)y_(t)\\\vdots \\\sum \limits _(n)x_(t)^(k)y_(t)\end(bmatrix))।)

ओएलएस अनुमानों के सांख्यिकीय गुण

सबसे पहले, हम ध्यान दें कि रैखिक मॉडल के लिए, कम से कम वर्ग अनुमान रैखिक अनुमान हैं, जैसा कि उपरोक्त सूत्र से निम्नानुसार है। कम से कम वर्गों के अनुमानों की निष्पक्षता के लिए, प्रतिगमन विश्लेषण की सबसे महत्वपूर्ण शर्त को पूरा करना आवश्यक और पर्याप्त है: कारकों पर सशर्त यादृच्छिक त्रुटि की गणितीय अपेक्षा शून्य के बराबर होनी चाहिए। यह शर्त संतुष्ट है, विशेष रूप से, यदि

यादृच्छिक त्रुटियों की गणितीय अपेक्षा शून्य है, और
कारक और यादृच्छिक त्रुटियां स्वतंत्र-यादृच्छिक-मान हैं।

दूसरी शर्त - बहिर्जात कारकों की स्थिति - मौलिक है। यदि यह संपत्ति संतुष्ट नहीं है, तो हम मान सकते हैं कि लगभग कोई भी अनुमान बेहद असंतोषजनक होगा: वे सुसंगत भी नहीं होंगे (अर्थात, बहुत बड़ी मात्रा में डेटा भी इस मामले में गुणात्मक अनुमान प्राप्त करने की अनुमति नहीं देता है)। शास्त्रीय मामले में, एक यादृच्छिक त्रुटि के विपरीत, कारकों के नियतत्ववाद के बारे में एक मजबूत धारणा बनाई जाती है, जिसका स्वचालित रूप से मतलब है कि बहिर्जात स्थिति संतुष्ट है। सामान्य मामले में, अनुमानों की स्थिरता के लिए, मैट्रिक्स के अभिसरण के साथ-साथ बहिर्जात स्थिति को संतुष्ट करने के लिए पर्याप्त है वी एक्स (\displaystyle वी_(एक्स))कुछ nondegenerate मैट्रिक्स के लिए नमूना आकार अनंत तक बढ़ जाता है।

निरंतरता और निष्पक्षता के अलावा, (साधारण) कम से कम वर्ग अनुमान भी प्रभावी (रैखिक निष्पक्ष अनुमानों के वर्ग में सर्वश्रेष्ठ) होने के लिए, एक यादृच्छिक त्रुटि के अतिरिक्त गुणों को संतुष्ट किया जाना चाहिए:

इन मान्यताओं को यादृच्छिक त्रुटियों के वेक्टर के सहप्रसरण (मैट्रिक्स) के लिए तैयार किया जा सकता है वी (ε) = σ 2 मैं (\displaystyle वी(\varepsilon)=\sigma ^(2)I).

एक रैखिक मॉडल जो इन शर्तों को पूरा करता है, कहलाता है क्लासिक. शास्त्रीय रैखिक प्रतिगमन के लिए ओएलएस अनुमान सभी रैखिक निष्पक्ष अनुमानों के वर्ग में निष्पक्ष, सुसंगत और सबसे कुशल अनुमान हैं (अंग्रेजी साहित्य में, संक्षेप में कभी-कभी उपयोग किया जाता है नीला (सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक) सबसे अच्छा रैखिक निष्पक्ष अनुमान है; घरेलू साहित्य में, गाऊसी- मार्कोव प्रमेय को अधिक बार उद्धृत किया जाता है)। जैसा कि यह दिखाना आसान है, गुणांक अनुमान वेक्टर का सहप्रसरण मैट्रिक्स इसके बराबर होगा:

वी (बी ^ ओ एल एस) = σ 2 (एक्स टी एक्स) − 1 (\displaystyle वी((\टोपी (बी))_(OLS))=\sigma ^(2)(X^(T)X)^(-1 )).

दक्षता का अर्थ है कि यह सहप्रसरण मैट्रिक्स "न्यूनतम" है (गुणांक का कोई भी रैखिक संयोजन, और विशेष रूप से स्वयं गुणांक, एक न्यूनतम विचरण है), यानी रैखिक निष्पक्ष अनुमानों के वर्ग में, ओएलएस अनुमान सबसे अच्छे हैं। इस मैट्रिक्स के विकर्ण तत्व - गुणांक के अनुमानों के भिन्न - प्राप्त अनुमानों की गुणवत्ता के महत्वपूर्ण पैरामीटर हैं। हालाँकि, सहप्रसरण मैट्रिक्स की गणना करना संभव नहीं है क्योंकि यादृच्छिक त्रुटि विचरण अज्ञात है। यह साबित किया जा सकता है कि यादृच्छिक त्रुटियों के विचरण का निष्पक्ष और सुसंगत (शास्त्रीय रैखिक मॉडल के लिए) अनुमान मूल्य है:

एस 2 = आर एस एस / (एन - के) (\displaystyle s^(2)=RSS/(n-k)).

इस मान को सहप्रसरण मैट्रिक्स के सूत्र में प्रतिस्थापित करते हुए, हम सहप्रसरण मैट्रिक्स का एक अनुमान प्राप्त करते हैं। परिणामी अनुमान भी निष्पक्ष और सुसंगत हैं। यह भी महत्वपूर्ण है कि त्रुटि विचरण का अनुमान (और इसलिए गुणांकों के प्रसरण) और मॉडल मापदंडों के अनुमान स्वतंत्र यादृच्छिक चर हैं, जो मॉडल गुणांक के बारे में परिकल्पना के परीक्षण के लिए परीक्षण के आंकड़े प्राप्त करना संभव बनाता है।

यह ध्यान दिया जाना चाहिए कि यदि शास्त्रीय मान्यताओं को पूरा नहीं किया जाता है, तो कम से कम वर्ग पैरामीटर अनुमान सबसे कुशल नहीं होते हैं और जहां डब्ल्यू (\ डिस्प्लेस्टाइल डब्ल्यू)कुछ सममित धनात्मक निश्चित भार मैट्रिक्स है। साधारण कम से कम वर्ग इस दृष्टिकोण का एक विशेष मामला है, जब वजन मैट्रिक्स पहचान मैट्रिक्स के समानुपाती होता है। जैसा कि ज्ञात है, सममित मैट्रिक्स (या ऑपरेटरों) के लिए एक अपघटन होता है W = P T P (\displaystyle W=P^(T)P). इसलिए, इस कार्यात्मक को निम्नानुसार दर्शाया जा सकता है e T P T P e = (P e) T P e = e T e ∗ (\displaystyle e^(T)P^(T)Pe=(Pe)^(T)Pe=e_(*)^(T)e_( *)), अर्थात्, इस कार्यात्मक को कुछ रूपांतरित "अवशिष्ट" के वर्गों के योग के रूप में दर्शाया जा सकता है। इस प्रकार, हम कम से कम वर्ग विधियों के एक वर्ग को अलग कर सकते हैं - एलएस-विधियां (कम से कम वर्ग)।

यह साबित होता है (ऐटकेन का प्रमेय) कि एक सामान्यीकृत रैखिक प्रतिगमन मॉडल के लिए (जिसमें यादृच्छिक त्रुटियों के सहप्रसरण मैट्रिक्स पर कोई प्रतिबंध नहीं लगाया जाता है), सबसे प्रभावी (रैखिक निष्पक्ष अनुमानों के वर्ग में) तथाकथित के अनुमान हैं। सामान्यीकृत ओएलएस (ओएमएनके, जीएलएस - सामान्यीकृत कम वर्ग)- यादृच्छिक त्रुटियों के व्युत्क्रम सहप्रसरण मैट्रिक्स के बराबर भार मैट्रिक्स के साथ एलएस-विधि: डब्ल्यू = वी ε - 1 (\displaystyle W=V_(\varepsilon )^(-1)).

यह दिखाया जा सकता है कि रैखिक मॉडल के मापदंडों के जीएलएस-अनुमानों के सूत्र का रूप है

बी ^ जी एल एस = (एक्स टी वी - 1 एक्स) - 1 एक्स टी वी - 1 y (\displaystyle (\टोपी (बी))_(जीएलएस)=(X^(T)V^(-1)X)^(-1) एक्स^(टी)वी^(-1)y).

इन अनुमानों का सहप्रसरण मैट्रिक्स, क्रमशः, के बराबर होगा

वी (बी ^ जी एल एस) = (एक्स टी वी - 1 एक्स) - 1 (\displaystyle वी((\टोपी (बी))_(जीएलएस))=(X^(T)V^(-1)X)^(- एक)).

वास्तव में, ओएलएस का सार मूल डेटा के एक निश्चित (रैखिक) परिवर्तन (पी) और रूपांतरित डेटा के लिए सामान्य न्यूनतम वर्गों के अनुप्रयोग में निहित है। इस परिवर्तन का उद्देश्य यह है कि रूपांतरित डेटा के लिए, यादृच्छिक त्रुटियां पहले से ही शास्त्रीय मान्यताओं को संतुष्ट करती हैं।

भारित न्यूनतम वर्ग

एक विकर्ण भार मैट्रिक्स (और इसलिए यादृच्छिक त्रुटियों के सहप्रसरण मैट्रिक्स) के मामले में, हमारे पास तथाकथित भारित न्यूनतम वर्ग (WLS - भारित कम से कम वर्ग) हैं। इस मामले में, मॉडल के अवशेषों के वर्गों का भारित योग कम से कम होता है, अर्थात, प्रत्येक अवलोकन को एक "वजन" प्राप्त होता है जो इस अवलोकन में यादृच्छिक त्रुटि के विचरण के विपरीत आनुपातिक होता है: e T W e = ∑ t = 1 n e t 2 t 2 (\displaystyle e^(T)We=\sum _(t=1)^(n)(\frac (e_(t)^(2))(\ सिग्मा _(टी)^(2)))). वास्तव में, डेटा को प्रेक्षणों को भारित करके (यादृच्छिक त्रुटियों के कल्पित मानक विचलन के अनुपात में विभाजित करके) रूपांतरित किया जाता है, और भारित डेटा पर सामान्य न्यूनतम वर्ग लागू होते हैं।

आईएसबीएन 978-5-7749-0473-0।

अर्थमिति। पाठ्यपुस्तक / एड। एलिसेवा आई। आई। - दूसरा संस्करण। - एम।: वित्त और सांख्यिकी, 2006. - 576 पी। - आईएसबीएन 5-279-02786-3।

अलेक्जेंड्रोवा एन.वी.गणितीय शब्दों, अवधारणाओं, पदनामों का इतिहास: एक शब्दकोश-संदर्भ पुस्तक। - तीसरा संस्करण। - एम।: एलकेआई, 2008। - 248 पी। - आईएसबीएन 978-5-382-00839-4।आई.वी. मितिन, रुसाकोव वी.एस. प्रयोगात्मक डेटा का विश्लेषण और प्रसंस्करण - 5 वां संस्करण - 24p।

हम फ़ंक्शन को दूसरी डिग्री के बहुपद द्वारा अनुमानित करते हैं। ऐसा करने के लिए, हम समीकरणों की सामान्य प्रणाली के गुणांक की गणना करते हैं:

, ,

आइए हम कम से कम वर्गों की एक सामान्य प्रणाली की रचना करें, जिसका रूप है:

सिस्टम का समाधान खोजना आसान है:,,।

इस प्रकार, दूसरी डिग्री का बहुपद पाया जाता है: .

सैद्धांतिक संदर्भ

पृष्ठ पर वापस जाएं<Введение в вычислительную математику. Примеры>

उदाहरण 2. एक बहुपद की इष्टतम घात ज्ञात करना।

पृष्ठ पर वापस जाएं<Введение в вычислительную математику. Примеры>

उदाहरण 3. एक अनुभवजन्य निर्भरता के मापदंडों को खोजने के लिए समीकरणों की एक सामान्य प्रणाली की व्युत्पत्ति।

आइए हम गुणांकों और कार्यों को निर्धारित करने के लिए समीकरणों की एक प्रणाली प्राप्त करें , जो अंकों के संबंध में दिए गए फ़ंक्शन का मूल-माध्य-वर्ग सन्निकटन करता है। एक समारोह लिखें और इसके लिए आवश्यक चरम शर्त लिखिए:

तब सामान्य प्रणाली रूप लेगी:

हमने अज्ञात मापदंडों के लिए समीकरणों की एक रैखिक प्रणाली प्राप्त की है, जिसे आसानी से हल किया जा सकता है।

सैद्धांतिक संदर्भ

पृष्ठ पर वापस जाएं<Введение в вычислительную математику. Примеры>

उदाहरण।

चर के मूल्यों पर प्रायोगिक डेटा एक्सतथा परतालिका में दिए गए हैं।

उनके संरेखण के परिणामस्वरूप, फ़ंक्शन

कम से कम वर्गों (LSM) की विधि का सार।

समस्या रैखिक निर्भरता गुणांक खोजने की है जिसके लिए दो चर का कार्य एकतथा बीसबसे छोटा मान लेता है। यानी डेटा दिया गया है एकतथा बीपाई गई सीधी रेखा से प्रयोगात्मक डेटा के वर्ग विचलन का योग सबसे छोटा होगा। यह न्यूनतम वर्ग विधि का संपूर्ण बिंदु है।

इस प्रकार, उदाहरण का समाधान दो चरों के एक फ़ंक्शन के चरम को खोजने के लिए कम हो गया है।

गुणांक खोजने के लिए सूत्रों की व्युत्पत्ति।

दो अज्ञात के साथ दो समीकरणों की एक प्रणाली संकलित और हल की जाती है। कार्यों के आंशिक व्युत्पन्न ढूँढना चर द्वारा एकतथा बी, हम इन व्युत्पन्नों को शून्य के बराबर करते हैं।

हम समीकरणों की परिणामी प्रणाली को किसी भी विधि से हल करते हैं (उदाहरण के लिए प्रतिस्थापन विधिया क्रैमर की विधि) और कम से कम वर्ग विधि (एलएसएम) का उपयोग करके गुणांक खोजने के लिए सूत्र प्राप्त करें।

डेटा के साथ एकतथा बीसमारोह सबसे छोटा मान लेता है। इस तथ्य का प्रमाण पृष्ठ के अंत में पाठ में नीचे दिया गया है।

यह कम से कम वर्गों की पूरी विधि है। पैरामीटर खोजने के लिए सूत्र एकइसमें रकम , , , और पैरामीटर शामिल हैं एनप्रयोगात्मक डेटा की मात्रा है। इन राशियों के मूल्यों की अलग से गणना करने की अनुशंसा की जाती है।

गुणक बीगणना के बाद पाया गया एक.

मूल उदाहरण को याद करने का समय आ गया है।

समाधान।

तालिका के अंतिम स्तंभ के मान पंक्तियों के मानों का योग हैं।

फलस्वरूप, वाई=0.165x+2.184वांछित सन्निकटन सीधी रेखा है।

कम से कम वर्गों की विधि की त्रुटि का अनुमान।

ऐसा करने के लिए, आपको इन पंक्तियों से मूल डेटा के वर्ग विचलन के योग की गणना करने की आवश्यकता है तथा , एक छोटा मान उस रेखा से मेल खाता है जो कम से कम वर्ग विधि के संदर्भ में मूल डेटा का बेहतर अनुमान लगाती है।

तब से , तब रेखा वाई=0.165x+2.184मूल डेटा का बेहतर अनुमान लगाता है।

कम से कम वर्ग विधि (LSM) का ग्राफिक चित्रण।

चार्ट पर सब कुछ बहुत अच्छा लग रहा है। लाल रेखा पाई गई रेखा है वाई=0.165x+2.184, नीली रेखा है , गुलाबी बिंदु मूल डेटा हैं।

यह किस लिए है, ये सभी अनुमान किस लिए हैं?

मैं व्यक्तिगत रूप से डेटा स्मूथिंग समस्याओं, इंटरपोलेशन और एक्सट्रपलेशन समस्याओं को हल करने के लिए उपयोग करता हूं (मूल उदाहरण में, आपको देखे गए मूल्य का मूल्य खोजने के लिए कहा जा सकता है आपपर एक्स = 3या जब एक्स = 6बहुराष्ट्रीय कंपनी विधि के अनुसार)। लेकिन हम इसके बारे में साइट के दूसरे भाग में बाद में बात करेंगे।

पृष्ठ के सबसे ऊपर

सबूत।

दूसरे क्रम के अंतर का रूप है:

वह है

पहले क्रम का कोणीय नाबालिग . असमानता सख्त है, क्योंकि अंक मेल नहीं खाते। यह निम्नलिखित में निहित होगा।

दूसरे क्रम का कोणीय नाबालिग

आइए साबित करें कि गणितीय प्रेरण की विधि।

निष्कर्ष: पाया मान एकतथा बीफ़ंक्शन के सबसे छोटे मान के अनुरूप हों इसलिए, कम से कम वर्ग विधि के लिए वांछित पैरामीटर हैं।

कभी समझे?
समाधान का आदेश दें

पृष्ठ के सबसे ऊपर

कम से कम वर्ग विधि का उपयोग करके पूर्वानुमान का विकास। समस्या समाधान उदाहरण

एक्सट्रपलेशन - यह वैज्ञानिक अनुसंधान की एक विधि है, जो भविष्यवाणी की वस्तु के भविष्य के विकास के लिए अतीत और वर्तमान प्रवृत्तियों, पैटर्न, संबंधों के प्रसार पर आधारित है। एक्सट्रपलेशन विधियों में शामिल हैं चलती औसत विधि, घातीय चौरसाई विधि, कम से कम वर्ग विधि।

सार कम से कम वर्ग विधि प्रेक्षित और परिकलित मानों के बीच वर्ग विचलन के योग को न्यूनतम करना शामिल है। परिकलित मान चयनित समीकरण के अनुसार पाए जाते हैं - प्रतिगमन समीकरण। वास्तविक मानों और परिकलित मानों के बीच की दूरी जितनी छोटी होगी, प्रतिगमन समीकरण के आधार पर पूर्वानुमान उतना ही सटीक होगा।

अध्ययन के तहत घटना के सार का सैद्धांतिक विश्लेषण, जिसमें परिवर्तन एक समय श्रृंखला द्वारा प्रदर्शित किया जाता है, वक्र चुनने के आधार के रूप में कार्य करता है। श्रृंखला के स्तरों की वृद्धि की प्रकृति के बारे में विचार कभी-कभी ध्यान में रखा जाता है। इसलिए, यदि अंकगणितीय प्रगति में उत्पादन की वृद्धि अपेक्षित है, तो एक सीधी रेखा में चौरसाई का प्रदर्शन किया जाता है। यदि यह पता चलता है कि वृद्धि घातीय है, तो घातीय कार्य के अनुसार चौरसाई किया जाना चाहिए।

कम से कम वर्गों की विधि का कार्य सूत्र : वाई टी+1 = ए*एक्स + बी, जहां t + 1 पूर्वानुमान अवधि है; t+1 - अनुमानित संकेतक; ए और बी गुणांक हैं; X समय का प्रतीक है।

गुणांक ए और बी की गणना निम्न सूत्रों के अनुसार की जाती है:

जहाँ, Uf - गतिकी की श्रृंखला के वास्तविक मान; n समय श्रृंखला में स्तरों की संख्या है;

अध्ययन के तहत घटना के विकास के पैटर्न को प्रतिबिंबित करने के लिए कम से कम वर्ग विधि द्वारा समय श्रृंखला को चौरसाई करना कार्य करता है। एक प्रवृत्ति की विश्लेषणात्मक अभिव्यक्ति में, समय को एक स्वतंत्र चर माना जाता है, और श्रृंखला के स्तर इस स्वतंत्र चर के कार्य के रूप में कार्य करते हैं।

किसी घटना का विकास इस बात पर निर्भर नहीं करता है कि प्रारंभिक बिंदु से कितने वर्ष बीत चुके हैं, बल्कि इस बात पर निर्भर करता है कि उसके विकास को किन कारकों ने प्रभावित किया, किस दिशा में और किस तीव्रता से। इससे यह स्पष्ट होता है कि समय में किसी घटना का विकास इन कारकों की क्रिया के परिणामस्वरूप प्रकट होता है।

वक्र के प्रकार को सही ढंग से निर्धारित करना, समय पर विश्लेषणात्मक निर्भरता का प्रकार पूर्व-पूर्वानुमान विश्लेषण के सबसे कठिन कार्यों में से एक है। .

प्रवृत्ति का वर्णन करने वाले फ़ंक्शन के प्रकार का चुनाव, जिनमें से पैरामीटर कम से कम वर्ग विधि द्वारा निर्धारित किए जाते हैं, ज्यादातर मामलों में अनुभवजन्य है, कई कार्यों का निर्माण करके और रूट के मूल्य के अनुसार उनकी एक दूसरे के साथ तुलना करके- माध्य-वर्ग त्रुटि, सूत्र द्वारा परिकलित:

जहाँ Uf - गतिकी की श्रृंखला के वास्तविक मूल्य; उर - समय श्रृंखला के परिकलित (चिकना) मान; n समय श्रृंखला में स्तरों की संख्या है; p प्रवृत्ति (विकास की प्रवृत्ति) का वर्णन करने वाले सूत्रों में परिभाषित मापदंडों की संख्या है।

कम से कम वर्ग विधि के नुकसान :

गणितीय समीकरण का उपयोग करके अध्ययन के तहत आर्थिक घटना का वर्णन करने का प्रयास करते समय, पूर्वानुमान थोड़े समय के लिए सटीक होगा और नई जानकारी उपलब्ध होने पर प्रतिगमन समीकरण की पुनर्गणना की जानी चाहिए;
प्रतिगमन समीकरण के चयन की जटिलता, जिसे मानक कंप्यूटर प्रोग्राम का उपयोग करके हल किया जा सकता है।

पूर्वानुमान विकसित करने के लिए कम से कम वर्ग विधि का उपयोग करने का एक उदाहरण

एक कार्य . इस क्षेत्र में बेरोजगारी के स्तर को दर्शाने वाले आंकड़े हैं, %

इन तरीकों का इस्तेमाल करके नवंबर, दिसंबर, जनवरी के महीनों के लिए क्षेत्र में बेरोजगारी दर का पूर्वानुमान बनाएं: मूविंग एवरेज, एक्सपोनेंशियल स्मूथिंग, कम से कम वर्ग।
प्रत्येक विधि का उपयोग करके परिणामी पूर्वानुमानों में त्रुटियों की गणना करें।
प्राप्त परिणामों की तुलना करें, निष्कर्ष निकालें।

कम से कम वर्ग समाधान

समाधान के लिए, हम एक तालिका संकलित करेंगे जिसमें हम आवश्यक गणना करेंगे:

= 28.63/10 = 2.86% पूर्वानुमान सटीकताउच्च।

निष्कर्ष : गणना में प्राप्त परिणामों की तुलना चलती औसत विधि , एक्स्पोनेंशियल स्मूदिंग और कम से कम वर्ग विधि, हम कह सकते हैं कि घातीय चौरसाई विधि द्वारा गणना में औसत सापेक्ष त्रुटि 20-50% के भीतर आती है। इसका मतलब है कि इस मामले में भविष्यवाणी की सटीकता केवल संतोषजनक है।

पहले और तीसरे मामलों में, पूर्वानुमान सटीकता अधिक है, क्योंकि औसत सापेक्ष त्रुटि 10% से कम है। लेकिन चलती औसत विधि ने अधिक विश्वसनीय परिणाम प्राप्त करना संभव बना दिया (नवंबर के लिए पूर्वानुमान - 1.52%, दिसंबर के लिए पूर्वानुमान - 1.53%, जनवरी के लिए पूर्वानुमान - 1.49%), क्योंकि इस पद्धति का उपयोग करते समय औसत सापेक्ष त्रुटि सबसे छोटी है - 1 , 13%।

कम से कम वर्ग विधि

अन्य संबंधित लेख:

प्रयुक्त स्रोतों की सूची

सामाजिक जोखिमों के निदान और चुनौतियों, खतरों और सामाजिक परिणामों की भविष्यवाणी करने के मुद्दों पर वैज्ञानिक और पद्धति संबंधी सिफारिशें। रूसी राज्य सामाजिक विश्वविद्यालय। मास्को। 2010;
व्लादिमीरोवा एल.पी. बाजार की स्थितियों में पूर्वानुमान और योजना: प्रोक। भत्ता। एम।: पब्लिशिंग हाउस "दशकोव एंड कंपनी", 2001;
नोविकोवा एन.वी., पॉज़्डीवा ओ.जी. राष्ट्रीय अर्थव्यवस्था का पूर्वानुमान: शैक्षिक और पद्धति संबंधी गाइड। येकातेरिनबर्ग: पब्लिशिंग हाउस यूराल। राज्य अर्थव्यवस्था विश्वविद्यालय, 2007;
स्लटस्किन एल.एन. बिजनेस फोरकास्टिंग में एमबीए कोर्स। मॉस्को: एल्पिना बिजनेस बुक्स, 2006।

एमएनई कार्यक्रम

डेटा दर्ज करें

डेटा और अनुमान वाई = ए + बी एक्स

मैं- प्रयोगात्मक बिंदु की संख्या;
एक्स मैं- बिंदु पर निश्चित पैरामीटर का मान मैं;
यी- बिंदु पर मापा पैरामीटर का मान मैं;
मैं- बिंदु पर माप वजन मैं;
वाई मैं, कैल्क।- मापा मूल्य और प्रतिगमन से गणना मूल्य के बीच का अंतर आपबिंदु पर मैं;
एस एक्स मैं (एक्स मैं)- त्रुटि अनुमान एक्स मैंमापते समय आपबिंदु पर मैं.

डेटा और अनुमान वाई = केएक्स

मैं	एक्स मैं	यी	मैं	वाई मैं, कैल्क।	मैं	एस एक्स मैं (एक्स मैं)

चार्ट पर क्लिक करें

बहुराष्ट्रीय कंपनी ऑनलाइन कार्यक्रम के लिए उपयोगकर्ता पुस्तिका।

डेटा फ़ील्ड में, प्रत्येक अलग लाइन पर एक प्रयोगात्मक बिंदु पर `x` और `y` के मान दर्ज करें। मानों को खाली जगह (स्पेस या टैब) से अलग किया जाना चाहिए.

तीसरा मान `w` का बिंदु भार हो सकता है। यदि बिंदु भार निर्दिष्ट नहीं है, तो यह एक के बराबर है। अधिकांश मामलों में, प्रयोगात्मक बिंदुओं के वजन अज्ञात हैं या गणना नहीं की गई है; सभी प्रयोगात्मक डेटा को समकक्ष माना जाता है। कभी-कभी मूल्यों की अध्ययन सीमा में वजन निश्चित रूप से समकक्ष नहीं होते हैं और सैद्धांतिक रूप से भी गणना की जा सकती है। उदाहरण के लिए, स्पेक्ट्रोफोटोमेट्री में, वजन की गणना सरल सूत्रों का उपयोग करके की जा सकती है, हालांकि मूल रूप से हर कोई श्रम लागत को कम करने के लिए इसकी उपेक्षा करता है।

डेटा को ऑफिस सूट स्प्रेडशीट से क्लिपबोर्ड के माध्यम से चिपकाया जा सकता है, जैसे कि माइक्रोसॉफ्ट ऑफिस से एक्सेल या ओपन ऑफिस से कैल्क। ऐसा करने के लिए, स्प्रैडशीट में, कॉपी करने के लिए डेटा की श्रेणी का चयन करें, क्लिपबोर्ड पर कॉपी करें और डेटा को इस पृष्ठ पर डेटा फ़ील्ड में पेस्ट करें।

कम से कम वर्ग विधि द्वारा गणना करने के लिए, दो गुणांक निर्धारित करने के लिए कम से कम दो बिंदुओं की आवश्यकता होती है `बी` - सीधी रेखा के झुकाव के कोण के स्पर्शक और `ए` - मूल्य को सीधी रेखा से काट दिया जाता है। `अक्ष.

गणना किए गए प्रतिगमन गुणांक की त्रुटि का अनुमान लगाने के लिए, प्रयोगात्मक बिंदुओं की संख्या को दो से अधिक पर सेट करना आवश्यक है।

कम से कम वर्ग विधि (LSM)।

प्रायोगिक बिंदुओं की संख्या जितनी अधिक होगी, गुणांकों का सांख्यिकीय अनुमान उतना ही सटीक होगा (छात्र के गुणांक में कमी के कारण) और सामान्य नमूने के अनुमान के करीब अनुमान।

प्रत्येक प्रायोगिक बिंदु पर मूल्य प्राप्त करना अक्सर महत्वपूर्ण श्रम लागतों से जुड़ा होता है, इसलिए, प्रयोगों की एक समझौता संख्या अक्सर की जाती है, जो एक सुपाच्य अनुमान देता है और अत्यधिक श्रम लागत का कारण नहीं बनता है। एक नियम के रूप में, दो गुणांक वाले रैखिक न्यूनतम वर्ग निर्भरता के लिए प्रायोगिक बिंदुओं की संख्या 5-7 अंकों के क्षेत्र में चुनी जाती है।

रैखिक निर्भरता के लिए कम से कम वर्गों का एक संक्षिप्त सिद्धांत

मान लीजिए कि हमारे पास प्रयोगात्मक डेटा का एक सेट है जो मूल्यों के जोड़े के रूप में है [`y_i`, `x_i`], जहां `i` 1 से `n` तक एक प्रयोगात्मक माप की संख्या है; `y_i` - बिंदु `i` पर मापे गए मान का मान; `x_i` - उस पैरामीटर का मान जिसे हम `i` बिंदु पर सेट करते हैं।

एक उदाहरण ओम के नियम का संचालन है। विद्युत परिपथ के वर्गों के बीच वोल्टेज (संभावित अंतर) को बदलकर, हम इस खंड से गुजरने वाली धारा की मात्रा को मापते हैं। भौतिकी हमें प्रयोगात्मक रूप से मिली निर्भरता देता है:

`मैं = यू/आर`,
जहां `मैं` - वर्तमान ताकत; `आर` - प्रतिरोध; `यू` - वोल्टेज।

इस मामले में, `y_i` मापा गया वर्तमान मान है, और `x_i` वोल्टेज मान है।

एक अन्य उदाहरण के रूप में, विलयन में किसी पदार्थ के विलयन द्वारा प्रकाश के अवशोषण पर विचार करें। रसायन विज्ञान हमें सूत्र देता है:

`ए = एल सी`,
जहाँ `A` विलयन का प्रकाशिक घनत्व है; `ε` - विलेय संप्रेषण; `एल` - पथ की लंबाई जब प्रकाश एक क्यूवेट के माध्यम से एक समाधान के साथ गुजरता है; `C` विलेय की सांद्रता है।

इस मामले में, `y_i` मापा ऑप्टिकल घनत्व है `ए`, और `x_i` उस पदार्थ की एकाग्रता है जिसे हम सेट करते हैं।

हम उस मामले पर विचार करेंगे जब `x_i` की स्थापना में सापेक्ष त्रुटि `y_i` को मापने में सापेक्ष त्रुटि से बहुत कम है। हम यह भी मानेंगे कि `y_i` के सभी मापा मूल्य यादृच्छिक हैं और सामान्य रूप से वितरित हैं, अर्थात। सामान्य वितरण कानून का पालन करें।

`x` पर `y` की रैखिक निर्भरता के मामले में, हम सैद्धांतिक निर्भरता लिख सकते हैं:
`वाई = ए + बीएक्स`।

ज्यामितीय दृष्टिकोण से, गुणांक `बी` रेखा के झुकाव के कोण के स्पर्शरेखा को `एक्स` अक्ष और गुणांक `ए` - के प्रतिच्छेदन बिंदु पर `y` के मान को दर्शाता है। `y` अक्ष के साथ रेखा (`x = 0` के लिए)।

प्रतिगमन रेखा के मापदंडों का पता लगाना।

एक प्रयोग में, माप त्रुटियों के कारण `y_i` के मापा मूल्य सैद्धांतिक रेखा पर बिल्कुल नहीं हो सकते हैं, जो हमेशा वास्तविक जीवन में निहित होते हैं। इसलिए, समीकरणों की एक प्रणाली द्वारा एक रैखिक समीकरण का प्रतिनिधित्व किया जाना चाहिए:
`y_i = a + b x_i + _i` (1),
जहां `ε_i` `i`वें प्रयोग में `y` की अज्ञात माप त्रुटि है।

निर्भरता (1) को भी कहते हैं वापसी, अर्थात। सांख्यिकीय महत्व के साथ एक दूसरे पर दो मात्राओं की निर्भरता।

निर्भरता को बहाल करने का कार्य प्रायोगिक बिंदुओं [`y_i`, `x_i`] से गुणांक `ए` और `बी` को खोजना है।

गुणांक खोजने के लिए `a` और `b` आमतौर पर प्रयोग किया जाता है कम से कम वर्ग विधि(एमएनके)। यह अधिकतम संभावना सिद्धांत का एक विशेष मामला है।

आइए (1) को `ε_i = y_i - a - b x_i` के रूप में फिर से लिखें।

तब चुकता त्रुटियों का योग होगा
`Φ = sum_(i=1)^(n) ε_i^2 = sum_(i=1)^(n) (y_i - a - b x_i)^2`। (2)

कम से कम वर्ग विधि का सिद्धांत योग (2) को पैरामीटर `ए` और `बी` . के संबंध में कम करना है.

न्यूनतम तक पहुँच जाता है जब गुणांक के संबंध में योग (2) के आंशिक व्युत्पन्न `a` तथा `b` शून्य के बराबर हैं:
`frac(आंशिक Φ)(आंशिक a) = frac(आंशिक योग_(i=1)^(n) (y_i - a - b x_i)^2)(आंशिक a) = 0`
`फ्रैक(आंशिक Φ)(आंशिक बी) = फ़्रेक(आंशिक योग_(i=1)^(n) (y_i - a - b x_i)^2)(आंशिक b) = 0`

डेरिवेटिव का विस्तार करते हुए, हम दो अज्ञात के साथ दो समीकरणों की एक प्रणाली प्राप्त करते हैं:
`sum_(i=1)^(n) (2a + 2bx_i - 2y_i) = sum_(i=1)^(n) (a + bx_i - y_i) = 0`
`sum_(i=1)^(n) (2bx_i^2 + 2ax_i - 2x_iy_i) = sum_(i=1)^(n) (bx_i^2 + ax_i - x_iy_i) = 0`

हम कोष्ठक खोलते हैं और वांछित गुणांक से स्वतंत्र राशि को दूसरी छमाही में स्थानांतरित करते हैं, हमें रैखिक समीकरणों की एक प्रणाली मिलती है:
`sum_(i=1)^(n) y_i = a n + b sum_(i=1)^(n) bx_i`
`sum_(i=1)^(n) x_iy_i = a sum_(i=1)^(n) x_i + b sum_(i=1)^(n) x_i^2`

परिणामी प्रणाली को हल करते हुए, हम गुणांक `ए` और `बी` के लिए सूत्र ढूंढते हैं:

`a = frac(sum_(i=1)^(n) y_i sum_(i=1)^(n) x_i^2 - sum_(i=1)^(n) x_i sum_(i=1)^(n) ) x_iy_i) (n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2)` (3.1)

`बी = फ़्रेक (एन योग_(i=1)^(एन) x_iy_i - sum_(i=1)^(n) x_i sum_(i=1)^(n) y_i) (n sum_(i=1)^ (एन) x_i^2 - (sum_(i=1)^(n) x_i)^2)` (3.2)

इन सूत्रों का समाधान तब होता है जब `n > 1` (कम से कम 2 बिंदुओं का उपयोग करके रेखा खींची जा सकती है) और जब निर्धारक `D = n sum_(i=1)^(n) x_i^2 — (sum_(i= 1) )^(n) x_i)^2 != 0`, अर्थात। जब प्रयोग में `x_i` बिंदु भिन्न हों (अर्थात जब रेखा लंबवत न हो)।

प्रतीपगमन रेखा के गुणांकों में त्रुटियों का अनुमान

गुणांक `ए` और `बी` की गणना में त्रुटि के अधिक सटीक अनुमान के लिए, बड़ी संख्या में प्रयोगात्मक बिंदु वांछनीय हैं। जब `n = 2`, गुणांकों की त्रुटि का अनुमान लगाना असंभव है, क्योंकि सन्निकटन रेखा विशिष्ट रूप से दो बिंदुओं से होकर गुजरेगी।

यादृच्छिक चर `V` की त्रुटि निर्धारित की जाती है त्रुटि संचय कानून
`S_V^2 = sum_(i=1)^p (frac(आंशिक f)(आंशिक z_i))^2 S_(z_i)^2`,
जहां `p` `S_(z_i)` त्रुटि के साथ `z_i` पैरामीटर की संख्या है जो `S_V` त्रुटि को प्रभावित करती है;
`f` `z_i` पर `वी` का एक निर्भरता कार्य है।

आइए गुणांक `a` और `b` . की त्रुटि के लिए त्रुटियों के संचय का नियम लिखें
`S_a^2 = sum_(i=1)^(n)(frac(आंशिक a)(आंशिक y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(आंशिक a) )(आंशिक x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(आंशिक a)(आंशिक y_i))^2 `,
`S_b^2 = sum_(i=1)^(n)(frac(आंशिक ख)(आंशिक y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(आंशिक ख) )(आंशिक x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(आंशिक ख)(आंशिक y_i))^2 `,
इसलिये `S_(x_i)^2 = 0` (हमने पहले आरक्षण किया था कि `x` की त्रुटि नगण्य है)।

`S_y^2 = S_(y_i)^2` - `y` आयाम में त्रुटि (विचरण, वर्ग मानक विचलन), यह मानते हुए कि त्रुटि सभी `y` मानों के लिए एक समान है।

परिणामी व्यंजकों में `a` और `b` की गणना के लिए सूत्रों को प्रतिस्थापित करने पर, हम प्राप्त करते हैं

`S_a^2 = S_y^2 frac(sum_(i=1)^(n) (sum_(i=1)^(n) x_i^2 - x_i sum_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n sum_(i=1)^(n) x_i^2 - (sum_(i=1)^(n) x_i)^2) sum_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frac(sum_(i=1)^(n) x_i^2) (डी)` (4.1)

`S_b^2 = S_y^2 frac(sum_(i=1)^(n) (n x_i - sum_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n sum_(i=1)^(n) x_i^2 - (sum_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) ` (4.2)

अधिकांश वास्तविक प्रयोगों में, `Sy` का मान नहीं मापा जाता है। ऐसा करने के लिए, योजना के एक या कई बिंदुओं पर कई समानांतर माप (प्रयोग) करना आवश्यक है, जिससे प्रयोग का समय (और संभवतः लागत) बढ़ जाता है। इसलिए, आमतौर पर यह माना जाता है कि प्रतिगमन रेखा से `y` के विचलन को यादृच्छिक माना जा सकता है। इस मामले में विचरण अनुमान `y` की गणना सूत्र द्वारा की जाती है।

`S_y^2 = S_(y,rest)^2 = frac(sum_(i=1)^n (y_i - a - b x_i)^2) (n-2)`।

भाजक `n-2` प्रकट होता है क्योंकि हमने प्रयोगात्मक डेटा के एक ही नमूने के लिए दो गुणांकों की गणना के कारण स्वतंत्रता की डिग्री की संख्या कम कर दी है।

इस अनुमान को समाश्रयण रेखा `S_(y,rest)^2` के सापेक्ष अवशिष्ट विचरण भी कहा जाता है।

गुणांक के महत्व का आकलन छात्र की कसौटी के अनुसार किया जाता है

`t_a = frac(|a|) (S_a)`, `t_b = frac(|b|) (S_b)`

यदि परिकलित मानदंड `t_a`, `t_b` तालिका मानदंड `t(P, n-2)` से कम हैं, तो यह माना जाता है कि संबंधित गुणांक किसी दिए गए प्रायिकता `P` के साथ शून्य से महत्वपूर्ण रूप से भिन्न नहीं है।

एक रैखिक संबंध के विवरण की गुणवत्ता का आकलन करने के लिए, आप फिशर मानदंड का उपयोग करके माध्य के सापेक्ष `S_(y,rest)^2` और `S_(bar y)` की तुलना कर सकते हैं।

`S_(bar y) = frac(sum_(i=1)^n (y_i - bar y)^2) (n-1) = frac(sum_(i=1)^n (y_i - (sum_(i=) 1)^n y_i) /n)^2) (n-1) - माध्य के सापेक्ष `y` के प्रसरण का नमूना अनुमान।

निर्भरता का वर्णन करने के लिए प्रतिगमन समीकरण की प्रभावशीलता का मूल्यांकन करने के लिए, फिशर गुणांक की गणना की जाती है
`एफ = एस_(बार वाई) / एस_(वाई, आराम)^2`,
जिसकी तुलना सारणीबद्ध फिशर गुणांक F(p, n-1, n-2) से की जाती है।

यदि `F > F(P, n-1, n-2)`, निर्भरता के विवरण के बीच अंतर `y = f(x)` प्रतिगमन समीकरण का उपयोग करते हुए और माध्य का उपयोग करने वाले विवरण को संभाव्यता के साथ सांख्यिकीय रूप से महत्वपूर्ण माना जाता है `प`। वे। प्रतिगमन माध्य के आसपास `y` के प्रसार से बेहतर निर्भरता का वर्णन करता है।

चार्ट पर क्लिक करें
तालिका में मान जोड़ने के लिए

कम से कम वर्ग विधि। कम से कम वर्गों की विधि का अर्थ है अज्ञात मापदंडों का निर्धारण a, b, c, स्वीकृत कार्यात्मक निर्भरता

कम से कम वर्गों की विधि का अर्थ है अज्ञात मापदंडों का निर्धारण ए, बी, सी,…स्वीकृत कार्यात्मक निर्भरता

वाई = एफ (एक्स, ए, बी, सी,…),

जो त्रुटि का न्यूनतम माध्य वर्ग (विचरण) प्रदान करेगा

, (24)

जहाँ x i, y i - प्रयोग से प्राप्त संख्याओं के युग्मों का समुच्चय।

चूंकि कई चर के एक फ़ंक्शन के चरम के लिए शर्त यह है कि इसके आंशिक डेरिवेटिव शून्य के बराबर हैं, फिर पैरामीटर ए, बी, सी,…समीकरणों की प्रणाली से निर्धारित होते हैं:

; ; ; … (25)

यह याद रखना चाहिए कि फ़ंक्शन के रूप के बाद पैरामीटर का चयन करने के लिए कम से कम वर्ग विधि का उपयोग किया जाता है वाई = एफ (एक्स)परिभाषित।

यदि सैद्धांतिक विचारों से कोई निष्कर्ष निकालना असंभव है कि अनुभवजन्य सूत्र क्या होना चाहिए, तो किसी को दृश्य प्रतिनिधित्व द्वारा निर्देशित किया जाना चाहिए, मुख्य रूप से देखे गए डेटा का ग्राफिकल प्रतिनिधित्व।

व्यवहार में, अक्सर निम्न प्रकार के कार्यों तक सीमित होता है:

1) रैखिक ;

2) द्विघात a.

कम से कम वर्ग विधि का सार है प्रवृत्ति मॉडल के मापदंडों को खोजने में जो समय या स्थान में किसी भी यादृच्छिक घटना के विकास की प्रवृत्ति का सबसे अच्छा वर्णन करता है (एक प्रवृत्ति एक ऐसी रेखा है जो इस विकास की प्रवृत्ति को दर्शाती है)। कम से कम वर्ग विधि (ओएलएस) का कार्य न केवल कुछ प्रवृत्ति मॉडल ढूंढना है, बल्कि सबसे अच्छा या इष्टतम मॉडल ढूंढना है। यह मॉडल इष्टतम होगा यदि देखे गए वास्तविक मूल्यों और संबंधित परिकलित प्रवृत्ति मूल्यों के बीच चुकता विचलन का योग न्यूनतम (सबसे छोटा) है:

प्रेक्षित वास्तविक मान के बीच मानक विचलन कहाँ है

और संगत परिकलित प्रवृत्ति मूल्य,

अध्ययन के तहत घटना का वास्तविक (मनाया) मूल्य,

ट्रेंड मॉडल का अनुमानित मूल्य,

अध्ययन के तहत घटना की टिप्पणियों की संख्या।

MNC का उपयोग शायद ही कभी अपने आप होता है। एक नियम के रूप में, अक्सर इसका उपयोग केवल सहसंबंध अध्ययन में एक आवश्यक तकनीक के रूप में किया जाता है। यह याद रखना चाहिए कि एलएसएम का सूचना आधार केवल एक विश्वसनीय सांख्यिकीय श्रृंखला हो सकती है, और टिप्पणियों की संख्या 4 से कम नहीं होनी चाहिए, अन्यथा, एलएसएम की चौरसाई प्रक्रियाएं अपना सामान्य ज्ञान खो सकती हैं।

OLS टूलकिट को निम्न प्रक्रियाओं में घटाया गया है:

पहली प्रक्रिया। यह पता चलता है कि क्या चयनित कारक-तर्क में परिवर्तन होने पर परिणामी विशेषता को बदलने की कोई प्रवृत्ति है, या दूसरे शब्दों में, क्या "के बीच कोई संबंध है" पर " तथा " एक्स ».

दूसरी प्रक्रिया। यह निर्धारित किया जाता है कि कौन सी रेखा (प्रक्षेपवक्र) इस प्रवृत्ति का वर्णन या वर्णन करने में सबसे अच्छी है।

तीसरी प्रक्रिया।

उदाहरण. मान लीजिए हमारे पास अध्ययनाधीन खेत के लिए सूरजमुखी की औसत उपज के बारे में जानकारी है (सारणी 9.1)।

तालिका 9.1

अवलोकन संख्या

उत्पादकता, सी/हे

चूंकि हमारे देश में सूरजमुखी के उत्पादन में प्रौद्योगिकी का स्तर पिछले 10 वर्षों में ज्यादा नहीं बदला है, इसका मतलब है कि, सबसे अधिक संभावना है, विश्लेषण की अवधि में उपज में उतार-चढ़ाव मौसम और जलवायु परिस्थितियों में उतार-चढ़ाव पर निर्भर करता है। क्या यह सच है?

पहली बहुराष्ट्रीय कंपनी प्रक्रिया। विश्लेषण किए गए 10 वर्षों में मौसम और जलवायु परिस्थितियों में परिवर्तन के आधार पर सूरजमुखी की उपज में बदलाव की प्रवृत्ति के अस्तित्व के बारे में परिकल्पना का परीक्षण किया जा रहा है।

इस उदाहरण में, के लिए " आप » सूरजमुखी की उपज लेने की सलाह दी जाती है, और « एक्स » विश्लेषण की गई अवधि में देखे गए वर्ष की संख्या है। के बीच किसी भी संबंध के अस्तित्व के बारे में परिकल्पना का परीक्षण करना " एक्स " तथा " आप » दो तरीकों से किया जा सकता है: मैन्युअल रूप से और कंप्यूटर प्रोग्राम की मदद से। बेशक, कंप्यूटर प्रौद्योगिकी की उपलब्धता के साथ, यह समस्या अपने आप हल हो जाती है। लेकिन, ओएलएस टूलकिट को बेहतर ढंग से समझने के लिए, "के बीच संबंध के अस्तित्व के बारे में परिकल्पना का परीक्षण करना उचित है" एक्स " तथा " आप » मैन्युअल रूप से, जब केवल एक पेन और एक साधारण कैलकुलेटर हाथ में हों। ऐसे मामलों में, एक प्रवृत्ति के अस्तित्व की परिकल्पना को विश्लेषण की गई समय श्रृंखला की ग्राफिक छवि के स्थान से दृष्टिगत रूप से सर्वोत्तम रूप से जांचा जाता है - सहसंबंध क्षेत्र:

हमारे उदाहरण में सहसंबंध क्षेत्र धीरे-धीरे बढ़ती हुई रेखा के आसपास स्थित है। यह अपने आप में सूरजमुखी की उपज में परिवर्तन में एक निश्चित प्रवृत्ति के अस्तित्व को इंगित करता है। किसी भी प्रवृत्ति की उपस्थिति के बारे में केवल तभी बोलना असंभव है जब सहसंबंध क्षेत्र एक वृत्त, एक वृत्त, एक कड़ाई से लंबवत या कड़ाई से क्षैतिज बादल जैसा दिखता है, या इसमें बेतरतीब ढंग से बिखरे हुए बिंदु होते हैं। अन्य सभी मामलों में, "के बीच संबंध के अस्तित्व की परिकल्पना की पुष्टि करना आवश्यक है" एक्स " तथा " आप और अनुसंधान जारी रखें।

दूसरी बहुराष्ट्रीय कंपनी प्रक्रिया। यह निर्धारित किया जाता है कि कौन सी रेखा (प्रक्षेपवक्र) विश्लेषण की गई अवधि के लिए सूरजमुखी की उपज में परिवर्तन की प्रवृत्ति का वर्णन या विशेषता बताने में सक्षम है।

कंप्यूटर प्रौद्योगिकी की उपलब्धता के साथ, इष्टतम प्रवृत्ति का चयन स्वचालित रूप से होता है। "मैनुअल" प्रसंस्करण के साथ, इष्टतम फ़ंक्शन का चुनाव, एक नियम के रूप में, दृश्य तरीके से - सहसंबंध क्षेत्र के स्थान से किया जाता है। यही है, चार्ट के प्रकार के अनुसार, रेखा के समीकरण का चयन किया जाता है, जो अनुभवजन्य प्रवृत्ति (वास्तविक प्रक्षेपवक्र के लिए) के लिए सबसे उपयुक्त है।

जैसा कि आप जानते हैं, प्रकृति में कार्यात्मक निर्भरता की एक विशाल विविधता है, इसलिए उनमें से एक छोटे से हिस्से का भी नेत्रहीन विश्लेषण करना बेहद मुश्किल है। सौभाग्य से, वास्तविक आर्थिक व्यवहार में, अधिकांश संबंधों को या तो एक परवलय, या एक अतिपरवलय, या एक सीधी रेखा द्वारा सटीक रूप से वर्णित किया जा सकता है। इस संबंध में, सर्वोत्तम फ़ंक्शन का चयन करने के लिए "मैनुअल" विकल्प के साथ, आप स्वयं को केवल इन तीन मॉडलों तक सीमित कर सकते हैं।

		अतिपरवलय:

दूसरे क्रम का परवलय: :

यह देखना आसान है कि हमारे उदाहरण में, विश्लेषण किए गए 10 वर्षों में सूरजमुखी की उपज में बदलाव की प्रवृत्ति एक सीधी रेखा द्वारा सबसे अच्छी विशेषता है, इसलिए प्रतिगमन समीकरण एक सीधी रेखा समीकरण होगा।

तीसरी प्रक्रिया। इस रेखा की विशेषता वाले प्रतिगमन समीकरण के मापदंडों की गणना की जाती है, या दूसरे शब्दों में, एक विश्लेषणात्मक सूत्र निर्धारित किया जाता है जो सर्वोत्तम प्रवृत्ति मॉडल का वर्णन करता है।

प्रतिगमन समीकरण के मापदंडों के मूल्यों को खोजना, हमारे मामले में, पैरामीटर और , एलएसएम का मूल है। यह प्रक्रिया सामान्य समीकरणों की एक प्रणाली को हल करने के लिए कम हो जाती है।

(9.2)

गॉस विधि द्वारा समीकरणों की यह प्रणाली काफी आसानी से हल हो जाती है। याद रखें कि समाधान के परिणामस्वरूप, हमारे उदाहरण में, मापदंडों के मूल्य और पाए जाते हैं। इस प्रकार, पाया गया प्रतिगमन समीकरण का निम्न रूप होगा:

श्रेणियाँ

स्क्रीनिंग

चरम सीमाओं का अल्ट्रासाउंड

अल्ट्रासाउंड के प्रकार

पेट का अल्ट्रासाउंड

छाती का अल्ट्रासाउंड

लोकप्रिय लेख

	हम समझते हैं कि पुतिन कितना कमाते हैं
	मौखिक आक्रामकता और मनोवैज्ञानिक दबाव: एक बेकार या जोड़तोड़ करने वाले से कैसे लड़ें मनोवैज्ञानिक दबाव की स्थिति में व्यवहार की विशेषताएं
	प्रायोजक कैसे खोजें और वे पैसे क्यों देते हैं
	रेंटल एग्रीमेंट टेम्प्लेट
	वार्ताकार को प्रभावित करने की मनोवैज्ञानिक तकनीक मौखिक प्रस्तुति में ध्यान आकर्षित करने की तकनीक

2022 "kingad.ru" - मानव अंगों की अल्ट्रासाउंड परीक्षा