न्यूनतम वर्ग विधि का उपयोग करके डेटा विश्लेषण। एक्सेल में न्यूनतम वर्ग
न्यूनतम वर्ग विधि
विषय के अंतिम पाठ में हम सबसे प्रसिद्ध एप्लिकेशन से परिचित होंगे एफएनपी, जो विज्ञान और अभ्यास के विभिन्न क्षेत्रों में सबसे व्यापक अनुप्रयोग पाता है। यह भौतिकी, रसायन विज्ञान, जीव विज्ञान, अर्थशास्त्र, समाजशास्त्र, मनोविज्ञान इत्यादि हो सकता है। भाग्य की इच्छा से, मुझे अक्सर अर्थव्यवस्था से निपटना पड़ता है, और इसलिए आज मैं आपके लिए एक अद्भुत देश के लिए टिकट की व्यवस्था करूंगा जिसे कहा जाता है अर्थमिति=)...आप ऐसा कैसे नहीं चाहते?! यह वहां बहुत अच्छा है - आपको बस निर्णय लेना है! ...लेकिन आप निश्चित रूप से यह सीखना चाहते हैं कि समस्याओं को कैसे हल किया जाए कम से कम वर्गों. और विशेष रूप से मेहनती पाठक उन्हें न केवल सटीक रूप से, बल्कि बहुत तेजी से हल करना सीखेंगे ;-) लेकिन पहले समस्या का सामान्य विवरण+संबंधित उदाहरण:
कुछ विषय क्षेत्र में संकेतकों का अध्ययन किया जाए जिनकी मात्रात्मक अभिव्यक्ति हो। साथ ही, यह मानने का हर कारण है कि संकेतक संकेतक पर निर्भर करता है। यह धारणा वैज्ञानिक परिकल्पना और प्राथमिक सामान्य ज्ञान पर आधारित दोनों हो सकती है। हालाँकि, आइए विज्ञान को एक तरफ छोड़ दें, और अधिक स्वादिष्ट क्षेत्रों का पता लगाएं - अर्थात् किराना स्टोर। द्वारा निरूपित करें:
- किराने की दुकान का खुदरा स्थान, वर्ग मीटर,
- किराना स्टोर का वार्षिक कारोबार, मिलियन रूबल।
यह बिल्कुल स्पष्ट है कि स्टोर का क्षेत्रफल जितना बड़ा होगा, ज्यादातर मामलों में उसका टर्नओवर उतना ही अधिक होगा।
मान लीजिए कि अवलोकन/प्रयोग/गणना/डफ के साथ नृत्य करने के बाद, हमारे पास संख्यात्मक डेटा है:
किराने की दुकानों के साथ, मुझे लगता है कि सब कुछ स्पष्ट है: - यह पहली दुकान का क्षेत्र है, - इसका वार्षिक कारोबार, - दूसरी दुकान का क्षेत्र, - इसका वार्षिक कारोबार, आदि। वैसे, वर्गीकृत सामग्रियों तक पहुंच होना बिल्कुल भी आवश्यक नहीं है - टर्नओवर का काफी सटीक मूल्यांकन इसका उपयोग करके प्राप्त किया जा सकता है गणितीय सांख्यिकी. हालाँकि, विचलित न हों, व्यावसायिक जासूसी का कोर्स पहले ही भुगतान किया जा चुका है =)
सारणीबद्ध डेटा को बिंदुओं के रूप में भी लिखा जा सकता है और हमारे लिए सामान्य तरीके से दर्शाया जा सकता है। कार्तीय प्रणाली .
आइए एक महत्वपूर्ण प्रश्न का उत्तर दें: गुणात्मक अध्ययन के लिए कितने अंक आवश्यक हैं?
जितना बड़ा उतना बेहतर। न्यूनतम स्वीकार्य सेट में 5-6 अंक होते हैं। इसके अलावा, डेटा की थोड़ी मात्रा के साथ, "असामान्य" परिणामों को नमूने में शामिल नहीं किया जाना चाहिए। इसलिए, उदाहरण के लिए, एक छोटा संभ्रांत स्टोर "अपने सहयोगियों" से अधिक परिमाण के ऑर्डरों में मदद कर सकता है, जिससे सामान्य पैटर्न को विकृत किया जा सकता है जिसे खोजने की आवश्यकता है!
यदि यह काफी सरल है, तो हमें एक फ़ंक्शन चुनना होगा, अनुसूचीजो जितना संभव हो सके बिंदुओं के करीब से गुजरता है . ऐसे फ़ंक्शन को कहा जाता है अनुमान करने वाले (अनुमान - सन्निकटन)या सैद्धांतिक कार्य . सामान्यतया, यहां एक स्पष्ट "दिखावा" तुरंत प्रकट होता है - उच्च डिग्री का एक बहुपद, जिसका ग्राफ सभी बिंदुओं से होकर गुजरता है। लेकिन यह विकल्प जटिल है, और अक्सर ग़लत भी होता है। (क्योंकि चार्ट हर समय "हवा" करेगा और मुख्य प्रवृत्ति को खराब रूप से प्रतिबिंबित करेगा).
इस प्रकार, वांछित कार्य पर्याप्त रूप से सरल होना चाहिए और साथ ही निर्भरता को पर्याप्त रूप से प्रतिबिंबित करना चाहिए। जैसा कि आप अनुमान लगा सकते हैं, ऐसे फ़ंक्शंस को खोजने के तरीकों में से एक को कहा जाता है कम से कम वर्गों. सबसे पहले, आइए इसके सार का सामान्य तरीके से विश्लेषण करें। कुछ फ़ंक्शन को प्रायोगिक डेटा का अनुमान लगाने दें:
इस सन्निकटन की सटीकता का मूल्यांकन कैसे करें? आइए हम प्रयोगात्मक और कार्यात्मक मूल्यों के बीच अंतर (विचलन) की भी गणना करें (हम ड्राइंग का अध्ययन करते हैं). पहला विचार जो मन में आता है वह यह अनुमान लगाना है कि राशि कितनी बड़ी है, लेकिन समस्या यह है कि अंतर नकारात्मक हो सकते हैं। (उदाहरण के लिए, )
और ऐसे योग के परिणामस्वरूप विचलन एक दूसरे को रद्द कर देंगे। इसलिए, अनुमान की सटीकता के अनुमान के रूप में, यह योग लेने का सुझाव देता है मॉड्यूलविचलन:
या मुड़े हुए रूप में: (उन लोगों के लिए जो नहीं जानते: योग चिह्न है, और - सहायक चर - "काउंटर", जो 1 से मान लेता है ) .
विभिन्न कार्यों के साथ प्रयोगात्मक बिंदुओं का अनुमान लगाने पर, हमें अलग-अलग मान मिलेंगे, और यह स्पष्ट है कि जहां यह योग कम है - वह फ़ंक्शन अधिक सटीक है।
ऐसी विधि मौजूद है और इसे कहा जाता है न्यूनतम मापांक विधि. हालाँकि, व्यवहार में यह बहुत अधिक व्यापक हो गया है। न्यूनतम वर्ग विधि, जिसमें संभावित नकारात्मक मान मापांक द्वारा नहीं, बल्कि विचलनों का वर्ग करके समाप्त किए जाते हैं:
, जिसके बाद ऐसे फ़ंक्शन के चयन के लिए प्रयास किए जाते हैं जो वर्ग विचलन का योग हो जितना संभव हो उतना छोटा था. दरअसल, इसलिए विधि का नाम.
और अब हम एक और महत्वपूर्ण बिंदु पर लौटते हैं: जैसा कि ऊपर बताया गया है, चयनित फ़ंक्शन काफी सरल होना चाहिए - लेकिन ऐसे कई फ़ंक्शन भी हैं: रेखीय , अतिपरवलिक , घातीय , लघुगणक , द्विघात वगैरह। और, निःसंदेह, यहां मैं तुरंत "गतिविधि के क्षेत्र को कम करना" चाहूंगा। अनुसंधान के लिए किस वर्ग के कार्यों को चुनना है? आदिम लेकिन प्रभावी तकनीक:
- अंक निकालने का सबसे आसान तरीका ड्राइंग पर और उनके स्थान का विश्लेषण करें। यदि वे एक सीधी रेखा में होते हैं, तो आपको तलाश करनी चाहिए सीधी रेखा समीकरण इष्टतम मूल्यों के साथ और। दूसरे शब्दों में, कार्य ऐसे गुणांक ढूंढना है - ताकि वर्ग विचलन का योग सबसे छोटा हो।
यदि बिंदु स्थित हैं, उदाहरण के लिए, साथ में अतिशयोक्ति, तो यह स्पष्ट है कि रैखिक फ़ंक्शन खराब सन्निकटन देगा। इस मामले में, हम हाइपरबोला समीकरण के लिए सबसे "अनुकूल" गुणांक की तलाश कर रहे हैं - वे जो वर्गों का न्यूनतम योग देते हैं .
अब गौर करें कि हम दोनों मामलों में किस बारे में बात कर रहे हैं दो चर के कार्य, किसके तर्क हैं निर्भरता विकल्प खोजे गए:
और संक्षेप में, हमें एक मानक समस्या को हल करने की आवश्यकता है - खोजने के लिए दो चर वाले फ़ंक्शन का न्यूनतम.
हमारे उदाहरण को याद करें: मान लीजिए कि "दुकान" बिंदु एक सीधी रेखा में स्थित होते हैं और उपस्थिति पर विश्वास करने का हर कारण है रैखिक निर्भरताव्यापारिक क्षेत्र से कारोबार। आइए ऐसे गुणांक "ए" और "बी" ढूंढें ताकि वर्ग विचलन का योग हो सबसे छोटा था. सब कुछ हमेशा की तरह - पहले प्रथम क्रम का आंशिक व्युत्पन्न. के अनुसार रैखिकता नियमआप योग चिह्न के ठीक नीचे अंतर कर सकते हैं:
यदि आप इस जानकारी का उपयोग किसी निबंध या टर्म पेपर के लिए करना चाहते हैं, तो मैं स्रोतों की सूची में लिंक के लिए बहुत आभारी रहूंगा, आपको ऐसी विस्तृत गणना कहीं भी नहीं मिलेगी:
आइए एक मानक प्रणाली बनाएं:
हम प्रत्येक समीकरण को "दो" से कम करते हैं और, इसके अलावा, योग को "विभाजित" करते हैं:
टिप्पणी : स्वतंत्र रूप से विश्लेषण करें कि "ए" और "बी" को योग चिह्न से क्यों हटाया जा सकता है। वैसे, औपचारिक तौर पर रकम से ऐसा किया जा सकता है
आइए सिस्टम को "लागू" रूप में फिर से लिखें:
जिसके बाद हमारी समस्या को हल करने के लिए एल्गोरिदम तैयार किया जाना शुरू होता है:
क्या हम बिंदुओं के निर्देशांक जानते हैं? हम जानते हैं। रकम क्या हम ढूंढ सकते हैं? आसानी से। हम सबसे सरल रचना करते हैं दो अज्ञात के साथ दो रैखिक समीकरणों की प्रणाली("ए" और "बेह"). हम सिस्टम को हल करते हैं, उदाहरण के लिए, क्रैमर विधि, जिसके परिणामस्वरूप एक स्थिर बिंदु बनता है . चेकिंग चरम सीमा के लिए पर्याप्त स्थिति, हम इस बिंदु पर फ़ंक्शन को सत्यापित कर सकते हैं सटीक पहुंचता है न्यूनतम. सत्यापन अतिरिक्त गणनाओं से जुड़ा है और इसलिए हम इसे पर्दे के पीछे छोड़ देंगे। (यदि आवश्यक हो, तो लापता फ़्रेम को देखा जा सकता हैयहाँ ) . हम अंतिम निष्कर्ष निकालते हैं:
समारोह सबसे अच्छा तरीका (कम से कम किसी अन्य रैखिक फ़ंक्शन की तुलना में)प्रयोगात्मक बिंदुओं को करीब लाता है . मोटे तौर पर कहें तो इसका ग्राफ जितना संभव हो सके इन बिंदुओं के करीब से गुजरता है। परंपरा में अर्थमितिपरिणामी सन्निकटन फलन को भी कहा जाता है युग्मित रैखिक प्रतिगमन समीकरण .
विचाराधीन समस्या अत्यधिक व्यावहारिक महत्व की है। हमारे उदाहरण की स्थिति में, समीकरण आपको यह अनुमान लगाने की अनुमति देता है कि किस प्रकार का टर्नओवर होगा ("यिग")विक्रय क्षेत्र के किसी न किसी मूल्य के साथ स्टोर पर होगा ("x" का एक या दूसरा अर्थ). हां, परिणामी पूर्वानुमान केवल एक पूर्वानुमान होगा, लेकिन कई मामलों में यह काफी सटीक साबित होगा।
मैं "वास्तविक" संख्याओं के साथ सिर्फ एक समस्या का विश्लेषण करूंगा, क्योंकि इसमें कोई कठिनाई नहीं है - सभी गणनाएं ग्रेड 7-8 में स्कूल पाठ्यक्रम के स्तर पर हैं। 95 प्रतिशत मामलों में, आपको केवल एक रैखिक फ़ंक्शन खोजने के लिए कहा जाएगा, लेकिन लेख के अंत में मैं दिखाऊंगा कि इष्टतम हाइपरबोला, घातांक और कुछ अन्य कार्यों के लिए समीकरण ढूंढना अधिक कठिन नहीं है।
वास्तव में, यह वादा किए गए उपहारों को वितरित करने के लिए बना हुआ है - ताकि आप सीखें कि ऐसे उदाहरणों को न केवल सटीक रूप से, बल्कि जल्दी से कैसे हल किया जाए। हम मानक का ध्यानपूर्वक अध्ययन करते हैं:
काम
दो संकेतकों के बीच संबंध का अध्ययन करने के परिणामस्वरूप, संख्याओं के निम्नलिखित जोड़े प्राप्त हुए:
न्यूनतम वर्ग विधि का उपयोग करके, वह रैखिक फ़ंक्शन ढूंढें जो अनुभवजन्य का सबसे अच्छा अनुमान लगाता है (अनुभव)डेटा। एक चित्र बनाएं जिस पर, कार्टेशियन आयताकार समन्वय प्रणाली में, प्रयोगात्मक बिंदु और अनुमानित फ़ंक्शन का एक ग्राफ़ बनाएं . अनुभवजन्य और सैद्धांतिक मूल्यों के बीच वर्ग विचलन का योग ज्ञात कीजिए। पता लगाएं कि क्या फ़ंक्शन बेहतर है (न्यूनतम वर्ग विधि के संदर्भ में)अनुमानित प्रायोगिक बिंदु.
ध्यान दें कि "x" मान प्राकृतिक मान हैं, और इसका एक विशिष्ट सार्थक अर्थ है, जिसके बारे में मैं थोड़ी देर बाद बात करूंगा; लेकिन निस्संदेह, वे भिन्नात्मक हो सकते हैं। इसके अलावा, किसी विशेष कार्य की सामग्री के आधार पर, "X" और "G" दोनों मान पूर्ण या आंशिक रूप से नकारात्मक हो सकते हैं। खैर, हमें एक "फेसलेस" कार्य दिया गया है, और हम इसे शुरू करते हैं समाधान:
हम सिस्टम के समाधान के रूप में इष्टतम फ़ंक्शन के गुणांक पाते हैं:
अधिक संक्षिप्त नोटेशन के प्रयोजनों के लिए, "काउंटर" वेरिएबल को छोड़ा जा सकता है, क्योंकि यह पहले से ही स्पष्ट है कि योग 1 से 1 तक किया जाता है।
आवश्यक राशियों की गणना सारणीबद्ध रूप में करना अधिक सुविधाजनक है:
गणना माइक्रोकैलकुलेटर पर की जा सकती है, लेकिन एक्सेल का उपयोग करना बहुत बेहतर है - तेज और त्रुटियों के बिना; एक छोटा वीडियो देखें:
इस प्रकार, हमें निम्नलिखित प्राप्त होता है प्रणाली:
यहां आप दूसरे समीकरण को 3 से गुणा कर सकते हैं पहले समीकरण से दूसरे को पद दर पद घटाएँ. लेकिन यह भाग्य है - व्यवहार में, सिस्टम अक्सर उपहार में नहीं दिए जाते हैं, और ऐसे मामलों में यह बचाता है क्रैमर विधि:
, इसलिए सिस्टम के पास एक अनूठा समाधान है।
चलो एक जाँच करते हैं. मैं समझता हूं कि मैं ऐसा नहीं करना चाहता, लेकिन उन गलतियों को क्यों छोड़ें जहां आप उन्हें बिल्कुल नहीं भूल सकते? सिस्टम के प्रत्येक समीकरण के बाईं ओर पाए गए समाधान को प्रतिस्थापित करें:
संगत समीकरणों के सही भाग प्राप्त होते हैं, जिसका अर्थ है कि सिस्टम सही ढंग से हल हो गया है।
इस प्रकार, वांछित सन्निकटन फलन:- से सभी रैखिक कार्यप्रायोगिक डेटा का सबसे अच्छा अनुमान इसके द्वारा लगाया जाता है।
भिन्न सीधा स्टोर के टर्नओवर की उसके क्षेत्र पर निर्भरता, पाई गई निर्भरता है रिवर्स (सिद्धांत "जितना अधिक - उतना कम"), और यह तथ्य तुरंत नकारात्मक द्वारा प्रकट हो जाता है कोणीय गुणांक. समारोह हमें सूचित करता है कि एक निश्चित संकेतक में 1 इकाई की वृद्धि के साथ, आश्रित संकेतक का मूल्य घट जाता है औसत 0.65 इकाइयों द्वारा. जैसा कि वे कहते हैं, एक प्रकार का अनाज की कीमत जितनी अधिक होगी, उतनी ही कम बिक्री होगी।
अनुमानित फ़ंक्शन को प्लॉट करने के लिए, हम इसके दो मान पाते हैं:
और ड्राइंग निष्पादित करें:
निर्मित रेखा कहलाती है प्रवृत्ति रेखा
(अर्थात्, एक रैखिक प्रवृत्ति रेखा, यानी सामान्य स्थिति में, एक प्रवृत्ति जरूरी नहीं कि एक सीधी रेखा हो). हर कोई "प्रवृत्ति में रहना" अभिव्यक्ति से परिचित है, और मुझे लगता है कि इस शब्द को अतिरिक्त टिप्पणियों की आवश्यकता नहीं है।
वर्ग विचलनों के योग की गणना करें अनुभवजन्य और सैद्धांतिक मूल्यों के बीच. ज्यामितीय रूप से, यह "क्रिमसन" खंडों की लंबाई के वर्गों का योग है (जिनमें से दो इतने छोटे हैं कि आप उन्हें देख भी नहीं सकते).
आइए एक तालिका में गणनाओं को संक्षेप में प्रस्तुत करें:
इन्हें फिर से मैन्युअल रूप से किया जा सकता है, बस मामले में मैं पहले बिंदु के लिए एक उदाहरण दूंगा:
लेकिन पहले से ज्ञात तरीके से ऐसा करना कहीं अधिक कुशल है:
आइए दोहराएँ: परिणाम का मतलब क्या है?से सभी रैखिक कार्यसमारोह प्रतिपादक सबसे छोटा है, अर्थात यह अपने परिवार में सबसे अच्छा सन्निकटन है। और यहाँ, वैसे, समस्या का अंतिम प्रश्न आकस्मिक नहीं है: क्या होगा यदि प्रस्तावित घातीय फ़ंक्शन प्रयोगात्मक बिंदुओं का बेहतर अनुमान लगाएगा?
आइए वर्ग विचलनों का संगत योग ज्ञात करें - उन्हें अलग करने के लिए, मैं उन्हें "एप्सिलॉन" अक्षर से नामित करूंगा। तकनीक बिल्कुल वैसी ही है:
और फिर से प्रत्येक अग्नि गणना के लिए पहले बिंदु के लिए:
एक्सेल में, हम मानक फ़ंक्शन का उपयोग करते हैं ऍक्स्प (सिंटैक्स एक्सेल सहायता में पाया जा सकता है).
निष्कर्ष: , इसलिए घातांकीय फ़ंक्शन प्रयोगात्मक बिंदुओं का अनुमान सीधी रेखा से भी बदतर लगाता है .
लेकिन यहां यह ध्यान दिया जाना चाहिए कि "बदतर" है अभी तक इसका मतलब नहीं है, गलत क्या है। अब मैंने इस घातीय फ़ंक्शन का एक ग्राफ़ बनाया - और यह बिंदुओं के करीब से भी गुजरता है - इतना कि विश्लेषणात्मक अध्ययन के बिना यह कहना मुश्किल है कि कौन सा फ़ंक्शन अधिक सटीक है।
यह समाधान पूरा करता है, और मैं तर्क के प्राकृतिक मूल्यों के प्रश्न पर लौटता हूं। विभिन्न अध्ययनों में, एक नियम के रूप में, आर्थिक या समाजशास्त्रीय, महीनों, वर्षों या अन्य समान समय अंतरालों को प्राकृतिक "X" के साथ क्रमांकित किया जाता है। उदाहरण के लिए, निम्नलिखित समस्या पर विचार करें:
हमारे पास वर्ष की पहली छमाही के लिए स्टोर के खुदरा कारोबार पर निम्नलिखित डेटा है:
सीधी रेखा विश्लेषणात्मक संरेखण का उपयोग करके, जुलाई के लिए बिक्री की मात्रा ज्ञात करें.
हां, कोई समस्या नहीं: हम महीनों को 1, 2, 3, 4, 5, 6 नंबर देते हैं और सामान्य एल्गोरिदम का उपयोग करते हैं, जिसके परिणामस्वरूप हमें एक समीकरण मिलता है - जब समय की बात आती है तो आमतौर पर केवल अक्षर "ते" होता है। " (हालाँकि यह महत्वपूर्ण नहीं है). परिणामी समीकरण से पता चलता है कि वर्ष की पहली छमाही में टर्नओवर में औसतन CU 27.74 की वृद्धि हुई। प्रति महीने। जुलाई के लिए पूर्वानुमान प्राप्त करें (माह #7): यूरोपीय संघ।
और इसी प्रकार के कार्य - अँधेरा ही अँधेरा है। जो लोग चाहें वे एक अतिरिक्त सेवा का उपयोग कर सकते हैं, अर्थात् मेरी एक्सेल कैलकुलेटर (प्रदर्शन के लिए संस्करण), कौन समस्या को लगभग तुरंत हल करता है!प्रोग्राम का कार्यशील संस्करण उपलब्ध है बदले मेंया के लिए प्रतीकात्मक भुगतान.
पाठ के अंत में, कुछ अन्य प्रकार की निर्भरताएँ खोजने के बारे में एक संक्षिप्त जानकारी। दरअसल, बताने के लिए कुछ खास नहीं है, क्योंकि मौलिक दृष्टिकोण और समाधान एल्गोरिदम वही रहते हैं।
आइए मान लें कि प्रयोगात्मक बिंदुओं का स्थान हाइपरबोला जैसा दिखता है। फिर, सर्वोत्तम हाइपरबोला के गुणांकों को खोजने के लिए, आपको न्यूनतम फ़ंक्शन को खोजने की आवश्यकता है - जो लोग विस्तृत गणना करना चाहते हैं और एक समान प्रणाली में आ सकते हैं:
औपचारिक तकनीकी दृष्टि से इसे "रैखिक" प्रणाली से प्राप्त किया जाता है (आइए इसे तारांकन चिह्न से चिह्नित करें)"x" को . से प्रतिस्थापित करना। ख़ैर, रकमें गणना करें, जिसके बाद इष्टतम गुणांक "ए" और "बीई" करें उपलब्ध.
यदि उस बात पर विश्वास करने का हर कारण है एक लघुगणकीय वक्र के साथ व्यवस्थित किया जाता है, फिर इष्टतम मानों की खोज करने और फ़ंक्शन का न्यूनतम खोजने के लिए . औपचारिक रूप से, सिस्टम में (*) को इसके द्वारा प्रतिस्थापित किया जाना चाहिए:
एक्सेल में गणना करते समय, फ़ंक्शन का उपयोग करें एल.एन. मैं स्वीकार करता हूं कि विचाराधीन प्रत्येक मामले के लिए कैलकुलेटर बनाना मेरे लिए मुश्किल नहीं होगा, लेकिन यह तब भी बेहतर होगा यदि आप गणनाओं को स्वयं "प्रोग्राम" करें। मदद के लिए वीडियो ट्यूटोरियल.
घातीय निर्भरता के साथ, स्थिति थोड़ी अधिक जटिल है। मामले को रैखिक मामले में कम करने के लिए, हम फ़ंक्शन का लघुगणक लेते हैं और उपयोग करते हैं लघुगणक के गुण:
अब, प्राप्त फ़ंक्शन की तुलना रैखिक फ़ंक्शन से करते हुए, हम इस निष्कर्ष पर पहुंचते हैं कि सिस्टम में (*) को और - द्वारा प्रतिस्थापित किया जाना चाहिए। सुविधा के लिए, हम निरूपित करते हैं:
कृपया ध्यान दें कि सिस्टम को और के संबंध में हल किया गया है, और इसलिए, जड़ों को खोजने के बाद, आपको स्वयं गुणांक को ढूंढना नहीं भूलना चाहिए।
प्रायोगिक बिंदुओं का अनुमान लगाना इष्टतम परवलय , मिलना चाहिए न्यूनतम तीन चर वाला एक फ़ंक्शन. मानक क्रियाएं करने के बाद, हमें निम्नलिखित "कार्य" मिलता है प्रणाली:
हाँ, बेशक, यहाँ अधिक मात्राएँ हैं, लेकिन अपने पसंदीदा एप्लिकेशन का उपयोग करते समय कोई कठिनाई नहीं होती है। और अंत में, मैं आपको बताऊंगा कि एक्सेल का उपयोग करके जल्दी से कैसे जांच करें और वांछित ट्रेंड लाइन बनाएं: एक स्कैटर चार्ट बनाएं, माउस से किसी भी बिंदु का चयन करें और चयन विकल्प पर राइट क्लिक करें "ट्रेंड लाइन जोड़ें". इसके बाद, चार्ट का प्रकार और टैब चुनें "विकल्प"विकल्प सक्रिय करें "चार्ट पर समीकरण दिखाएँ". ठीक है
हमेशा की तरह, मैं लेख को कुछ सुंदर वाक्यांश के साथ समाप्त करना चाहता हूं, और मैंने लगभग टाइप किया "ट्रेंड में रहें!"। लेकिन समय के साथ उन्होंने अपना मन बदल लिया. और इसलिए नहीं कि यह फार्मूलाबद्ध है। मैं किसी को नहीं जानता, लेकिन मैं प्रचारित अमेरिकी और विशेष रूप से यूरोपीय प्रवृत्ति का बिल्कुल भी पालन नहीं करना चाहता =) इसलिए, मैं चाहता हूं कि आप में से प्रत्येक अपनी-अपनी लाइन पर कायम रहे!
http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html
न्यूनतम वर्ग विधि सबसे आम में से एक है और इसके कारण यह सबसे अधिक विकसित है रैखिक अर्थमिति मॉडल के मापदंडों का आकलन करने के तरीकों की सादगी और दक्षता. उसी समय, इसका उपयोग करते समय कुछ सावधानी बरतनी चाहिए, क्योंकि इसका उपयोग करके बनाए गए मॉडल अपने मापदंडों की गुणवत्ता के लिए कई आवश्यकताओं को पूरा नहीं कर सकते हैं और परिणामस्वरूप, प्रक्रिया विकास के पैटर्न को "अच्छी तरह से" प्रतिबिंबित नहीं करते हैं।
आइए कम से कम वर्ग विधि का उपयोग करके एक रैखिक अर्थमिति मॉडल के मापदंडों का अनुमान लगाने की प्रक्रिया पर अधिक विस्तार से विचार करें। ऐसे मॉडल को सामान्य रूप में समीकरण (1.2) द्वारा दर्शाया जा सकता है:
y t = a 0 + a 1 x 1t +...+ a n x nt + ε t।
मापदंडों का अनुमान लगाते समय प्रारंभिक डेटा a 0 , a 1 ,..., a n निर्भर चर के मानों का वेक्टर है य= (y 1 , y 2 , ... , y T)" और स्वतंत्र चर के मानों का मैट्रिक्स
जिसमें पहला कॉलम, जिसमें एक शामिल है, मॉडल के गुणांक से मेल खाता है।
न्यूनतम वर्ग विधि को इसका नाम इस मूल सिद्धांत के आधार पर मिला है कि इसके आधार पर प्राप्त पैरामीटर अनुमान को संतुष्ट करना चाहिए: मॉडल त्रुटि के वर्गों का योग न्यूनतम होना चाहिए।
न्यूनतम वर्ग विधि द्वारा समस्याओं को हल करने के उदाहरण
उदाहरण 2.1.व्यापारिक उद्यम का एक नेटवर्क है जिसमें 12 स्टोर शामिल हैं, जिनकी गतिविधियों की जानकारी तालिका में प्रस्तुत की गई है। 2.1.
कंपनी का प्रबंधन जानना चाहेगा कि वार्षिक कारोबार का आकार स्टोर के खुदरा स्थान पर कैसे निर्भर करता है।
तालिका 2.1
दुकान का नंबर | वार्षिक कारोबार, मिलियन रूबल | व्यापार क्षेत्र, हजार मी 2 |
19,76 | 0,24 | |
38,09 | 0,31 | |
40,95 | 0,55 | |
41,08 | 0,48 | |
56,29 | 0,78 | |
68,51 | 0,98 | |
75,01 | 0,94 | |
89,05 | 1,21 | |
91,13 | 1,29 | |
91,26 | 1,12 | |
99,84 | 1,29 | |
108,55 | 1,49 |
न्यूनतम वर्ग समाधान.आइए नामित करें - -वें स्टोर का वार्षिक कारोबार, मिलियन रूबल; -वें स्टोर का विक्रय क्षेत्र, हजार मी 2।
चित्र.2.1. उदाहरण 2.1 के लिए स्कैटरप्लॉट
चरों के बीच कार्यात्मक संबंध का स्वरूप निर्धारित करना और एक स्कैटरप्लॉट का निर्माण करना (चित्र 2.1)।
स्कैटर आरेख के आधार पर, हम यह निष्कर्ष निकाल सकते हैं कि वार्षिक कारोबार बिक्री क्षेत्र पर सकारात्मक रूप से निर्भर है (यानी, y की वृद्धि के साथ वृद्धि होगी)। कार्यात्मक कनेक्शन का सबसे उपयुक्त रूप है रेखीय.
आगे की गणना के लिए जानकारी तालिका में प्रस्तुत की गई है। 2.2. न्यूनतम वर्ग विधि का उपयोग करके, हम रैखिक एक-कारक अर्थमिति मॉडल के मापदंडों का अनुमान लगाते हैं
तालिका 2.2
टी | आप टी | एक्स 1t | य टी 2 | x1t2 | x 1t y t |
19,76 | 0,24 | 390,4576 | 0,0576 | 4,7424 | |
38,09 | 0,31 | 1450,8481 | 0,0961 | 11,8079 | |
40,95 | 0,55 | 1676,9025 | 0,3025 | 22,5225 | |
41,08 | 0,48 | 1687,5664 | 0,2304 | 19,7184 | |
56,29 | 0,78 | 3168,5641 | 0,6084 | 43,9062 | |
68,51 | 0,98 | 4693,6201 | 0,9604 | 67,1398 | |
75,01 | 0,94 | 5626,5001 | 0,8836 | 70,5094 | |
89,05 | 1,21 | 7929,9025 | 1,4641 | 107,7505 | |
91,13 | 1,29 | 8304,6769 | 1,6641 | 117,5577 | |
91,26 | 1,12 | 8328,3876 | 1,2544 | 102,2112 | |
99,84 | 1,29 | 9968,0256 | 1,6641 | 128,7936 | |
108,55 | 1,49 | 11783,1025 | 2,2201 | 161,7395 | |
एस | 819,52 | 10,68 | 65008,554 | 11,4058 | 858,3991 |
औसत | 68,29 | 0,89 |
इस प्रकार,
इसलिए, व्यापार क्षेत्र में 1 हजार मीटर 2 की वृद्धि के साथ, अन्य चीजें समान होने पर, औसत वार्षिक कारोबार 67.8871 मिलियन रूबल बढ़ जाता है।
उदाहरण 2.2.उद्यम के प्रबंधन ने देखा कि वार्षिक कारोबार न केवल स्टोर के बिक्री क्षेत्र पर निर्भर करता है (उदाहरण 2.1 देखें), बल्कि आगंतुकों की औसत संख्या पर भी निर्भर करता है। प्रासंगिक जानकारी तालिका में प्रस्तुत की गई है। 2.3.
तालिका 2.3
समाधान।निरूपित करें - प्रति दिन वें स्टोर पर आगंतुकों की औसत संख्या, हजार लोग।
चरों के बीच कार्यात्मक संबंध का स्वरूप निर्धारित करना और एक स्कैटरप्लॉट का निर्माण करना (चित्र 2.2)।
स्कैटर आरेख के आधार पर, हम यह निष्कर्ष निकाल सकते हैं कि वार्षिक कारोबार सकारात्मक रूप से प्रति दिन आगंतुकों की औसत संख्या से संबंधित है (यानी, y की वृद्धि के साथ वृद्धि होगी)। कार्यात्मक निर्भरता का रूप रैखिक है।
चावल। 2.2. उदाहरण 2.2 के लिए स्कैटरप्लॉट
तालिका 2.4
टी | एक्स 2t | एक्स 2टी 2 | yt x 2t | x 1t x 2t |
8,25 | 68,0625 | 163,02 | 1,98 | |
10,24 | 104,8575 | 390,0416 | 3,1744 | |
9,31 | 86,6761 | 381,2445 | 5,1205 | |
11,01 | 121,2201 | 452,2908 | 5,2848 | |
8,54 | 72,9316 | 480,7166 | 6,6612 | |
7,51 | 56,4001 | 514,5101 | 7,3598 | |
12,36 | 152,7696 | 927,1236 | 11,6184 | |
10,81 | 116,8561 | 962,6305 | 13,0801 | |
9,89 | 97,8121 | 901,2757 | 12,7581 | |
13,72 | 188,2384 | 1252,0872 | 15,3664 | |
12,27 | 150,5529 | 1225,0368 | 15,8283 | |
13,92 | 193,7664 | 1511,016 | 20,7408 | |
एस | 127,83 | 1410,44 | 9160,9934 | 118,9728 |
औसत | 10,65 |
सामान्य तौर पर, दो-कारक अर्थमितीय मॉडल के मापदंडों को निर्धारित करना आवश्यक है
y t = a 0 + a 1 x 1t + a 2 x 2t + ε t
आगे की गणना के लिए आवश्यक जानकारी तालिका में प्रस्तुत की गई है। 2.4.
आइए हम न्यूनतम वर्ग विधि का उपयोग करके एक रैखिक दो-कारक अर्थमिति मॉडल के मापदंडों का अनुमान लगाएं।
इस प्रकार,
गुणांक का मूल्यांकन = 61.6583 से पता चलता है कि, अन्य चीजें समान होने पर, व्यापार क्षेत्र में 1 हजार मीटर 2 की वृद्धि के साथ, वार्षिक कारोबार में औसतन 61.6583 मिलियन रूबल की वृद्धि होगी।
गुणांक का अनुमान = 2.2748 दर्शाता है कि, अन्य चीजें समान होने पर, प्रति 1 हजार लोगों पर आगंतुकों की औसत संख्या में वृद्धि होती है। प्रति दिन, वार्षिक कारोबार में औसतन 2.2748 मिलियन रूबल की वृद्धि होगी।
उदाहरण 2.3.तालिका में प्रस्तुत जानकारी का उपयोग करना। 2.2 और 2.4, एकल-कारक अर्थमिति मॉडल के पैरामीटर का अनुमान लगाएं
-वें स्टोर के वार्षिक कारोबार का केंद्रित मूल्य कहां है, मिलियन रूबल; - टी-वें स्टोर, हजार लोगों पर आगंतुकों की औसत दैनिक संख्या का केंद्रित मूल्य। (उदाहरण 2.1-2.2 देखें)।
समाधान।गणना के लिए आवश्यक अतिरिक्त जानकारी तालिका में प्रस्तुत की गई है। 2.5.
तालिका 2.5
-48,53 | -2,40 | 5,7720 | 116,6013 | |
-30,20 | -0,41 | 0,1702 | 12,4589 | |
-27,34 | -1,34 | 1,8023 | 36,7084 | |
-27,21 | 0,36 | 0,1278 | -9,7288 | |
-12,00 | -2,11 | 4,4627 | 25,3570 | |
0,22 | -3,14 | 9,8753 | -0,6809 | |
6,72 | 1,71 | 2,9156 | 11,4687 | |
20,76 | 0,16 | 0,0348 | 3,2992 | |
22,84 | -0,76 | 0,5814 | -17,413 | |
22,97 | 3,07 | 9,4096 | 70,4503 | |
31,55 | 1,62 | 2,6163 | 51,0267 | |
40,26 | 3,27 | 10,6766 | 131,5387 | |
जोड़ | 48,4344 | 431,0566 |
सूत्र (2.35) का उपयोग करके, हम प्राप्त करते हैं
इस प्रकार,
http://www.cleverstudents.ru/articles/mnk.html
उदाहरण।
चर के मूल्यों पर प्रायोगिक डेटा एक्सऔर परतालिका में दिए गए हैं।
उनके संरेखण के परिणामस्वरूप, फ़ंक्शन
का उपयोग करते हुए न्यूनतम वर्ग विधि, इन आंकड़ों को एक रैखिक निर्भरता के साथ अनुमानित करें y=ax+b(पैरामीटर खोजें एऔर बी). पता लगाएं कि दोनों में से कौन सी रेखा बेहतर है (न्यूनतम वर्ग विधि के अर्थ में) प्रयोगात्मक डेटा को संरेखित करती है। एक चित्र बनाओ.
समाधान।
हमारे उदाहरण में एन=5. आवश्यक गुणांकों के सूत्रों में शामिल राशियों की गणना की सुविधा के लिए हम तालिका भरते हैं।
तालिका की चौथी पंक्ति के मान प्रत्येक संख्या के लिए दूसरी पंक्ति के मानों को तीसरी पंक्ति के मानों से गुणा करके प्राप्त किए जाते हैं मैं.
तालिका की पाँचवीं पंक्ति के मान प्रत्येक संख्या के लिए दूसरी पंक्ति के मानों का वर्ग करके प्राप्त किए जाते हैं मैं.
तालिका के अंतिम कॉलम के मान पंक्तियों के मानों का योग हैं।
गुणांक ज्ञात करने के लिए हम न्यूनतम वर्ग विधि के सूत्रों का उपयोग करते हैं एऔर बी. हम उनमें तालिका के अंतिम कॉलम से संबंधित मान प्रतिस्थापित करते हैं:
इस तरह, y=0.165x+2.184वांछित अनुमानित सीधी रेखा है।
यह पता लगाना बाकी है कि कौन सी पंक्तियाँ हैं y=0.165x+2.184या मूल डेटा का बेहतर अनुमान लगाना, यानी न्यूनतम वर्ग विधि का उपयोग करके अनुमान लगाना।
सबूत।
ताकि जब मिले एऔर बीफ़ंक्शन सबसे छोटा मान लेता है, यह आवश्यक है कि इस बिंदु पर फ़ंक्शन के लिए दूसरे क्रम के अंतर के द्विघात रूप का मैट्रिक्स सकारात्मक निश्चित था. चलिए दिखाते हैं.
दूसरे क्रम के अंतर का रूप है:
वह है
इसलिए, द्विघात रूप के मैट्रिक्स का रूप होता है
और तत्वों का मान निर्भर नहीं करता है एऔर बी.
आइए हम दिखाएं कि मैट्रिक्स सकारात्मक निश्चित है। इसके लिए आवश्यक है कि कोण माइनर सकारात्मक हों।
प्रथम क्रम का कोणीय लघु . बिंदुओं के बाद से असमानता सख्त है
- ट्यूटोरियल
परिचय
मैं एक कंप्यूटर प्रोग्रामर हूं. मैंने अपने करियर में सबसे बड़ी छलांग तब लगाई जब मैंने यह कहना सीखा: "मैं कुछ भी समझ में नहीं आ रहा!"अब मुझे विज्ञान के उस प्रकाशक को यह बताने में कोई शर्म नहीं है कि वह मुझे व्याख्यान दे रहा है, कि मुझे समझ नहीं आ रहा है कि वह, वह प्रकाशक, मुझसे किस बारे में बात कर रहा है। और यह बहुत कठिन है. हाँ, यह स्वीकार करना कठिन और शर्मनाक है कि आप नहीं जानते। कौन यह स्वीकार करना पसंद करता है कि वह किसी चीज़ की मूल बातें नहीं जानता है। अपने पेशे के कारण, मुझे बड़ी संख्या में प्रस्तुतियों और व्याख्यानों में भाग लेना पड़ता है, जहाँ, मैं स्वीकार करता हूँ, अधिकांश मामलों में मुझे नींद आती है, क्योंकि मुझे कुछ भी समझ नहीं आता है। और मुझे समझ नहीं आता क्योंकि विज्ञान की वर्तमान स्थिति की सबसे बड़ी समस्या गणित में है। यह मानता है कि सभी छात्र गणित के सभी क्षेत्रों से परिचित हैं (जो बेतुका है)। यह स्वीकार करना कि आप नहीं जानते कि व्युत्पन्न क्या है (कि यह थोड़ी देर बाद की बात है) शर्म की बात है।
लेकिन मैंने यह कहना सीख लिया है कि मैं नहीं जानता कि गुणा क्या है। हाँ, मैं नहीं जानता कि झूठ बीजगणित पर उपबीजगणित क्या है। हाँ, मैं नहीं जानता कि जीवन में द्विघात समीकरणों की आवश्यकता क्यों है। वैसे, यदि आप आश्वस्त हैं कि आप जानते हैं, तो हमारे पास बात करने के लिए कुछ है! गणित युक्तियों की एक श्रृंखला है। गणितज्ञ जनता को भ्रमित करने और डराने की कोशिश करते हैं; जहां कोई भ्रम नहीं, कोई प्रतिष्ठा नहीं, कोई अधिकार नहीं. हां, सबसे अमूर्त भाषा में बोलना प्रतिष्ठित है, जो अपने आप में पूरी तरह से बकवास है।
क्या आप जानते हैं कि व्युत्पन्न क्या है? सबसे अधिक संभावना है कि आप मुझे अंतर संबंध की सीमा के बारे में बताएंगे। सेंट पीटर्सबर्ग स्टेट यूनिवर्सिटी में गणित के प्रथम वर्ष में, विक्टर पेट्रोविच खविन ने मुझे परिभाषितबिंदु पर फ़ंक्शन की टेलर श्रृंखला के पहले पद के गुणांक के रूप में व्युत्पन्न (यह व्युत्पन्न के बिना टेलर श्रृंखला निर्धारित करने के लिए एक अलग जिम्नास्टिक था)। मैं इस परिभाषा पर बहुत देर तक हँसता रहा, जब तक कि आख़िरकार मुझे समझ नहीं आया कि यह किस बारे में है। व्युत्पन्न केवल इस माप से अधिक कुछ नहीं है कि जिस फ़ंक्शन को हम विभेदित कर रहे हैं वह फ़ंक्शन y=x, y=x^2, y=x^3 के कितना समान है।
अब मुझे उन छात्रों को व्याख्यान देने का सम्मान प्राप्त हुआ है डरनाअंक शास्त्र। यदि आप गणित से डरते हैं - तो हम रास्ते पर हैं। जैसे ही आप कोई पाठ पढ़ने की कोशिश करें और आपको लगे कि यह अत्यधिक जटिल है, तो समझ लें कि वह ख़राब तरीके से लिखा गया है। मेरा तर्क है कि गणित का एक भी क्षेत्र ऐसा नहीं है जिसके बारे में सटीकता खोए बिना "उंगलियों पर" बात नहीं की जा सकती।
निकट भविष्य के लिए चुनौती: मैंने अपने छात्रों को यह समझने का निर्देश दिया कि एक रैखिक-द्विघात नियंत्रक क्या है। शरमाओ मत, अपने जीवन के तीन मिनट बर्बाद करो, लिंक का अनुसरण करो। अगर आपको कुछ समझ नहीं आया तो हम रास्ते पर हैं. मुझे (पेशेवर गणितज्ञ-प्रोग्रामर) भी कुछ समझ नहीं आया। और मैं आपको विश्वास दिलाता हूं, इसे "उंगलियों पर" सुलझाया जा सकता है। फिलहाल मुझे नहीं पता कि यह क्या है, लेकिन मैं आपको विश्वास दिलाता हूं कि हम इसका पता लगाने में सक्षम होंगे।
तो, पहला व्याख्यान जो मैं अपने विद्यार्थियों को देने जा रहा हूँ, जब वे मेरे पास यह कहकर भयभीत होकर दौड़ने आएँगे कि रैखिक-द्विघात नियंत्रक एक भयानक बग है जिस पर आप अपने जीवन में कभी भी काबू नहीं पा सकेंगे, वह है न्यूनतम वर्ग विधियाँ. क्या आप रैखिक समीकरण हल कर सकते हैं? यदि आप यह पाठ पढ़ रहे हैं, तो संभवतः नहीं।
तो, दो बिंदु (x0, y0), (x1, y1) दिए गए हैं, उदाहरण के लिए, (1,1) और (3,2), कार्य इन दो बिंदुओं से गुजरने वाली सीधी रेखा के समीकरण को ढूंढना है:
चित्रण
इस सीधी रेखा में निम्नलिखित जैसा समीकरण होना चाहिए:
यहां अल्फा और बीटा हमारे लिए अज्ञात हैं, लेकिन इस रेखा के दो बिंदु ज्ञात हैं:
आप इस समीकरण को मैट्रिक्स रूप में लिख सकते हैं:
यहां हमें एक गीतात्मक विषयांतर करना चाहिए: मैट्रिक्स क्या है? मैट्रिक्स और कुछ नहीं बल्कि एक द्वि-आयामी सरणी है। यह डेटा स्टोर करने का एक तरीका है, इससे अधिक वैल्यू नहीं दी जानी चाहिए। यह हम पर निर्भर है कि किसी निश्चित मैट्रिक्स की सटीक व्याख्या कैसे की जाए। समय-समय पर, मैं इसे एक रैखिक मानचित्रण के रूप में, समय-समय पर एक द्विघात रूप के रूप में, और कभी-कभी केवल वैक्टर के एक सेट के रूप में व्याख्या करूंगा। यह सब सन्दर्भ में स्पष्ट हो जायेगा।
आइए विशिष्ट मैट्रिक्स को उनके प्रतीकात्मक प्रतिनिधित्व से बदलें:
तब (अल्फा, बीटा) आसानी से पाया जा सकता है:
हमारे पिछले डेटा के लिए अधिक विशेष रूप से:
जो बिंदु (1,1) और (3,2) से गुजरने वाली एक सीधी रेखा के निम्नलिखित समीकरण की ओर ले जाता है:
ठीक है, यहाँ सब कुछ स्पष्ट है। और आइए इससे होकर गुजरने वाली एक सीधी रेखा का समीकरण ज्ञात करें तीनअंक: (x0,y0), (x1,y1) और (x2,y2):
ओह-ओह-ओह, लेकिन हमारे पास दो अज्ञातों के लिए तीन समीकरण हैं! मानक गणितज्ञ कहेंगे कि कोई समाधान नहीं है। प्रोग्रामर क्या कहेगा? और वह सबसे पहले समीकरणों की पिछली प्रणाली को निम्नलिखित रूप में फिर से लिखेगा:
हमारे मामले में, वेक्टर i, j, b त्रि-आयामी हैं, इसलिए, (सामान्य मामले में) इस प्रणाली का कोई समाधान नहीं है। कोई भी सदिश (alpha\*i + beta\*j) सदिशों (i, j) द्वारा फैलाए गए तल में स्थित होता है। यदि b इस तल से संबंधित नहीं है, तो कोई समाधान नहीं है (समीकरण में समानता प्राप्त नहीं की जा सकती)। क्या करें? आइए एक समझौते की तलाश करें. आइए निरूपित करें ई(अल्फा, बीटा)वास्तव में हमने समानता कैसे हासिल नहीं की:
और हम इस त्रुटि को कम करने का प्रयास करेंगे:
एक वर्ग क्यों?
हम न केवल मानदंड के न्यूनतम की तलाश कर रहे हैं, बल्कि मानदंड के न्यूनतम वर्ग की भी तलाश कर रहे हैं। क्यों? न्यूनतम बिंदु स्वयं मेल खाता है, और वर्ग एक सहज फ़ंक्शन (तर्कों का एक द्विघात फ़ंक्शन (अल्फा, बीटा)) देता है, जबकि केवल लंबाई एक शंकु के रूप में एक फ़ंक्शन देती है, जो न्यूनतम बिंदु पर गैर-विभेदित होती है। ब्र्र. वर्ग अधिक सुविधाजनक है.
जाहिर है, वेक्टर होने पर त्रुटि कम हो जाती है इसदिशों द्वारा फैलाए गए समतल का ओर्थोगोनल मैंऔर जे.
चित्रण
दूसरे शब्दों में: हम एक ऐसी रेखा की तलाश कर रहे हैं, जिसमें इस रेखा के सभी बिंदुओं से दूरियों की वर्ग लंबाई का योग न्यूनतम हो:
अद्यतन: यहां मेरे पास एक जंब है, लाइन की दूरी को लंबवत रूप से मापा जाना चाहिए, न कि ऑर्थोग्राफ़िक प्रक्षेपण से। यह टिप्पणीकार सही है.
चित्रण
पूरी तरह से अलग शब्दों में (सावधानीपूर्वक, खराब रूप से औपचारिक, लेकिन यह उंगलियों पर स्पष्ट होना चाहिए): हम सभी जोड़ों के बीच सभी संभावित रेखाएं लेते हैं और सभी के बीच औसत रेखा की तलाश करते हैं:
चित्रण
उंगलियों पर एक और स्पष्टीकरण: हम सभी डेटा बिंदुओं (यहां हमारे पास तीन हैं) और उस रेखा के बीच एक स्प्रिंग जोड़ते हैं जिसे हम ढूंढ रहे हैं, और संतुलन स्थिति की रेखा बिल्कुल वही है जिसे हम ढूंढ रहे हैं।
द्विघात रूप न्यूनतम
तो, वेक्टर दिया गया है बीऔर मैट्रिक्स के कॉलम-वेक्टर द्वारा फैला हुआ विमान ए(इस मामले में (x0,x1,x2) और (1,1,1)), हम एक वेक्टर की तलाश कर रहे हैं इलंबाई के न्यूनतम वर्ग के साथ. जाहिर है, न्यूनतम केवल वेक्टर के लिए ही प्राप्त किया जा सकता है इ, मैट्रिक्स के कॉलम-वेक्टर द्वारा फैलाए गए विमान के लिए ऑर्थोगोनल ए:दूसरे शब्दों में, हम एक वेक्टर x=(alpha, beta) की तलाश कर रहे हैं जैसे:
मैं आपको याद दिलाता हूं कि यह वेक्टर x=(alpha, beta) द्विघात फलन का न्यूनतम है ||e(alpha, beta)||^2:
यहां यह याद रखना उपयोगी है कि मैट्रिक्स की व्याख्या द्विघात रूप के साथ-साथ की जा सकती है, उदाहरण के लिए, पहचान मैट्रिक्स ((1,0),(0,1)) की व्याख्या x^2 + y के एक फ़ंक्शन के रूप में की जा सकती है। ^2:
द्विघात रूप
इस सभी जिम्नास्टिक को रैखिक प्रतिगमन के रूप में जाना जाता है।
डिरिचलेट सीमा स्थिति के साथ लाप्लास समीकरण
अब सबसे सरल वास्तविक समस्या: एक निश्चित त्रिकोणीय सतह है, इसे चिकना करना आवश्यक है। उदाहरण के लिए, आइए मेरा चेहरा मॉडल लोड करें:मूल प्रतिबद्धता उपलब्ध है. बाहरी निर्भरता को कम करने के लिए, मैंने अपने सॉफ़्टवेयर रेंडरर का कोड लिया, जो पहले से ही हैब्रे पर था। रैखिक प्रणाली को हल करने के लिए, मैं ओपनएनएल का उपयोग करता हूं, यह एक बेहतरीन सॉल्वर है, लेकिन इसे इंस्टॉल करना बहुत मुश्किल है: आपको अपने प्रोजेक्ट फ़ोल्डर में दो फ़ाइलों (.h + .c) को कॉपी करने की आवश्यकता है। सभी स्मूथिंग निम्नलिखित कोड द्वारा की जाती है:
(int d=0; d के लिए)<3; d++) {
nlNewContext();
nlSolverParameteri(NL_NB_VARIABLES, verts.size());
nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE);
nlBegin(NL_SYSTEM);
nlBegin(NL_MATRIX);
for (int i=0; i<(int)verts.size(); i++) {
nlBegin(NL_ROW);
nlCoefficient(i, 1);
nlRightHandSide(verts[i][d]);
nlEnd(NL_ROW);
}
for (unsigned int i=0; i
एक्स, वाई और जेड निर्देशांक अलग-अलग हैं, मैं उन्हें अलग से सुचारू करता हूं। यानी, मैं रैखिक समीकरणों की तीन प्रणालियों को हल करता हूं, जिनमें से प्रत्येक में चरों की संख्या मेरे मॉडल में शीर्षों की संख्या के समान है। मैट्रिक्स A की पहली n पंक्तियों में प्रति पंक्ति केवल एक 1 है, और वेक्टर b की पहली n पंक्तियों में मूल मॉडल निर्देशांक हैं। यानी, मैं नई शीर्ष स्थिति और पुरानी शीर्ष स्थिति के बीच स्प्रिंग-टाई करता हूं - नए को पुराने से बहुत दूर नहीं होना चाहिए।
मैट्रिक्स A की सभी बाद की पंक्तियाँ (faces.size()*3 = ग्रिड में सभी त्रिकोणों के किनारों की संख्या) में 1 की एक घटना और -1 की एक घटना होती है, जबकि वेक्टर b के विपरीत शून्य घटक होते हैं। इसका मतलब है कि मैं हमारे त्रिकोणीय जाल के प्रत्येक किनारे पर एक स्प्रिंग लगाता हूं: सभी किनारे अपने शुरुआती और अंतिम बिंदुओं के समान शीर्ष प्राप्त करने का प्रयास करते हैं।
एक बार फिर: सभी शीर्ष परिवर्तनशील हैं, और वे अपनी मूल स्थिति से अधिक दूर नहीं जा सकते, लेकिन साथ ही वे एक-दूसरे के समान बनने का प्रयास करते हैं।
यहाँ परिणाम है:
सब कुछ ठीक हो जाएगा, मॉडल वास्तव में चिकना है, लेकिन यह अपने मूल किनारे से दूर चला गया है। आइए कोड को थोड़ा बदलें:
(int i=0; i के लिए)<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }
हमारे मैट्रिक्स ए में, किनारे पर मौजूद शीर्षों के लिए, मैं श्रेणी v_i = verts[i][d] से एक पंक्ति नहीं जोड़ता, बल्कि 1000*v_i = 1000*verts[i][d] जोड़ता हूं। इससे क्या परिवर्तन होता है? और इससे हमारी त्रुटि का द्विघात रूप बदल जाता है। अब किनारे पर शीर्ष से एक विचलन पर पहले की तरह एक यूनिट नहीं, बल्कि 1000 * 1000 यूनिट खर्च होंगे। यही है, हमने चरम शिखर पर एक मजबूत स्प्रिंग लटका दिया, समाधान दूसरों को अधिक मजबूती से खींचना पसंद करता है। यहाँ परिणाम है:
आइए शीर्षों के बीच स्प्रिंग्स की ताकत को दोगुना करें:
nlगुणांक(चेहरा[जे], 2); nlगुणांक(चेहरा[(j+1)%3], -2);
यह तर्कसंगत है कि सतह चिकनी हो गई है:
और अब तो सौ गुना भी मजबूत:
यह क्या है? कल्पना कीजिए कि हमने एक तार की अंगूठी को साबुन के पानी में डुबोया है। परिणामस्वरूप, परिणामी साबुन फिल्म उसी सीमा - हमारे तार की अंगूठी को छूते हुए, यथासंभव सबसे छोटी वक्रता रखने का प्रयास करेगी। बॉर्डर को ठीक करने और अंदर एक चिकनी सतह की मांग करने से हमें बिल्कुल यही मिला है। बधाई हो, हमने डिरिचलेट सीमा शर्तों के साथ लाप्लास समीकरण को हल कर लिया है। ठीक लगता है? लेकिन वास्तव में, हल करने के लिए रैखिक समीकरणों की केवल एक प्रणाली।
पॉइसन समीकरण
चलिए एक और बढ़िया नाम लेते हैं.मान लीजिए कि मेरे पास इस तरह की एक छवि है:
सब अच्छे हैं, लेकिन कुर्सी मुझे पसंद नहीं.
मैं चित्र को आधा काट दूँगा:
और मैं अपने हाथों से एक कुर्सी चुनूंगा:
फिर मैं मास्क में जो भी सफेद है उसे तस्वीर के बाईं ओर खींच लूंगा, और साथ ही मैं पूरी तस्वीर में कहूंगा कि दो पड़ोसी पिक्सल के बीच का अंतर दो पड़ोसी पिक्सल के बीच के अंतर के बराबर होना चाहिए। सही छवि:
(int i=0; i के लिए) यहाँ परिणाम है: कोड और चित्र उपलब्ध हैं न्यूनतम वर्ग विधि (ओएलएस, इंजी. साधारण न्यूनतम वर्ग, ओएलएस)- विभिन्न समस्याओं को हल करने के लिए उपयोग की जाने वाली एक गणितीय विधि, जो वांछित चर से कुछ कार्यों के वर्ग विचलन के योग को कम करने पर आधारित है। इसका उपयोग समीकरणों की अतिनिर्धारित प्रणालियों को "हल" करने के लिए किया जा सकता है (जब समीकरणों की संख्या अज्ञात की संख्या से अधिक हो जाती है), समीकरणों की सामान्य (अतिनिर्धारित नहीं) गैर-रेखीय प्रणालियों के मामले में समाधान ढूंढने के लिए, बिंदु मानों का अनुमान लगाने के लिए किया जा सकता है। एक निश्चित कार्य का. नमूना डेटा से प्रतिगमन मॉडल के अज्ञात मापदंडों का अनुमान लगाने के लिए ओएलएस प्रतिगमन विश्लेषण के बुनियादी तरीकों में से एक है। 1
/
5 ✪ न्यूनतम वर्ग विधि। विषय ✪ मितिन आई.वी. - भौतिक परिणामों का प्रसंस्करण। प्रयोग - न्यूनतम वर्ग विधि (व्याख्यान 4) ✪ न्यूनतम वर्ग, पाठ 1/2. रैखिक प्रकार्य ✪ अर्थमिति। व्याख्यान 5. न्यूनतम वर्ग विधि ✪ न्यूनतम वर्ग विधि। जवाब XIX सदी की शुरुआत तक। वैज्ञानिकों के पास समीकरणों की ऐसी प्रणाली को हल करने के लिए कुछ निश्चित नियम नहीं थे जिनमें अज्ञात की संख्या समीकरणों की संख्या से कम हो; उस समय तक, समीकरणों के प्रकार और कैलकुलेटर की सरलता के आधार पर विशेष तरीकों का उपयोग किया जाता था, और इसलिए अलग-अलग कैलकुलेटर, एक ही अवलोकन डेटा से शुरू होकर, अलग-अलग निष्कर्ष पर आते थे। गॉस (1795) को विधि के पहले अनुप्रयोग का श्रेय दिया जाता है, और लिजेंड्रे (1805) ने स्वतंत्र रूप से इसे इसके आधुनिक नाम (एफआर) के तहत खोजा और प्रकाशित किया। मेथोडे डेस मोइंड्रेस क्वारेस) . लाप्लास ने इस पद्धति को संभाव्यता के सिद्धांत से जोड़ा और अमेरिकी गणितज्ञ एड्रेन (1808) ने इसके संभाव्य अनुप्रयोगों पर विचार किया। यह विधि व्यापक है और एन्के, बेसेल, हैनसेन और अन्य लोगों के आगे के शोध से इसमें सुधार हुआ है। होने देना एक्स (\डिस्प्लेस्टाइल x)- किट एन (\डिस्प्लेस्टाइल एन)अज्ञात चर (पैरामीटर), f i (x) (\displaystyle f_(i)(x)), , एम > एन (\डिस्प्लेस्टाइल एम>एन)- चर के इस सेट से कार्यों का सेट। समस्या ऐसे मूल्यों को चुनने की है एक्स (\डिस्प्लेस्टाइल x)ताकि इन फ़ंक्शंस के मान कुछ मानों के जितना संभव हो उतना करीब हों y i (\displaystyle y_(i)). संक्षेप में, हम समीकरणों की अतिनिर्धारित प्रणाली के "समाधान" के बारे में बात कर रहे हैं f i (x) = y i (\displaystyle f_(i)(x)=y_(i)), i = 1 , … , m (\displaystyle i=1,\ldots ,m)संकेतित अर्थ में, सिस्टम के बाएँ और दाएँ भागों की अधिकतम निकटता। एलएसएम का सार "निकटता के माप" के रूप में बाएँ और दाएँ भागों के वर्ग विचलन के योग को चुनना है | f i (x) − y i | (\displaystyle |f_(i)(x)-y_(i)|). इस प्रकार, एलएसएम का सार इस प्रकार व्यक्त किया जा सकता है: यदि समीकरणों की प्रणाली का कोई समाधान है, तो वर्गों का न्यूनतम योग शून्य के बराबर होगा और समीकरणों की प्रणाली का सटीक समाधान विश्लेषणात्मक रूप से या, उदाहरण के लिए, विभिन्न संख्यात्मक अनुकूलन विधियों द्वारा पाया जा सकता है। यदि सिस्टम अतिनिर्धारित है, यानी, मोटे तौर पर कहें तो, स्वतंत्र समीकरणों की संख्या अज्ञात चर की संख्या से अधिक है, तो सिस्टम के पास सटीक समाधान नहीं है और कम से कम वर्ग विधि हमें कुछ "इष्टतम" वेक्टर खोजने की अनुमति देती है एक्स (\डिस्प्लेस्टाइल x)सदिशों की अधिकतम निकटता के अर्थ में वाई (\डिस्प्लेस्टाइल वाई)और एफ (एक्स) (\डिस्प्लेस्टाइल एफ(एक्स))या विचलन वेक्टर की अधिकतम निकटता ई (\डिस्प्लेस्टाइल ई)शून्य तक (निकटता को यूक्लिडियन दूरी के अर्थ में समझा जाता है)। विशेष रूप से, न्यूनतम वर्ग विधि का उपयोग रैखिक समीकरणों की प्रणाली को "हल" करने के लिए किया जा सकता है कहाँ ए (\डिस्प्लेस्टाइल ए)आयताकार आकार मैट्रिक्स m × n , m > n (\displaystyle m\times n,m>n)(अर्थात मैट्रिक्स ए की पंक्तियों की संख्या आवश्यक चर की संख्या से अधिक है)। समीकरणों की ऐसी प्रणाली का आम तौर पर कोई समाधान नहीं होता है। इसलिए, इस प्रणाली को केवल ऐसे वेक्टर को चुनने के अर्थ में "हल" किया जा सकता है एक्स (\डिस्प्लेस्टाइल x)वैक्टरों के बीच "दूरी" को कम करने के लिए ए एक्स (\डिस्प्लेस्टाइल एक्स)और बी (\डिस्प्लेस्टाइल बी). ऐसा करने के लिए, आप सिस्टम के समीकरणों के बाएँ और दाएँ भागों के वर्ग अंतरों के योग को न्यूनतम करने के लिए मानदंड लागू कर सकते हैं, अर्थात (ए एक्स - बी) टी (ए एक्स - बी) → मिनट (\displaystyle (एक्स-बी)^(टी)(एक्स-बी)\राइटएरो \मिनट ). यह दिखाना आसान है कि इस न्यूनतमकरण समस्या का समाधान समीकरणों की निम्नलिखित प्रणाली के समाधान की ओर ले जाता है उसको रहनो दो एन (\डिस्प्लेस्टाइल एन)कुछ चर के मान वाई (\डिस्प्लेस्टाइल वाई)(यह अवलोकनों, प्रयोगों आदि के परिणाम हो सकते हैं) और संबंधित चर एक्स (\डिस्प्लेस्टाइल x). चुनौती बीच संबंध बनाने की है वाई (\डिस्प्लेस्टाइल वाई)और एक्स (\डिस्प्लेस्टाइल x)कुछ अज्ञात मापदंडों तक ज्ञात कुछ फ़ंक्शन द्वारा अनुमानित बी (\डिस्प्लेस्टाइल बी), अर्थात्, वास्तव में मापदंडों का सर्वोत्तम मान खोजें बी (\डिस्प्लेस्टाइल बी), मूल्यों का अधिकतम अनुमान लगाना f (x , b) (\displaystyle f(x,b))वास्तविक मूल्यों के लिए वाई (\डिस्प्लेस्टाइल वाई). वास्तव में, यह समीकरणों की एक अतिनिर्धारित प्रणाली के "समाधान" के मामले को कम कर देता है बी (\डिस्प्लेस्टाइल बी): F (x t , b) = y t , t = 1 , … , n (\displaystyle f(x_(t),b)=y_(t),t=1,\ldots ,n). प्रतिगमन विश्लेषण में, और विशेष रूप से अर्थमिति में, चर के बीच संबंधों के संभाव्य मॉडल का उपयोग किया जाता है। Y t = f (x t , b) + ε t (\displaystyle y_(t)=f(x_(t),b)+\varepsilon _(t)), कहाँ ε t (\displaystyle \varepsilon _(t))- तथाकथित यादृच्छिक त्रुटियाँमॉडल। तदनुसार, देखे गए मूल्यों का विचलन वाई (\डिस्प्लेस्टाइल वाई)मॉडल से f (x , b) (\displaystyle f(x,b))मॉडल में पहले से ही मान लिया गया है। एलएसएम (साधारण, शास्त्रीय) का सार ऐसे मापदंडों को खोजना है बी (\डिस्प्लेस्टाइल बी), जिस पर वर्ग विचलन का योग (त्रुटियाँ, प्रतिगमन मॉडल के लिए उन्हें अक्सर प्रतिगमन अवशेष कहा जाता है) e t (\displaystyle e_(t))न्यूनतम होगा: कहाँ आर एस एस (\डिस्प्लेस्टाइल आरएसएस)- अंग्रेज़ी। वर्गों के अवशिष्ट योग को इस प्रकार परिभाषित किया गया है: सामान्य स्थिति में, इस समस्या को अनुकूलन (न्यूनीकरण) के संख्यात्मक तरीकों से हल किया जा सकता है। इस मामले में, एक बोलता है अरैखिक न्यूनतम वर्ग(एनएलएस या एनएलएलएस - इंजी. गैर-रैखिक न्यूनतम वर्ग)। कई मामलों में, एक विश्लेषणात्मक समाधान प्राप्त किया जा सकता है। न्यूनतमकरण समस्या को हल करने के लिए, फ़ंक्शन के स्थिर बिंदुओं को खोजना आवश्यक है आर एस एस (बी) (\displaystyle आरएसएस(बी)), अज्ञात मापदंडों के संबंध में इसे अलग करना बी (\डिस्प्लेस्टाइल बी), डेरिवेटिव को शून्य के बराबर करना और समीकरणों की परिणामी प्रणाली को हल करना: प्रतिगमन निर्भरता को रैखिक होने दें: होने देना यसमझाए जा रहे चर के अवलोकनों का कॉलम वेक्टर है, और एक्स (\डिस्प्लेस्टाइल एक्स)- यह (n × k) (\displaystyle ((n\times k)))- कारक अवलोकनों का मैट्रिक्स (मैट्रिक्स की पंक्तियाँ - किसी दिए गए अवलोकन में कारक मूल्यों के वेक्टर, कॉलम द्वारा - सभी अवलोकनों में किसी दिए गए कारक के मूल्यों के वेक्टर)। रैखिक मॉडल के मैट्रिक्स प्रतिनिधित्व का रूप है: तब समझाए गए चर के अनुमानों का वेक्टर और प्रतिगमन अवशेषों का वेक्टर बराबर होगा तदनुसार, प्रतिगमन अवशेषों के वर्गों का योग बराबर होगा पैरामीटर वेक्टर के संबंध में इस फ़ंक्शन को अलग करना बी (\डिस्प्लेस्टाइल बी)और डेरिवेटिव को शून्य के बराबर करने पर, हमें समीकरणों की एक प्रणाली प्राप्त होती है (मैट्रिक्स रूप में): गूढ़ मैट्रिक्स रूप में, समीकरणों की यह प्रणाली इस तरह दिखती है: (∑ x t 1 2 ∑ x t 1 x t 2 ∑ x t 1 x t 3 … ∑ x t 1 x t k ∑ x t 2 x t 1 ∑ x t 2 2 ∑ x t 2 x t 3 … ∑ x t 2 x t k ∑ x t 3 x t 1 ∑ x t 3 x t 2 ∑ x t 3 2 … ∑ x t 3 x t k ⋮ ⋮ ⋮ ⋱ ⋮ ∑ x t k x t 1 ∑ x t k x t 2 ∑ x t k x t 3 … ∑ x t k 2) (b 1 b 2 b 3 ⋮ b k) = (∑ x t 1 y) टी ∑ एक्स टी 2 वाई टी ∑ एक्स टी 3 y t ⋮ ∑ x t k y t) , (\displaystyle (\begin(pmatrix)\sum x_(t1)^(2)&\sum x_(t1)x_(t2)&\sum x_(t1)x_(t3)&\ldots &\sum x_(t1)x_(tk)\\\sum x_(t2)x_(t1)&\sum x_(t2)^(2)&\sum x_(t2)x_(t3)&\ldots &\ योग x_(t2)x_(tk)\\\sum x_(t3)x_(t1)&\sum x_(t3)x_(t2)&\sum x_(t3)^(2)&\ldots &\sum x_ (t3)x_(tk)\\vdots &\vdots &\vdots &\ddots &\vdots \\\sum x_(tk)x_(t1)&\sum x_(tk)x_(t2)&\sum x_ (tk)x_(t3)&\ldots &\sum x_(tk)^(2)\\\end(pmatrix))(\begin(pmatrix)b_(1)\\b_(2)\\b_(3) )\\vdots \\b_(k)\\\end(pmatrix))=(\begin(pmatrix)\sum x_(t1)y_(t)\\\sum x_(t2)y_(t)\\ \sum x_(t3)y_(t)\\\vdots \\\sum x_(tk)y_(t)\\\end(pmatrix)),)जहां सभी रकमों को सभी स्वीकार्य मूल्यों से ऊपर लिया जाता है टी (\डिस्प्लेस्टाइल टी). यदि मॉडल में एक स्थिरांक शामिल किया गया है (हमेशा की तरह), तो x t 1 = 1 (\displaystyle x_(t1)=1)सभी के लिए टी (\डिस्प्लेस्टाइल टी)इसलिए, समीकरणों की प्रणाली के मैट्रिक्स के ऊपरी बाएँ कोने में अवलोकनों की संख्या है एन (\डिस्प्लेस्टाइल एन), और पहली पंक्ति और पहले कॉलम के शेष तत्वों में - केवल चर के मानों का योग: ∑ x t j (\displaystyle \sum x_(tj))और सिस्टम के दाईं ओर का पहला तत्व - ∑ y t (\displaystyle \sum y_(t)). समीकरणों की इस प्रणाली का समाधान रैखिक मॉडल के लिए न्यूनतम वर्ग अनुमान के लिए सामान्य सूत्र देता है: विश्लेषणात्मक उद्देश्यों के लिए, इस सूत्र का अंतिम प्रतिनिधित्व उपयोगी साबित होता है (समीकरणों की प्रणाली में जब n से विभाजित किया जाता है, तो योग के बजाय अंकगणितीय साधन दिखाई देते हैं)। यदि प्रतिगमन मॉडल में डेटा केंद्रित, तो इस प्रतिनिधित्व में पहले मैट्रिक्स में कारकों के नमूना सहप्रसरण मैट्रिक्स का अर्थ है, और दूसरा आश्रित चर के साथ कारकों के सहप्रसरण का वेक्टर है। यदि, इसके अतिरिक्त, डेटा भी है सामान्यीकृत SKO पर (अर्थात, अंततः मानकीकृत), तो पहले मैट्रिक्स में कारकों के नमूना सहसंबंध मैट्रिक्स का अर्थ है, दूसरा वेक्टर - आश्रित चर के साथ कारकों के नमूना सहसंबंध का वेक्टर। मॉडलों के लिए एलएलएस अनुमान की एक महत्वपूर्ण संपत्ति एक स्थिरांक के साथ- निर्मित प्रतिगमन की रेखा नमूना डेटा के गुरुत्वाकर्षण के केंद्र से होकर गुजरती है, अर्थात समानता पूरी होती है: विशेष रूप से, चरम मामले में जब एकमात्र प्रतिगामी एक स्थिरांक होता है, तो हम पाते हैं कि एकल पैरामीटर (स्वयं स्थिरांक) का ओएलएस अनुमान समझाए जा रहे चर के औसत मूल्य के बराबर है। अर्थात्, बड़ी संख्या के नियमों से अपने अच्छे गुणों के लिए जाना जाने वाला अंकगणितीय माध्य भी एक न्यूनतम वर्ग अनुमान है - यह इससे वर्ग विचलन के न्यूनतम योग की कसौटी को पूरा करता है। जोड़ीवार रैखिक प्रतिगमन के मामले में y t = a + b x t + ε t (\displaystyle y_(t)=a+bx_(t)+\varepsilon _(t)), जब एक चर की दूसरे पर रैखिक निर्भरता का अनुमान लगाया जाता है, तो गणना सूत्र सरल हो जाते हैं (आप मैट्रिक्स बीजगणित के बिना कर सकते हैं)। समीकरणों की प्रणाली का रूप है: यहां से गुणांकों का अनुमान ढूंढना आसान है: इस तथ्य के बावजूद कि सामान्य स्थिति में स्थिरांक वाले मॉडल बेहतर होते हैं, कुछ मामलों में सैद्धांतिक विचारों से यह ज्ञात होता है कि स्थिरांक ए (\डिस्प्लेस्टाइल ए)शून्य के बराबर होना चाहिए. उदाहरण के लिए, भौतिकी में, वोल्टेज और करंट के बीच संबंध का रूप होता है यू = आई ⋅ आर (\displaystyle यू=आई\सीडॉट आर); वोल्टेज और करंट को मापने के लिए प्रतिरोध का अनुमान लगाना आवश्यक है। ऐसे में हम बात कर रहे हैं एक मॉडल की y = b x (\displaystyle y=bx). इस मामले में, समीकरणों की एक प्रणाली के बजाय, हमारे पास एक एकल समीकरण है (∑ x t 2) b = ∑ x t y t (\displaystyle \left(\sum x_(t)^(2)\right)b=\sum x_(t)y_(t)). इसलिए, एकल गुणांक का अनुमान लगाने के सूत्र का रूप है B ^ = ∑ t = 1 n x t y t ∑ t = 1 n x t 2 = x y ¯ x 2 ¯ (\displaystyle (\hat (b))=(\frac (\sum _(t=1)^(n)x_(t )y_(t))(\sum _(t=1)^(n)x_(t)^(2)))=(\frac (\overline (xy))(\overline (x^(2)) ))). यदि डेटा एक चर के बहुपद प्रतिगमन फ़ंक्शन द्वारा फिट किया गया है f (x) = b 0 + ∑ i = 1 k b i x i (\displaystyle f(x)=b_(0)+\sum \limits _(i=1)^(k)b_(i)x^(i)), फिर, डिग्री को समझना x i (\displaystyle x^(i))प्रत्येक के लिए स्वतंत्र कारकों के रूप में मैं (\डिस्प्लेस्टाइल मैं)रैखिक मॉडल के मापदंडों के आकलन के लिए सामान्य सूत्र के आधार पर मॉडल के मापदंडों का अनुमान लगाना संभव है। ऐसा करने के लिए, सामान्य सूत्र में इस तरह की व्याख्या के साथ इसे ध्यान में रखना पर्याप्त है x t i x t j = x t i x t j = x t i + j (\displaystyle x_(ti)x_(tj)=x_(t)^(i)x_(t)^(j)=x_(t)^(i+j))और x t j y t = x t j y t (\displaystyle x_(tj)y_(t)=x_(t)^(j)y_(t)). इसलिए, इस मामले में मैट्रिक्स समीकरण रूप लेंगे: (n ∑ n x t … ∑ n x t k ∑ n x t ∑ n x i 2 … ∑ m x i k + 1 ⋮ ⋮ ⋱ ⋮ ∑ n x t k ∑ n x t k + 1 … ∑ n x t 2 k) [ b 0 b 1 ⋮ b k ] = [ ∑ n y t ∑ n x t y t ⋮ ∑ n x t k y t ] . (\displaystyle (\begin(pmatrix)n&\sum \limits _(n)x_(t)&\ldots &\sum \limits _(n)x_(t)^(k)\\\sum \limits _( n)x_(t)&\sum \limits _(n)x_(i)^(2)&\ldots &\sum \limits _(m)x_(i)^(k+1)\\\vdots & \vdots &\ddots &\vdots \\\sum \limits _(n)x_(t)^(k)&\sum \limits _(n)x_(t)^(k+1)&\ldots &\ योग \सीमा _(n)x_(t)^(2k)\end(pmatrix))(\begin(bmatrix)b_(0)\\b_(1)\\\vdots \\b_(k)\end( bmatrix))=(\begin(bmatrix)\sum \limits _(n)y_(t)\\\sum \limits _(n)x_(t)y_(t)\\\vdots \\\sum \limits _(n)x_(t)^(k)y_(t)\end(bmatrix)).) सबसे पहले, हम ध्यान दें कि रैखिक मॉडल के लिए, न्यूनतम वर्ग अनुमान रैखिक अनुमान हैं, जैसा कि उपरोक्त सूत्र से मिलता है। न्यूनतम वर्ग अनुमानों की निष्पक्षता के लिए, प्रतिगमन विश्लेषण की सबसे महत्वपूर्ण शर्त को पूरा करना आवश्यक और पर्याप्त है: कारकों पर सशर्त यादृच्छिक त्रुटि की गणितीय अपेक्षा शून्य के बराबर होनी चाहिए। यह शर्त पूरी होती है, विशेषकर, यदि दूसरी स्थिति - बहिर्जात कारकों की स्थिति - मौलिक है। यदि यह संपत्ति संतुष्ट नहीं है, तो हम मान सकते हैं कि लगभग कोई भी अनुमान बेहद असंतोषजनक होगा: वे सुसंगत भी नहीं होंगे (अर्थात, बहुत बड़ी मात्रा में डेटा भी इस मामले में गुणात्मक अनुमान प्राप्त करने की अनुमति नहीं देता है)। शास्त्रीय मामले में, यादृच्छिक त्रुटि के विपरीत, कारकों के नियतत्ववाद के बारे में एक मजबूत धारणा बनाई जाती है, जिसका स्वचालित रूप से मतलब है कि बहिर्जात स्थिति संतुष्ट है। सामान्य स्थिति में, अनुमानों की स्थिरता के लिए, मैट्रिक्स के अभिसरण के साथ-साथ बहिर्जातता की स्थिति को संतुष्ट करना पर्याप्त है वी एक्स (\डिस्प्लेस्टाइल वी_(एक्स))जैसे-जैसे नमूना आकार अनंत तक बढ़ता है, कुछ गैर-अपक्षयी मैट्रिक्स में बदल जाता है। निरंतरता और निष्पक्षता के अलावा, (सामान्य) एलएसएम के अनुमान भी प्रभावी (रैखिक निष्पक्ष अनुमानों की श्रेणी में सर्वश्रेष्ठ) होने के लिए, एक यादृच्छिक त्रुटि के अतिरिक्त गुणों को पूरा करना आवश्यक है: इन धारणाओं को यादृच्छिक त्रुटियों के वेक्टर के सहप्रसरण मैट्रिक्स के लिए तैयार किया जा सकता है V (ε) = σ 2 I (\displaystyle V(\varepsilon)=\sigma ^(2)I). एक रैखिक मॉडल जो इन शर्तों को पूरा करता है उसे कहा जाता है क्लासिक. शास्त्रीय रैखिक प्रतिगमन के लिए न्यूनतम वर्ग अनुमानक निष्पक्ष, सुसंगत और सभी रैखिक निष्पक्ष अनुमानकों के वर्ग में सबसे कुशल अनुमानक हैं (संक्षिप्त नाम नीला (सर्वोत्तम रैखिक निष्पक्ष अनुमानक) सर्वोत्तम रैखिक निष्पक्ष अनुमान है; घरेलू साहित्य में, गॉस - मार्कोव प्रमेय को अधिक बार उद्धृत किया जाता है)। जैसा कि यह दिखाना आसान है, गुणांक अनुमान वेक्टर का सहप्रसरण मैट्रिक्स इसके बराबर होगा: V (b ^ O L S) = σ 2 (X T )). दक्षता का अर्थ है कि यह सहप्रसरण मैट्रिक्स "न्यूनतम" है (गुणांकों का कोई भी रैखिक संयोजन, और विशेष रूप से स्वयं गुणांकों में न्यूनतम विचरण होता है), अर्थात, रैखिक निष्पक्ष अनुमानों की श्रेणी में, ओएलएस अनुमान सर्वोत्तम हैं। इस मैट्रिक्स के विकर्ण तत्व - गुणांक के अनुमानों के प्रसरण - प्राप्त अनुमानों की गुणवत्ता के महत्वपूर्ण पैरामीटर हैं। हालाँकि, सहप्रसरण मैट्रिक्स की गणना करना संभव नहीं है क्योंकि यादृच्छिक त्रुटि विचरण अज्ञात है। यह साबित किया जा सकता है कि यादृच्छिक त्रुटियों के विचरण का निष्पक्ष और सुसंगत (शास्त्रीय रैखिक मॉडल के लिए) अनुमान मूल्य है: एस 2 = आर एस एस / (एन - के) (\displaystyle एस^(2)=आरएसएस/(एन-के)). इस मान को सहप्रसरण मैट्रिक्स के सूत्र में प्रतिस्थापित करने पर, हमें सहप्रसरण मैट्रिक्स का एक अनुमान प्राप्त होता है। परिणामी अनुमान भी निष्पक्ष और सुसंगत हैं। यह भी महत्वपूर्ण है कि त्रुटि भिन्नता का अनुमान (और इसलिए गुणांक के भिन्नता) और मॉडल पैरामीटर के अनुमान स्वतंत्र यादृच्छिक चर हैं, जो मॉडल गुणांक के बारे में परिकल्पनाओं के परीक्षण के लिए परीक्षण आंकड़े प्राप्त करना संभव बनाता है। यह ध्यान दिया जाना चाहिए कि यदि शास्त्रीय मान्यताओं को पूरा नहीं किया जाता है, तो न्यूनतम वर्ग पैरामीटर अनुमान सबसे कुशल नहीं हैं और, जहां डब्ल्यू (\डिस्प्लेस्टाइल डब्ल्यू)कुछ सममित सकारात्मक निश्चित भार मैट्रिक्स है। साधारण न्यूनतम वर्ग इस दृष्टिकोण का एक विशेष मामला है, जब भार मैट्रिक्स पहचान मैट्रिक्स के समानुपाती होता है। जैसा कि ज्ञात है, सममित मैट्रिक्स (या ऑपरेटरों) के लिए एक अपघटन होता है डब्ल्यू = पी टी पी (\displaystyle डब्ल्यू=पी^(टी)पी). इसलिए, इस कार्यात्मकता को निम्नानुसार दर्शाया जा सकता है e T P T P e = (P e) T P e = e * T e * (\displaystyle e^(T)P^(T)Pe=(Pe)^(T)Pe=e_(*)^(T)e_( *)), अर्थात्, इस कार्यात्मकता को कुछ रूपांतरित "अवशेषों" के वर्गों के योग के रूप में दर्शाया जा सकता है। इस प्रकार, हम न्यूनतम वर्ग विधियों के एक वर्ग को अलग कर सकते हैं - एलएस-विधियाँ (न्यूनतम वर्ग)। यह साबित हो गया है (ऐटकेन का प्रमेय) कि एक सामान्यीकृत रैखिक प्रतिगमन मॉडल (जिसमें यादृच्छिक त्रुटियों के सहप्रसरण मैट्रिक्स पर कोई प्रतिबंध नहीं लगाया जाता है) के लिए, सबसे प्रभावी (रैखिक निष्पक्ष अनुमानों के वर्ग में) तथाकथित के अनुमान हैं। सामान्यीकृत ओएलएस (ओएमएनके, जीएलएस - सामान्यीकृत न्यूनतम वर्ग)- यादृच्छिक त्रुटियों के व्युत्क्रम सहप्रसरण मैट्रिक्स के बराबर भार मैट्रिक्स के साथ एलएस-विधि: W = V ε − 1 (\displaystyle W=V_(\varepsilon )^(-1)). यह दिखाया जा सकता है कि रैखिक मॉडल के मापदंडों के जीएलएस-अनुमान के सूत्र का रूप है बी ^ जी एल एस = (एक्स टी वी - 1 एक्स) - 1 एक्स टी वी - 1 वाई (\displaystyle (\टोपी (बी))_(जीएलएस)=(एक्स^(टी)वी^(-1)एक्स)^(-1) एक्स^(टी)वी^(-1)y). इन अनुमानों का सहप्रसरण मैट्रिक्स क्रमशः बराबर होगा वी (बी ^ जी एल एस) = (एक्स टी वी - 1 एक्स) - 1 (\displaystyle वी((\टोपी (बी))_(जीएलएस))=(एक्स^(टी)वी^(-1)एक्स)^(- 1)). वास्तव में, ओएलएस का सार मूल डेटा के एक निश्चित (रैखिक) परिवर्तन (पी) और रूपांतरित डेटा के लिए सामान्य न्यूनतम वर्गों के अनुप्रयोग में निहित है। इस परिवर्तन का उद्देश्य यह है कि रूपांतरित डेटा के लिए, यादृच्छिक त्रुटियां पहले से ही शास्त्रीय मान्यताओं को संतुष्ट करती हैं। एक विकर्ण भार मैट्रिक्स (और इसलिए यादृच्छिक त्रुटियों के सहप्रसरण मैट्रिक्स) के मामले में, हमारे पास तथाकथित भारित न्यूनतम वर्ग (डब्ल्यूएलएस - भारित न्यूनतम वर्ग) हैं। इस मामले में, मॉडल के अवशेषों के वर्गों का भारित योग कम से कम किया जाता है, अर्थात, प्रत्येक अवलोकन को एक "वजन" प्राप्त होता है जो इस अवलोकन में यादृच्छिक त्रुटि के विचरण के व्युत्क्रमानुपाती होता है: e T W e = ∑ t = 1 n e t 2 σ t 2 (\displaystyle e^(T)We=\sum _(t=1)^(n)(\frac (e_(t)^(2))(\ सिग्मा _(टी)^(2)))). वास्तव में, डेटा को अवलोकनों को भारित करके (यादृच्छिक त्रुटियों के अनुमानित मानक विचलन के आनुपातिक राशि से विभाजित करके) रूपांतरित किया जाता है, और भारित डेटा पर सामान्य न्यूनतम वर्ग लागू किया जाता है। आईएसबीएन 978-5-7749-0473-0। हम फ़ंक्शन को दूसरी डिग्री के बहुपद द्वारा अनुमानित करते हैं। ऐसा करने के लिए, हम समीकरणों की सामान्य प्रणाली के गुणांकों की गणना करते हैं: , , आइए हम न्यूनतम वर्गों की एक सामान्य प्रणाली बनाएं, जिसका रूप इस प्रकार है: सिस्टम का समाधान ढूंढना आसान है:, , . इस प्रकार, दूसरी डिग्री का बहुपद पाया जाता है:। सैद्धांतिक संदर्भ पृष्ठ पर वापस जाएँ<Введение в вычислительную математику. Примеры> उदाहरण 2. एक बहुपद की इष्टतम घात ज्ञात करना। पृष्ठ पर वापस जाएँ<Введение в вычислительную математику. Примеры> उदाहरण 3. अनुभवजन्य निर्भरता के मापदंडों को खोजने के लिए समीकरणों की एक सामान्य प्रणाली की व्युत्पत्ति। आइए हम गुणांकों और कार्यों को निर्धारित करने के लिए समीकरणों की एक प्रणाली प्राप्त करें , जो बिंदुओं के संबंध में दिए गए फ़ंक्शन का मूल-माध्य-वर्ग सन्निकटन करता है। एक फ़ंक्शन लिखें और इसके लिए आवश्यक चरम स्थिति लिखें: तब सामान्य प्रणाली यह रूप ले लेगी: हमने अज्ञात मापदंडों के लिए समीकरणों की एक रैखिक प्रणाली प्राप्त की है, जिसे आसानी से हल किया जा सकता है। सैद्धांतिक संदर्भ पृष्ठ पर वापस जाएँ<Введение в вычислительную математику. Примеры> उदाहरण। चर के मूल्यों पर प्रायोगिक डेटा एक्सऔर परतालिका में दिए गए हैं। उनके संरेखण के परिणामस्वरूप, फ़ंक्शन का उपयोग करते हुए न्यूनतम वर्ग विधि, इन आंकड़ों को एक रैखिक निर्भरता के साथ अनुमानित करें y=ax+b(पैरामीटर खोजें एऔर बी). पता लगाएं कि दोनों में से कौन सी रेखा बेहतर है (न्यूनतम वर्ग विधि के अर्थ में) प्रयोगात्मक डेटा को संरेखित करती है। एक चित्र बनाओ. समस्या रैखिक निर्भरता गुणांक को खोजने की है जिसके लिए दो चर का कार्य होता है एऔर बीसबसे छोटा मान लेता है. यानी डेटा दिया गया है एऔर बीपाई गई सीधी रेखा से प्रयोगात्मक डेटा के वर्ग विचलन का योग सबसे छोटा होगा। यह न्यूनतम वर्ग विधि का संपूर्ण बिंदु है। इस प्रकार, उदाहरण का समाधान दो चर वाले फ़ंक्शन के चरम को खोजने तक कम हो गया है। दो अज्ञात वाले दो समीकरणों की एक प्रणाली संकलित और हल की जाती है। कार्यों के आंशिक व्युत्पन्न ढूँढना चर द्वारा एऔर बी, हम इन व्युत्पन्नों को शून्य के बराबर करते हैं। हम समीकरणों की परिणामी प्रणाली को किसी भी विधि से हल करते हैं (उदाहरण के लिए)। प्रतिस्थापन विधिया क्रैमर विधि) और न्यूनतम वर्ग विधि (एलएसएम) का उपयोग करके गुणांक खोजने के लिए सूत्र प्राप्त करें। डेटा के साथ एऔर बीसमारोह सबसे छोटा मान लेता है. इस तथ्य का प्रमाण नीचे पृष्ठ के अंत में पाठ में दिया गया है। यह न्यूनतम वर्गों की पूरी विधि है। पैरामीटर खोजने का सूत्र एइसमें योग , , , और पैरामीटर शामिल हैं एनप्रायोगिक डेटा की मात्रा है. इन राशियों के मूल्यों की गणना अलग से करने की अनुशंसा की जाती है। गुणक बीगणना के बाद पाया गया ए. मूल उदाहरण को याद करने का समय आ गया है। समाधान। हमारे उदाहरण में एन=5. आवश्यक गुणांकों के सूत्रों में शामिल राशियों की गणना की सुविधा के लिए हम तालिका भरते हैं। तालिका की चौथी पंक्ति के मान प्रत्येक संख्या के लिए दूसरी पंक्ति के मानों को तीसरी पंक्ति के मानों से गुणा करके प्राप्त किए जाते हैं मैं. तालिका की पाँचवीं पंक्ति के मान प्रत्येक संख्या के लिए दूसरी पंक्ति के मानों का वर्ग करके प्राप्त किए जाते हैं मैं. तालिका के अंतिम कॉलम के मान पंक्तियों के मानों का योग हैं। गुणांक ज्ञात करने के लिए हम न्यूनतम वर्ग विधि के सूत्रों का उपयोग करते हैं एऔर बी. हम उनमें तालिका के अंतिम कॉलम से संबंधित मान प्रतिस्थापित करते हैं: इस तरह, y=0.165x+2.184वांछित अनुमानित सीधी रेखा है। यह पता लगाना बाकी है कि कौन सी पंक्तियाँ हैं y=0.165x+2.184या मूल डेटा का बेहतर अनुमान लगाना, यानी न्यूनतम वर्ग विधि का उपयोग करके अनुमान लगाना। ऐसा करने के लिए, आपको इन पंक्तियों से मूल डेटा के वर्ग विचलन के योग की गणना करने की आवश्यकता है और , एक छोटा मान उस रेखा से मेल खाता है जो न्यूनतम वर्ग विधि के संदर्भ में मूल डेटा का बेहतर अनुमान लगाता है। चूँकि , तब से पंक्ति y=0.165x+2.184मूल डेटा का बेहतर अनुमान लगाता है। चार्ट पर सब कुछ बहुत अच्छा लग रहा है। लाल रेखा पाई गई रेखा है y=0.165x+2.184, नीली रेखा है , गुलाबी बिंदु मूल डेटा हैं। यह किस लिए है, ये सभी अनुमान किस लिए हैं? मैं व्यक्तिगत रूप से डेटा स्मूथिंग समस्याओं, इंटरपोलेशन और एक्सट्रपलेशन समस्याओं को हल करने के लिए उपयोग करता हूं (मूल उदाहरण में, आपको देखे गए मूल्य का मूल्य खोजने के लिए कहा जा सकता है यपर एक्स=3या जब एक्स=6एमएनसी पद्धति के अनुसार)। लेकिन हम इसके बारे में बाद में साइट के दूसरे अनुभाग में अधिक बात करेंगे। पृष्ठ के सबसे ऊपर सबूत। ताकि जब मिले एऔर बीफ़ंक्शन सबसे छोटा मान लेता है, यह आवश्यक है कि इस बिंदु पर फ़ंक्शन के लिए दूसरे क्रम के अंतर के द्विघात रूप का मैट्रिक्स सकारात्मक निश्चित था. चलिए दिखाते हैं. दूसरे क्रम के अंतर का रूप है: वह है इसलिए, द्विघात रूप के मैट्रिक्स का रूप होता है आइए हम दिखाएं कि मैट्रिक्स सकारात्मक निश्चित है। इसके लिए आवश्यक है कि कोण माइनर सकारात्मक हों। प्रथम क्रम का कोणीय लघु . असमानता सख्त है, क्योंकि अंक मेल नहीं खाते। यह निम्नलिखित में निहित होगा। दूसरे क्रम का कोणीय लघु आइए इसे साबित करें गणितीय प्रेरण की विधि. निष्कर्ष: मान मिले एऔर बीफ़ंक्शन के सबसे छोटे मान के अनुरूप इसलिए, न्यूनतम वर्ग विधि के लिए वांछित पैरामीटर हैं। कभी समझे? पृष्ठ के सबसे ऊपर एक्सट्रपलेशन
- यह वैज्ञानिक अनुसंधान की एक विधि है, जो पूर्वानुमान की वस्तु के भविष्य के विकास के लिए अतीत और वर्तमान प्रवृत्तियों, पैटर्न, संबंधों के प्रसार पर आधारित है। एक्सट्रपलेशन विधियों में शामिल हैं
चलती औसत विधि, घातीय चौरसाई विधि, न्यूनतम वर्ग विधि। सार न्यूनतम वर्ग विधि
इसमें प्रेक्षित और परिकलित मानों के बीच वर्ग विचलन के योग को न्यूनतम करना शामिल है। परिकलित मान चयनित समीकरण - प्रतिगमन समीकरण के अनुसार पाए जाते हैं। वास्तविक मानों और परिकलित मानों के बीच की दूरी जितनी कम होगी, प्रतिगमन समीकरण के आधार पर पूर्वानुमान उतना ही अधिक सटीक होगा। अध्ययन के तहत घटना के सार का सैद्धांतिक विश्लेषण, जिसमें परिवर्तन एक समय श्रृंखला द्वारा प्रदर्शित होता है, एक वक्र चुनने के आधार के रूप में कार्य करता है। श्रृंखला के स्तरों की वृद्धि की प्रकृति के बारे में कभी-कभी विचार किया जाता है। इसलिए, यदि आउटपुट की वृद्धि अंकगणितीय प्रगति में अपेक्षित है, तो स्मूथिंग एक सीधी रेखा में की जाती है। यदि यह पता चलता है कि वृद्धि घातांकीय है, तो घातीय फलन के अनुसार चौरसाई की जानी चाहिए। न्यूनतम वर्ग विधि का कार्य सूत्र
: Y t+1 = a*X + b, जहां t + 1 पूर्वानुमानित अवधि है; Уt+1 - अनुमानित संकेतक; ए और बी गुणांक हैं; X समय का प्रतीक है. गुणांक ए और बी की गणना निम्नलिखित सूत्रों के अनुसार की जाती है: जहां, यूएफ - गतिशीलता की श्रृंखला के वास्तविक मूल्य; n समय श्रृंखला में स्तरों की संख्या है; न्यूनतम वर्ग विधि द्वारा समय श्रृंखला को सुचारू करना अध्ययन के तहत घटना के विकास के पैटर्न को प्रतिबिंबित करने का कार्य करता है। किसी प्रवृत्ति की विश्लेषणात्मक अभिव्यक्ति में, समय को एक स्वतंत्र चर के रूप में माना जाता है, और श्रृंखला के स्तर इस स्वतंत्र चर के एक कार्य के रूप में कार्य करते हैं। किसी घटना का विकास इस बात पर निर्भर नहीं करता है कि शुरुआती बिंदु से कितने साल बीत चुके हैं, बल्कि इस बात पर निर्भर करता है कि किन कारकों ने इसके विकास को, किस दिशा में और किस तीव्रता से प्रभावित किया है। इससे यह स्पष्ट है कि समय में किसी घटना का विकास इन कारकों की क्रिया के परिणामस्वरूप प्रकट होता है। वक्र के प्रकार, समय पर विश्लेषणात्मक निर्भरता के प्रकार को सही ढंग से निर्धारित करना पूर्व-भविष्यवाणी विश्लेषण के सबसे कठिन कार्यों में से एक है।
. प्रवृत्ति का वर्णन करने वाले फ़ंक्शन के प्रकार का चयन, जिसके पैरामीटर कम से कम वर्ग विधि द्वारा निर्धारित किए जाते हैं, ज्यादातर मामलों में अनुभवजन्य होता है, कई कार्यों का निर्माण करके और मूल-माध्य के मूल्य से उनकी एक-दूसरे के साथ तुलना करके -वर्ग त्रुटि सूत्र द्वारा गणना की गई: जहां यूएफ - गतिशीलता की श्रृंखला के वास्तविक मूल्य; उर - समय श्रृंखला के परिकलित (सुचारू) मान; n समय श्रृंखला में स्तरों की संख्या है; पी प्रवृत्ति (विकास की प्रवृत्ति) का वर्णन करने वाले सूत्रों में परिभाषित मापदंडों की संख्या है। न्यूनतम वर्ग विधि के नुकसान
: काम
. क्षेत्र में बेरोजगारी के स्तर को दर्शाने वाले आंकड़े हैं,% न्यूनतम वर्ग समाधान
समाधान के लिए, हम एक तालिका संकलित करेंगे जिसमें हम आवश्यक गणनाएँ करेंगे: ε = 28.63/10 = 2.86% पूर्वानुमान सटीकताउच्च। निष्कर्ष
: गणना में प्राप्त परिणामों की तुलना करना चलती औसत विधि
, घातांक सुगम करना
और न्यूनतम वर्ग विधि, हम कह सकते हैं कि घातांकीय स्मूथिंग विधि द्वारा गणना में औसत सापेक्ष त्रुटि 20-50% के भीतर आती है। इसका मतलब यह है कि इस मामले में भविष्यवाणी की सटीकता केवल संतोषजनक है। पहले और तीसरे मामले में, पूर्वानुमान सटीकता अधिक है, क्योंकि औसत सापेक्ष त्रुटि 10% से कम है। लेकिन चलती औसत पद्धति ने अधिक विश्वसनीय परिणाम प्राप्त करना संभव बना दिया (नवंबर के लिए पूर्वानुमान - 1.52%, दिसंबर के लिए पूर्वानुमान - 1.53%, जनवरी के लिए पूर्वानुमान - 1.49%), क्योंकि इस पद्धति का उपयोग करते समय औसत सापेक्ष त्रुटि सबसे छोटी है - 1 ,13%। प्रयुक्त स्रोतों की सूची मैं- प्रयोगात्मक बिंदु की संख्या; चार्ट पर क्लिक करें डेटा फ़ील्ड में, प्रत्येक अलग पंक्ति पर एक प्रयोगात्मक बिंदु पर `x` और `y` के मान दर्ज करें। मानों को रिक्त स्थान (स्पेस या टैब) द्वारा अलग किया जाना चाहिए। तीसरा मान `w` का बिंदु भार हो सकता है। यदि बिंदु भार निर्दिष्ट नहीं है, तो यह एक के बराबर है। अधिकांश मामलों में, प्रायोगिक बिंदुओं का भार अज्ञात है या गणना नहीं की गई है; सभी प्रायोगिक डेटा को समतुल्य माना जाता है। कभी-कभी मूल्यों की अध्ययन की गई सीमा में वजन निश्चित रूप से समकक्ष नहीं होते हैं और सैद्धांतिक रूप से भी गणना की जा सकती है। उदाहरण के लिए, स्पेक्ट्रोफोटोमेट्री में, वजन की गणना सरल सूत्रों का उपयोग करके की जा सकती है, हालांकि मूल रूप से हर कोई श्रम लागत को कम करने के लिए इसकी उपेक्षा करता है। डेटा को ऑफिस सूट स्प्रेडशीट से क्लिपबोर्ड के माध्यम से चिपकाया जा सकता है, जैसे माइक्रोसॉफ्ट ऑफिस से एक्सेल या ओपन ऑफिस से कैल्क। ऐसा करने के लिए, स्प्रेडशीट में, कॉपी करने के लिए डेटा की श्रेणी का चयन करें, क्लिपबोर्ड पर कॉपी करें, और डेटा को इस पृष्ठ पर डेटा फ़ील्ड में पेस्ट करें। न्यूनतम वर्ग विधि द्वारा गणना करने के लिए, दो गुणांक `बी` निर्धारित करने के लिए कम से कम दो बिंदुओं की आवश्यकता होती है - सीधी रेखा के झुकाव के कोण की स्पर्शरेखा और `ए` - `y पर सीधी रेखा द्वारा काटा गया मान `अक्ष. परिकलित प्रतिगमन गुणांक की त्रुटि का अनुमान लगाने के लिए, प्रयोगात्मक बिंदुओं की संख्या दो से अधिक निर्धारित करना आवश्यक है। प्रयोगात्मक बिंदुओं की संख्या जितनी अधिक होगी, गुणांक का सांख्यिकीय अनुमान उतना ही अधिक सटीक होगा (छात्र के गुणांक में कमी के कारण) और अनुमान सामान्य नमूने के अनुमान के जितना करीब होगा। प्रत्येक प्रयोगात्मक बिंदु पर मूल्य प्राप्त करना अक्सर महत्वपूर्ण श्रम लागत से जुड़ा होता है, इसलिए, प्रयोगों की एक समझौता संख्या अक्सर की जाती है, जो एक सुपाच्य अनुमान देता है और अत्यधिक श्रम लागत का कारण नहीं बनता है। एक नियम के रूप में, दो गुणांक वाले रैखिक न्यूनतम वर्ग निर्भरता के लिए प्रयोगात्मक बिंदुओं की संख्या 5-7 बिंदुओं के क्षेत्र में चुनी जाती है। मान लीजिए कि हमारे पास मानों के जोड़े के रूप में प्रयोगात्मक डेटा का एक सेट है [`y_i`, `x_i`], जहां `i` 1 से `n` तक एक प्रयोगात्मक माप की संख्या है; `y_i` - बिंदु `i` पर मापा गया मान का मान; `x_i` - पैरामीटर का मान जिसे हम बिंदु `i` पर सेट करते हैं। एक उदाहरण ओम के नियम का संचालन है। विद्युत परिपथ के अनुभागों के बीच वोल्टेज (संभावित अंतर) को बदलकर, हम इस अनुभाग से गुजरने वाली धारा की मात्रा को मापते हैं। भौतिकी हमें प्रयोगात्मक रूप से पाई गई निर्भरता देती है: `आई=यू/आर`, इस मामले में, `y_i` मापा गया वर्तमान मान है, और `x_i` वोल्टेज मान है। एक अन्य उदाहरण के रूप में, घोल में किसी पदार्थ के घोल द्वारा प्रकाश के अवशोषण पर विचार करें। रसायन विज्ञान हमें सूत्र देता है: `ए = εएल सी`, इस मामले में, `y_i` मापा गया ऑप्टिकल घनत्व `A` है, और `x_i` उस पदार्थ की सांद्रता है जिसे हम निर्धारित करते हैं। हम उस मामले पर विचार करेंगे जब `x_i` सेट करने में सापेक्ष त्रुटि `y_i` मापने में सापेक्ष त्रुटि से बहुत कम है। हम यह भी मानेंगे कि `y_i` के सभी मापे गए मान यादृच्छिक और सामान्य रूप से वितरित हैं, अर्थात। सामान्य वितरण कानून का पालन करें. `y` की `x` पर रैखिक निर्भरता के मामले में, हम एक सैद्धांतिक निर्भरता लिख सकते हैं: ज्यामितीय दृष्टिकोण से, गुणांक `बी` `x` अक्ष पर रेखा के झुकाव के कोण के स्पर्शरेखा को दर्शाता है, और गुणांक `a` - के चौराहे के बिंदु पर `y` का मान है `y` अक्ष के साथ रेखा (`x = 0` के साथ)। एक प्रयोग में, माप त्रुटियों के कारण `y_i` के मापा मान सैद्धांतिक रेखा पर बिल्कुल झूठ नहीं बोल सकते, जो हमेशा वास्तविक जीवन में अंतर्निहित होते हैं। इसलिए, एक रैखिक समीकरण को समीकरणों की एक प्रणाली द्वारा दर्शाया जाना चाहिए: निर्भरता (1) भी कहा जाता है प्रतिगमन, अर्थात। सांख्यिकीय महत्व के साथ दो मात्राओं की एक दूसरे पर निर्भरता। निर्भरता को बहाल करने का कार्य प्रयोगात्मक बिंदुओं [`y_i`, `x_i`] से गुणांक `a` और `b` को खोजना है। गुणांक ज्ञात करने के लिए आमतौर पर `a` और `b` का उपयोग किया जाता है न्यूनतम वर्ग विधि(एमएनके)। यह अधिकतम संभावना सिद्धांत का एक विशेष मामला है। आइए (1) को `ε_i = y_i - a - b x_i` के रूप में फिर से लिखें। तब चुकता त्रुटियों का योग होगा न्यूनतम वर्ग विधि का सिद्धांत पैरामीटर `ए` और `बी` के संबंध में योग (2) को कम करना है. न्यूनतम तब पहुँच जाता है जब गुणांक `ए` और `बी` के संबंध में योग (2) का आंशिक व्युत्पन्न शून्य के बराबर होता है: डेरिवेटिव का विस्तार करते हुए, हमें दो अज्ञात के साथ दो समीकरणों की एक प्रणाली प्राप्त होती है: हम कोष्ठक खोलते हैं और वांछित गुणांकों से स्वतंत्र योगों को दूसरे आधे भाग में स्थानांतरित करते हैं, हमें रैखिक समीकरणों की एक प्रणाली मिलती है: परिणामी प्रणाली को हल करते हुए, हम गुणांक `ए` और `बी` के लिए सूत्र पाते हैं: `a = frac(sum_(i=1)^(n) y_i sum_(i=1)^(n) x_i^2 - sum_(i=1)^(n) x_i sum_(i=1)^(n ) x_iy_i) (n sum_(i=1)^(n) x_i^2 - (sum_(i=1)^(n) x_i)^2)` (3.1) `b = frac(n sum_(i=1)^(n) x_iy_i - sum_(i=1)^(n) x_i sum_(i=1)^(n) y_i) (n sum_(i=1)^ (n) x_i^2 - (sum_(i=1)^(n) x_i)^2)` (3.2) इन सूत्रों में समाधान होते हैं जब `n > 1` (रेखा कम से कम 2 बिंदुओं का उपयोग करके खींची जा सकती है) और जब निर्धारक `D = n sum_(i=1)^(n) x_i^2 - (sum_(i= 1) )^(n) x_i)^2 != 0`, अर्थात. जब प्रयोग में `x_i` बिंदु भिन्न हों (अर्थात जब रेखा लंबवत न हो)। गुणांक `ए` और `बी` की गणना में त्रुटि के अधिक सटीक अनुमान के लिए, बड़ी संख्या में प्रयोगात्मक बिंदु वांछनीय हैं। जब `n = 2`, तो गुणांक की त्रुटि का अनुमान लगाना असंभव है, क्योंकि अनुमानित रेखा विशिष्ट रूप से दो बिंदुओं से होकर गुजरेगी। यादृच्छिक चर `V` की त्रुटि निर्धारित की जाती है त्रुटि संचय कानून आइए गुणांक `ए` और `बी` की त्रुटि के लिए त्रुटियों के संचय का नियम लिखें `S_y^2 = S_(y_i)^2` - `y` आयाम में त्रुटि (विचरण, वर्ग मानक विचलन), यह मानते हुए कि त्रुटि सभी `y` मानों के लिए एक समान है। परिणामी अभिव्यक्तियों में `a` और `b` की गणना के लिए सूत्रों को प्रतिस्थापित करने पर, हमें मिलता है `S_a^2 = S_y^2 frac(sum_(i=1)^(n) (sum_(i=1)^(n) x_i^2 - x_i sum_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n sum_(i=1)^(n) x_i^2 - (sum_(i=1)^(n) x_i)^2) sum_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frac(sum_(i=1)^(n) x_i^2) (D)` (4.1) `S_b^2 = S_y^2 frac(sum_(i=1)^(n) (n x_i - sum_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n sum_(i=1)^(n) x_i^2 - (sum_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) ` (4.2) अधिकांश वास्तविक प्रयोगों में, `Sy` का मान मापा नहीं जाता है। ऐसा करने के लिए, योजना के एक या कई बिंदुओं पर कई समानांतर माप (प्रयोग) करना आवश्यक है, जिससे प्रयोग का समय (और संभवतः लागत) बढ़ जाता है। इसलिए, आमतौर पर यह माना जाता है कि प्रतिगमन रेखा से `y` के विचलन को यादृच्छिक माना जा सकता है। इस मामले में विचरण अनुमान `y` की गणना सूत्र द्वारा की जाती है। `S_y^2 = S_(y,rest)^2 = frac(sum_(i=1)^n (y_i - a - b x_i)^2) (n-2)`. भाजक `n-2` प्रकट होता है क्योंकि हमने प्रयोगात्मक डेटा के एक ही नमूने के लिए दो गुणांकों की गणना के कारण स्वतंत्रता की डिग्री की संख्या कम कर दी है। इस अनुमान को प्रतिगमन रेखा `S_(y,rest)^2` के सापेक्ष अवशिष्ट विचरण भी कहा जाता है। गुणांकों के महत्व का आकलन छात्र की कसौटी के अनुसार किया जाता है `t_a = frac(|a|) (S_a)`, `t_b = frac(|b|) (S_b)` यदि परिकलित मानदंड `t_a`, `t_b` तालिका मानदंड `t(P, n-2)` से कम हैं, तो यह माना जाता है कि संबंधित गुणांक दी गई संभावना `P` के साथ शून्य से काफी भिन्न नहीं है। एक रैखिक संबंध के विवरण की गुणवत्ता का आकलन करने के लिए, आप फिशर मानदंड का उपयोग करके माध्य के सापेक्ष `S_(y,rest)^2` और `S_(bar y)` की तुलना कर सकते हैं। `S_(bar y) = frac(sum_(i=1)^n (y_i - bar y)^2) (n-1) = frac(sum_(i=1)^n (y_i - (sum_(i=) 1)^n y_i) /n)^2) (n-1)` - माध्य के सापेक्ष `y` के विचरण का नमूना अनुमान। निर्भरता का वर्णन करने के लिए प्रतिगमन समीकरण की प्रभावशीलता का मूल्यांकन करने के लिए, फिशर गुणांक की गणना की जाती है यदि `F > F(P, n-1, n-2)`, प्रतिगमन समीकरण का उपयोग करके निर्भरता के विवरण `y = f(x)` और माध्य का उपयोग करके विवरण के बीच का अंतर संभाव्यता के साथ सांख्यिकीय रूप से महत्वपूर्ण माना जाता है `पी`. वे। प्रतिगमन माध्य के चारों ओर `y` के प्रसार की तुलना में निर्भरता का बेहतर वर्णन करता है। चार्ट पर क्लिक करें न्यूनतम वर्ग विधि का अर्थ है अज्ञात मापदंडों का निर्धारण ए, बी, सी,…स्वीकृत कार्यात्मक निर्भरता y = f(x,a,b,c,…), जो त्रुटि का न्यूनतम माध्य वर्ग (विचरण) प्रदान करेगा , (24) जहाँ x i , y i - प्रयोग से प्राप्त संख्याओं के युग्मों का समुच्चय। चूंकि कई चर वाले किसी फ़ंक्शन के चरम की स्थिति यह है कि इसका आंशिक व्युत्पन्न शून्य के बराबर है, तो पैरामीटर ए, बी, सी,…समीकरणों की प्रणाली से निर्धारित होते हैं: ; ; ; … (25) यह याद रखना चाहिए कि फ़ंक्शन के रूप के बाद पैरामीटर का चयन करने के लिए न्यूनतम वर्ग विधि का उपयोग किया जाता है वाई = एफ(एक्स)परिभाषित। यदि सैद्धांतिक विचारों से यह निष्कर्ष निकालना असंभव है कि अनुभवजन्य सूत्र क्या होना चाहिए, तो किसी को दृश्य अभ्यावेदन द्वारा निर्देशित किया जाना चाहिए, मुख्य रूप से देखे गए डेटा का चित्रमय प्रतिनिधित्व। व्यवहार में, यह प्रायः निम्नलिखित प्रकार के कार्यों तक सीमित होता है: 1) रैखिक ; 2) द्विघात ए . न्यूनतम वर्ग विधि का सार है
एक प्रवृत्ति मॉडल के मापदंडों को खोजने में जो समय या स्थान में कुछ यादृच्छिक घटना के विकास की प्रवृत्ति का सबसे अच्छा वर्णन करता है (एक प्रवृत्ति एक रेखा है जो इस विकास की प्रवृत्ति को दर्शाती है)। न्यूनतम वर्ग विधि (ओएलएस) का कार्य न केवल कुछ ट्रेंड मॉडल ढूंढना है, बल्कि सर्वोत्तम या इष्टतम मॉडल ढूंढना है। यह मॉडल इष्टतम होगा यदि देखे गए वास्तविक मूल्यों और संबंधित गणना प्रवृत्ति मूल्यों के बीच वर्ग विचलन का योग न्यूनतम (सबसे छोटा) हो: प्रेक्षित वास्तविक मान के बीच मानक विचलन कहां है और संबंधित गणना प्रवृत्ति मूल्य, अध्ययन के तहत घटना का वास्तविक (मनाया गया) मूल्य, ट्रेंड मॉडल का अनुमानित मूल्य, अध्ययनाधीन घटना के अवलोकनों की संख्या। बहुराष्ट्रीय कंपनी का प्रयोग शायद ही कभी किया जाता है। एक नियम के रूप में, अक्सर इसका उपयोग केवल सहसंबंध अध्ययन में एक आवश्यक तकनीक के रूप में किया जाता है।
यह याद रखना चाहिए कि एलएसएम का सूचना आधार केवल एक विश्वसनीय सांख्यिकीय श्रृंखला हो सकता है, और टिप्पणियों की संख्या 4 से कम नहीं होनी चाहिए, अन्यथा, एलएसएम की सुचारु प्रक्रियाएं अपना सामान्य ज्ञान खो सकती हैं। ओएलएस टूलकिट को निम्नलिखित प्रक्रियाओं में घटा दिया गया है: पहली प्रक्रिया.
यह पता चलता है कि क्या चयनित कारक-तर्क बदलने पर परिणामी विशेषता में बदलाव की कोई प्रवृत्ति है, या दूसरे शब्दों में, क्या "के बीच कोई संबंध है" पर
" और " एक्स
». दूसरी प्रक्रिया.
यह निर्धारित किया जाता है कि कौन सी रेखा (प्रक्षेपवक्र) इस प्रवृत्ति का वर्णन या विशेषता बताने में सबसे सक्षम है। तीसरी प्रक्रिया.
उदाहरण. मान लीजिए कि हमारे पास अध्ययन के तहत खेत के लिए औसत सूरजमुखी उपज की जानकारी है (तालिका 9.1)। तालिका 9.1 अवलोकन संख्या उत्पादकता, सी/हे चूँकि हमारे देश में सूरजमुखी के उत्पादन में प्रौद्योगिकी का स्तर पिछले 10 वर्षों में बहुत अधिक नहीं बदला है, इसका मतलब है कि, सबसे अधिक संभावना है, विश्लेषण अवधि में उपज में उतार-चढ़ाव मौसम और जलवायु परिस्थितियों में उतार-चढ़ाव पर बहुत अधिक निर्भर था। क्या यह सच है? पहली एमएनसी प्रक्रिया.
विश्लेषण किए गए 10 वर्षों में मौसम और जलवायु परिस्थितियों में बदलाव के आधार पर सूरजमुखी की उपज में बदलाव की प्रवृत्ति के अस्तित्व के बारे में परिकल्पना का परीक्षण किया जा रहा है। इस उदाहरण में, "के लिए य
» सूरजमुखी की उपज लेने की सलाह दी जाती है, और के लिए एक्स
» विश्लेषित अवधि में देखे गए वर्ष की संख्या है। के बीच किसी भी रिश्ते के अस्तित्व के बारे में परिकल्पना का परीक्षण एक्स
" और " य
»दो तरीकों से किया जा सकता है: मैन्युअल रूप से और कंप्यूटर प्रोग्राम की मदद से। निःसंदेह, कंप्यूटर प्रौद्योगिकी की उपलब्धता से यह समस्या अपने आप हल हो जाती है। लेकिन, ओएलएस टूलकिट को बेहतर ढंग से समझने के लिए, "के बीच संबंध के अस्तित्व के बारे में परिकल्पना का परीक्षण करना उचित है।" एक्स
" और " य
» मैन्युअल रूप से, जब केवल एक पेन और एक साधारण कैलकुलेटर हाथ में हो। ऐसे मामलों में, किसी प्रवृत्ति के अस्तित्व की परिकल्पना को विश्लेषण की गई समय श्रृंखला - सहसंबंध क्षेत्र की ग्राफिक छवि के स्थान द्वारा सबसे अच्छी तरह से जांचा जाता है: हमारे उदाहरण में सहसंबंध क्षेत्र धीरे-धीरे बढ़ती हुई रेखा के आसपास स्थित है। यह अपने आप में सूरजमुखी की पैदावार में बदलाव की एक निश्चित प्रवृत्ति के अस्तित्व को इंगित करता है। किसी प्रवृत्ति की उपस्थिति के बारे में केवल तभी बोलना असंभव है जब सहसंबंध क्षेत्र एक वृत्त, एक वृत्त, एक सख्ती से ऊर्ध्वाधर या सख्ती से क्षैतिज बादल जैसा दिखता है, या इसमें बेतरतीब ढंग से बिखरे हुए बिंदु होते हैं। अन्य सभी मामलों में, "के बीच संबंध के अस्तित्व की परिकल्पना की पुष्टि करना आवश्यक है" एक्स
" और " य
और अनुसंधान जारी रखें. दूसरी एमएनसी प्रक्रिया.
यह निर्धारित किया जाता है कि कौन सी रेखा (प्रक्षेपवक्र) विश्लेषण की गई अवधि के लिए सूरजमुखी की उपज में बदलाव की प्रवृत्ति का वर्णन या विशेषता बताने में सबसे सक्षम है। कंप्यूटर प्रौद्योगिकी की उपलब्धता के साथ, इष्टतम प्रवृत्ति का चयन स्वचालित रूप से होता है। "मैनुअल" प्रसंस्करण के साथ, इष्टतम फ़ंक्शन का चुनाव, एक नियम के रूप में, दृश्य तरीके से किया जाता है - सहसंबंध क्षेत्र के स्थान के अनुसार। अर्थात्, चार्ट के प्रकार के अनुसार, रेखा के समीकरण का चयन किया जाता है, जो अनुभवजन्य प्रवृत्ति (वास्तविक प्रक्षेपवक्र के लिए) के लिए सबसे उपयुक्त है। जैसा कि आप जानते हैं, प्रकृति में कार्यात्मक निर्भरताओं की एक विशाल विविधता है, इसलिए उनमें से एक छोटे से हिस्से का भी दृश्य विश्लेषण करना बेहद मुश्किल है। सौभाग्य से, वास्तविक आर्थिक व्यवहार में, अधिकांश रिश्तों को या तो परवलय, या अतिपरवलय, या एक सीधी रेखा द्वारा सटीक रूप से वर्णित किया जा सकता है। इस संबंध में, सर्वोत्तम फ़ंक्शन का चयन करने के लिए "मैनुअल" विकल्प के साथ, आप स्वयं को केवल इन तीन मॉडलों तक सीमित कर सकते हैं। अतिपरवलय: दूसरे क्रम का परवलय: : यह देखना आसान है कि हमारे उदाहरण में, विश्लेषण किए गए 10 वर्षों में सूरजमुखी की उपज में बदलाव की प्रवृत्ति को एक सीधी रेखा द्वारा सबसे अच्छी तरह से चित्रित किया गया है, इसलिए प्रतिगमन समीकरण एक सीधी रेखा समीकरण होगा। तीसरी प्रक्रिया.
इस रेखा की विशेषता बताने वाले प्रतिगमन समीकरण के मापदंडों की गणना की जाती है, या दूसरे शब्दों में, एक विश्लेषणात्मक सूत्र निर्धारित किया जाता है जो सर्वोत्तम प्रवृत्ति मॉडल का वर्णन करता है। प्रतिगमन समीकरण के मापदंडों के मूल्यों का पता लगाना, हमारे मामले में, पैरामीटर और, सबसे कम वर्गों का मूल है। यह प्रक्रिया सामान्य समीकरणों की एक प्रणाली को हल करने तक सिमट कर रह गई है। (9.2) समीकरणों की इस प्रणाली को गॉस विधि द्वारा काफी आसानी से हल किया जा सकता है। याद रखें कि समाधान के परिणामस्वरूप, हमारे उदाहरण में, मापदंडों के मान पाए जाते हैं। इस प्रकार, पाए गए प्रतिगमन समीकरण का निम्नलिखित रूप होगा: विश्वकोश यूट्यूब
उपशीर्षक
कहानी
न्यूनतम वर्ग विधि का सार
उदाहरण - रैखिक समीकरणों की प्रणाली
प्रतिगमन विश्लेषण में ओएलएस (डेटा सन्निकटन)
रैखिक प्रतिगमन के मामले में एलएसएम
सबसे सरल विशेष मामले
बहुपद मॉडल का मामला
ओएलएस अनुमानों के सांख्यिकीय गुण
भारित न्यूनतम वर्ग
न्यूनतम वर्ग विधि (एलएसएम) का सार।
गुणांक ज्ञात करने के लिए सूत्रों की व्युत्पत्ति।
न्यूनतम वर्ग विधि की त्रुटि का अनुमान.
न्यूनतम वर्ग विधि (एलएसएम) का ग्राफिक चित्रण।
और तत्वों का मान निर्भर नहीं करता है एऔर बी.
समाधान का आदेश देंन्यूनतम वर्ग विधि का उपयोग करके पूर्वानुमान का विकास। समस्या समाधान उदाहरण
पूर्वानुमान विकसित करने के लिए न्यूनतम वर्ग विधि का उपयोग करने का एक उदाहरण
न्यूनतम वर्ग विधि
अन्य संबंधित लेख:
एमएनई कार्यक्रम
डेटा दर्ज करें
डेटा और अनुमान वाई = ए + बी एक्स
एक्स मैं- बिंदु पर निश्चित पैरामीटर का मान मैं;
यी- बिंदु पर मापा पैरामीटर का मान मैं;
ω मैं- बिंदु पर माप वजन मैं;
मैं, कैल्क।- मापा मूल्य और प्रतिगमन से गणना मूल्य के बीच का अंतर यबिंदु पर मैं;
एस एक्स आई (एक्स आई)- त्रुटि अनुमान एक्स मैंमापते समय यबिंदु पर मैं.डेटा और अनुमान वाई = केएक्स
मैं
एक्स मैं
यी
ω मैं
मैं, कैल्क।
Δy मैं
एस एक्स आई (एक्स आई)
एमएनसी ऑनलाइन कार्यक्रम के लिए उपयोगकर्ता पुस्तिका।
न्यूनतम वर्ग विधि (एलएसएम)।
रैखिक निर्भरता के लिए न्यूनतम वर्गों का एक संक्षिप्त सिद्धांत
जहां `मैं` - वर्तमान ताकत; `आर` - प्रतिरोध; `यू` - वोल्टेज।
जहां `ए` समाधान का ऑप्टिकल घनत्व है; `ε` - विलेय संप्रेषण; `एल` - पथ की लंबाई जब प्रकाश एक समाधान के साथ क्युवेट से गुजरता है; `C` विलेय की सांद्रता है।
`y = a + bx`.प्रतिगमन रेखा के मापदंडों का पता लगाना।
`y_i = a + b x_i + ε_i` (1),
जहां `ε_i` `i`वें प्रयोग में `y` की अज्ञात माप त्रुटि है।
`Φ = sum_(i=1)^(n) ε_i^2 = sum_(i=1)^(n) (y_i - a - b x_i)^2`. (2)
`frac(आंशिक Φ)(आंशिक a) = frac(आंशिक sum_(i=1)^(n) (y_i - a - b x_i)^2)(आंशिक a) = 0`
`frac(आंशिक Φ)(आंशिक b) = frac(आंशिक sum_(i=1)^(n) (y_i - a - b x_i)^2)(आंशिक b) = 0`
`sum_(i=1)^(n) (2a + 2bx_i - 2y_i) = sum_(i=1)^(n) (a + bx_i - y_i) = 0`
`sum_(i=1)^(n) (2bx_i^2 + 2ax_i - 2x_iy_i) = sum_(i=1)^(n) (bx_i^2 + ax_i - x_iy_i) = 0`
`sum_(i=1)^(n) y_i = a n + b sum_(i=1)^(n) bx_i`
`sum_(i=1)^(n) x_iy_i = a sum_(i=1)^(n) x_i + b sum_(i=1)^(n) x_i^2`प्रतिगमन रेखा के गुणांकों में त्रुटियों का अनुमान
`S_V^2 = sum_(i=1)^p (frac(आंशिक f)(आंशिक z_i))^2 S_(z_i)^2`,
जहां `p` `S_(z_i)` त्रुटि वाले `z_i` पैरामीटर की संख्या है जो `S_V` त्रुटि को प्रभावित करती है;
`f` `z_i` पर `V` का निर्भरता फ़ंक्शन है।
`S_a^2 = sum_(i=1)^(n)(frac(आंशिक a)(आंशिक y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(आंशिक a) )(आंशिक x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(आंशिक a)(आंशिक y_i))^2 `,
`S_b^2 = sum_(i=1)^(n)(frac(आंशिक b)(आंशिक y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(आंशिक b) )(आंशिक x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(आंशिक b)(आंशिक y_i))^2 `,
क्योंकि `S_(x_i)^2 = 0` (हमने पहले आरक्षण दिया था कि `x` की त्रुटि नगण्य है)।
`F = S_(बार y) / S_(y, बाकी)^2`,
जिसकी तुलना सारणीबद्ध फिशर गुणांक `F(p, n-1, n-2)` से की जाती है।
तालिका में मान जोड़ने के लिएन्यूनतम वर्ग विधि. न्यूनतम वर्गों की विधि का अर्थ है अज्ञात मापदंडों ए, बी, सी, स्वीकृत कार्यात्मक निर्भरता का निर्धारण