एसडी से 95 विश्वास अंतराल अंतर। विश्वास अंतराल
अक्सर मूल्यांकक को उस खंड के रियल एस्टेट बाजार का विश्लेषण करना होता है जिसमें मूल्यांकन की जा रही संपत्ति स्थित है। यदि बाजार विकसित है, तो प्रस्तुत वस्तुओं के पूरे सेट का विश्लेषण करना मुश्किल हो सकता है, इसलिए विश्लेषण के लिए वस्तुओं का एक नमूना उपयोग किया जाता है। यह नमूना हमेशा सजातीय नहीं बनता है; कभी-कभी इसे चरम बिंदुओं से साफ़ करना आवश्यक होता है - बहुत अधिक या बहुत कम बाज़ार ऑफ़र। इसी उद्देश्य से इसका प्रयोग किया जाता है विश्वास अंतराल. इस अध्ययन का उद्देश्य आत्मविश्वास अंतराल की गणना के लिए दो तरीकों का तुलनात्मक विश्लेषण करना और अनुमान.प्रो प्रणाली में विभिन्न नमूनों के साथ काम करते समय इष्टतम गणना विकल्प का चयन करना है।
कॉन्फिडेंस अंतराल एक नमूने के आधार पर गणना की गई विशेषता मूल्यों का एक अंतराल है, जिसमें ज्ञात संभावना के साथ सामान्य जनसंख्या का अनुमानित पैरामीटर शामिल होता है।
विश्वास अंतराल की गणना करने का उद्देश्य नमूना डेटा के आधार पर ऐसे अंतराल का निर्माण करना है ताकि दी गई संभावना के साथ यह कहा जा सके कि अनुमानित पैरामीटर का मान इस अंतराल में है। दूसरे शब्दों में, विश्वास अंतराल में एक निश्चित संभावना के साथ अनुमानित मूल्य का अज्ञात मूल्य शामिल होता है। अंतराल जितना व्यापक होगा, अशुद्धि उतनी ही अधिक होगी।
कॉन्फिडेंस इंटरवल निर्धारित करने के लिए अलग-अलग तरीके हैं। इस लेख में हम 2 तरीकों पर गौर करेंगे:
- माध्यिका और मानक विचलन के माध्यम से;
- टी-सांख्यिकी (छात्र का गुणांक) के महत्वपूर्ण मूल्य के माध्यम से।
सीआई की गणना के लिए विभिन्न तरीकों के तुलनात्मक विश्लेषण के चरण:
1. एक डेटा नमूना तैयार करें;
2. हम इसे सांख्यिकीय तरीकों का उपयोग करके संसाधित करते हैं: हम औसत मूल्य, माध्यिका, विचरण, आदि की गणना करते हैं;
3. विश्वास अंतराल की गणना दो तरीकों से करें;
4. साफ किए गए नमूनों और परिणामी आत्मविश्वास अंतराल का विश्लेषण करें।
चरण 1. डेटा नमूनाकरण
नमूना estimatica.pro प्रणाली का उपयोग करके बनाया गया था। नमूने में "ख्रुश्चेव" प्रकार के लेआउट के साथ तीसरे मूल्य क्षेत्र में 1-कमरे वाले अपार्टमेंट की बिक्री के लिए 91 प्रस्ताव शामिल थे।
तालिका 1. प्रारंभिक नमूना
मूल्य 1 वर्ग मीटर, इकाई |
|
चित्र .1। प्रारंभिक नमूना
चरण 2. प्रारंभिक नमूने का प्रसंस्करण
सांख्यिकीय विधियों का उपयोग करके किसी नमूने को संसाधित करने के लिए निम्नलिखित मानों की गणना की आवश्यकता होती है:
1. अंकगणितीय माध्य
2. माध्यिका नमूने को दर्शाने वाली एक संख्या है: नमूना तत्वों का बिल्कुल आधा हिस्सा माध्यिका से बड़ा है, अन्य आधा माध्यिका से कम है
(विषम संख्या में मान वाले नमूने के लिए)
3. रेंज - नमूने में अधिकतम और न्यूनतम मूल्यों के बीच का अंतर
4. वेरिएंस - डेटा की भिन्नता का अधिक सटीक अनुमान लगाने के लिए उपयोग किया जाता है
5. नमूना मानक विचलन (इसके बाद - एसडी) अंकगणित माध्य के आसपास समायोजन मूल्यों के फैलाव का सबसे आम संकेतक है।
6. भिन्नता का गुणांक - समायोजन मूल्यों के बिखरने की डिग्री को दर्शाता है
7. दोलन गुणांक - औसत के आसपास नमूने में चरम मूल्य मूल्यों के सापेक्ष उतार-चढ़ाव को दर्शाता है
तालिका 2. मूल नमूने के सांख्यिकीय संकेतक
भिन्नता का गुणांक, जो डेटा की एकरूपता को दर्शाता है, 12.29% है, लेकिन दोलन का गुणांक बहुत अधिक है। इस प्रकार, हम कह सकते हैं कि मूल नमूना सजातीय नहीं है, तो आइए विश्वास अंतराल की गणना के लिए आगे बढ़ें।
चरण 3. आत्मविश्वास अंतराल गणना
विधि 1. माध्यिका और मानक विचलन का उपयोग करके गणना।
विश्वास अंतराल निम्नानुसार निर्धारित किया जाता है: न्यूनतम मूल्य - मानक विचलन माध्यिका से घटाया जाता है; अधिकतम मान - मानक विचलन माध्यिका में जोड़ा जाता है।
इस प्रकार, आत्मविश्वास अंतराल (47179 सीयू; 60689 सीयू)
चावल। 2. विश्वास अंतराल के अंतर्गत आने वाले मान 1.
विधि 2. टी-सांख्यिकी (छात्र गुणांक) के महत्वपूर्ण मूल्य का उपयोग करके एक आत्मविश्वास अंतराल का निर्माण
एस.वी. ग्रिबोव्स्की ने अपनी पुस्तक "संपत्ति मूल्य का अनुमान लगाने के लिए गणितीय तरीके" में छात्र गुणांक के माध्यम से आत्मविश्वास अंतराल की गणना करने की एक विधि का वर्णन किया है। इस विधि का उपयोग करके गणना करते समय, अनुमानक को स्वयं महत्व स्तर ∝ निर्धारित करना होगा, जो संभावना निर्धारित करता है जिसके साथ विश्वास अंतराल का निर्माण किया जाएगा। आमतौर पर, 0.1 के महत्व स्तर का उपयोग किया जाता है; 0.05 और 0.01. वे 0.9 की आत्मविश्वास संभावनाओं के अनुरूप हैं; 0.95 और 0.99. इस पद्धति के साथ, गणितीय अपेक्षा और विचरण के वास्तविक मूल्यों को व्यावहारिक रूप से अज्ञात माना जाता है (जो व्यावहारिक अनुमान समस्याओं को हल करते समय लगभग हमेशा सत्य होता है)।
कॉन्फिडेंस इंटरवल फॉर्मूला:
एन - नमूना आकार;
महत्व स्तर ∝ के साथ टी-सांख्यिकी (छात्र वितरण) का महत्वपूर्ण मूल्य, स्वतंत्रता की डिग्री एन -1 की संख्या, जो विशेष सांख्यिकीय तालिकाओं से या एमएस एक्सेल (→ "सांख्यिकीय" → अध्ययनकर्ता) का उपयोग करके निर्धारित की जाती है;
∝ - महत्व स्तर, ∝=0.01 लें।
चावल। 2. विश्वास अंतराल के अंतर्गत आने वाले मान 2.
चरण 4. आत्मविश्वास अंतराल की गणना के लिए विभिन्न तरीकों का विश्लेषण
आत्मविश्वास अंतराल की गणना करने के दो तरीके - माध्यिका और छात्र के गुणांक के माध्यम से - अंतराल के विभिन्न मूल्यों को जन्म देते हैं। तदनुसार, हमें दो अलग-अलग साफ किए गए नमूने मिले।
तालिका 3. तीन नमूनों के आँकड़े।
अनुक्रमणिका |
प्रारंभिक नमूना |
1 विकल्प |
विकल्प 2 |
औसत मूल्य |
|||
फैलाव |
|||
कोएफ़. बदलाव |
|||
कोएफ़. दोलनों |
|||
सेवानिवृत्त वस्तुओं की संख्या, पीसी। |
की गई गणनाओं के आधार पर, हम कह सकते हैं कि विभिन्न तरीकों से प्राप्त विश्वास अंतराल मान प्रतिच्छेद करते हैं, इसलिए आप मूल्यांकनकर्ता के विवेक पर किसी भी गणना पद्धति का उपयोग कर सकते हैं।
हालाँकि, हमारा मानना है कि estimatica.pro प्रणाली में काम करते समय, बाजार विकास की डिग्री के आधार पर विश्वास अंतराल की गणना के लिए एक विधि चुनने की सलाह दी जाती है:
- यदि बाजार अविकसित है, तो माध्यिका और मानक विचलन का उपयोग करके गणना पद्धति का उपयोग करें, क्योंकि इस मामले में सेवानिवृत्त वस्तुओं की संख्या कम है;
- यदि बाजार विकसित हो गया है, तो टी-सांख्यिकी (छात्र गुणांक) के महत्वपूर्ण मूल्य के माध्यम से गणना लागू करें, क्योंकि एक बड़ा प्रारंभिक नमूना बनाना संभव है।
लेख तैयार करने में निम्नलिखित का उपयोग किया गया:
1. ग्रिबोव्स्की एस.वी., सिवेट्स एस.ए., लेविकिना आई.ए. संपत्ति के मूल्य का आकलन करने के लिए गणितीय तरीके। मॉस्को, 2014
2. सिस्टम डेटा estimatica.pro
विश्वास अंतराल ( अंग्रेज़ी विश्वास अंतराल) आँकड़ों में प्रयुक्त अंतराल अनुमानों के प्रकारों में से एक, जिनकी गणना किसी दिए गए महत्व स्तर के लिए की जाती है। वे हमें यह कथन करने की अनुमति देते हैं कि जनसंख्या के अज्ञात सांख्यिकीय पैरामीटर का सही मूल्य सांख्यिकीय महत्व के चयनित स्तर द्वारा निर्दिष्ट संभावना के साथ मूल्यों की प्राप्त सीमा के भीतर है।
सामान्य वितरण
जब डेटा की जनसंख्या का विचरण (σ 2) ज्ञात होता है, तो z-स्कोर का उपयोग आत्मविश्वास सीमा (विश्वास अंतराल के अंतिम बिंदु) की गणना करने के लिए किया जा सकता है। टी-वितरण का उपयोग करने की तुलना में, ज़ेड-स्कोर का उपयोग करने से आप न केवल एक संकीर्ण आत्मविश्वास अंतराल का निर्माण कर सकेंगे, बल्कि अपेक्षित मूल्य और मानक विचलन (σ) का अधिक विश्वसनीय अनुमान भी लगा सकेंगे, क्योंकि ज़ेड-स्कोर एक पर आधारित है। सामान्य वितरण।
FORMULA
विश्वास अंतराल के सीमा बिंदुओं को निर्धारित करने के लिए, बशर्ते कि डेटा की जनसंख्या का मानक विचलन ज्ञात हो, निम्नलिखित सूत्र का उपयोग किया जाता है
एल = एक्स - जेड α/2 | σ |
के √ N |
उदाहरण
मान लें कि नमूना आकार 25 अवलोकन है, नमूना अपेक्षित मूल्य 15 है, और जनसंख्या मानक विचलन 8 है। α=5% के महत्व स्तर के लिए, Z-स्कोर Z α/2 =1.96 है। इस मामले में, विश्वास अंतराल की निचली और ऊपरी सीमाएं होंगी
एल = 15 - 1.96 | 8 | = 11,864 |
√25 |
एल = 15 + 1.96 | 8 | = 18,136 |
√25 |
इस प्रकार, हम कह सकते हैं कि 95% संभावना के साथ जनसंख्या की गणितीय अपेक्षा 11.864 से 18.136 की सीमा में गिर जाएगी।
विश्वास अंतराल को कम करने के तरीके
आइए मान लें कि हमारे अध्ययन के उद्देश्यों के लिए सीमा बहुत व्यापक है। कॉन्फिडेंस इंटरवल की सीमा को कम करने के दो तरीके हैं।
- सांख्यिकीय महत्व α का स्तर कम करें।
- नमूना आकार बढ़ाएँ.
सांख्यिकीय महत्व के स्तर को α=10% तक कम करने पर, हमें Z α/2 =1.64 के बराबर Z-स्कोर प्राप्त होता है। इस स्थिति में, अंतराल की निचली और ऊपरी सीमाएँ होंगी
एल = 15 - 1.64 | 8 | = 12,376 |
√25 |
एल = 15 + 1.64 | 8 | = 17,624 |
√25 |
और कॉन्फिडेंस इंटरवल को ही फॉर्म में लिखा जा सकता है
इस मामले में, हम यह धारणा बना सकते हैं कि 90% संभावना के साथ जनसंख्या की गणितीय अपेक्षा सीमा के भीतर आ जाएगी।
यदि हम चाहते हैं कि सांख्यिकीय महत्व α का स्तर कम न हो, तो नमूना आकार बढ़ाना ही एकमात्र विकल्प है। इसे 144 अवलोकनों तक बढ़ाने पर, हमें विश्वास सीमा के निम्नलिखित मान प्राप्त होते हैं
एल = 15 - 1.96 | 8 | = 13,693 |
√144 |
एल = 15 + 1.96 | 8 | = 16,307 |
√144 |
कॉन्फिडेंस इंटरवल का स्वयं निम्नलिखित रूप होगा
इस प्रकार, सांख्यिकीय महत्व के स्तर को कम किए बिना विश्वास अंतराल को कम करना केवल नमूना आकार को बढ़ाकर संभव है। यदि नमूना आकार बढ़ाना संभव नहीं है, तो सांख्यिकीय महत्व के स्तर को कम करके ही विश्वास अंतराल को कम किया जा सकता है।
सामान्य से भिन्न वितरण के लिए विश्वास अंतराल का निर्माण करना
यदि जनसंख्या का मानक विचलन ज्ञात नहीं है या वितरण सामान्य से भिन्न है, तो टी-वितरण का उपयोग आत्मविश्वास अंतराल के निर्माण के लिए किया जाता है। यह तकनीक अधिक रूढ़िवादी है, जो ज़ेड-स्कोर पर आधारित तकनीक की तुलना में व्यापक आत्मविश्वास अंतराल में परिलक्षित होती है।
FORMULA
टी-वितरण के आधार पर विश्वास अंतराल की निचली और ऊपरी सीमा की गणना करने के लिए, निम्नलिखित सूत्रों का उपयोग करें
एल = एक्स - टी α | σ |
के √ N |
छात्र वितरण या टी-वितरण केवल एक पैरामीटर पर निर्भर करता है - स्वतंत्रता की डिग्री की संख्या, जो विशेषता के व्यक्तिगत मूल्यों की संख्या (नमूने में टिप्पणियों की संख्या) के बराबर है। स्वतंत्रता की डिग्री (एन) की दी गई संख्या और सांख्यिकीय महत्व α के स्तर के लिए छात्र के टी-टेस्ट का मूल्य संदर्भ तालिकाओं में पाया जा सकता है।
उदाहरण
मान लें कि नमूना आकार 25 व्यक्तिगत मान है, नमूना अपेक्षित मूल्य 50 है, और नमूना मानक विचलन 28 है। सांख्यिकीय महत्व α=5% के स्तर के लिए एक विश्वास अंतराल का निर्माण करना आवश्यक है।
हमारे मामले में, स्वतंत्रता की डिग्री की संख्या 24 (25-1) है, इसलिए सांख्यिकीय महत्व α=5% के स्तर के लिए छात्र के टी-टेस्ट का संबंधित तालिका मूल्य 2.064 है। इसलिए, विश्वास अंतराल की निचली और ऊपरी सीमाएं होंगी
एल = 50 - 2.064 | 28 | = 38,442 |
√25 |
एल = 50 + 2.064 | 28 | = 61,558 |
√25 |
और अंतराल को ही रूप में लिखा जा सकता है
इस प्रकार, हम कह सकते हैं कि 95% संभावना के साथ जनसंख्या की गणितीय अपेक्षा सीमा में होगी।
टी वितरण का उपयोग करने से आप सांख्यिकीय महत्व को कम करके या नमूना आकार को बढ़ाकर विश्वास अंतराल को कम कर सकते हैं।
हमारे उदाहरण की स्थितियों में सांख्यिकीय महत्व को 95% से घटाकर 90% करने पर, हम छात्र के टी-टेस्ट का संबंधित तालिका मान 1.711 प्राप्त करते हैं।
एल = 50 - 1.711 | 28 | = 40,418 |
√25 |
एल = 50 + 1.711 | 28 | = 59,582 |
√25 |
इस मामले में, हम कह सकते हैं कि 90% संभावना के साथ जनसंख्या की गणितीय अपेक्षा सीमा में होगी।
यदि हम सांख्यिकीय महत्व को कम नहीं करना चाहते हैं, तो नमूना आकार बढ़ाना ही एकमात्र विकल्प है। मान लीजिए कि यह 64 व्यक्तिगत अवलोकन हैं, न कि 25, जैसा कि उदाहरण की मूल स्थिति में है। स्वतंत्रता की 63 डिग्री (64-1) और सांख्यिकीय महत्व के स्तर α=5% के लिए छात्र के टी-टेस्ट का तालिका मूल्य 1.998 है।
एल = 50 - 1.998 | 28 | = 43,007 |
√64 |
एल = 50 + 1.998 | 28 | = 56,993 |
√64 |
यह हमें यह कहने की अनुमति देता है कि 95% संभावना के साथ जनसंख्या की गणितीय अपेक्षा सीमा में होगी।
बड़े नमूने
बड़े नमूने डेटा की आबादी से नमूने हैं जिनमें व्यक्तिगत अवलोकनों की संख्या 100 से अधिक है। सांख्यिकीय अध्ययनों से पता चला है कि बड़े नमूने सामान्य रूप से वितरित होते हैं, भले ही जनसंख्या का वितरण सामान्य न हो। इसके अलावा, ऐसे नमूनों के लिए, आत्मविश्वास अंतराल का निर्माण करते समय जेड-स्कोर और टी-वितरण का उपयोग लगभग समान परिणाम देता है। इस प्रकार, बड़े नमूनों के लिए, टी-वितरण के बजाय सामान्य वितरण के लिए जेड-स्कोर का उपयोग करना स्वीकार्य है।
आइए इसे संक्षेप में बताएं
विश्वास अंतराल।
विश्वास अंतराल की गणना संबंधित पैरामीटर की औसत त्रुटि पर आधारित है। विश्वास अंतराल दिखाता है कि संभाव्यता (1-ए) के साथ अनुमानित पैरामीटर का सही मूल्य किस सीमा के भीतर निहित है। यहां ए महत्व स्तर है, (1-ए) को आत्मविश्वास संभावना भी कहा जाता है।
पहले अध्याय में हमने दिखाया कि, उदाहरण के लिए, अंकगणितीय माध्य के लिए, लगभग 95% मामलों में वास्तविक जनसंख्या माध्य माध्य की 2 मानक त्रुटियों के भीतर होता है। इस प्रकार, माध्य के लिए 95% विश्वास अंतराल की सीमाएं नमूना माध्य से माध्य की माध्य त्रुटि के दोगुने से अलग हो जाएंगी, अर्थात। हम आत्मविश्वास के स्तर के आधार पर माध्य की औसत त्रुटि को एक निश्चित गुणांक से गुणा करते हैं। औसत और औसत के अंतर के लिए, छात्र गुणांक (छात्र के परीक्षण का महत्वपूर्ण मूल्य) लिया जाता है, शेयरों के शेयर और अंतर के लिए, z मानदंड का महत्वपूर्ण मूल्य लिया जाता है। गुणांक और औसत त्रुटि के उत्पाद को किसी दिए गए पैरामीटर की अधिकतम त्रुटि कहा जा सकता है, अर्थात। इसका आकलन करते समय हम अधिकतम प्राप्त कर सकते हैं।
के लिए आत्मविश्वास अंतराल अंकगणित औसत : .
यहाँ नमूना माध्य है;
अंकगणित माध्य की औसत त्रुटि;
एस -नमूना मानक विचलन;
एन
एफ = एन-1 (छात्र का गुणांक)।
के लिए आत्मविश्वास अंतराल अंकगणितीय साधनों के अंतर :
यहाँ नमूना साधनों के बीच अंतर है;
- अंकगणितीय माध्यों के बीच अंतर की औसत त्रुटि;
एस 1 , एस 2 –नमूना मानक विचलन;
n1,n2
किसी दिए गए महत्व स्तर ए और स्वतंत्रता की डिग्री की संख्या के लिए छात्र के परीक्षण का महत्वपूर्ण मूल्य एफ=एन 1 +एन 2-2 (छात्र का गुणांक)।
के लिए आत्मविश्वास अंतराल शेयरों :
.
यहाँ d नमूना अंश है;
- औसत अंश त्रुटि;
एन- नमूना आकार (समूह आकार);
के लिए आत्मविश्वास अंतराल शेयरों का अंतर :
यहाँ नमूना शेयरों में अंतर है;
- अंकगणितीय माध्यों के बीच अंतर की औसत त्रुटि;
n1,n2- नमूना मात्रा (समूहों की संख्या);
किसी दिए गए महत्व स्तर पर z मानदंड का महत्वपूर्ण मान ( , , )।
संकेतकों के बीच अंतर के लिए विश्वास अंतराल की गणना करके, हम, सबसे पहले, सीधे प्रभाव के संभावित मूल्यों को देखते हैं, न कि केवल इसके बिंदु अनुमान को। दूसरे, हम शून्य परिकल्पना की स्वीकृति या अस्वीकृति के बारे में निष्कर्ष निकाल सकते हैं और तीसरा, हम परीक्षण की शक्ति के बारे में निष्कर्ष निकाल सकते हैं।
आत्मविश्वास अंतराल का उपयोग करके परिकल्पनाओं का परीक्षण करते समय, आपको निम्नलिखित नियम का पालन करना होगा:
यदि साधनों में अंतर के 100(1-ए) प्रतिशत विश्वास अंतराल में शून्य नहीं है, तो अंतर महत्व स्तर ए पर सांख्यिकीय रूप से महत्वपूर्ण हैं; इसके विपरीत, यदि इस अंतराल में शून्य है, तो अंतर सांख्यिकीय रूप से महत्वपूर्ण नहीं हैं।
वास्तव में, यदि इस अंतराल में शून्य है, तो इसका मतलब है कि जिस संकेतक की तुलना की जा रही है वह किसी एक समूह में दूसरे की तुलना में अधिक या कम हो सकता है, अर्थात। देखे गए मतभेद संयोग के कारण हैं।
परीक्षण की शक्ति का अंदाजा विश्वास अंतराल के भीतर शून्य के स्थान से लगाया जा सकता है। यदि शून्य अंतराल की निचली या ऊपरी सीमा के करीब है, तो यह संभव है कि बड़ी संख्या में समूहों की तुलना करने पर, अंतर सांख्यिकीय महत्व तक पहुंच जाएगा। यदि शून्य अंतराल के मध्य के करीब है, तो इसका मतलब है कि प्रयोगात्मक समूह में संकेतक में वृद्धि और कमी दोनों समान रूप से होने की संभावना है, और, शायद, वास्तव में कोई अंतर नहीं है।
उदाहरण:
दो अलग-अलग प्रकार के एनेस्थीसिया का उपयोग करते समय सर्जिकल मृत्यु दर की तुलना करने के लिए: पहले प्रकार के एनेस्थीसिया से 61 लोगों का ऑपरेशन किया गया, 8 की मृत्यु हो गई, दूसरे प्रकार के एनेस्थीसिया से 67 लोगों का ऑपरेशन किया गया, 10 की मृत्यु हो गई।
डी 1 = 8/61 = 0.131; डी2 = 10/67 = 0.149; d1-d2 = - 0.018.
तुलना की गई विधियों की घातकता में अंतर 100(1-ए) = 95% की संभावना के साथ (-0.018 - 0.122; -0.018 + 0.122) या (-0.14; 0.104) की सीमा में होगा। अंतराल में शून्य होता है, अर्थात। दो अलग-अलग प्रकार के एनेस्थीसिया के साथ समान मृत्यु दर की परिकल्पना को अस्वीकार नहीं किया जा सकता है।
इस प्रकार, मृत्यु दर घटकर 14% हो सकती है और 95% की संभावना के साथ 10.4% तक बढ़ सकती है, यानी। शून्य लगभग अंतराल के मध्य में है, इसलिए यह तर्क दिया जा सकता है कि, सबसे अधिक संभावना है, ये दोनों विधियां वास्तव में घातकता में भिन्न नहीं हैं।
पहले चर्चा किए गए उदाहरण में, टैपिंग टेस्ट के दौरान औसत दबाव समय की तुलना उन छात्रों के चार समूहों में की गई थी जिनके परीक्षा स्कोर में अंतर था। आइए ग्रेड 2 और 5 के साथ परीक्षा उत्तीर्ण करने वाले छात्रों के लिए औसत दबाव समय के लिए आत्मविश्वास अंतराल और इन औसतों के बीच अंतर के लिए आत्मविश्वास अंतराल की गणना करें।
विद्यार्थी के गुणांक विद्यार्थी की वितरण तालिकाओं (परिशिष्ट देखें) का उपयोग करके पाए जाते हैं: पहले समूह के लिए: = t(0.05;48) = 2.011; दूसरे समूह के लिए: = t(0.05;61) = 2.000. इस प्रकार, पहले समूह के लिए आत्मविश्वास अंतराल: = (162.19-2.011*2.18; 162.19+2.011*2.18) = (157.8; 166.6), दूसरे समूह के लिए (156.55- 2,000*1.88; 156.55+2,000*1.88) = (152.8) ; 160.3). तो, उन लोगों के लिए जिन्होंने 2 के साथ परीक्षा उत्तीर्ण की, औसत दबाव समय 157.8 एमएस से 166.6 एमएस तक है, जिसकी संभावना 95% है, उन लोगों के लिए जिन्होंने परीक्षा 5 के साथ उत्तीर्ण की है - 152.8 एमएस से 160.3 एमएस तक, 95% की संभावना के साथ। .
आप साधनों के लिए विश्वास अंतराल का उपयोग करके भी शून्य परिकल्पना का परीक्षण कर सकते हैं, न कि केवल साधनों में अंतर के लिए। उदाहरण के लिए, जैसा कि हमारे मामले में, यदि साधनों के लिए विश्वास अंतराल ओवरलैप होता है, तो शून्य परिकल्पना को अस्वीकार नहीं किया जा सकता है। किसी चुने गए महत्व स्तर पर किसी परिकल्पना को अस्वीकार करने के लिए, संबंधित आत्मविश्वास अंतराल को ओवरलैप नहीं करना चाहिए।
आइए ग्रेड 2 और 5 के साथ परीक्षा उत्तीर्ण करने वाले समूहों में औसत दबाव समय के अंतर के लिए आत्मविश्वास अंतराल खोजें। औसत का अंतर: 162.19 - 156.55 = 5.64। विद्यार्थी का गुणांक: = t(0.05;49+62-2) = t(0.05;109) = 1.982. समूह मानक विचलन इसके बराबर होंगे: ; . हम माध्यों के बीच अंतर की औसत त्रुटि की गणना करते हैं:। आत्मविश्वास अंतराल: =(5.64-1.982*2.87; 5.64+1.982*2.87) = (-0.044; 11.33)।
तो, 2 और 5 के साथ परीक्षा उत्तीर्ण करने वाले समूहों में औसत दबाव समय का अंतर -0.044 एमएस से 11.33 एमएस तक होगा। इस अंतराल में शून्य शामिल है, अर्थात। जो लोग अच्छी तरह से परीक्षा उत्तीर्ण कर चुके हैं उनके लिए औसत दबाव समय या तो बढ़ सकता है या उन लोगों की तुलना में घट सकता है जिन्होंने परीक्षा असंतोषजनक रूप से उत्तीर्ण की है, यानी। शून्य परिकल्पना को अस्वीकार नहीं किया जा सकता। लेकिन शून्य निचली सीमा के बहुत करीब है, और जो लोग अच्छी तरह से उत्तीर्ण हुए उनके लिए दबाव का समय कम होने की अधिक संभावना है। इस प्रकार, हम यह निष्कर्ष निकाल सकते हैं कि 2 और 5 उत्तीर्ण करने वालों के बीच दबाव के औसत समय में अभी भी अंतर हैं, हम औसत समय में परिवर्तन, औसत समय के प्रसार और नमूना आकार को देखते हुए उनका पता नहीं लगा सके।
एक परीक्षण की शक्ति एक गलत शून्य परिकल्पना को अस्वीकार करने की संभावना है, अर्थात। अंतर ढूंढें जहां वे वास्तव में मौजूद हैं।
परीक्षण की शक्ति महत्व के स्तर, समूहों के बीच अंतर के परिमाण, समूहों में मूल्यों के प्रसार और नमूनों के आकार के आधार पर निर्धारित की जाती है।
विद्यार्थी के परीक्षण और विचरण के विश्लेषण के लिए, संवेदनशीलता आरेखों का उपयोग किया जा सकता है।
मानदंड की शक्ति का उपयोग समूहों की आवश्यक संख्या को प्रारंभिक रूप से निर्धारित करने के लिए किया जा सकता है।
आत्मविश्वास अंतराल दिखाता है कि किसी दी गई संभावना के साथ अनुमानित पैरामीटर का वास्तविक मान किस सीमा के भीतर निहित है।
आत्मविश्वास अंतराल का उपयोग करके, आप सांख्यिकीय परिकल्पनाओं का परीक्षण कर सकते हैं और मानदंडों की संवेदनशीलता के बारे में निष्कर्ष निकाल सकते हैं।
साहित्य।
ग्लैंज़ एस. - अध्याय 6,7.
रेब्रोवा ओ.यू. - पृ.112-114, पृ.171-173, पृ.234-238.
सिडोरेंको ई.वी. - पृष्ठ 32-33।
छात्रों के आत्म-परीक्षण के लिए प्रश्न।
1. कसौटी की शक्ति क्या है?
2. किन मामलों में मानदंड की शक्ति का मूल्यांकन करना आवश्यक है?
3. शक्ति की गणना के तरीके.
6. आत्मविश्वास अंतराल का उपयोग करके सांख्यिकीय परिकल्पना का परीक्षण कैसे करें?
7. विश्वास अंतराल की गणना करते समय मानदंड की शक्ति के बारे में क्या कहा जा सकता है?
कार्य.
गणितीय अपेक्षा के लिए विश्वास अंतराल - यह डेटा से गणना किया गया एक अंतराल है, जिसमें ज्ञात संभावना के साथ, सामान्य जनसंख्या की गणितीय अपेक्षा शामिल होती है। गणितीय अपेक्षा के लिए एक प्राकृतिक अनुमान उसके देखे गए मूल्यों का अंकगणितीय माध्य है। इसलिए, पूरे पाठ में हम "औसत" और "औसत मूल्य" शब्दों का उपयोग करेंगे। आत्मविश्वास अंतराल की गणना करने की समस्याओं में, सबसे अधिक बार एक उत्तर की आवश्यकता होती है जैसे "औसत संख्या का आत्मविश्वास अंतराल [किसी विशेष समस्या में मूल्य] [छोटे मूल्य] से [बड़े मूल्य] तक होता है।" आत्मविश्वास अंतराल का उपयोग करके, आप न केवल औसत मूल्यों का मूल्यांकन कर सकते हैं, बल्कि सामान्य जनसंख्या की किसी विशेष विशेषता के अनुपात का भी मूल्यांकन कर सकते हैं। औसत मान, फैलाव, मानक विचलन और त्रुटि, जिसके माध्यम से हम नई परिभाषाओं और सूत्रों पर पहुंचेंगे, पाठ में चर्चा की गई है नमूने और जनसंख्या के लक्षण .
माध्य के बिंदु और अंतराल अनुमान
यदि जनसंख्या के औसत मूल्य का अनुमान किसी संख्या (बिंदु) द्वारा लगाया जाता है, तो एक विशिष्ट औसत, जिसकी गणना टिप्पणियों के नमूने से की जाती है, को जनसंख्या के अज्ञात औसत मूल्य के अनुमान के रूप में लिया जाता है। इस मामले में, नमूना माध्य का मान - एक यादृच्छिक चर - सामान्य जनसंख्या के माध्य मान से मेल नहीं खाता है। इसलिए, नमूना माध्य इंगित करते समय, आपको साथ ही नमूना त्रुटि भी इंगित करनी होगी। नमूनाकरण त्रुटि का माप मानक त्रुटि है, जिसे माध्य के समान इकाइयों में व्यक्त किया जाता है। इसलिए, निम्नलिखित संकेतन का अक्सर उपयोग किया जाता है: .
यदि औसत के अनुमान को एक निश्चित संभाव्यता के साथ जोड़ने की आवश्यकता है, तो जनसंख्या में रुचि के पैरामीटर का आकलन एक संख्या से नहीं, बल्कि एक अंतराल द्वारा किया जाना चाहिए। एक विश्वास अंतराल एक ऐसा अंतराल है जिसमें, एक निश्चित संभावना के साथ पीअनुमानित जनसंख्या सूचक का मान ज्ञात किया जाता है। कॉन्फिडेंस इंटरवल जिसमें यह संभावित है पी = 1 - α यादृच्छिक चर पाया जाता है, जिसकी गणना निम्नानुसार की जाती है:
,
α = 1 - पी, जो सांख्यिकी पर लगभग किसी भी पुस्तक के परिशिष्ट में पाया जा सकता है।
व्यवहार में, जनसंख्या माध्य और विचरण ज्ञात नहीं हैं, इसलिए जनसंख्या विचरण को नमूना विचरण से और जनसंख्या माध्य को नमूना माध्य से प्रतिस्थापित कर दिया जाता है। इस प्रकार, अधिकांश मामलों में विश्वास अंतराल की गणना निम्नानुसार की जाती है:
.
जनसंख्या माध्य का अनुमान लगाने के लिए आत्मविश्वास अंतराल सूत्र का उपयोग किया जा सकता है
- जनसंख्या का मानक विचलन ज्ञात है;
- या जनसंख्या का मानक विचलन अज्ञात है, लेकिन नमूना आकार 30 से अधिक है।
नमूना माध्य जनसंख्या माध्य का निष्पक्ष अनुमान है। बदले में, नमूना विचरण जनसंख्या भिन्नता का निष्पक्ष अनुमान नहीं है। नमूना विचरण सूत्र, नमूना आकार में जनसंख्या विचरण का निष्पक्ष अनुमान प्राप्त करने के लिए एनद्वारा प्रतिस्थापित किया जाना चाहिए एन-1.
उदाहरण 1।एक निश्चित शहर में यादृच्छिक रूप से चुने गए 100 कैफे से जानकारी एकत्र की गई कि उनमें कर्मचारियों की औसत संख्या 4.6 के मानक विचलन के साथ 10.5 है। कैफे कर्मचारियों की संख्या के लिए 95% विश्वास अंतराल निर्धारित करें।
महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य कहां है α = 0,05 .
इस प्रकार, कैफे कर्मचारियों की औसत संख्या के लिए 95% विश्वास अंतराल 9.6 से 11.4 तक था।
उदाहरण 2. 64 अवलोकनों की जनसंख्या से एक यादृच्छिक नमूने के लिए, निम्नलिखित कुल मूल्यों की गणना की गई:
प्रेक्षणों में मानों का योग,
औसत से मूल्यों के वर्ग विचलन का योग .
गणितीय अपेक्षा के लिए 95% विश्वास अंतराल की गणना करें।
आइए मानक विचलन की गणना करें:
,
आइए औसत मूल्य की गणना करें:
.
हम आत्मविश्वास अंतराल के लिए अभिव्यक्ति में मानों को प्रतिस्थापित करते हैं:
महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य कहां है α = 0,05 .
हम पाते हैं:
इस प्रकार, इस नमूने की गणितीय अपेक्षा के लिए 95% विश्वास अंतराल 7.484 से 11.266 तक था।
उदाहरण 3. 100 अवलोकनों के यादृच्छिक जनसंख्या नमूने के लिए, परिकलित माध्य 15.2 है और मानक विचलन 3.2 है। अपेक्षित मूल्य के लिए 95% विश्वास अंतराल की गणना करें, फिर 99% विश्वास अंतराल की। यदि नमूना शक्ति और इसकी भिन्नता अपरिवर्तित रहती है और आत्मविश्वास गुणांक बढ़ता है, तो क्या आत्मविश्वास अंतराल संकीर्ण या चौड़ा होगा?
हम इन मानों को विश्वास अंतराल के लिए अभिव्यक्ति में प्रतिस्थापित करते हैं:
महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य कहां है α = 0,05 .
हम पाते हैं:
.
इस प्रकार, इस नमूने के माध्य के लिए 95% विश्वास अंतराल 14.57 से 15.82 तक था।
हम फिर से इन मानों को विश्वास अंतराल के लिए अभिव्यक्ति में प्रतिस्थापित करते हैं:
महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य कहां है α = 0,01 .
हम पाते हैं:
.
इस प्रकार, इस नमूने के माध्य के लिए 99% विश्वास अंतराल 14.37 से 16.02 तक था।
जैसा कि हम देखते हैं, जैसे-जैसे विश्वास गुणांक बढ़ता है, मानक सामान्य वितरण का महत्वपूर्ण मूल्य भी बढ़ता है, और परिणामस्वरूप, अंतराल के शुरुआती और समाप्ति बिंदु माध्य से आगे स्थित होते हैं, और इस प्रकार गणितीय अपेक्षा के लिए विश्वास अंतराल बढ़ता है .
विशिष्ट गुरुत्व के बिंदु और अंतराल अनुमान
कुछ नमूना विशेषता के हिस्से की व्याख्या शेयर के बिंदु अनुमान के रूप में की जा सकती है पीसामान्य जनसंख्या में समान विशेषताएँ। यदि इस मान को संभाव्यता के साथ संबद्ध करने की आवश्यकता है, तो विशिष्ट गुरुत्व के विश्वास अंतराल की गणना की जानी चाहिए पीसंभाव्यता के साथ जनसंख्या में विशेषता पी = 1 - α :
.
उदाहरण 4.किसी शहर में दो उम्मीदवार हैं एऔर बीमेयर के लिए दौड़ रहे हैं. 200 शहर निवासियों का यादृच्छिक सर्वेक्षण किया गया, जिनमें से 46% ने जवाब दिया कि वे उम्मीदवार को वोट देंगे ए, 26% - उम्मीदवार के लिए बीऔर 28% को नहीं पता कि वे किसे वोट देंगे। उम्मीदवार का समर्थन करने वाले शहर निवासियों के अनुपात के लिए 95% विश्वास अंतराल निर्धारित करें ए.
कोई भी नमूना केवल सामान्य जनसंख्या का एक अनुमानित विचार देता है, और सभी नमूना सांख्यिकीय विशेषताएँ (माध्य, मोड, विचरण...) कुछ सन्निकटन हैं या कहें कि सामान्य मापदंडों का एक अनुमान है, जिसकी ज्यादातर मामलों में गणना करना संभव नहीं है। सामान्य जनसंख्या की दुर्गमता के लिए (चित्र 20)।
चित्र 20. नमूनाकरण त्रुटि
लेकिन आप उस अंतराल को निर्दिष्ट कर सकते हैं जिसमें, एक निश्चित डिग्री की संभावना के साथ, सांख्यिकीय विशेषता का सही (सामान्य) मान निहित है। इस अंतराल को कहा जाता है डी आत्मविश्वास अंतराल (सीआई)।
तो 95% की संभावना के साथ सामान्य औसत मूल्य भीतर निहित है
से, (20)
कहाँ टी - छात्र के परीक्षण का तालिका मूल्य α =0.05 और एफ= एन-1
इस मामले में 99% सीआई भी पाया जा सकता है टी के लिए चयनित α =0,01.
कॉन्फिडेंस इंटरवल का व्यावहारिक महत्व क्या है?
एक विस्तृत आत्मविश्वास अंतराल इंगित करता है कि नमूना माध्य जनसंख्या माध्य को सटीक रूप से प्रतिबिंबित नहीं करता है। यह आमतौर पर अपर्याप्त नमूना आकार, या इसकी विविधता के कारण होता है, अर्थात। बड़ा फैलाव. दोनों माध्य की एक बड़ी त्रुटि देते हैं और तदनुसार, एक व्यापक सीआई देते हैं। और यही अनुसंधान योजना चरण पर लौटने का आधार है।
सीआई की ऊपरी और निचली सीमाएं यह अनुमान प्रदान करती हैं कि परिणाम चिकित्सकीय रूप से महत्वपूर्ण होंगे या नहीं
आइए समूह गुणों के अध्ययन के परिणामों के सांख्यिकीय और नैदानिक महत्व के प्रश्न पर कुछ विस्तार से ध्यान दें। आइए याद रखें कि सांख्यिकी का कार्य नमूना डेटा के आधार पर सामान्य आबादी में कम से कम कुछ अंतरों का पता लगाना है। चिकित्सकों के लिए चुनौती अंतर का पता लगाना है (सिर्फ कोई नहीं) जो निदान या उपचार में सहायता करेगा। और सांख्यिकीय निष्कर्ष हमेशा नैदानिक निष्कर्षों का आधार नहीं होते हैं। इस प्रकार, हीमोग्लोबिन में 3 ग्राम/लीटर की सांख्यिकीय रूप से महत्वपूर्ण कमी चिंता का कारण नहीं है। और, इसके विपरीत, यदि मानव शरीर में कोई समस्या पूरी आबादी के स्तर पर व्यापक नहीं है, तो यह इस समस्या से न निपटने का कोई कारण नहीं है।
आइए इस स्थिति पर नजर डालें उदाहरण. शोधकर्ताओं को आश्चर्य हुआ कि क्या जो लड़के किसी प्रकार की संक्रामक बीमारी से पीड़ित हैं, वे विकास में अपने साथियों से पीछे रह जाते हैं। इस उद्देश्य के लिए, एक नमूना अध्ययन किया गया जिसमें इस बीमारी से पीड़ित 10 लड़कों ने भाग लिया। परिणाम तालिका 23 में प्रस्तुत किए गए हैं। तालिका 23. सांख्यिकीय प्रसंस्करण के परिणाम
इन गणनाओं से यह पता चलता है कि किसी संक्रामक बीमारी से पीड़ित 10 वर्षीय लड़कों की नमूना औसत ऊंचाई सामान्य (132.5 सेमी) के करीब है। हालाँकि, आत्मविश्वास अंतराल की निचली सीमा (126.6 सेमी) इंगित करती है कि 95% संभावना है कि इन बच्चों की वास्तविक औसत ऊंचाई "छोटी ऊंचाई" की अवधारणा से मेल खाती है, अर्थात। ये बच्चे अविकसित हैं। इस उदाहरण में, विश्वास अंतराल गणना के परिणाम चिकित्सकीय रूप से महत्वपूर्ण हैं। |