एसडी से 95 कॉन्फिडेंस इंटरवल डिफरेंस। विश्वास अंतराल
अक्सर मूल्यांकक को उस खंड के अचल संपत्ति बाजार का विश्लेषण करना पड़ता है जिसमें मूल्यांकन वस्तु स्थित है। यदि बाजार विकसित है, तो प्रस्तुत वस्तुओं के पूरे सेट का विश्लेषण करना मुश्किल हो सकता है, इसलिए विश्लेषण के लिए वस्तुओं का एक नमूना उपयोग किया जाता है। यह नमूना हमेशा सजातीय नहीं होता है, कभी-कभी इसे चरम सीमाओं से मुक्त करने की आवश्यकता होती है - बहुत अधिक या बहुत कम बाजार ऑफ़र। इसी उद्देश्य से इसे लागू किया जाता है विश्वास अंतराल. इस अध्ययन का उद्देश्य कॉन्फिडेंस इंटरवल की गणना के लिए दो तरीकों का तुलनात्मक विश्लेषण करना है और एस्टीमेटिका.प्रो सिस्टम में विभिन्न नमूनों के साथ काम करते समय सर्वश्रेष्ठ गणना विकल्प चुनना है।
विश्वास अंतराल - नमूने के आधार पर गणना की जाती है, विशेषता के मूल्यों का अंतराल, जिसमें ज्ञात संभावना के साथ सामान्य जनसंख्या का अनुमानित पैरामीटर होता है।
कॉन्फ़िडेंस इंटरवल की गणना करने का अर्थ नमूना डेटा के आधार पर एक ऐसा इंटरवल बनाना है, ताकि दी गई प्रायिकता के साथ यह दावा किया जा सके कि अनुमानित पैरामीटर का मान इस अंतराल में है। दूसरे शब्दों में, एक निश्चित संभावना के साथ विश्वास अंतराल में अनुमानित मात्रा का अज्ञात मान होता है। अंतराल जितना व्यापक होगा, अशुद्धि उतनी ही अधिक होगी।
कॉन्फिडेंस इंटरवल निर्धारित करने के लिए अलग-अलग तरीके हैं। इस लेख में, हम 2 तरीकों पर विचार करेंगे:
- माध्यिका और मानक विचलन के माध्यम से;
- टी-सांख्यिकीय (छात्र के गुणांक) के महत्वपूर्ण मूल्य के माध्यम से।
सीआई की गणना के लिए विभिन्न तरीकों के तुलनात्मक विश्लेषण के चरण:
1. एक डेटा नमूना तैयार करें;
2. हम इसे सांख्यिकीय तरीकों से संसाधित करते हैं: हम माध्य मान, माध्यिका, विचरण आदि की गणना करते हैं;
3. हम कॉन्फिडेंस इंटरवल की गणना दो तरह से करते हैं;
4. साफ किए गए नमूनों और प्राप्त विश्वास अंतराल का विश्लेषण करें।
चरण 1. डेटा नमूनाकरण
नमूना estmatica.pro सिस्टम का उपयोग करके बनाया गया था। नमूने में "ख्रुश्चेव" योजना के प्रकार के साथ तीसरे मूल्य क्षेत्र में 1-कमरे वाले अपार्टमेंट की बिक्री के लिए 91 प्रस्ताव शामिल थे।
तालिका 1 प्रारंभिक नमूना
1 sq.m., c.u. की कीमत |
|
चित्र .1। प्रारंभिक नमूना
स्टेज 2. प्रारंभिक नमूने का प्रसंस्करण
सांख्यिकीय विधियों द्वारा नमूना प्रसंस्करण के लिए निम्नलिखित मूल्यों की गणना की आवश्यकता होती है:
1. अंकगणित माध्य
2. माध्यिका - एक संख्या जो नमूने की विशेषता है: नमूना तत्वों का ठीक आधा माध्यिका से अधिक है, अन्य आधा माध्यिका से कम है
(मानों की विषम संख्या वाले नमूने के लिए)
3. रेंज - नमूने में अधिकतम और न्यूनतम मूल्यों के बीच का अंतर
4. भिन्नता - डेटा में भिन्नता का अधिक सटीक अनुमान लगाने के लिए उपयोग किया जाता है
5. नमूने के लिए मानक विचलन (बाद में आरएमएस के रूप में संदर्भित) अंकगणितीय माध्य के आसपास समायोजन मूल्यों के फैलाव का सबसे आम संकेतक है।
6. भिन्नता का गुणांक - समायोजन मूल्यों के फैलाव की डिग्री को दर्शाता है
7. दोलन गुणांक - औसत के आसपास के नमूने में कीमतों के चरम मूल्यों के सापेक्ष उतार-चढ़ाव को दर्शाता है
तालिका 2. मूल नमूने के सांख्यिकीय संकेतक
भिन्नता का गुणांक, जो डेटा की एकरूपता की विशेषता है, 12.29% है, लेकिन दोलन का गुणांक बहुत बड़ा है। इस प्रकार, हम कह सकते हैं कि मूल नमूना सजातीय नहीं है, तो चलिए विश्वास अंतराल की गणना करने के लिए आगे बढ़ते हैं।
स्टेज 3. विश्वास अंतराल की गणना
विधि 1. माध्यिका और मानक विचलन के माध्यम से गणना।
विश्वास अंतराल निम्नानुसार निर्धारित किया जाता है: न्यूनतम मान - मानक विचलन माध्यिका से घटाया जाता है; अधिकतम मान - माध्यिका में मानक विचलन जोड़ा जाता है।
इस प्रकार, कॉन्फिडेंस इंटरवल (47179 CU; 60689 CU)
चावल। 2. कॉन्फिडेंस इंटरवल 1 के भीतर मान।
विधि 2. टी-सांख्यिकी (छात्र के गुणांक) के महत्वपूर्ण मूल्य के माध्यम से एक विश्वास अंतराल का निर्माण
एस.वी. ग्रिबोव्स्की ने "संपत्ति के मूल्य का आकलन करने के लिए गणितीय तरीके" पुस्तक में छात्र के गुणांक के माध्यम से विश्वास अंतराल की गणना के लिए एक विधि का वर्णन किया है। इस पद्धति से गणना करते समय, अनुमानक को स्वयं महत्व स्तर ∝ सेट करना चाहिए, जो उस संभावना को निर्धारित करता है जिसके साथ विश्वास अंतराल बनाया जाएगा। 0.1 के महत्व स्तर आमतौर पर उपयोग किए जाते हैं; 0.05 और 0.01। वे 0.9 की विश्वास संभावनाओं के अनुरूप हैं; 0.95 और 0.99। इस पद्धति के साथ, गणितीय अपेक्षा और विचरण के वास्तविक मूल्यों को व्यावहारिक रूप से अज्ञात माना जाता है (जो व्यावहारिक मूल्यांकन समस्याओं को हल करते समय लगभग हमेशा सत्य होता है)।
विश्वास अंतराल सूत्र:
एन - नमूना आकार;
महत्व स्तर ∝ के साथ टी-सांख्यिकी (छात्रों का वितरण) का महत्वपूर्ण मूल्य, स्वतंत्रता की डिग्री की संख्या n-1, जो विशेष सांख्यिकीय तालिकाओं द्वारा या एमएस एक्सेल (→"सांख्यिकीय"→ STUDRASPOBR) का उपयोग करके निर्धारित किया जाता है;
∝ - सार्थकता स्तर, हम ∝=0.01 लेते हैं।
चावल। 2. विश्वास अंतराल के भीतर मान 2.
चरण 4. कॉन्फ़िडेंस इंटरवल की गणना करने के विभिन्न तरीकों का विश्लेषण
विश्वास अंतराल की गणना के दो तरीके - माध्यिका और छात्र के गुणांक के माध्यम से - अंतराल के विभिन्न मूल्यों का नेतृत्व किया। तदनुसार, दो अलग-अलग शुद्ध नमूने प्राप्त किए गए थे।
तालिका 3. तीन नमूनों के लिए सांख्यिकीय संकेतक।
अनुक्रमणिका |
प्रारंभिक नमूना |
1 विकल्प |
विकल्प 2 |
औसत मूल्य |
|||
फैलाव |
|||
कोफ। बदलाव |
|||
कोफ। दोलनों |
|||
सेवानिवृत्त वस्तुओं की संख्या, पीसी। |
प्रदर्शन की गई गणनाओं के आधार पर, हम कह सकते हैं कि विभिन्न विधियों द्वारा प्राप्त विश्वास अंतराल के मान प्रतिच्छेद करते हैं, इसलिए आप मूल्यांकक के विवेक पर गणना के किसी भी तरीके का उपयोग कर सकते हैं।
हालांकि, हम मानते हैं कि एस्टिमेटिका.प्रो सिस्टम में काम करते समय, बाजार के विकास की डिग्री के आधार पर विश्वास अंतराल की गणना के लिए एक विधि चुनने की सलाह दी जाती है:
- यदि बाजार विकसित नहीं है, तो औसत और मानक विचलन के माध्यम से गणना की विधि लागू करें, क्योंकि इस मामले में सेवानिवृत्त वस्तुओं की संख्या कम है;
- यदि बाजार विकसित है, तो गणना को टी-सांख्यिकी (छात्र के गुणांक) के महत्वपूर्ण मूल्य के माध्यम से लागू करें, क्योंकि एक बड़ा प्रारंभिक नमूना बनाना संभव है।
लेख तैयार करने में इस्तेमाल किया गया:
1. ग्रिबोव्स्की एस.वी., सिवेट्स एस.ए., लेविकिना आई.ए. संपत्ति के मूल्य का आकलन करने के लिए गणितीय तरीके। मास्को, 2014
2. एस्टीमेटिका.प्रो सिस्टम से डेटा
विश्वास अंतराल ( अंग्रेज़ी विश्वास अंतराल) आँकड़ों में प्रयुक्त अंतराल अनुमानों में से एक प्रकार, जिसकी गणना किसी दिए गए महत्व के स्तर के लिए की जाती है। वे हमें एक बयान देने की अनुमति देते हैं कि सामान्य आबादी के अज्ञात सांख्यिकीय पैरामीटर का सही मूल्य मूल्यों की प्राप्त सीमा में है जो कि सांख्यिकीय महत्व के चुने हुए स्तर द्वारा दिया जाता है।
सामान्य वितरण
जब डेटा की जनसंख्या का प्रसरण (σ 2) ज्ञात होता है, तो विश्वास सीमा (विश्वास अंतराल के सीमा बिंदु) की गणना करने के लिए एक z-स्कोर का उपयोग किया जा सकता है। टी-वितरण का उपयोग करने की तुलना में, जेड-स्कोर का उपयोग न केवल एक संकीर्ण विश्वास अंतराल प्रदान करेगा, बल्कि माध्य और मानक विचलन (σ) के अधिक विश्वसनीय अनुमान भी प्रदान करेगा, क्योंकि जेड-स्कोर सामान्य वितरण पर आधारित है।
FORMULA
कॉन्फिडेंस इंटरवल की सीमा बिंदुओं को निर्धारित करने के लिए, बशर्ते कि डेटा की जनसंख्या का मानक विचलन ज्ञात हो, निम्न सूत्र का उपयोग किया जाता है
एल = एक्स - जेड α/2 | σ |
के √ N |
उदाहरण
मान लें कि नमूना आकार 25 प्रेक्षण हैं, नमूना माध्य 15 है, और जनसंख्या मानक विचलन 8 है। α=5% के महत्व स्तर के लिए, Z-स्कोर Z α/2 =1.96 है। इस मामले में, विश्वास अंतराल की निचली और ऊपरी सीमाएँ होंगी
एल = 15 - 1.96 | 8 | = 11,864 |
√25 |
एल = 15 + 1.96 | 8 | = 18,136 |
√25 |
इस प्रकार, हम कह सकते हैं कि 95% की संभावना के साथ सामान्य जनसंख्या की गणितीय अपेक्षा 11.864 से 18.136 की सीमा में आ जाएगी।
कॉन्फिडेंस इंटरवल को कम करने के तरीके
मान लीजिए कि हमारे अध्ययन के प्रयोजनों के लिए सीमा बहुत विस्तृत है। कॉन्फिडेंस इंटरवल रेंज को कम करने के दो तरीके हैं।
- सांख्यिकीय महत्व α के स्तर को कम करें।
- नमूना आकार बढ़ाएँ।
सांख्यिकीय महत्व के स्तर को α=10% तक कम करने पर, हमें Z α/2 =1.64 के बराबर एक Z-स्कोर मिलता है। इस मामले में, अंतराल की निचली और ऊपरी सीमाएं होंगी
एल = 15 - 1.64 | 8 | = 12,376 |
√25 |
एल = 15 + 1.64 | 8 | = 17,624 |
√25 |
और विश्वास अंतराल को स्वयं के रूप में लिखा जा सकता है
इस मामले में, हम यह मान सकते हैं कि 90% की संभावना के साथ, सामान्य जनसंख्या की गणितीय अपेक्षा सीमा में आ जाएगी।
यदि हम सांख्यिकीय महत्व का स्तर α रखना चाहते हैं, तो नमूना आकार को बढ़ाने का एकमात्र विकल्प है। इसे 144 प्रेक्षणों तक बढ़ाते हुए, हम विश्वास सीमा के निम्नलिखित मान प्राप्त करते हैं
एल = 15 - 1.96 | 8 | = 13,693 |
√144 |
एल = 15 + 1.96 | 8 | = 16,307 |
√144 |
कॉन्फिडेंस इंटरवल खुद इस तरह दिखेगा:
इस प्रकार, सांख्यिकीय महत्व के स्तर को कम किए बिना विश्वास अंतराल को कम करना केवल नमूना आकार को बढ़ाकर ही संभव है। यदि नमूना आकार में वृद्धि करना संभव नहीं है, तो विश्वास अंतराल की संकीर्णता केवल सांख्यिकीय महत्व के स्तर को कम करके प्राप्त की जा सकती है।
एक गैर-सामान्य बंटन के लिए विश्वास्यता अंतराल बनाना
यदि जनसंख्या मानक विचलन ज्ञात नहीं है या वितरण गैर-सामान्य है, तो टी-वितरण का उपयोग विश्वास अंतराल के निर्माण के लिए किया जाता है। यह तकनीक अधिक रूढ़िवादी है, जो जेड-स्कोर पर आधारित तकनीक की तुलना में व्यापक विश्वास अंतराल में व्यक्त की जाती है।
FORMULA
टी-वितरण के आधार पर विश्वास अंतराल की निचली और ऊपरी सीमा की गणना करने के लिए निम्न सूत्रों का उपयोग किया जाता है
एल = एक्स - टीα | σ |
के √ N |
छात्र का वितरण या टी-वितरण केवल एक पैरामीटर पर निर्भर करता है - स्वतंत्रता की डिग्री की संख्या, जो व्यक्तिगत सुविधा मूल्यों की संख्या (नमूने में टिप्पणियों की संख्या) के बराबर है। स्वतंत्रता की दी गई संख्या (n) और सांख्यिकीय महत्व α के स्तर के लिए छात्र के t-परीक्षण का मान लुकअप तालिकाओं में पाया जा सकता है।
उदाहरण
मान लें कि नमूना आकार 25 अलग-अलग मान हैं, नमूने का औसत मूल्य 50 है, और नमूने का मानक विचलन 28 है। आपको सांख्यिकीय महत्व α=5% के स्तर के लिए एक विश्वास अंतराल बनाने की आवश्यकता है।
हमारे मामले में, स्वतंत्रता की डिग्री की संख्या 24 (25-1) है, इसलिए, सांख्यिकीय महत्व α=5% के स्तर के लिए छात्र के टी-टेस्ट का संगत सारणीबद्ध मान 2.064 है। इसलिए, कॉन्फिडेंस इंटरवल की निचली और ऊपरी सीमाएं होंगी
एल = 50 - 2.064 | 28 | = 38,442 |
√25 |
एल = 50 + 2.064 | 28 | = 61,558 |
√25 |
और अंतराल को स्वयं के रूप में लिखा जा सकता है
इस प्रकार, हम कह सकते हैं कि 95% की संभावना के साथ सामान्य आबादी की गणितीय अपेक्षा सीमा में होगी।
टी-वितरण का उपयोग करने से आप सांख्यिकीय महत्व को कम करके या नमूना आकार बढ़ाकर विश्वास अंतराल को कम कर सकते हैं।
हमारे उदाहरण की स्थितियों में सांख्यिकीय महत्व को 95% से 90% तक कम करना, हमें छात्र के टी-टेस्ट 1.711 का संगत सारणीबद्ध मूल्य मिलता है।
एल = 50 - 1.711 | 28 | = 40,418 |
√25 |
एल = 50 + 1.711 | 28 | = 59,582 |
√25 |
इस मामले में, हम कह सकते हैं कि 90% की संभावना के साथ सामान्य जनसंख्या की गणितीय अपेक्षा सीमा में होगी।
यदि हम सांख्यिकीय महत्व को कम नहीं करना चाहते हैं, तो नमूना आकार को बढ़ाना ही एकमात्र विकल्प है। मान लीजिए कि यह 64 अलग-अलग अवलोकन हैं, न कि उदाहरण की प्रारंभिक स्थिति में 25। स्वतंत्रता की 63 डिग्री (64-1) और सांख्यिकीय महत्व α=5% के स्तर के लिए छात्र के टी-टेस्ट का सारणीबद्ध मान 1.998 है।
एल = 50 - 1.998 | 28 | = 43,007 |
√64 |
एल = 50 + 1.998 | 28 | = 56,993 |
√64 |
यह हमें यह दावा करने का अवसर देता है कि 95% की संभावना के साथ सामान्य जनसंख्या की गणितीय अपेक्षा सीमा में होगी।
बड़े नमूने
बड़े नमूने 100 से अधिक व्यक्तिगत टिप्पणियों वाले डेटा की आबादी से नमूने हैं। सांख्यिकीय अध्ययनों से पता चला है कि बड़े नमूने सामान्य रूप से वितरित किए जाते हैं, भले ही जनसंख्या का वितरण सामान्य न हो। इसके अलावा, ऐसे नमूनों के लिए, आत्मविश्वास अंतराल का निर्माण करते समय जेड-स्कोर और टी-वितरण का उपयोग लगभग समान परिणाम देता है। इस प्रकार, बड़े नमूनों के लिए, टी-वितरण के बजाय सामान्य वितरण के लिए जेड-स्कोर का उपयोग करना स्वीकार्य है।
उपसंहार
विश्वास अंतराल।
कॉन्फिडेंस इंटरवल की गणना संबंधित पैरामीटर की औसत त्रुटि पर आधारित है। विश्वास अंतराल संभाव्यता (1-ए) के साथ अनुमानित पैरामीटर का सही मान किस सीमा के भीतर दिखाता है। यहाँ a सार्थकता स्तर है, (1-a) को विश्वास स्तर भी कहा जाता है।
पहले अध्याय में, हमने दिखाया कि, उदाहरण के लिए, अंकगणितीय माध्य के लिए, वास्तविक जनसंख्या माध्य लगभग 95% समय के माध्य की 2 औसत त्रुटियों के भीतर होता है। इस प्रकार, माध्य के लिए 95% विश्वास्यता अंतराल की सीमाएं नमूना माध्य से माध्य की माध्य त्रुटि के दोगुने से होंगी, अर्थात हम माध्य की औसत त्रुटि को किसी ऐसे कारक से गुणा करते हैं जो विश्वास स्तर पर निर्भर करता है। माध्य और माध्य के अंतर के लिए, छात्र का गुणांक (विद्यार्थी की कसौटी का महत्वपूर्ण मूल्य) लिया जाता है, शेयरों के हिस्से और अंतर के लिए, z मानदंड का महत्वपूर्ण मूल्य। गुणांक और औसत त्रुटि के उत्पाद को इस पैरामीटर की सीमांत त्रुटि कहा जा सकता है, अर्थात अधिकतम जो हम इसका मूल्यांकन करते समय प्राप्त कर सकते हैं।
के लिए विश्वास अंतराल अंकगणित औसत : .
यहाँ नमूना माध्य है;
अंकगणितीय माध्य की औसत त्रुटि;
एस-नमूना मानक विचलन;
एन
च = एन-1 (छात्र का गुणांक)।
के लिए विश्वास अंतराल अंकगणितीय साधनों का अंतर :
यहाँ, नमूना माध्यों के बीच अंतर है;
- अंकगणितीय साधनों के अंतर की औसत त्रुटि;
एस 1, एस 2 -नमूना मानक विचलन;
एन 1, एन 2
किसी दिए गए महत्व के स्तर के लिए छात्र की कसौटी का महत्वपूर्ण मूल्य और स्वतंत्रता की डिग्री की संख्या च=n1 +n2-2 (विद्यार्थी का गुणांक)।
के लिए विश्वास अंतराल शेयरों :
.
यहाँ d नमूना हिस्सा है;
- औसत शेयर त्रुटि;
एन- नमूना आकार (समूह आकार);
के लिए विश्वास अंतराल मतभेद साझा करें :
यहाँ, सैंपल शेयरों के बीच का अंतर है;
अंकगणितीय साधनों के बीच अंतर की औसत त्रुटि है;
एन 1, एन 2- नमूना आकार (समूहों की संख्या);
दिए गए सार्थकता स्तर a ( , , ) पर कसौटी z का महत्वपूर्ण मान।
संकेतकों में अंतर के लिए विश्वास अंतराल की गणना करके, हम, सबसे पहले, सीधे प्रभाव के संभावित मूल्यों को देखते हैं, न कि केवल इसके बिंदु अनुमान को। दूसरा, हम शून्य परिकल्पना की स्वीकृति या खंडन के बारे में एक निष्कर्ष निकाल सकते हैं और तीसरा, हम कसौटी की शक्ति के बारे में एक निष्कर्ष निकाल सकते हैं।
कॉन्फिडेंस इंटरवल का उपयोग करते हुए परिकल्पना का परीक्षण करते समय, निम्नलिखित नियम का पालन किया जाना चाहिए:
यदि माध्य अंतर के 100(1-ए)-प्रतिशत विश्वास अंतराल में शून्य नहीं है, तो अंतर सांख्यिकीय रूप से महत्व स्तर पर महत्वपूर्ण होते हैं; इसके विपरीत, यदि इस अंतराल में शून्य है, तो अंतर सांख्यिकीय रूप से महत्वपूर्ण नहीं हैं।
वास्तव में, यदि इस अंतराल में शून्य है, तो, इसका मतलब है कि तुलनात्मक संकेतक एक समूह में दूसरे की तुलना में अधिक या कम हो सकता है, अर्थात। देखे गए अंतर यादृच्छिक हैं।
उस स्थान से जहां विश्वास अंतराल के भीतर शून्य स्थित है, कसौटी की शक्ति का न्याय किया जा सकता है। यदि शून्य अंतराल की निचली या ऊपरी सीमा के करीब है, तो शायद बड़ी संख्या में तुलनात्मक समूहों के साथ, अंतर सांख्यिकीय महत्व तक पहुंच जाएगा। यदि शून्य अंतराल के मध्य के करीब है, तो इसका मतलब है कि प्रायोगिक समूह में सूचक की वृद्धि और कमी दोनों समान रूप से संभावित हैं, और शायद वास्तव में कोई अंतर नहीं है।
उदाहरण:
दो अलग-अलग प्रकार के एनेस्थीसिया का उपयोग करते समय सर्जिकल मृत्यु दर की तुलना करने के लिए: पहले प्रकार के एनेस्थीसिया का उपयोग करके 61 लोगों का ऑपरेशन किया गया, 8 की मृत्यु हो गई, दूसरे का उपयोग करते हुए - 67 लोग, 10 की मृत्यु हो गई।
डी 1 \u003d 8/61 \u003d 0.131; डी 2 \u003d 10/67 \u003d 0.149; डी1-डी2 = - 0.018।
तुलनात्मक विधियों की घातकता में अंतर 100 (1-ए) = 95% की संभावना के साथ (-0.018 - 0.122; -0.018 + 0.122) या (-0.14; 0.104) की सीमा में होगा। अंतराल में शून्य होता है, अर्थात दो अलग-अलग प्रकार के एनेस्थेसिया के साथ एक ही घातकता की परिकल्पना को खारिज नहीं किया जा सकता है।
इस प्रकार, मृत्यु दर 14% तक घट सकती है और 95% की संभावना के साथ 10.4% तक बढ़ सकती है, अर्थात। शून्य लगभग अंतराल के बीच में है, इसलिए यह तर्क दिया जा सकता है कि, सबसे अधिक संभावना है, ये दो विधियां वास्तव में घातकता में भिन्न नहीं हैं।
पहले लिए गए उदाहरण में, औसत टैपिंग समय की तुलना उनके परीक्षा अंकों में भिन्न छात्रों के चार समूहों में की गई थी। आइए 2 और 5 की परीक्षा उत्तीर्ण करने वाले छात्रों के लिए औसत दबाव समय के विश्वास अंतराल और इन औसत के बीच के अंतर के लिए विश्वास अंतराल की गणना करें।
छात्र के गुणांक छात्र के वितरण की तालिका से पाए जाते हैं (परिशिष्ट देखें): पहले समूह के लिए: = t(0.05;48) = 2.011; दूसरे समूह के लिए: = टी (0.05; 61) = 2.000। इस प्रकार, पहले समूह के लिए विश्वास अंतराल: = (162.19-2.011 * 2.18; 162.19 + 2.011 * 2.18) = (157.8; 166.6) , दूसरे समूह के लिए (156.55- 2.000*1.88; 156.55+2.000*1.88) = (152.8) ; 160.3). तो, उन लोगों के लिए जिन्होंने 2 के लिए परीक्षा उत्तीर्ण की, औसत दबाव का समय 157.8 एमएस से 166.6 एमएस तक 95% की संभावना के साथ है, जिन्होंने 5 के लिए परीक्षा उत्तीर्ण की - 152.8 एमएस से 160.3 एमएस तक 95% की संभावना के साथ .
आप साधनों के लिए विश्वास अंतराल का उपयोग करके अशक्त परिकल्पना का परीक्षण भी कर सकते हैं, न कि केवल साधनों में अंतर के लिए। उदाहरण के लिए, जैसा कि हमारे मामले में, यदि साधनों के लिए विश्वास अंतराल ओवरलैप होता है, तो अशक्त परिकल्पना को अस्वीकार नहीं किया जा सकता है। एक चुने हुए महत्व स्तर पर एक परिकल्पना को अस्वीकार करने के लिए, संबंधित विश्वास अंतरालों को ओवरलैप नहीं करना चाहिए।
आइए 2 और 5 की परीक्षा उत्तीर्ण करने वाले समूहों में औसत दबाव समय में अंतर के लिए विश्वास अंतराल का पता लगाएं। औसत में अंतर: 162.19 - 156.55 = 5.64। छात्र का गुणांक: \u003d t (0.05; 49 + 62-2) \u003d t (0.05; 109) \u003d 1.982। समूह मानक विचलन इसके बराबर होंगे: ; . हम साधनों के बीच के अंतर की औसत त्रुटि की गणना करते हैं:। विश्वास अंतराल: \u003d (5.64-1.982 * 2.87; 5.64 + 1.982 * 2.87) \u003d (-0.044; 11.33)।
तो, 2 और 5 पर परीक्षा उत्तीर्ण करने वाले समूहों में औसत दबाने के समय में अंतर -0.044 एमएस से 11.33 एमएस की सीमा में होगा। इस अंतराल में शून्य शामिल है, अर्थात उत्कृष्ट परिणामों के साथ परीक्षा उत्तीर्ण करने वालों के लिए औसत दबाव समय उन लोगों की तुलना में बढ़ और घट सकता है, जिन्होंने परीक्षा को असंतोषजनक रूप से उत्तीर्ण किया है, अर्थात। शून्य परिकल्पना को अस्वीकार नहीं किया जा सकता। लेकिन शून्य निचली सीमा के बहुत करीब है, उत्कृष्ट राहगीरों के लिए दबाने का समय कम होने की संभावना अधिक है। इस प्रकार, हम यह निष्कर्ष निकाल सकते हैं कि 2 और 5 से पार करने वालों के बीच औसत क्लिक समय में अभी भी अंतर हैं, हम औसत समय में दिए गए परिवर्तन, औसत समय और नमूना आकार के प्रसार के लिए उनका पता नहीं लगा सके।
परीक्षण की शक्ति एक गलत अशक्त परिकल्पना को अस्वीकार करने की संभावना है, अर्थात अंतर खोजें जहां वे वास्तव में हैं।
परीक्षण की शक्ति महत्व के स्तर, समूहों के बीच अंतर के परिमाण, समूहों में मूल्यों के प्रसार और नमूना आकार के आधार पर निर्धारित की जाती है।
छात्र के टी-परीक्षण और प्रसरण के विश्लेषण के लिए, आप संवेदनशीलता चार्ट का उपयोग कर सकते हैं।
समूहों की आवश्यक संख्या के प्रारंभिक निर्धारण में कसौटी की शक्ति का उपयोग किया जा सकता है।
कॉन्फ़िडेंस इंटरवल दिखाता है कि किस सीमा के भीतर अनुमानित पैरामीटर का सही मान दी गई प्रायिकता के साथ है।
विश्वास अंतराल की सहायता से, आप सांख्यिकीय परिकल्पनाओं का परीक्षण कर सकते हैं और मानदंडों की संवेदनशीलता के बारे में निष्कर्ष निकाल सकते हैं।
साहित्य।
ग्लैंट्ज़ एस - अध्याय 6.7।
रेब्रोवा ओ.यू. - पृष्ठ 112-114, पृष्ठ 171-173, पृष्ठ 234-238।
सिदोरेंको ई। वी। - पीपी। 32-33।
छात्रों की आत्म-परीक्षा के लिए प्रश्न।
1. कसौटी की शक्ति क्या है?
2. मानदंड की शक्ति का मूल्यांकन करने के लिए किन मामलों में आवश्यक है?
3. शक्ति की गणना के तरीके।
6. कॉन्फिडेंस इंटरवल का उपयोग करके एक सांख्यिकीय परिकल्पना का परीक्षण कैसे करें?
7. कॉन्फिडेंस इंटरवल की गणना करते समय कसौटी की शक्ति के बारे में क्या कहा जा सकता है?
कार्य।
गणितीय अपेक्षा के लिए विश्वास अंतराल - यह डेटा से गणना किया गया ऐसा अंतराल है, जिसमें ज्ञात संभावना के साथ सामान्य आबादी की गणितीय अपेक्षा होती है। गणितीय अपेक्षा के लिए प्राकृतिक अनुमान इसके देखे गए मूल्यों का अंकगणितीय माध्य है। इसलिए, पाठ के दौरान हम "औसत", "औसत मूल्य" शब्दों का उपयोग करेंगे। कॉन्फिडेंस इंटरवल की गणना की समस्याओं में, सबसे अधिक आवश्यक उत्तर "औसत संख्या [एक विशिष्ट समस्या में मान] का कॉन्फिडेंस इंटरवल [निम्न मान] से [उच्च मान] तक है"। विश्वास अंतराल की मदद से, न केवल औसत मूल्यों का मूल्यांकन करना संभव है, बल्कि सामान्य आबादी की एक या दूसरी विशेषता का हिस्सा भी है। औसत मूल्य, भिन्नता, मानक विचलन और त्रुटि, जिसके माध्यम से हम नई परिभाषाओं और सूत्रों तक पहुंचेंगे, पाठ में विश्लेषण किया जाता है नमूना और जनसंख्या लक्षण .
माध्य का बिंदु और अंतराल अनुमान
यदि सामान्य जनसंख्या का माध्य मान एक संख्या (बिंदु) द्वारा अनुमानित किया जाता है, तो प्रेक्षणों के नमूने से परिकलित एक विशिष्ट माध्य को सामान्य जनसंख्या के अज्ञात माध्य के अनुमान के रूप में लिया जाता है। इस मामले में, नमूना माध्य का मान - एक यादृच्छिक चर - सामान्य जनसंख्या के माध्य मान के साथ मेल नहीं खाता है। इसलिए, नमूने के औसत मूल्य को इंगित करते समय, नमूना त्रुटि को इंगित करना भी आवश्यक है। मानक त्रुटि का उपयोग नमूना त्रुटि के माप के रूप में किया जाता है, जिसे समान इकाइयों में माध्य के रूप में व्यक्त किया जाता है। इसलिए, निम्नलिखित संकेतन का अक्सर उपयोग किया जाता है:।
यदि माध्य का अनुमान एक निश्चित संभाव्यता से जुड़ा होना आवश्यक है, तो ब्याज की सामान्य जनसंख्या के पैरामीटर का अनुमान एक संख्या से नहीं, बल्कि एक अंतराल से लगाया जाना चाहिए। कॉन्फ़िडेंस इंटरवल एक ऐसा इंटरवल है, जिसमें एक निश्चित प्रायिकता के साथ, पीसामान्य जनसंख्या के अनुमानित संकेतक का मूल्य पाया जाता है। कॉन्फिडेंस इंटरवल जिसमें प्रायिकता के साथ पी = 1 - α एक यादृच्छिक चर है, इसकी गणना निम्नानुसार की जाती है:
,
α = 1 - पी, जो सांख्यिकी पर लगभग किसी भी पुस्तक के परिशिष्ट में पाया जा सकता है।
व्यवहार में, जनसंख्या माध्य और विचरण ज्ञात नहीं हैं, इसलिए जनसंख्या विचरण को नमूना विचरण से बदल दिया जाता है, और जनसंख्या माध्य को नमूना माध्य से बदल दिया जाता है। इस प्रकार, ज्यादातर मामलों में विश्वास अंतराल की गणना निम्नानुसार की जाती है:
.
जनसंख्या माध्य का अनुमान लगाने के लिए विश्वास अंतराल सूत्र का उपयोग किया जा सकता है
- सामान्य जनसंख्या का मानक विचलन ज्ञात है;
- या जनसंख्या का मानक विचलन ज्ञात नहीं है, लेकिन नमूना आकार 30 से अधिक है।
नमूना माध्य जनसंख्या माध्य का एक निष्पक्ष अनुमान है। बदले में, नमूना विचरण जनसंख्या भिन्नता का एक निष्पक्ष अनुमान नहीं है। नमूना भिन्नता सूत्र में जनसंख्या भिन्नता का एक निष्पक्ष अनुमान प्राप्त करने के लिए, नमूना आकार है एनसे बदला जाना चाहिए एन-1.
उदाहरण 1एक निश्चित शहर में 100 बेतरतीब ढंग से चुने गए कैफे से जानकारी एकत्र की जाती है कि उनमें कर्मचारियों की औसत संख्या 4.6 के मानक विचलन के साथ 10.5 है। कैफे कर्मचारियों की संख्या के 95% का विश्वास अंतराल निर्धारित करें।
जहां महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य है α = 0,05 .
इस प्रकार, कैफे कर्मचारियों की औसत संख्या के लिए 95% विश्वास अंतराल 9.6 और 11.4 के बीच था।
उदाहरण 2 64 प्रेक्षणों की सामान्य जनसंख्या से एक यादृच्छिक नमूने के लिए, निम्नलिखित कुल मानों की गणना की गई:
प्रेक्षणों में मानों का योग ,
माध्य से मानों के वर्ग विचलन का योग .
अपेक्षित मूल्य के लिए 95% विश्वास अंतराल की गणना करें।
मानक विचलन की गणना करें:
,
औसत मूल्य की गणना करें:
.
विश्वास अंतराल के लिए व्यंजक में मानों को प्रतिस्थापित करें:
जहां महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य है α = 0,05 .
हम पाते हैं:
इस प्रकार, इस नमूने की गणितीय अपेक्षा के लिए 95% विश्वास अंतराल 7.484 से 11.266 के बीच था।
उदाहरण 3 100 अवलोकनों की एक सामान्य आबादी से एक यादृच्छिक नमूने के लिए, 15.2 का औसत मान और 3.2 का मानक विचलन की गणना की गई। अपेक्षित मान के लिए 95% विश्वास अंतराल की गणना करें, फिर 99% विश्वास अंतराल। यदि नमूना शक्ति और इसकी भिन्नता समान रहती है, लेकिन विश्वास कारक बढ़ जाता है, तो क्या विश्वास अंतराल संकीर्ण या चौड़ा होगा?
हम इन मूल्यों को विश्वास अंतराल के लिए अभिव्यक्ति में प्रतिस्थापित करते हैं:
जहां महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य है α = 0,05 .
हम पाते हैं:
.
इस प्रकार, इस नमूने के औसत के लिए 95% विश्वास अंतराल 14.57 से 15.82 तक था।
फिर से, हम इन मूल्यों को विश्वास अंतराल के लिए अभिव्यक्ति में प्रतिस्थापित करते हैं:
जहां महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य है α = 0,01 .
हम पाते हैं:
.
इस प्रकार, इस नमूने के औसत के लिए 99% विश्वास अंतराल 14.37 से 16.02 तक था।
जैसा कि आप देख सकते हैं, जैसे-जैसे विश्वास कारक बढ़ता है, मानक सामान्य वितरण का महत्वपूर्ण मूल्य भी बढ़ता है, और, इसलिए, अंतराल के प्रारंभ और अंत बिंदु माध्य से आगे स्थित होते हैं, और इस प्रकार गणितीय अपेक्षा के लिए विश्वास अंतराल बढ़ती है।
विशिष्ट गुरुत्व का बिंदु और अंतराल अनुमान
नमूने की कुछ विशेषता के हिस्से की व्याख्या शेयर के एक बिंदु अनुमान के रूप में की जा सकती है पीसामान्य आबादी में एक ही विशेषता। यदि इस मान को प्रायिकता से जोड़ने की आवश्यकता है, तो विशिष्ट गुरुत्व के विश्वास अंतराल की गणना की जानी चाहिए पीसंभावना के साथ सामान्य आबादी में सुविधा पी = 1 - α :
.
उदाहरण 4एक निश्चित शहर में दो उम्मीदवार हैं एऔर बीमहापौर के लिए चल रहा है। शहर के 200 निवासियों को यादृच्छिक रूप से मतदान किया गया, जिनमें से 46% ने उत्तर दिया कि वे उम्मीदवार को वोट देंगे ए, 26% - उम्मीदवार के लिए बीऔर 28% नहीं जानते कि वे किसे वोट देंगे। उम्मीदवार का समर्थन करने वाले शहर के निवासियों के अनुपात के लिए 95% विश्वास अंतराल निर्धारित करें ए.
कोई भी नमूना सामान्य आबादी का केवल एक अनुमानित विचार देता है, और सभी नमूना सांख्यिकीय विशेषताओं (माध्य, मोड, विचरण ...) कुछ सन्निकटन हैं या सामान्य मापदंडों का एक अनुमान है, जो कि ज्यादातर मामलों में गणना नहीं की जा सकती है सामान्य आबादी की दुर्गमता (चित्र 20)।
चित्रा 20. नमूनाकरण त्रुटि
लेकिन आप उस अंतराल को निर्दिष्ट कर सकते हैं जिसमें एक निश्चित डिग्री की संभावना के साथ, सांख्यिकीय विशेषता का सही (सामान्य) मूल्य निहित है। यह अंतराल कहा जाता है डी विश्वास अंतराल (सीआई)।
तो 95% की संभावना के साथ सामान्य औसत भीतर निहित है
से, (20)
कहाँ टी - के लिए छात्र की कसौटी का सारणीबद्ध मूल्य α = 0.05 और एफ= एन-1
पाया जा सकता है और इस मामले में 99% सीआई टी के लिए चुना α =0,01.
विश्वास अंतराल का व्यावहारिक महत्व क्या है?
एक व्यापक विश्वास अंतराल इंगित करता है कि नमूना माध्य जनसंख्या माध्य को सटीक रूप से प्रतिबिंबित नहीं करता है। यह आमतौर पर एक अपर्याप्त नमूना आकार, या इसकी विषमता के कारण होता है, अर्थात बड़ा फैलाव। दोनों माध्य में बड़ी त्रुटि देते हैं और तदनुसार व्यापक सीआई देते हैं। और यही कारण है कि शोध योजना चरण में वापस आ गए हैं।
ऊपरी और निचली सीआई सीमाएं मूल्यांकन करती हैं कि क्या परिणाम नैदानिक रूप से महत्वपूर्ण होंगे
आइए समूह गुणों के अध्ययन के परिणामों के सांख्यिकीय और नैदानिक महत्व के प्रश्न पर अधिक विस्तार से ध्यान दें। याद रखें कि आंकड़ों का काम नमूना डेटा के आधार पर सामान्य आबादी में कम से कम कुछ अंतरों का पता लगाना है। ऐसे (कोई नहीं) मतभेदों को ढूंढना चिकित्सक का काम है जो निदान या उपचार में मदद करेगा। और हमेशा सांख्यिकीय निष्कर्ष नैदानिक निष्कर्षों का आधार नहीं होते हैं। इस प्रकार, हीमोग्लोबिन में 3 ग्राम/लीटर की सांख्यिकीय रूप से महत्वपूर्ण कमी चिंता का कारण नहीं है। और, इसके विपरीत, यदि मानव शरीर में कुछ समस्या का संपूर्ण जनसंख्या के स्तर पर द्रव्यमान चरित्र नहीं है, तो यह इस समस्या से निपटने का कोई कारण नहीं है।
हम इस स्थिति पर विचार करेंगे उदाहरण. शोधकर्ताओं ने सोचा कि जिन लड़कों को किसी प्रकार की संक्रामक बीमारी थी, वे विकास में अपने साथियों से पिछड़ रहे थे। इसके लिए एक चुनिंदा अध्ययन किया गया, जिसमें इस बीमारी से ग्रस्त 10 लड़कों ने हिस्सा लिया। परिणाम तालिका 23 में प्रस्तुत किए गए हैं। तालिका 23. सांख्यिकीय परिणाम
इन गणनाओं से, यह इस प्रकार है कि 10 वर्षीय लड़कों की चयनात्मक औसत ऊंचाई, जिन्हें किसी प्रकार की संक्रामक बीमारी हुई है, सामान्य (132.5 सेमी) के करीब है। हालांकि, विश्वास अंतराल (126.6 सेमी) की निचली सीमा इंगित करती है कि 95% संभावना है कि इन बच्चों की वास्तविक औसत ऊंचाई "छोटे कद" की अवधारणा से मेल खाती है, अर्थात। ये बच्चे बौने हैं। इस उदाहरण में, विश्वास अंतराल परिकलन के परिणाम नैदानिक रूप से महत्वपूर्ण हैं। |