एसडी से 95 कॉन्फिडेंस इंटरवल डिफरेंस। विश्वास अंतराल

अक्सर मूल्यांकक को उस खंड के अचल संपत्ति बाजार का विश्लेषण करना पड़ता है जिसमें मूल्यांकन वस्तु स्थित है। यदि बाजार विकसित है, तो प्रस्तुत वस्तुओं के पूरे सेट का विश्लेषण करना मुश्किल हो सकता है, इसलिए विश्लेषण के लिए वस्तुओं का एक नमूना उपयोग किया जाता है। यह नमूना हमेशा सजातीय नहीं होता है, कभी-कभी इसे चरम सीमाओं से मुक्त करने की आवश्यकता होती है - बहुत अधिक या बहुत कम बाजार ऑफ़र। इसी उद्देश्य से इसे लागू किया जाता है विश्वास अंतराल. इस अध्ययन का उद्देश्य कॉन्फिडेंस इंटरवल की गणना के लिए दो तरीकों का तुलनात्मक विश्लेषण करना है और एस्टीमेटिका.प्रो सिस्टम में विभिन्न नमूनों के साथ काम करते समय सर्वश्रेष्ठ गणना विकल्प चुनना है।

विश्वास अंतराल - नमूने के आधार पर गणना की जाती है, विशेषता के मूल्यों का अंतराल, जिसमें ज्ञात संभावना के साथ सामान्य जनसंख्या का अनुमानित पैरामीटर होता है।

कॉन्फ़िडेंस इंटरवल की गणना करने का अर्थ नमूना डेटा के आधार पर एक ऐसा इंटरवल बनाना है, ताकि दी गई प्रायिकता के साथ यह दावा किया जा सके कि अनुमानित पैरामीटर का मान इस अंतराल में है। दूसरे शब्दों में, एक निश्चित संभावना के साथ विश्वास अंतराल में अनुमानित मात्रा का अज्ञात मान होता है। अंतराल जितना व्यापक होगा, अशुद्धि उतनी ही अधिक होगी।

कॉन्फिडेंस इंटरवल निर्धारित करने के लिए अलग-अलग तरीके हैं। इस लेख में, हम 2 तरीकों पर विचार करेंगे:

  • माध्यिका और मानक विचलन के माध्यम से;
  • टी-सांख्यिकीय (छात्र के गुणांक) के महत्वपूर्ण मूल्य के माध्यम से।

सीआई की गणना के लिए विभिन्न तरीकों के तुलनात्मक विश्लेषण के चरण:

1. एक डेटा नमूना तैयार करें;

2. हम इसे सांख्यिकीय तरीकों से संसाधित करते हैं: हम माध्य मान, माध्यिका, विचरण आदि की गणना करते हैं;

3. हम कॉन्फिडेंस इंटरवल की गणना दो तरह से करते हैं;

4. साफ किए गए नमूनों और प्राप्त विश्वास अंतराल का विश्लेषण करें।

चरण 1. डेटा नमूनाकरण

नमूना estmatica.pro सिस्टम का उपयोग करके बनाया गया था। नमूने में "ख्रुश्चेव" योजना के प्रकार के साथ तीसरे मूल्य क्षेत्र में 1-कमरे वाले अपार्टमेंट की बिक्री के लिए 91 प्रस्ताव शामिल थे।

तालिका 1 प्रारंभिक नमूना

1 sq.m., c.u. की कीमत

चित्र .1। प्रारंभिक नमूना



स्टेज 2. प्रारंभिक नमूने का प्रसंस्करण

सांख्यिकीय विधियों द्वारा नमूना प्रसंस्करण के लिए निम्नलिखित मूल्यों की गणना की आवश्यकता होती है:

1. अंकगणित माध्य

2. माध्यिका - एक संख्या जो नमूने की विशेषता है: नमूना तत्वों का ठीक आधा माध्यिका से अधिक है, अन्य आधा माध्यिका से कम है

(मानों की विषम संख्या वाले नमूने के लिए)

3. रेंज - नमूने में अधिकतम और न्यूनतम मूल्यों के बीच का अंतर

4. भिन्नता - डेटा में भिन्नता का अधिक सटीक अनुमान लगाने के लिए उपयोग किया जाता है

5. नमूने के लिए मानक विचलन (बाद में आरएमएस के रूप में संदर्भित) अंकगणितीय माध्य के आसपास समायोजन मूल्यों के फैलाव का सबसे आम संकेतक है।

6. भिन्नता का गुणांक - समायोजन मूल्यों के फैलाव की डिग्री को दर्शाता है

7. दोलन गुणांक - औसत के आसपास के नमूने में कीमतों के चरम मूल्यों के सापेक्ष उतार-चढ़ाव को दर्शाता है

तालिका 2. मूल नमूने के सांख्यिकीय संकेतक

भिन्नता का गुणांक, जो डेटा की एकरूपता की विशेषता है, 12.29% है, लेकिन दोलन का गुणांक बहुत बड़ा है। इस प्रकार, हम कह सकते हैं कि मूल नमूना सजातीय नहीं है, तो चलिए विश्वास अंतराल की गणना करने के लिए आगे बढ़ते हैं।

स्टेज 3. विश्वास अंतराल की गणना

विधि 1. माध्यिका और मानक विचलन के माध्यम से गणना।

विश्वास अंतराल निम्नानुसार निर्धारित किया जाता है: न्यूनतम मान - मानक विचलन माध्यिका से घटाया जाता है; अधिकतम मान - माध्यिका में मानक विचलन जोड़ा जाता है।

इस प्रकार, कॉन्फिडेंस इंटरवल (47179 CU; 60689 CU)

चावल। 2. कॉन्फिडेंस इंटरवल 1 के भीतर मान।



विधि 2. टी-सांख्यिकी (छात्र के गुणांक) के महत्वपूर्ण मूल्य के माध्यम से एक विश्वास अंतराल का निर्माण

एस.वी. ग्रिबोव्स्की ने "संपत्ति के मूल्य का आकलन करने के लिए गणितीय तरीके" पुस्तक में छात्र के गुणांक के माध्यम से विश्वास अंतराल की गणना के लिए एक विधि का वर्णन किया है। इस पद्धति से गणना करते समय, अनुमानक को स्वयं महत्व स्तर ∝ सेट करना चाहिए, जो उस संभावना को निर्धारित करता है जिसके साथ विश्वास अंतराल बनाया जाएगा। 0.1 के महत्व स्तर आमतौर पर उपयोग किए जाते हैं; 0.05 और 0.01। वे 0.9 की विश्वास संभावनाओं के अनुरूप हैं; 0.95 और 0.99। इस पद्धति के साथ, गणितीय अपेक्षा और विचरण के वास्तविक मूल्यों को व्यावहारिक रूप से अज्ञात माना जाता है (जो व्यावहारिक मूल्यांकन समस्याओं को हल करते समय लगभग हमेशा सत्य होता है)।

विश्वास अंतराल सूत्र:

एन - नमूना आकार;

महत्व स्तर ∝ के साथ टी-सांख्यिकी (छात्रों का वितरण) का महत्वपूर्ण मूल्य, स्वतंत्रता की डिग्री की संख्या n-1, जो विशेष सांख्यिकीय तालिकाओं द्वारा या एमएस एक्सेल (→"सांख्यिकीय"→ STUDRASPOBR) का उपयोग करके निर्धारित किया जाता है;

∝ - सार्थकता स्तर, हम ∝=0.01 लेते हैं।

चावल। 2. विश्वास अंतराल के भीतर मान 2.

चरण 4. कॉन्फ़िडेंस इंटरवल की गणना करने के विभिन्न तरीकों का विश्लेषण

विश्वास अंतराल की गणना के दो तरीके - माध्यिका और छात्र के गुणांक के माध्यम से - अंतराल के विभिन्न मूल्यों का नेतृत्व किया। तदनुसार, दो अलग-अलग शुद्ध नमूने प्राप्त किए गए थे।

तालिका 3. तीन नमूनों के लिए सांख्यिकीय संकेतक।

अनुक्रमणिका

प्रारंभिक नमूना

1 विकल्प

विकल्प 2

औसत मूल्य

फैलाव

कोफ। बदलाव

कोफ। दोलनों

सेवानिवृत्त वस्तुओं की संख्या, पीसी।

प्रदर्शन की गई गणनाओं के आधार पर, हम कह सकते हैं कि विभिन्न विधियों द्वारा प्राप्त विश्वास अंतराल के मान प्रतिच्छेद करते हैं, इसलिए आप मूल्यांकक के विवेक पर गणना के किसी भी तरीके का उपयोग कर सकते हैं।

हालांकि, हम मानते हैं कि एस्टिमेटिका.प्रो सिस्टम में काम करते समय, बाजार के विकास की डिग्री के आधार पर विश्वास अंतराल की गणना के लिए एक विधि चुनने की सलाह दी जाती है:

  • यदि बाजार विकसित नहीं है, तो औसत और मानक विचलन के माध्यम से गणना की विधि लागू करें, क्योंकि इस मामले में सेवानिवृत्त वस्तुओं की संख्या कम है;
  • यदि बाजार विकसित है, तो गणना को टी-सांख्यिकी (छात्र के गुणांक) के महत्वपूर्ण मूल्य के माध्यम से लागू करें, क्योंकि एक बड़ा प्रारंभिक नमूना बनाना संभव है।

लेख तैयार करने में इस्तेमाल किया गया:

1. ग्रिबोव्स्की एस.वी., सिवेट्स एस.ए., लेविकिना आई.ए. संपत्ति के मूल्य का आकलन करने के लिए गणितीय तरीके। मास्को, 2014

2. एस्टीमेटिका.प्रो सिस्टम से डेटा

विश्वास अंतराल ( अंग्रेज़ी विश्वास अंतराल) आँकड़ों में प्रयुक्त अंतराल अनुमानों में से एक प्रकार, जिसकी गणना किसी दिए गए महत्व के स्तर के लिए की जाती है। वे हमें एक बयान देने की अनुमति देते हैं कि सामान्य आबादी के अज्ञात सांख्यिकीय पैरामीटर का सही मूल्य मूल्यों की प्राप्त सीमा में है जो कि सांख्यिकीय महत्व के चुने हुए स्तर द्वारा दिया जाता है।

सामान्य वितरण

जब डेटा की जनसंख्या का प्रसरण (σ 2) ज्ञात होता है, तो विश्वास सीमा (विश्वास अंतराल के सीमा बिंदु) की गणना करने के लिए एक z-स्कोर का उपयोग किया जा सकता है। टी-वितरण का उपयोग करने की तुलना में, जेड-स्कोर का उपयोग न केवल एक संकीर्ण विश्वास अंतराल प्रदान करेगा, बल्कि माध्य और मानक विचलन (σ) के अधिक विश्वसनीय अनुमान भी प्रदान करेगा, क्योंकि जेड-स्कोर सामान्य वितरण पर आधारित है।

FORMULA

कॉन्फिडेंस इंटरवल की सीमा बिंदुओं को निर्धारित करने के लिए, बशर्ते कि डेटा की जनसंख्या का मानक विचलन ज्ञात हो, निम्न सूत्र का उपयोग किया जाता है

एल = एक्स - जेड α/2 σ
के √ N

उदाहरण

मान लें कि नमूना आकार 25 प्रेक्षण हैं, नमूना माध्य 15 है, और जनसंख्या मानक विचलन 8 है। α=5% के महत्व स्तर के लिए, Z-स्कोर Z α/2 =1.96 है। इस मामले में, विश्वास अंतराल की निचली और ऊपरी सीमाएँ होंगी

एल = 15 - 1.96 8 = 11,864
√25
एल = 15 + 1.96 8 = 18,136
√25

इस प्रकार, हम कह सकते हैं कि 95% की संभावना के साथ सामान्य जनसंख्या की गणितीय अपेक्षा 11.864 से 18.136 की सीमा में आ जाएगी।

कॉन्फिडेंस इंटरवल को कम करने के तरीके

मान लीजिए कि हमारे अध्ययन के प्रयोजनों के लिए सीमा बहुत विस्तृत है। कॉन्फिडेंस इंटरवल रेंज को कम करने के दो तरीके हैं।

  1. सांख्यिकीय महत्व α के स्तर को कम करें।
  2. नमूना आकार बढ़ाएँ।

सांख्यिकीय महत्व के स्तर को α=10% तक कम करने पर, हमें Z α/2 =1.64 के बराबर एक Z-स्कोर मिलता है। इस मामले में, अंतराल की निचली और ऊपरी सीमाएं होंगी

एल = 15 - 1.64 8 = 12,376
√25
एल = 15 + 1.64 8 = 17,624
√25

और विश्वास अंतराल को स्वयं के रूप में लिखा जा सकता है

इस मामले में, हम यह मान सकते हैं कि 90% की संभावना के साथ, सामान्य जनसंख्या की गणितीय अपेक्षा सीमा में आ जाएगी।

यदि हम सांख्यिकीय महत्व का स्तर α रखना चाहते हैं, तो नमूना आकार को बढ़ाने का एकमात्र विकल्प है। इसे 144 प्रेक्षणों तक बढ़ाते हुए, हम विश्वास सीमा के निम्नलिखित मान प्राप्त करते हैं

एल = 15 - 1.96 8 = 13,693
√144
एल = 15 + 1.96 8 = 16,307
√144

कॉन्फिडेंस इंटरवल खुद इस तरह दिखेगा:

इस प्रकार, सांख्यिकीय महत्व के स्तर को कम किए बिना विश्वास अंतराल को कम करना केवल नमूना आकार को बढ़ाकर ही संभव है। यदि नमूना आकार में वृद्धि करना संभव नहीं है, तो विश्वास अंतराल की संकीर्णता केवल सांख्यिकीय महत्व के स्तर को कम करके प्राप्त की जा सकती है।

एक गैर-सामान्य बंटन के लिए विश्वास्यता अंतराल बनाना

यदि जनसंख्या मानक विचलन ज्ञात नहीं है या वितरण गैर-सामान्य है, तो टी-वितरण का उपयोग विश्वास अंतराल के निर्माण के लिए किया जाता है। यह तकनीक अधिक रूढ़िवादी है, जो जेड-स्कोर पर आधारित तकनीक की तुलना में व्यापक विश्वास अंतराल में व्यक्त की जाती है।

FORMULA

टी-वितरण के आधार पर विश्वास अंतराल की निचली और ऊपरी सीमा की गणना करने के लिए निम्न सूत्रों का उपयोग किया जाता है

एल = एक्स - टीα σ
के √ N

छात्र का वितरण या टी-वितरण केवल एक पैरामीटर पर निर्भर करता है - स्वतंत्रता की डिग्री की संख्या, जो व्यक्तिगत सुविधा मूल्यों की संख्या (नमूने में टिप्पणियों की संख्या) के बराबर है। स्वतंत्रता की दी गई संख्या (n) और सांख्यिकीय महत्व α के स्तर के लिए छात्र के t-परीक्षण का मान लुकअप तालिकाओं में पाया जा सकता है।

उदाहरण

मान लें कि नमूना आकार 25 अलग-अलग मान हैं, नमूने का औसत मूल्य 50 है, और नमूने का मानक विचलन 28 है। आपको सांख्यिकीय महत्व α=5% के स्तर के लिए एक विश्वास अंतराल बनाने की आवश्यकता है।

हमारे मामले में, स्वतंत्रता की डिग्री की संख्या 24 (25-1) है, इसलिए, सांख्यिकीय महत्व α=5% के स्तर के लिए छात्र के टी-टेस्ट का संगत सारणीबद्ध मान 2.064 है। इसलिए, कॉन्फिडेंस इंटरवल की निचली और ऊपरी सीमाएं होंगी

एल = 50 - 2.064 28 = 38,442
√25
एल = 50 + 2.064 28 = 61,558
√25

और अंतराल को स्वयं के रूप में लिखा जा सकता है

इस प्रकार, हम कह सकते हैं कि 95% की संभावना के साथ सामान्य आबादी की गणितीय अपेक्षा सीमा में होगी।

टी-वितरण का उपयोग करने से आप सांख्यिकीय महत्व को कम करके या नमूना आकार बढ़ाकर विश्वास अंतराल को कम कर सकते हैं।

हमारे उदाहरण की स्थितियों में सांख्यिकीय महत्व को 95% से 90% तक कम करना, हमें छात्र के टी-टेस्ट 1.711 का संगत सारणीबद्ध मूल्य मिलता है।

एल = 50 - 1.711 28 = 40,418
√25
एल = 50 + 1.711 28 = 59,582
√25

इस मामले में, हम कह सकते हैं कि 90% की संभावना के साथ सामान्य जनसंख्या की गणितीय अपेक्षा सीमा में होगी।

यदि हम सांख्यिकीय महत्व को कम नहीं करना चाहते हैं, तो नमूना आकार को बढ़ाना ही एकमात्र विकल्प है। मान लीजिए कि यह 64 अलग-अलग अवलोकन हैं, न कि उदाहरण की प्रारंभिक स्थिति में 25। स्वतंत्रता की 63 डिग्री (64-1) और सांख्यिकीय महत्व α=5% के स्तर के लिए छात्र के टी-टेस्ट का सारणीबद्ध मान 1.998 है।

एल = 50 - 1.998 28 = 43,007
√64
एल = 50 + 1.998 28 = 56,993
√64

यह हमें यह दावा करने का अवसर देता है कि 95% की संभावना के साथ सामान्य जनसंख्या की गणितीय अपेक्षा सीमा में होगी।

बड़े नमूने

बड़े नमूने 100 से अधिक व्यक्तिगत टिप्पणियों वाले डेटा की आबादी से नमूने हैं। सांख्यिकीय अध्ययनों से पता चला है कि बड़े नमूने सामान्य रूप से वितरित किए जाते हैं, भले ही जनसंख्या का वितरण सामान्य न हो। इसके अलावा, ऐसे नमूनों के लिए, आत्मविश्वास अंतराल का निर्माण करते समय जेड-स्कोर और टी-वितरण का उपयोग लगभग समान परिणाम देता है। इस प्रकार, बड़े नमूनों के लिए, टी-वितरण के बजाय सामान्य वितरण के लिए जेड-स्कोर का उपयोग करना स्वीकार्य है।

उपसंहार

विश्वास अंतराल।

कॉन्फिडेंस इंटरवल की गणना संबंधित पैरामीटर की औसत त्रुटि पर आधारित है। विश्वास अंतराल संभाव्यता (1-ए) के साथ अनुमानित पैरामीटर का सही मान किस सीमा के भीतर दिखाता है। यहाँ a सार्थकता स्तर है, (1-a) को विश्वास स्तर भी कहा जाता है।

पहले अध्याय में, हमने दिखाया कि, उदाहरण के लिए, अंकगणितीय माध्य के लिए, वास्तविक जनसंख्या माध्य लगभग 95% समय के माध्य की 2 औसत त्रुटियों के भीतर होता है। इस प्रकार, माध्य के लिए 95% विश्वास्यता अंतराल की सीमाएं नमूना माध्य से माध्य की माध्य त्रुटि के दोगुने से होंगी, अर्थात हम माध्य की औसत त्रुटि को किसी ऐसे कारक से गुणा करते हैं जो विश्वास स्तर पर निर्भर करता है। माध्य और माध्य के अंतर के लिए, छात्र का गुणांक (विद्यार्थी की कसौटी का महत्वपूर्ण मूल्य) लिया जाता है, शेयरों के हिस्से और अंतर के लिए, z मानदंड का महत्वपूर्ण मूल्य। गुणांक और औसत त्रुटि के उत्पाद को इस पैरामीटर की सीमांत त्रुटि कहा जा सकता है, अर्थात अधिकतम जो हम इसका मूल्यांकन करते समय प्राप्त कर सकते हैं।

के लिए विश्वास अंतराल अंकगणित औसत : .

यहाँ नमूना माध्य है;

अंकगणितीय माध्य की औसत त्रुटि;

एस-नमूना मानक विचलन;

एन

च = एन-1 (छात्र का गुणांक)।

के लिए विश्वास अंतराल अंकगणितीय साधनों का अंतर :

यहाँ, नमूना माध्यों के बीच अंतर है;

- अंकगणितीय साधनों के अंतर की औसत त्रुटि;

एस 1, एस 2 -नमूना मानक विचलन;

एन 1, एन 2

किसी दिए गए महत्व के स्तर के लिए छात्र की कसौटी का महत्वपूर्ण मूल्य और स्वतंत्रता की डिग्री की संख्या च=n1 +n2-2 (विद्यार्थी का गुणांक)।

के लिए विश्वास अंतराल शेयरों :

.

यहाँ d नमूना हिस्सा है;

- औसत शेयर त्रुटि;

एन- नमूना आकार (समूह आकार);

के लिए विश्वास अंतराल मतभेद साझा करें :

यहाँ, सैंपल शेयरों के बीच का अंतर है;

अंकगणितीय साधनों के बीच अंतर की औसत त्रुटि है;

एन 1, एन 2- नमूना आकार (समूहों की संख्या);

दिए गए सार्थकता स्तर a ( , , ) पर कसौटी z का महत्वपूर्ण मान।

संकेतकों में अंतर के लिए विश्वास अंतराल की गणना करके, हम, सबसे पहले, सीधे प्रभाव के संभावित मूल्यों को देखते हैं, न कि केवल इसके बिंदु अनुमान को। दूसरा, हम शून्य परिकल्पना की स्वीकृति या खंडन के बारे में एक निष्कर्ष निकाल सकते हैं और तीसरा, हम कसौटी की शक्ति के बारे में एक निष्कर्ष निकाल सकते हैं।

कॉन्फिडेंस इंटरवल का उपयोग करते हुए परिकल्पना का परीक्षण करते समय, निम्नलिखित नियम का पालन किया जाना चाहिए:

यदि माध्य अंतर के 100(1-ए)-प्रतिशत विश्वास अंतराल में शून्य नहीं है, तो अंतर सांख्यिकीय रूप से महत्व स्तर पर महत्वपूर्ण होते हैं; इसके विपरीत, यदि इस अंतराल में शून्य है, तो अंतर सांख्यिकीय रूप से महत्वपूर्ण नहीं हैं।

वास्तव में, यदि इस अंतराल में शून्य है, तो, इसका मतलब है कि तुलनात्मक संकेतक एक समूह में दूसरे की तुलना में अधिक या कम हो सकता है, अर्थात। देखे गए अंतर यादृच्छिक हैं।

उस स्थान से जहां विश्वास अंतराल के भीतर शून्य स्थित है, कसौटी की शक्ति का न्याय किया जा सकता है। यदि शून्य अंतराल की निचली या ऊपरी सीमा के करीब है, तो शायद बड़ी संख्या में तुलनात्मक समूहों के साथ, अंतर सांख्यिकीय महत्व तक पहुंच जाएगा। यदि शून्य अंतराल के मध्य के करीब है, तो इसका मतलब है कि प्रायोगिक समूह में सूचक की वृद्धि और कमी दोनों समान रूप से संभावित हैं, और शायद वास्तव में कोई अंतर नहीं है।

उदाहरण:

दो अलग-अलग प्रकार के एनेस्थीसिया का उपयोग करते समय सर्जिकल मृत्यु दर की तुलना करने के लिए: पहले प्रकार के एनेस्थीसिया का उपयोग करके 61 लोगों का ऑपरेशन किया गया, 8 की मृत्यु हो गई, दूसरे का उपयोग करते हुए - 67 लोग, 10 की मृत्यु हो गई।

डी 1 \u003d 8/61 \u003d 0.131; डी 2 \u003d 10/67 \u003d 0.149; डी1-डी2 = - 0.018।

तुलनात्मक विधियों की घातकता में अंतर 100 (1-ए) = 95% की संभावना के साथ (-0.018 - 0.122; -0.018 + 0.122) या (-0.14; 0.104) की सीमा में होगा। अंतराल में शून्य होता है, अर्थात दो अलग-अलग प्रकार के एनेस्थेसिया के साथ एक ही घातकता की परिकल्पना को खारिज नहीं किया जा सकता है।

इस प्रकार, मृत्यु दर 14% तक घट सकती है और 95% की संभावना के साथ 10.4% तक बढ़ सकती है, अर्थात। शून्य लगभग अंतराल के बीच में है, इसलिए यह तर्क दिया जा सकता है कि, सबसे अधिक संभावना है, ये दो विधियां वास्तव में घातकता में भिन्न नहीं हैं।

पहले लिए गए उदाहरण में, औसत टैपिंग समय की तुलना उनके परीक्षा अंकों में भिन्न छात्रों के चार समूहों में की गई थी। आइए 2 और 5 की परीक्षा उत्तीर्ण करने वाले छात्रों के लिए औसत दबाव समय के विश्वास अंतराल और इन औसत के बीच के अंतर के लिए विश्वास अंतराल की गणना करें।

छात्र के गुणांक छात्र के वितरण की तालिका से पाए जाते हैं (परिशिष्ट देखें): पहले समूह के लिए: = t(0.05;48) = 2.011; दूसरे समूह के लिए: = टी (0.05; 61) = 2.000। इस प्रकार, पहले समूह के लिए विश्वास अंतराल: = (162.19-2.011 * 2.18; 162.19 + 2.011 * 2.18) = (157.8; 166.6) , दूसरे समूह के लिए (156.55- 2.000*1.88; 156.55+2.000*1.88) = (152.8) ; 160.3). तो, उन लोगों के लिए जिन्होंने 2 के लिए परीक्षा उत्तीर्ण की, औसत दबाव का समय 157.8 एमएस से 166.6 एमएस तक 95% की संभावना के साथ है, जिन्होंने 5 के लिए परीक्षा उत्तीर्ण की - 152.8 एमएस से 160.3 एमएस तक 95% की संभावना के साथ .

आप साधनों के लिए विश्वास अंतराल का उपयोग करके अशक्त परिकल्पना का परीक्षण भी कर सकते हैं, न कि केवल साधनों में अंतर के लिए। उदाहरण के लिए, जैसा कि हमारे मामले में, यदि साधनों के लिए विश्वास अंतराल ओवरलैप होता है, तो अशक्त परिकल्पना को अस्वीकार नहीं किया जा सकता है। एक चुने हुए महत्व स्तर पर एक परिकल्पना को अस्वीकार करने के लिए, संबंधित विश्वास अंतरालों को ओवरलैप नहीं करना चाहिए।

आइए 2 और 5 की परीक्षा उत्तीर्ण करने वाले समूहों में औसत दबाव समय में अंतर के लिए विश्वास अंतराल का पता लगाएं। औसत में अंतर: 162.19 - 156.55 = 5.64। छात्र का गुणांक: \u003d t (0.05; 49 + 62-2) \u003d t (0.05; 109) \u003d 1.982। समूह मानक विचलन इसके बराबर होंगे: ; . हम साधनों के बीच के अंतर की औसत त्रुटि की गणना करते हैं:। विश्वास अंतराल: \u003d (5.64-1.982 * 2.87; 5.64 + 1.982 * 2.87) \u003d (-0.044; 11.33)।

तो, 2 और 5 पर परीक्षा उत्तीर्ण करने वाले समूहों में औसत दबाने के समय में अंतर -0.044 एमएस से 11.33 एमएस की सीमा में होगा। इस अंतराल में शून्य शामिल है, अर्थात उत्कृष्ट परिणामों के साथ परीक्षा उत्तीर्ण करने वालों के लिए औसत दबाव समय उन लोगों की तुलना में बढ़ और घट सकता है, जिन्होंने परीक्षा को असंतोषजनक रूप से उत्तीर्ण किया है, अर्थात। शून्य परिकल्पना को अस्वीकार नहीं किया जा सकता। लेकिन शून्य निचली सीमा के बहुत करीब है, उत्कृष्ट राहगीरों के लिए दबाने का समय कम होने की संभावना अधिक है। इस प्रकार, हम यह निष्कर्ष निकाल सकते हैं कि 2 और 5 से पार करने वालों के बीच औसत क्लिक समय में अभी भी अंतर हैं, हम औसत समय में दिए गए परिवर्तन, औसत समय और नमूना आकार के प्रसार के लिए उनका पता नहीं लगा सके।



परीक्षण की शक्ति एक गलत अशक्त परिकल्पना को अस्वीकार करने की संभावना है, अर्थात अंतर खोजें जहां वे वास्तव में हैं।

परीक्षण की शक्ति महत्व के स्तर, समूहों के बीच अंतर के परिमाण, समूहों में मूल्यों के प्रसार और नमूना आकार के आधार पर निर्धारित की जाती है।

छात्र के टी-परीक्षण और प्रसरण के विश्लेषण के लिए, आप संवेदनशीलता चार्ट का उपयोग कर सकते हैं।

समूहों की आवश्यक संख्या के प्रारंभिक निर्धारण में कसौटी की शक्ति का उपयोग किया जा सकता है।

कॉन्फ़िडेंस इंटरवल दिखाता है कि किस सीमा के भीतर अनुमानित पैरामीटर का सही मान दी गई प्रायिकता के साथ है।

विश्वास अंतराल की सहायता से, आप सांख्यिकीय परिकल्पनाओं का परीक्षण कर सकते हैं और मानदंडों की संवेदनशीलता के बारे में निष्कर्ष निकाल सकते हैं।

साहित्य।

ग्लैंट्ज़ एस - अध्याय 6.7।

रेब्रोवा ओ.यू. - पृष्ठ 112-114, पृष्ठ 171-173, पृष्ठ 234-238।

सिदोरेंको ई। वी। - पीपी। 32-33।

छात्रों की आत्म-परीक्षा के लिए प्रश्न।

1. कसौटी की शक्ति क्या है?

2. मानदंड की शक्ति का मूल्यांकन करने के लिए किन मामलों में आवश्यक है?

3. शक्ति की गणना के तरीके।

6. कॉन्फिडेंस इंटरवल का उपयोग करके एक सांख्यिकीय परिकल्पना का परीक्षण कैसे करें?

7. कॉन्फिडेंस इंटरवल की गणना करते समय कसौटी की शक्ति के बारे में क्या कहा जा सकता है?

कार्य।

गणितीय अपेक्षा के लिए विश्वास अंतराल - यह डेटा से गणना किया गया ऐसा अंतराल है, जिसमें ज्ञात संभावना के साथ सामान्य आबादी की गणितीय अपेक्षा होती है। गणितीय अपेक्षा के लिए प्राकृतिक अनुमान इसके देखे गए मूल्यों का अंकगणितीय माध्य है। इसलिए, पाठ के दौरान हम "औसत", "औसत मूल्य" शब्दों का उपयोग करेंगे। कॉन्फिडेंस इंटरवल की गणना की समस्याओं में, सबसे अधिक आवश्यक उत्तर "औसत संख्या [एक विशिष्ट समस्या में मान] का कॉन्फिडेंस इंटरवल [निम्न मान] से [उच्च मान] तक है"। विश्वास अंतराल की मदद से, न केवल औसत मूल्यों का मूल्यांकन करना संभव है, बल्कि सामान्य आबादी की एक या दूसरी विशेषता का हिस्सा भी है। औसत मूल्य, भिन्नता, मानक विचलन और त्रुटि, जिसके माध्यम से हम नई परिभाषाओं और सूत्रों तक पहुंचेंगे, पाठ में विश्लेषण किया जाता है नमूना और जनसंख्या लक्षण .

माध्य का बिंदु और अंतराल अनुमान

यदि सामान्य जनसंख्या का माध्य मान एक संख्या (बिंदु) द्वारा अनुमानित किया जाता है, तो प्रेक्षणों के नमूने से परिकलित एक विशिष्ट माध्य को सामान्य जनसंख्या के अज्ञात माध्य के अनुमान के रूप में लिया जाता है। इस मामले में, नमूना माध्य का मान - एक यादृच्छिक चर - सामान्य जनसंख्या के माध्य मान के साथ मेल नहीं खाता है। इसलिए, नमूने के औसत मूल्य को इंगित करते समय, नमूना त्रुटि को इंगित करना भी आवश्यक है। मानक त्रुटि का उपयोग नमूना त्रुटि के माप के रूप में किया जाता है, जिसे समान इकाइयों में माध्य के रूप में व्यक्त किया जाता है। इसलिए, निम्नलिखित संकेतन का अक्सर उपयोग किया जाता है:।

यदि माध्य का अनुमान एक निश्चित संभाव्यता से जुड़ा होना आवश्यक है, तो ब्याज की सामान्य जनसंख्या के पैरामीटर का अनुमान एक संख्या से नहीं, बल्कि एक अंतराल से लगाया जाना चाहिए। कॉन्फ़िडेंस इंटरवल एक ऐसा इंटरवल है, जिसमें एक निश्चित प्रायिकता के साथ, पीसामान्य जनसंख्या के अनुमानित संकेतक का मूल्य पाया जाता है। कॉन्फिडेंस इंटरवल जिसमें प्रायिकता के साथ पी = 1 - α एक यादृच्छिक चर है, इसकी गणना निम्नानुसार की जाती है:

,

α = 1 - पी, जो सांख्यिकी पर लगभग किसी भी पुस्तक के परिशिष्ट में पाया जा सकता है।

व्यवहार में, जनसंख्या माध्य और विचरण ज्ञात नहीं हैं, इसलिए जनसंख्या विचरण को नमूना विचरण से बदल दिया जाता है, और जनसंख्या माध्य को नमूना माध्य से बदल दिया जाता है। इस प्रकार, ज्यादातर मामलों में विश्वास अंतराल की गणना निम्नानुसार की जाती है:

.

जनसंख्या माध्य का अनुमान लगाने के लिए विश्वास अंतराल सूत्र का उपयोग किया जा सकता है

  • सामान्य जनसंख्या का मानक विचलन ज्ञात है;
  • या जनसंख्या का मानक विचलन ज्ञात नहीं है, लेकिन नमूना आकार 30 से अधिक है।

नमूना माध्य जनसंख्या माध्य का एक निष्पक्ष अनुमान है। बदले में, नमूना विचरण जनसंख्या भिन्नता का एक निष्पक्ष अनुमान नहीं है। नमूना भिन्नता सूत्र में जनसंख्या भिन्नता का एक निष्पक्ष अनुमान प्राप्त करने के लिए, नमूना आकार है एनसे बदला जाना चाहिए एन-1.

उदाहरण 1एक निश्चित शहर में 100 बेतरतीब ढंग से चुने गए कैफे से जानकारी एकत्र की जाती है कि उनमें कर्मचारियों की औसत संख्या 4.6 के मानक विचलन के साथ 10.5 है। कैफे कर्मचारियों की संख्या के 95% का विश्वास अंतराल निर्धारित करें।

जहां महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य है α = 0,05 .

इस प्रकार, कैफे कर्मचारियों की औसत संख्या के लिए 95% विश्वास अंतराल 9.6 और 11.4 के बीच था।

उदाहरण 2 64 प्रेक्षणों की सामान्य जनसंख्या से एक यादृच्छिक नमूने के लिए, निम्नलिखित कुल मानों की गणना की गई:

प्रेक्षणों में मानों का योग ,

माध्य से मानों के वर्ग विचलन का योग .

अपेक्षित मूल्य के लिए 95% विश्वास अंतराल की गणना करें।

मानक विचलन की गणना करें:

,

औसत मूल्य की गणना करें:

.

विश्वास अंतराल के लिए व्यंजक में मानों को प्रतिस्थापित करें:

जहां महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य है α = 0,05 .

हम पाते हैं:

इस प्रकार, इस नमूने की गणितीय अपेक्षा के लिए 95% विश्वास अंतराल 7.484 से 11.266 के बीच था।

उदाहरण 3 100 अवलोकनों की एक सामान्य आबादी से एक यादृच्छिक नमूने के लिए, 15.2 का औसत मान और 3.2 का मानक विचलन की गणना की गई। अपेक्षित मान के लिए 95% विश्वास अंतराल की गणना करें, फिर 99% विश्वास अंतराल। यदि नमूना शक्ति और इसकी भिन्नता समान रहती है, लेकिन विश्वास कारक बढ़ जाता है, तो क्या विश्वास अंतराल संकीर्ण या चौड़ा होगा?

हम इन मूल्यों को विश्वास अंतराल के लिए अभिव्यक्ति में प्रतिस्थापित करते हैं:

जहां महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य है α = 0,05 .

हम पाते हैं:

.

इस प्रकार, इस नमूने के औसत के लिए 95% विश्वास अंतराल 14.57 से 15.82 तक था।

फिर से, हम इन मूल्यों को विश्वास अंतराल के लिए अभिव्यक्ति में प्रतिस्थापित करते हैं:

जहां महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य है α = 0,01 .

हम पाते हैं:

.

इस प्रकार, इस नमूने के औसत के लिए 99% विश्वास अंतराल 14.37 से 16.02 तक था।

जैसा कि आप देख सकते हैं, जैसे-जैसे विश्वास कारक बढ़ता है, मानक सामान्य वितरण का महत्वपूर्ण मूल्य भी बढ़ता है, और, इसलिए, अंतराल के प्रारंभ और अंत बिंदु माध्य से आगे स्थित होते हैं, और इस प्रकार गणितीय अपेक्षा के लिए विश्वास अंतराल बढ़ती है।

विशिष्ट गुरुत्व का बिंदु और अंतराल अनुमान

नमूने की कुछ विशेषता के हिस्से की व्याख्या शेयर के एक बिंदु अनुमान के रूप में की जा सकती है पीसामान्य आबादी में एक ही विशेषता। यदि इस मान को प्रायिकता से जोड़ने की आवश्यकता है, तो विशिष्ट गुरुत्व के विश्वास अंतराल की गणना की जानी चाहिए पीसंभावना के साथ सामान्य आबादी में सुविधा पी = 1 - α :

.

उदाहरण 4एक निश्चित शहर में दो उम्मीदवार हैं और बीमहापौर के लिए चल रहा है। शहर के 200 निवासियों को यादृच्छिक रूप से मतदान किया गया, जिनमें से 46% ने उत्तर दिया कि वे उम्मीदवार को वोट देंगे , 26% - उम्मीदवार के लिए बीऔर 28% नहीं जानते कि वे किसे वोट देंगे। उम्मीदवार का समर्थन करने वाले शहर के निवासियों के अनुपात के लिए 95% विश्वास अंतराल निर्धारित करें .

कोई भी नमूना सामान्य आबादी का केवल एक अनुमानित विचार देता है, और सभी नमूना सांख्यिकीय विशेषताओं (माध्य, मोड, विचरण ...) कुछ सन्निकटन हैं या सामान्य मापदंडों का एक अनुमान है, जो कि ज्यादातर मामलों में गणना नहीं की जा सकती है सामान्य आबादी की दुर्गमता (चित्र 20)।

चित्रा 20. नमूनाकरण त्रुटि

लेकिन आप उस अंतराल को निर्दिष्ट कर सकते हैं जिसमें एक निश्चित डिग्री की संभावना के साथ, सांख्यिकीय विशेषता का सही (सामान्य) मूल्य निहित है। यह अंतराल कहा जाता है डी विश्वास अंतराल (सीआई)।

तो 95% की संभावना के साथ सामान्य औसत भीतर निहित है

से, (20)

कहाँ टी - के लिए छात्र की कसौटी का सारणीबद्ध मूल्य α = 0.05 और एफ= एन-1

पाया जा सकता है और इस मामले में 99% सीआई टी के लिए चुना α =0,01.

विश्वास अंतराल का व्यावहारिक महत्व क्या है?

    एक व्यापक विश्वास अंतराल इंगित करता है कि नमूना माध्य जनसंख्या माध्य को सटीक रूप से प्रतिबिंबित नहीं करता है। यह आमतौर पर एक अपर्याप्त नमूना आकार, या इसकी विषमता के कारण होता है, अर्थात बड़ा फैलाव। दोनों माध्य में बड़ी त्रुटि देते हैं और तदनुसार व्यापक सीआई देते हैं। और यही कारण है कि शोध योजना चरण में वापस आ गए हैं।

    ऊपरी और निचली सीआई सीमाएं मूल्यांकन करती हैं कि क्या परिणाम नैदानिक ​​रूप से महत्वपूर्ण होंगे

आइए समूह गुणों के अध्ययन के परिणामों के सांख्यिकीय और नैदानिक ​​​​महत्व के प्रश्न पर अधिक विस्तार से ध्यान दें। याद रखें कि आंकड़ों का काम नमूना डेटा के आधार पर सामान्य आबादी में कम से कम कुछ अंतरों का पता लगाना है। ऐसे (कोई नहीं) मतभेदों को ढूंढना चिकित्सक का काम है जो निदान या उपचार में मदद करेगा। और हमेशा सांख्यिकीय निष्कर्ष नैदानिक ​​​​निष्कर्षों का आधार नहीं होते हैं। इस प्रकार, हीमोग्लोबिन में 3 ग्राम/लीटर की सांख्यिकीय रूप से महत्वपूर्ण कमी चिंता का कारण नहीं है। और, इसके विपरीत, यदि मानव शरीर में कुछ समस्या का संपूर्ण जनसंख्या के स्तर पर द्रव्यमान चरित्र नहीं है, तो यह इस समस्या से निपटने का कोई कारण नहीं है।

हम इस स्थिति पर विचार करेंगे उदाहरण.

शोधकर्ताओं ने सोचा कि जिन लड़कों को किसी प्रकार की संक्रामक बीमारी थी, वे विकास में अपने साथियों से पिछड़ रहे थे। इसके लिए एक चुनिंदा अध्ययन किया गया, जिसमें इस बीमारी से ग्रस्त 10 लड़कों ने हिस्सा लिया। परिणाम तालिका 23 में प्रस्तुत किए गए हैं।

तालिका 23. सांख्यिकीय परिणाम

निचली सीमा

ऊपरी सीमा

निर्दिष्टीकरण (सेमी)

मध्य

इन गणनाओं से, यह इस प्रकार है कि 10 वर्षीय लड़कों की चयनात्मक औसत ऊंचाई, जिन्हें किसी प्रकार की संक्रामक बीमारी हुई है, सामान्य (132.5 सेमी) के करीब है। हालांकि, विश्वास अंतराल (126.6 सेमी) की निचली सीमा इंगित करती है कि 95% संभावना है कि इन बच्चों की वास्तविक औसत ऊंचाई "छोटे कद" की अवधारणा से मेल खाती है, अर्थात। ये बच्चे बौने हैं।

इस उदाहरण में, विश्वास अंतराल परिकलन के परिणाम नैदानिक ​​रूप से महत्वपूर्ण हैं।

श्रेणियाँ

लोकप्रिय लेख

2023 "Kingad.ru" - मानव अंगों की अल्ट्रासाउंड परीक्षा