एसडी से 95 विश्वास अंतराल अंतर। विश्वास अंतराल

अक्सर मूल्यांकक को उस खंड के रियल एस्टेट बाजार का विश्लेषण करना होता है जिसमें मूल्यांकन की जा रही संपत्ति स्थित है। यदि बाजार विकसित है, तो प्रस्तुत वस्तुओं के पूरे सेट का विश्लेषण करना मुश्किल हो सकता है, इसलिए विश्लेषण के लिए वस्तुओं का एक नमूना उपयोग किया जाता है। यह नमूना हमेशा सजातीय नहीं बनता है; कभी-कभी इसे चरम बिंदुओं से साफ़ करना आवश्यक होता है - बहुत अधिक या बहुत कम बाज़ार ऑफ़र। इसी उद्देश्य से इसका प्रयोग किया जाता है विश्वास अंतराल. इस अध्ययन का उद्देश्य आत्मविश्वास अंतराल की गणना के लिए दो तरीकों का तुलनात्मक विश्लेषण करना और अनुमान.प्रो प्रणाली में विभिन्न नमूनों के साथ काम करते समय इष्टतम गणना विकल्प का चयन करना है।

कॉन्फिडेंस अंतराल एक नमूने के आधार पर गणना की गई विशेषता मूल्यों का एक अंतराल है, जिसमें ज्ञात संभावना के साथ सामान्य जनसंख्या का अनुमानित पैरामीटर शामिल होता है।

विश्वास अंतराल की गणना करने का उद्देश्य नमूना डेटा के आधार पर ऐसे अंतराल का निर्माण करना है ताकि दी गई संभावना के साथ यह कहा जा सके कि अनुमानित पैरामीटर का मान इस अंतराल में है। दूसरे शब्दों में, विश्वास अंतराल में एक निश्चित संभावना के साथ अनुमानित मूल्य का अज्ञात मूल्य शामिल होता है। अंतराल जितना व्यापक होगा, अशुद्धि उतनी ही अधिक होगी।

कॉन्फिडेंस इंटरवल निर्धारित करने के लिए अलग-अलग तरीके हैं। इस लेख में हम 2 तरीकों पर गौर करेंगे:

  • माध्यिका और मानक विचलन के माध्यम से;
  • टी-सांख्यिकी (छात्र का गुणांक) के महत्वपूर्ण मूल्य के माध्यम से।

सीआई की गणना के लिए विभिन्न तरीकों के तुलनात्मक विश्लेषण के चरण:

1. एक डेटा नमूना तैयार करें;

2. हम इसे सांख्यिकीय तरीकों का उपयोग करके संसाधित करते हैं: हम औसत मूल्य, माध्यिका, विचरण, आदि की गणना करते हैं;

3. विश्वास अंतराल की गणना दो तरीकों से करें;

4. साफ किए गए नमूनों और परिणामी आत्मविश्वास अंतराल का विश्लेषण करें।

चरण 1. डेटा नमूनाकरण

नमूना estimatica.pro प्रणाली का उपयोग करके बनाया गया था। नमूने में "ख्रुश्चेव" प्रकार के लेआउट के साथ तीसरे मूल्य क्षेत्र में 1-कमरे वाले अपार्टमेंट की बिक्री के लिए 91 प्रस्ताव शामिल थे।

तालिका 1. प्रारंभिक नमूना

मूल्य 1 वर्ग मीटर, इकाई

चित्र .1। प्रारंभिक नमूना



चरण 2. प्रारंभिक नमूने का प्रसंस्करण

सांख्यिकीय विधियों का उपयोग करके किसी नमूने को संसाधित करने के लिए निम्नलिखित मानों की गणना की आवश्यकता होती है:

1. अंकगणितीय माध्य

2. माध्यिका नमूने को दर्शाने वाली एक संख्या है: नमूना तत्वों का बिल्कुल आधा हिस्सा माध्यिका से बड़ा है, अन्य आधा माध्यिका से कम है

(विषम संख्या में मान वाले नमूने के लिए)

3. रेंज - नमूने में अधिकतम और न्यूनतम मूल्यों के बीच का अंतर

4. वेरिएंस - डेटा की भिन्नता का अधिक सटीक अनुमान लगाने के लिए उपयोग किया जाता है

5. नमूना मानक विचलन (इसके बाद - एसडी) अंकगणित माध्य के आसपास समायोजन मूल्यों के फैलाव का सबसे आम संकेतक है।

6. भिन्नता का गुणांक - समायोजन मूल्यों के बिखरने की डिग्री को दर्शाता है

7. दोलन गुणांक - औसत के आसपास नमूने में चरम मूल्य मूल्यों के सापेक्ष उतार-चढ़ाव को दर्शाता है

तालिका 2. मूल नमूने के सांख्यिकीय संकेतक

भिन्नता का गुणांक, जो डेटा की एकरूपता को दर्शाता है, 12.29% है, लेकिन दोलन का गुणांक बहुत अधिक है। इस प्रकार, हम कह सकते हैं कि मूल नमूना सजातीय नहीं है, तो आइए विश्वास अंतराल की गणना के लिए आगे बढ़ें।

चरण 3. आत्मविश्वास अंतराल गणना

विधि 1. माध्यिका और मानक विचलन का उपयोग करके गणना।

विश्वास अंतराल निम्नानुसार निर्धारित किया जाता है: न्यूनतम मूल्य - मानक विचलन माध्यिका से घटाया जाता है; अधिकतम मान - मानक विचलन माध्यिका में जोड़ा जाता है।

इस प्रकार, आत्मविश्वास अंतराल (47179 सीयू; 60689 सीयू)

चावल। 2. विश्वास अंतराल के अंतर्गत आने वाले मान 1.



विधि 2. टी-सांख्यिकी (छात्र गुणांक) के महत्वपूर्ण मूल्य का उपयोग करके एक आत्मविश्वास अंतराल का निर्माण

एस.वी. ग्रिबोव्स्की ने अपनी पुस्तक "संपत्ति मूल्य का अनुमान लगाने के लिए गणितीय तरीके" में छात्र गुणांक के माध्यम से आत्मविश्वास अंतराल की गणना करने की एक विधि का वर्णन किया है। इस विधि का उपयोग करके गणना करते समय, अनुमानक को स्वयं महत्व स्तर ∝ निर्धारित करना होगा, जो संभावना निर्धारित करता है जिसके साथ विश्वास अंतराल का निर्माण किया जाएगा। आमतौर पर, 0.1 के महत्व स्तर का उपयोग किया जाता है; 0.05 और 0.01. वे 0.9 की आत्मविश्वास संभावनाओं के अनुरूप हैं; 0.95 और 0.99. इस पद्धति के साथ, गणितीय अपेक्षा और विचरण के वास्तविक मूल्यों को व्यावहारिक रूप से अज्ञात माना जाता है (जो व्यावहारिक अनुमान समस्याओं को हल करते समय लगभग हमेशा सत्य होता है)।

कॉन्फिडेंस इंटरवल फॉर्मूला:

एन - नमूना आकार;

महत्व स्तर ∝ के साथ टी-सांख्यिकी (छात्र वितरण) का महत्वपूर्ण मूल्य, स्वतंत्रता की डिग्री एन -1 की संख्या, जो विशेष सांख्यिकीय तालिकाओं से या एमएस एक्सेल (→ "सांख्यिकीय" → अध्ययनकर्ता) का उपयोग करके निर्धारित की जाती है;

∝ - महत्व स्तर, ∝=0.01 लें।

चावल। 2. विश्वास अंतराल के अंतर्गत आने वाले मान 2.

चरण 4. आत्मविश्वास अंतराल की गणना के लिए विभिन्न तरीकों का विश्लेषण

आत्मविश्वास अंतराल की गणना करने के दो तरीके - माध्यिका और छात्र के गुणांक के माध्यम से - अंतराल के विभिन्न मूल्यों को जन्म देते हैं। तदनुसार, हमें दो अलग-अलग साफ किए गए नमूने मिले।

तालिका 3. तीन नमूनों के आँकड़े।

अनुक्रमणिका

प्रारंभिक नमूना

1 विकल्प

विकल्प 2

औसत मूल्य

फैलाव

कोएफ़. बदलाव

कोएफ़. दोलनों

सेवानिवृत्त वस्तुओं की संख्या, पीसी।

की गई गणनाओं के आधार पर, हम कह सकते हैं कि विभिन्न तरीकों से प्राप्त विश्वास अंतराल मान प्रतिच्छेद करते हैं, इसलिए आप मूल्यांकनकर्ता के विवेक पर किसी भी गणना पद्धति का उपयोग कर सकते हैं।

हालाँकि, हमारा मानना ​​​​है कि estimatica.pro प्रणाली में काम करते समय, बाजार विकास की डिग्री के आधार पर विश्वास अंतराल की गणना के लिए एक विधि चुनने की सलाह दी जाती है:

  • यदि बाजार अविकसित है, तो माध्यिका और मानक विचलन का उपयोग करके गणना पद्धति का उपयोग करें, क्योंकि इस मामले में सेवानिवृत्त वस्तुओं की संख्या कम है;
  • यदि बाजार विकसित हो गया है, तो टी-सांख्यिकी (छात्र गुणांक) के महत्वपूर्ण मूल्य के माध्यम से गणना लागू करें, क्योंकि एक बड़ा प्रारंभिक नमूना बनाना संभव है।

लेख तैयार करने में निम्नलिखित का उपयोग किया गया:

1. ग्रिबोव्स्की एस.वी., सिवेट्स एस.ए., लेविकिना आई.ए. संपत्ति के मूल्य का आकलन करने के लिए गणितीय तरीके। मॉस्को, 2014

2. सिस्टम डेटा estimatica.pro

विश्वास अंतराल ( अंग्रेज़ी विश्वास अंतराल) आँकड़ों में प्रयुक्त अंतराल अनुमानों के प्रकारों में से एक, जिनकी गणना किसी दिए गए महत्व स्तर के लिए की जाती है। वे हमें यह कथन करने की अनुमति देते हैं कि जनसंख्या के अज्ञात सांख्यिकीय पैरामीटर का सही मूल्य सांख्यिकीय महत्व के चयनित स्तर द्वारा निर्दिष्ट संभावना के साथ मूल्यों की प्राप्त सीमा के भीतर है।

सामान्य वितरण

जब डेटा की जनसंख्या का विचरण (σ 2) ज्ञात होता है, तो z-स्कोर का उपयोग आत्मविश्वास सीमा (विश्वास अंतराल के अंतिम बिंदु) की गणना करने के लिए किया जा सकता है। टी-वितरण का उपयोग करने की तुलना में, ज़ेड-स्कोर का उपयोग करने से आप न केवल एक संकीर्ण आत्मविश्वास अंतराल का निर्माण कर सकेंगे, बल्कि अपेक्षित मूल्य और मानक विचलन (σ) का अधिक विश्वसनीय अनुमान भी लगा सकेंगे, क्योंकि ज़ेड-स्कोर एक पर आधारित है। सामान्य वितरण।

FORMULA

विश्वास अंतराल के सीमा बिंदुओं को निर्धारित करने के लिए, बशर्ते कि डेटा की जनसंख्या का मानक विचलन ज्ञात हो, निम्नलिखित सूत्र का उपयोग किया जाता है

एल = एक्स - जेड α/2 σ
के √ N

उदाहरण

मान लें कि नमूना आकार 25 अवलोकन है, नमूना अपेक्षित मूल्य 15 है, और जनसंख्या मानक विचलन 8 है। α=5% के महत्व स्तर के लिए, Z-स्कोर Z α/2 =1.96 है। इस मामले में, विश्वास अंतराल की निचली और ऊपरी सीमाएं होंगी

एल = 15 - 1.96 8 = 11,864
√25
एल = 15 + 1.96 8 = 18,136
√25

इस प्रकार, हम कह सकते हैं कि 95% संभावना के साथ जनसंख्या की गणितीय अपेक्षा 11.864 से 18.136 की सीमा में गिर जाएगी।

विश्वास अंतराल को कम करने के तरीके

आइए मान लें कि हमारे अध्ययन के उद्देश्यों के लिए सीमा बहुत व्यापक है। कॉन्फिडेंस इंटरवल की सीमा को कम करने के दो तरीके हैं।

  1. सांख्यिकीय महत्व α का स्तर कम करें।
  2. नमूना आकार बढ़ाएँ.

सांख्यिकीय महत्व के स्तर को α=10% तक कम करने पर, हमें Z α/2 =1.64 के बराबर Z-स्कोर प्राप्त होता है। इस स्थिति में, अंतराल की निचली और ऊपरी सीमाएँ होंगी

एल = 15 - 1.64 8 = 12,376
√25
एल = 15 + 1.64 8 = 17,624
√25

और कॉन्फिडेंस इंटरवल को ही फॉर्म में लिखा जा सकता है

इस मामले में, हम यह धारणा बना सकते हैं कि 90% संभावना के साथ जनसंख्या की गणितीय अपेक्षा सीमा के भीतर आ जाएगी।

यदि हम चाहते हैं कि सांख्यिकीय महत्व α का स्तर कम न हो, तो नमूना आकार बढ़ाना ही एकमात्र विकल्प है। इसे 144 अवलोकनों तक बढ़ाने पर, हमें विश्वास सीमा के निम्नलिखित मान प्राप्त होते हैं

एल = 15 - 1.96 8 = 13,693
√144
एल = 15 + 1.96 8 = 16,307
√144

कॉन्फिडेंस इंटरवल का स्वयं निम्नलिखित रूप होगा

इस प्रकार, सांख्यिकीय महत्व के स्तर को कम किए बिना विश्वास अंतराल को कम करना केवल नमूना आकार को बढ़ाकर संभव है। यदि नमूना आकार बढ़ाना संभव नहीं है, तो सांख्यिकीय महत्व के स्तर को कम करके ही विश्वास अंतराल को कम किया जा सकता है।

सामान्य से भिन्न वितरण के लिए विश्वास अंतराल का निर्माण करना

यदि जनसंख्या का मानक विचलन ज्ञात नहीं है या वितरण सामान्य से भिन्न है, तो टी-वितरण का उपयोग आत्मविश्वास अंतराल के निर्माण के लिए किया जाता है। यह तकनीक अधिक रूढ़िवादी है, जो ज़ेड-स्कोर पर आधारित तकनीक की तुलना में व्यापक आत्मविश्वास अंतराल में परिलक्षित होती है।

FORMULA

टी-वितरण के आधार पर विश्वास अंतराल की निचली और ऊपरी सीमा की गणना करने के लिए, निम्नलिखित सूत्रों का उपयोग करें

एल = एक्स - टी α σ
के √ N

छात्र वितरण या टी-वितरण केवल एक पैरामीटर पर निर्भर करता है - स्वतंत्रता की डिग्री की संख्या, जो विशेषता के व्यक्तिगत मूल्यों की संख्या (नमूने में टिप्पणियों की संख्या) के बराबर है। स्वतंत्रता की डिग्री (एन) की दी गई संख्या और सांख्यिकीय महत्व α के स्तर के लिए छात्र के टी-टेस्ट का मूल्य संदर्भ तालिकाओं में पाया जा सकता है।

उदाहरण

मान लें कि नमूना आकार 25 व्यक्तिगत मान है, नमूना अपेक्षित मूल्य 50 है, और नमूना मानक विचलन 28 है। सांख्यिकीय महत्व α=5% के स्तर के लिए एक विश्वास अंतराल का निर्माण करना आवश्यक है।

हमारे मामले में, स्वतंत्रता की डिग्री की संख्या 24 (25-1) है, इसलिए सांख्यिकीय महत्व α=5% के स्तर के लिए छात्र के टी-टेस्ट का संबंधित तालिका मूल्य 2.064 है। इसलिए, विश्वास अंतराल की निचली और ऊपरी सीमाएं होंगी

एल = 50 - 2.064 28 = 38,442
√25
एल = 50 + 2.064 28 = 61,558
√25

और अंतराल को ही रूप में लिखा जा सकता है

इस प्रकार, हम कह सकते हैं कि 95% संभावना के साथ जनसंख्या की गणितीय अपेक्षा सीमा में होगी।

टी वितरण का उपयोग करने से आप सांख्यिकीय महत्व को कम करके या नमूना आकार को बढ़ाकर विश्वास अंतराल को कम कर सकते हैं।

हमारे उदाहरण की स्थितियों में सांख्यिकीय महत्व को 95% से घटाकर 90% करने पर, हम छात्र के टी-टेस्ट का संबंधित तालिका मान 1.711 प्राप्त करते हैं।

एल = 50 - 1.711 28 = 40,418
√25
एल = 50 + 1.711 28 = 59,582
√25

इस मामले में, हम कह सकते हैं कि 90% संभावना के साथ जनसंख्या की गणितीय अपेक्षा सीमा में होगी।

यदि हम सांख्यिकीय महत्व को कम नहीं करना चाहते हैं, तो नमूना आकार बढ़ाना ही एकमात्र विकल्प है। मान लीजिए कि यह 64 व्यक्तिगत अवलोकन हैं, न कि 25, जैसा कि उदाहरण की मूल स्थिति में है। स्वतंत्रता की 63 डिग्री (64-1) और सांख्यिकीय महत्व के स्तर α=5% के लिए छात्र के टी-टेस्ट का तालिका मूल्य 1.998 है।

एल = 50 - 1.998 28 = 43,007
√64
एल = 50 + 1.998 28 = 56,993
√64

यह हमें यह कहने की अनुमति देता है कि 95% संभावना के साथ जनसंख्या की गणितीय अपेक्षा सीमा में होगी।

बड़े नमूने

बड़े नमूने डेटा की आबादी से नमूने हैं जिनमें व्यक्तिगत अवलोकनों की संख्या 100 से अधिक है। सांख्यिकीय अध्ययनों से पता चला है कि बड़े नमूने सामान्य रूप से वितरित होते हैं, भले ही जनसंख्या का वितरण सामान्य न हो। इसके अलावा, ऐसे नमूनों के लिए, आत्मविश्वास अंतराल का निर्माण करते समय जेड-स्कोर और टी-वितरण का उपयोग लगभग समान परिणाम देता है। इस प्रकार, बड़े नमूनों के लिए, टी-वितरण के बजाय सामान्य वितरण के लिए जेड-स्कोर का उपयोग करना स्वीकार्य है।

आइए इसे संक्षेप में बताएं

विश्वास अंतराल।

विश्वास अंतराल की गणना संबंधित पैरामीटर की औसत त्रुटि पर आधारित है। विश्वास अंतराल दिखाता है कि संभाव्यता (1-ए) के साथ अनुमानित पैरामीटर का सही मूल्य किस सीमा के भीतर निहित है। यहां ए महत्व स्तर है, (1-ए) को आत्मविश्वास संभावना भी कहा जाता है।

पहले अध्याय में हमने दिखाया कि, उदाहरण के लिए, अंकगणितीय माध्य के लिए, लगभग 95% मामलों में वास्तविक जनसंख्या माध्य माध्य की 2 मानक त्रुटियों के भीतर होता है। इस प्रकार, माध्य के लिए 95% विश्वास अंतराल की सीमाएं नमूना माध्य से माध्य की माध्य त्रुटि के दोगुने से अलग हो जाएंगी, अर्थात। हम आत्मविश्वास के स्तर के आधार पर माध्य की औसत त्रुटि को एक निश्चित गुणांक से गुणा करते हैं। औसत और औसत के अंतर के लिए, छात्र गुणांक (छात्र के परीक्षण का महत्वपूर्ण मूल्य) लिया जाता है, शेयरों के शेयर और अंतर के लिए, z मानदंड का महत्वपूर्ण मूल्य लिया जाता है। गुणांक और औसत त्रुटि के उत्पाद को किसी दिए गए पैरामीटर की अधिकतम त्रुटि कहा जा सकता है, अर्थात। इसका आकलन करते समय हम अधिकतम प्राप्त कर सकते हैं।

के लिए आत्मविश्वास अंतराल अंकगणित औसत : .

यहाँ नमूना माध्य है;

अंकगणित माध्य की औसत त्रुटि;

एस -नमूना मानक विचलन;

एन

एफ = एन-1 (छात्र का गुणांक)।

के लिए आत्मविश्वास अंतराल अंकगणितीय साधनों के अंतर :

यहाँ नमूना साधनों के बीच अंतर है;

- अंकगणितीय माध्यों के बीच अंतर की औसत त्रुटि;

एस 1 , एस 2 –नमूना मानक विचलन;

n1,n2

किसी दिए गए महत्व स्तर ए और स्वतंत्रता की डिग्री की संख्या के लिए छात्र के परीक्षण का महत्वपूर्ण मूल्य एफ=एन 1 +एन 2-2 (छात्र का गुणांक)।

के लिए आत्मविश्वास अंतराल शेयरों :

.

यहाँ d नमूना अंश है;

- औसत अंश त्रुटि;

एन- नमूना आकार (समूह आकार);

के लिए आत्मविश्वास अंतराल शेयरों का अंतर :

यहाँ नमूना शेयरों में अंतर है;

- अंकगणितीय माध्यों के बीच अंतर की औसत त्रुटि;

n1,n2- नमूना मात्रा (समूहों की संख्या);

किसी दिए गए महत्व स्तर पर z मानदंड का महत्वपूर्ण मान ( , , )।

संकेतकों के बीच अंतर के लिए विश्वास अंतराल की गणना करके, हम, सबसे पहले, सीधे प्रभाव के संभावित मूल्यों को देखते हैं, न कि केवल इसके बिंदु अनुमान को। दूसरे, हम शून्य परिकल्पना की स्वीकृति या अस्वीकृति के बारे में निष्कर्ष निकाल सकते हैं और तीसरा, हम परीक्षण की शक्ति के बारे में निष्कर्ष निकाल सकते हैं।

आत्मविश्वास अंतराल का उपयोग करके परिकल्पनाओं का परीक्षण करते समय, आपको निम्नलिखित नियम का पालन करना होगा:

यदि साधनों में अंतर के 100(1-ए) प्रतिशत विश्वास अंतराल में शून्य नहीं है, तो अंतर महत्व स्तर ए पर सांख्यिकीय रूप से महत्वपूर्ण हैं; इसके विपरीत, यदि इस अंतराल में शून्य है, तो अंतर सांख्यिकीय रूप से महत्वपूर्ण नहीं हैं।

वास्तव में, यदि इस अंतराल में शून्य है, तो इसका मतलब है कि जिस संकेतक की तुलना की जा रही है वह किसी एक समूह में दूसरे की तुलना में अधिक या कम हो सकता है, अर्थात। देखे गए मतभेद संयोग के कारण हैं।

परीक्षण की शक्ति का अंदाजा विश्वास अंतराल के भीतर शून्य के स्थान से लगाया जा सकता है। यदि शून्य अंतराल की निचली या ऊपरी सीमा के करीब है, तो यह संभव है कि बड़ी संख्या में समूहों की तुलना करने पर, अंतर सांख्यिकीय महत्व तक पहुंच जाएगा। यदि शून्य अंतराल के मध्य के करीब है, तो इसका मतलब है कि प्रयोगात्मक समूह में संकेतक में वृद्धि और कमी दोनों समान रूप से होने की संभावना है, और, शायद, वास्तव में कोई अंतर नहीं है।

उदाहरण:

दो अलग-अलग प्रकार के एनेस्थीसिया का उपयोग करते समय सर्जिकल मृत्यु दर की तुलना करने के लिए: पहले प्रकार के एनेस्थीसिया से 61 लोगों का ऑपरेशन किया गया, 8 की मृत्यु हो गई, दूसरे प्रकार के एनेस्थीसिया से 67 लोगों का ऑपरेशन किया गया, 10 की मृत्यु हो गई।

डी 1 = 8/61 = 0.131; डी2 = 10/67 = 0.149; d1-d2 = - 0.018.

तुलना की गई विधियों की घातकता में अंतर 100(1-ए) = 95% की संभावना के साथ (-0.018 - 0.122; -0.018 + 0.122) या (-0.14; 0.104) की सीमा में होगा। अंतराल में शून्य होता है, अर्थात। दो अलग-अलग प्रकार के एनेस्थीसिया के साथ समान मृत्यु दर की परिकल्पना को अस्वीकार नहीं किया जा सकता है।

इस प्रकार, मृत्यु दर घटकर 14% हो सकती है और 95% की संभावना के साथ 10.4% तक बढ़ सकती है, यानी। शून्य लगभग अंतराल के मध्य में है, इसलिए यह तर्क दिया जा सकता है कि, सबसे अधिक संभावना है, ये दोनों विधियां वास्तव में घातकता में भिन्न नहीं हैं।

पहले चर्चा किए गए उदाहरण में, टैपिंग टेस्ट के दौरान औसत दबाव समय की तुलना उन छात्रों के चार समूहों में की गई थी जिनके परीक्षा स्कोर में अंतर था। आइए ग्रेड 2 और 5 के साथ परीक्षा उत्तीर्ण करने वाले छात्रों के लिए औसत दबाव समय के लिए आत्मविश्वास अंतराल और इन औसतों के बीच अंतर के लिए आत्मविश्वास अंतराल की गणना करें।

विद्यार्थी के गुणांक विद्यार्थी की वितरण तालिकाओं (परिशिष्ट देखें) का उपयोग करके पाए जाते हैं: पहले समूह के लिए: = t(0.05;48) = 2.011; दूसरे समूह के लिए: = t(0.05;61) = 2.000. इस प्रकार, पहले समूह के लिए आत्मविश्वास अंतराल: = (162.19-2.011*2.18; 162.19+2.011*2.18) = (157.8; 166.6), दूसरे समूह के लिए (156.55- 2,000*1.88; 156.55+2,000*1.88) = (152.8) ; 160.3). तो, उन लोगों के लिए जिन्होंने 2 के साथ परीक्षा उत्तीर्ण की, औसत दबाव समय 157.8 एमएस से 166.6 एमएस तक है, जिसकी संभावना 95% है, उन लोगों के लिए जिन्होंने परीक्षा 5 के साथ उत्तीर्ण की है - 152.8 एमएस से 160.3 एमएस तक, 95% की संभावना के साथ। .

आप साधनों के लिए विश्वास अंतराल का उपयोग करके भी शून्य परिकल्पना का परीक्षण कर सकते हैं, न कि केवल साधनों में अंतर के लिए। उदाहरण के लिए, जैसा कि हमारे मामले में, यदि साधनों के लिए विश्वास अंतराल ओवरलैप होता है, तो शून्य परिकल्पना को अस्वीकार नहीं किया जा सकता है। किसी चुने गए महत्व स्तर पर किसी परिकल्पना को अस्वीकार करने के लिए, संबंधित आत्मविश्वास अंतराल को ओवरलैप नहीं करना चाहिए।

आइए ग्रेड 2 और 5 के साथ परीक्षा उत्तीर्ण करने वाले समूहों में औसत दबाव समय के अंतर के लिए आत्मविश्वास अंतराल खोजें। औसत का अंतर: 162.19 - 156.55 = 5.64। विद्यार्थी का गुणांक: = t(0.05;49+62-2) = t(0.05;109) = 1.982. समूह मानक विचलन इसके बराबर होंगे: ; . हम माध्यों के बीच अंतर की औसत त्रुटि की गणना करते हैं:। आत्मविश्वास अंतराल: =(5.64-1.982*2.87; 5.64+1.982*2.87) = (-0.044; 11.33)।

तो, 2 और 5 के साथ परीक्षा उत्तीर्ण करने वाले समूहों में औसत दबाव समय का अंतर -0.044 एमएस से 11.33 एमएस तक होगा। इस अंतराल में शून्य शामिल है, अर्थात। जो लोग अच्छी तरह से परीक्षा उत्तीर्ण कर चुके हैं उनके लिए औसत दबाव समय या तो बढ़ सकता है या उन लोगों की तुलना में घट सकता है जिन्होंने परीक्षा असंतोषजनक रूप से उत्तीर्ण की है, यानी। शून्य परिकल्पना को अस्वीकार नहीं किया जा सकता। लेकिन शून्य निचली सीमा के बहुत करीब है, और जो लोग अच्छी तरह से उत्तीर्ण हुए उनके लिए दबाव का समय कम होने की अधिक संभावना है। इस प्रकार, हम यह निष्कर्ष निकाल सकते हैं कि 2 और 5 उत्तीर्ण करने वालों के बीच दबाव के औसत समय में अभी भी अंतर हैं, हम औसत समय में परिवर्तन, औसत समय के प्रसार और नमूना आकार को देखते हुए उनका पता नहीं लगा सके।



एक परीक्षण की शक्ति एक गलत शून्य परिकल्पना को अस्वीकार करने की संभावना है, अर्थात। अंतर ढूंढें जहां वे वास्तव में मौजूद हैं।

परीक्षण की शक्ति महत्व के स्तर, समूहों के बीच अंतर के परिमाण, समूहों में मूल्यों के प्रसार और नमूनों के आकार के आधार पर निर्धारित की जाती है।

विद्यार्थी के परीक्षण और विचरण के विश्लेषण के लिए, संवेदनशीलता आरेखों का उपयोग किया जा सकता है।

मानदंड की शक्ति का उपयोग समूहों की आवश्यक संख्या को प्रारंभिक रूप से निर्धारित करने के लिए किया जा सकता है।

आत्मविश्वास अंतराल दिखाता है कि किसी दी गई संभावना के साथ अनुमानित पैरामीटर का वास्तविक मान किस सीमा के भीतर निहित है।

आत्मविश्वास अंतराल का उपयोग करके, आप सांख्यिकीय परिकल्पनाओं का परीक्षण कर सकते हैं और मानदंडों की संवेदनशीलता के बारे में निष्कर्ष निकाल सकते हैं।

साहित्य।

ग्लैंज़ एस. - अध्याय 6,7.

रेब्रोवा ओ.यू. - पृ.112-114, पृ.171-173, पृ.234-238.

सिडोरेंको ई.वी. - पृष्ठ 32-33।

छात्रों के आत्म-परीक्षण के लिए प्रश्न।

1. कसौटी की शक्ति क्या है?

2. किन मामलों में मानदंड की शक्ति का मूल्यांकन करना आवश्यक है?

3. शक्ति की गणना के तरीके.

6. आत्मविश्वास अंतराल का उपयोग करके सांख्यिकीय परिकल्पना का परीक्षण कैसे करें?

7. विश्वास अंतराल की गणना करते समय मानदंड की शक्ति के बारे में क्या कहा जा सकता है?

कार्य.

गणितीय अपेक्षा के लिए विश्वास अंतराल - यह डेटा से गणना किया गया एक अंतराल है, जिसमें ज्ञात संभावना के साथ, सामान्य जनसंख्या की गणितीय अपेक्षा शामिल होती है। गणितीय अपेक्षा के लिए एक प्राकृतिक अनुमान उसके देखे गए मूल्यों का अंकगणितीय माध्य है। इसलिए, पूरे पाठ में हम "औसत" और "औसत मूल्य" शब्दों का उपयोग करेंगे। आत्मविश्वास अंतराल की गणना करने की समस्याओं में, सबसे अधिक बार एक उत्तर की आवश्यकता होती है जैसे "औसत संख्या का आत्मविश्वास अंतराल [किसी विशेष समस्या में मूल्य] [छोटे मूल्य] से [बड़े मूल्य] तक होता है।" आत्मविश्वास अंतराल का उपयोग करके, आप न केवल औसत मूल्यों का मूल्यांकन कर सकते हैं, बल्कि सामान्य जनसंख्या की किसी विशेष विशेषता के अनुपात का भी मूल्यांकन कर सकते हैं। औसत मान, फैलाव, मानक विचलन और त्रुटि, जिसके माध्यम से हम नई परिभाषाओं और सूत्रों पर पहुंचेंगे, पाठ में चर्चा की गई है नमूने और जनसंख्या के लक्षण .

माध्य के बिंदु और अंतराल अनुमान

यदि जनसंख्या के औसत मूल्य का अनुमान किसी संख्या (बिंदु) द्वारा लगाया जाता है, तो एक विशिष्ट औसत, जिसकी गणना टिप्पणियों के नमूने से की जाती है, को जनसंख्या के अज्ञात औसत मूल्य के अनुमान के रूप में लिया जाता है। इस मामले में, नमूना माध्य का मान - एक यादृच्छिक चर - सामान्य जनसंख्या के माध्य मान से मेल नहीं खाता है। इसलिए, नमूना माध्य इंगित करते समय, आपको साथ ही नमूना त्रुटि भी इंगित करनी होगी। नमूनाकरण त्रुटि का माप मानक त्रुटि है, जिसे माध्य के समान इकाइयों में व्यक्त किया जाता है। इसलिए, निम्नलिखित संकेतन का अक्सर उपयोग किया जाता है: .

यदि औसत के अनुमान को एक निश्चित संभाव्यता के साथ जोड़ने की आवश्यकता है, तो जनसंख्या में रुचि के पैरामीटर का आकलन एक संख्या से नहीं, बल्कि एक अंतराल द्वारा किया जाना चाहिए। एक विश्वास अंतराल एक ऐसा अंतराल है जिसमें, एक निश्चित संभावना के साथ पीअनुमानित जनसंख्या सूचक का मान ज्ञात किया जाता है। कॉन्फिडेंस इंटरवल जिसमें यह संभावित है पी = 1 - α यादृच्छिक चर पाया जाता है, जिसकी गणना निम्नानुसार की जाती है:

,

α = 1 - पी, जो सांख्यिकी पर लगभग किसी भी पुस्तक के परिशिष्ट में पाया जा सकता है।

व्यवहार में, जनसंख्या माध्य और विचरण ज्ञात नहीं हैं, इसलिए जनसंख्या विचरण को नमूना विचरण से और जनसंख्या माध्य को नमूना माध्य से प्रतिस्थापित कर दिया जाता है। इस प्रकार, अधिकांश मामलों में विश्वास अंतराल की गणना निम्नानुसार की जाती है:

.

जनसंख्या माध्य का अनुमान लगाने के लिए आत्मविश्वास अंतराल सूत्र का उपयोग किया जा सकता है

  • जनसंख्या का मानक विचलन ज्ञात है;
  • या जनसंख्या का मानक विचलन अज्ञात है, लेकिन नमूना आकार 30 से अधिक है।

नमूना माध्य जनसंख्या माध्य का निष्पक्ष अनुमान है। बदले में, नमूना विचरण जनसंख्या भिन्नता का निष्पक्ष अनुमान नहीं है। नमूना विचरण सूत्र, नमूना आकार में जनसंख्या विचरण का निष्पक्ष अनुमान प्राप्त करने के लिए एनद्वारा प्रतिस्थापित किया जाना चाहिए एन-1.

उदाहरण 1।एक निश्चित शहर में यादृच्छिक रूप से चुने गए 100 कैफे से जानकारी एकत्र की गई कि उनमें कर्मचारियों की औसत संख्या 4.6 के मानक विचलन के साथ 10.5 है। कैफे कर्मचारियों की संख्या के लिए 95% विश्वास अंतराल निर्धारित करें।

महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य कहां है α = 0,05 .

इस प्रकार, कैफे कर्मचारियों की औसत संख्या के लिए 95% विश्वास अंतराल 9.6 से 11.4 तक था।

उदाहरण 2. 64 अवलोकनों की जनसंख्या से एक यादृच्छिक नमूने के लिए, निम्नलिखित कुल मूल्यों की गणना की गई:

प्रेक्षणों में मानों का योग,

औसत से मूल्यों के वर्ग विचलन का योग .

गणितीय अपेक्षा के लिए 95% विश्वास अंतराल की गणना करें।

आइए मानक विचलन की गणना करें:

,

आइए औसत मूल्य की गणना करें:

.

हम आत्मविश्वास अंतराल के लिए अभिव्यक्ति में मानों को प्रतिस्थापित करते हैं:

महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य कहां है α = 0,05 .

हम पाते हैं:

इस प्रकार, इस नमूने की गणितीय अपेक्षा के लिए 95% विश्वास अंतराल 7.484 से 11.266 तक था।

उदाहरण 3. 100 अवलोकनों के यादृच्छिक जनसंख्या नमूने के लिए, परिकलित माध्य 15.2 है और मानक विचलन 3.2 है। अपेक्षित मूल्य के लिए 95% विश्वास अंतराल की गणना करें, फिर 99% विश्वास अंतराल की। यदि नमूना शक्ति और इसकी भिन्नता अपरिवर्तित रहती है और आत्मविश्वास गुणांक बढ़ता है, तो क्या आत्मविश्वास अंतराल संकीर्ण या चौड़ा होगा?

हम इन मानों को विश्वास अंतराल के लिए अभिव्यक्ति में प्रतिस्थापित करते हैं:

महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य कहां है α = 0,05 .

हम पाते हैं:

.

इस प्रकार, इस नमूने के माध्य के लिए 95% विश्वास अंतराल 14.57 से 15.82 तक था।

हम फिर से इन मानों को विश्वास अंतराल के लिए अभिव्यक्ति में प्रतिस्थापित करते हैं:

महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य कहां है α = 0,01 .

हम पाते हैं:

.

इस प्रकार, इस नमूने के माध्य के लिए 99% विश्वास अंतराल 14.37 से 16.02 तक था।

जैसा कि हम देखते हैं, जैसे-जैसे विश्वास गुणांक बढ़ता है, मानक सामान्य वितरण का महत्वपूर्ण मूल्य भी बढ़ता है, और परिणामस्वरूप, अंतराल के शुरुआती और समाप्ति बिंदु माध्य से आगे स्थित होते हैं, और इस प्रकार गणितीय अपेक्षा के लिए विश्वास अंतराल बढ़ता है .

विशिष्ट गुरुत्व के बिंदु और अंतराल अनुमान

कुछ नमूना विशेषता के हिस्से की व्याख्या शेयर के बिंदु अनुमान के रूप में की जा सकती है पीसामान्य जनसंख्या में समान विशेषताएँ। यदि इस मान को संभाव्यता के साथ संबद्ध करने की आवश्यकता है, तो विशिष्ट गुरुत्व के विश्वास अंतराल की गणना की जानी चाहिए पीसंभाव्यता के साथ जनसंख्या में विशेषता पी = 1 - α :

.

उदाहरण 4.किसी शहर में दो उम्मीदवार हैं और बीमेयर के लिए दौड़ रहे हैं. 200 शहर निवासियों का यादृच्छिक सर्वेक्षण किया गया, जिनमें से 46% ने जवाब दिया कि वे उम्मीदवार को वोट देंगे , 26% - उम्मीदवार के लिए बीऔर 28% को नहीं पता कि वे किसे वोट देंगे। उम्मीदवार का समर्थन करने वाले शहर निवासियों के अनुपात के लिए 95% विश्वास अंतराल निर्धारित करें .

कोई भी नमूना केवल सामान्य जनसंख्या का एक अनुमानित विचार देता है, और सभी नमूना सांख्यिकीय विशेषताएँ (माध्य, मोड, विचरण...) कुछ सन्निकटन हैं या कहें कि सामान्य मापदंडों का एक अनुमान है, जिसकी ज्यादातर मामलों में गणना करना संभव नहीं है। सामान्य जनसंख्या की दुर्गमता के लिए (चित्र 20)।

चित्र 20. नमूनाकरण त्रुटि

लेकिन आप उस अंतराल को निर्दिष्ट कर सकते हैं जिसमें, एक निश्चित डिग्री की संभावना के साथ, सांख्यिकीय विशेषता का सही (सामान्य) मान निहित है। इस अंतराल को कहा जाता है डी आत्मविश्वास अंतराल (सीआई)।

तो 95% की संभावना के साथ सामान्य औसत मूल्य भीतर निहित है

से, (20)

कहाँ टी - छात्र के परीक्षण का तालिका मूल्य α =0.05 और एफ= एन-1

इस मामले में 99% सीआई भी पाया जा सकता है टी के लिए चयनित α =0,01.

कॉन्फिडेंस इंटरवल का व्यावहारिक महत्व क्या है?

    एक विस्तृत आत्मविश्वास अंतराल इंगित करता है कि नमूना माध्य जनसंख्या माध्य को सटीक रूप से प्रतिबिंबित नहीं करता है। यह आमतौर पर अपर्याप्त नमूना आकार, या इसकी विविधता के कारण होता है, अर्थात। बड़ा फैलाव. दोनों माध्य की एक बड़ी त्रुटि देते हैं और तदनुसार, एक व्यापक सीआई देते हैं। और यही अनुसंधान योजना चरण पर लौटने का आधार है।

    सीआई की ऊपरी और निचली सीमाएं यह अनुमान प्रदान करती हैं कि परिणाम चिकित्सकीय रूप से महत्वपूर्ण होंगे या नहीं

आइए समूह गुणों के अध्ययन के परिणामों के सांख्यिकीय और नैदानिक ​​​​महत्व के प्रश्न पर कुछ विस्तार से ध्यान दें। आइए याद रखें कि सांख्यिकी का कार्य नमूना डेटा के आधार पर सामान्य आबादी में कम से कम कुछ अंतरों का पता लगाना है। चिकित्सकों के लिए चुनौती अंतर का पता लगाना है (सिर्फ कोई नहीं) जो निदान या उपचार में सहायता करेगा। और सांख्यिकीय निष्कर्ष हमेशा नैदानिक ​​​​निष्कर्षों का आधार नहीं होते हैं। इस प्रकार, हीमोग्लोबिन में 3 ग्राम/लीटर की सांख्यिकीय रूप से महत्वपूर्ण कमी चिंता का कारण नहीं है। और, इसके विपरीत, यदि मानव शरीर में कोई समस्या पूरी आबादी के स्तर पर व्यापक नहीं है, तो यह इस समस्या से न निपटने का कोई कारण नहीं है।

आइए इस स्थिति पर नजर डालें उदाहरण.

शोधकर्ताओं को आश्चर्य हुआ कि क्या जो लड़के किसी प्रकार की संक्रामक बीमारी से पीड़ित हैं, वे विकास में अपने साथियों से पीछे रह जाते हैं। इस उद्देश्य के लिए, एक नमूना अध्ययन किया गया जिसमें इस बीमारी से पीड़ित 10 लड़कों ने भाग लिया। परिणाम तालिका 23 में प्रस्तुत किए गए हैं।

तालिका 23. सांख्यिकीय प्रसंस्करण के परिणाम

निचली सीमा

ऊपरी सीमा

मानक (सेमी)

औसत

इन गणनाओं से यह पता चलता है कि किसी संक्रामक बीमारी से पीड़ित 10 वर्षीय लड़कों की नमूना औसत ऊंचाई सामान्य (132.5 सेमी) के करीब है। हालाँकि, आत्मविश्वास अंतराल की निचली सीमा (126.6 सेमी) इंगित करती है कि 95% संभावना है कि इन बच्चों की वास्तविक औसत ऊंचाई "छोटी ऊंचाई" की अवधारणा से मेल खाती है, अर्थात। ये बच्चे अविकसित हैं।

इस उदाहरण में, विश्वास अंतराल गणना के परिणाम चिकित्सकीय रूप से महत्वपूर्ण हैं।

श्रेणियाँ

लोकप्रिय लेख

2023 "kingad.ru" - मानव अंगों की अल्ट्रासाउंड जांच