चूंकि नया वेरिएबल सामान्य रूप से वितरित किया जाता है, वेरिएबल φ के लिए 95% विश्वास अंतराल की निचली और ऊपरी सीमाएं φ-1.96 और φ+1.96left"> होंगी

छोटे नमूनों के लिए 1.96 के बजाय, स्वतंत्रता की एन-1 डिग्री के लिए टी मान को प्रतिस्थापित करने की सिफारिश की जाती है। यह विधि नकारात्मक मान उत्पन्न नहीं करती है और वाल्ड विधि की तुलना में आवृत्तियों के लिए विश्वास अंतराल के अधिक सटीक अनुमान की अनुमति देती है। इसके अलावा, चिकित्सा सांख्यिकी पर कई घरेलू संदर्भ पुस्तकों में इसका वर्णन किया गया है, हालांकि, चिकित्सा अनुसंधान में इसका व्यापक उपयोग नहीं हुआ है। कोणीय परिवर्तन का उपयोग करके आत्मविश्वास अंतराल की गणना 0 या 1 के करीब आने वाली आवृत्तियों के लिए अनुशंसित नहीं है।

यहीं पर चिकित्सा शोधकर्ताओं के लिए सांख्यिकी की बुनियादी बातों पर अधिकांश पुस्तकों में आत्मविश्वास अंतराल का आकलन करने के तरीकों का वर्णन आमतौर पर समाप्त होता है, और यह समस्या न केवल घरेलू बल्कि विदेशी साहित्य के लिए भी विशिष्ट है। दोनों विधियाँ केंद्रीय सीमा प्रमेय पर आधारित हैं, जिसका तात्पर्य एक बड़े नमूने से है।

उपरोक्त विधियों का उपयोग करके आत्मविश्वास अंतराल का अनुमान लगाने की कमियों को ध्यान में रखते हुए, क्लॉपर और पियर्सन ने 1934 में अध्ययन किए जा रहे गुण के द्विपद वितरण को देखते हुए, तथाकथित सटीक आत्मविश्वास अंतराल की गणना करने के लिए एक विधि प्रस्तावित की। यह विधि कई ऑनलाइन कैलकुलेटर में उपलब्ध है, लेकिन इस तरह से प्राप्त विश्वास अंतराल ज्यादातर मामलों में बहुत व्यापक है। साथ ही, इस पद्धति को उन मामलों में उपयोग के लिए अनुशंसित किया जाता है जहां रूढ़िवादी मूल्यांकन आवश्यक है। जैसे-जैसे नमूना आकार घटता जाता है, विधि की रूढ़िवादिता की डिग्री बढ़ती जाती है, विशेषकर जब एन< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

कई सांख्यिकीविदों के अनुसार, आवृत्तियों के लिए आत्मविश्वास अंतराल का सबसे इष्टतम मूल्यांकन विल्सन विधि द्वारा किया जाता है, जिसे 1927 में प्रस्तावित किया गया था, लेकिन व्यावहारिक रूप से घरेलू बायोमेडिकल अनुसंधान में इसका उपयोग नहीं किया जाता है। यह विधि न केवल बहुत छोटी और बहुत बड़ी दोनों आवृत्तियों के लिए विश्वास अंतराल का अनुमान लगाने की अनुमति देती है, बल्कि कम संख्या में अवलोकनों के लिए भी लागू होती है। सामान्य तौर पर, विल्सन के सूत्र के अनुसार आत्मविश्वास अंतराल का रूप होता है

विश्वास अंतराल की संभावना क्या है? विश्वास अंतराल

बुद्धिमत्ता केवल ज्ञान में ही नहीं, बल्कि ज्ञान को व्यवहार में लागू करने की क्षमता में भी समाहित होती है। (अरस्तू)

विश्वास अंतराल

सामान्य समीक्षा

जनसंख्या से एक नमूना लेकर, हम रुचि के पैरामीटर का एक बिंदु अनुमान प्राप्त करते हैं और अनुमान की सटीकता को इंगित करने के लिए मानक त्रुटि की गणना करते हैं।

हालाँकि, अधिकांश मामलों में मानक त्रुटि स्वीकार्य नहीं है। जनसंख्या पैरामीटर के लिए अंतराल अनुमान के साथ सटीकता के इस माप को जोड़ना अधिक उपयोगी है।

यह पैरामीटर के लिए कॉन्फिडेंस इंटरवल (सीआई - कॉन्फिडेंस इंटरवल, सीआई - कॉन्फिडेंस इंटरवल) की गणना करने के लिए नमूना आंकड़े (पैरामीटर) के सैद्धांतिक संभाव्यता वितरण के ज्ञान का उपयोग करके किया जा सकता है।

सामान्य तौर पर, एक आत्मविश्वास अंतराल मानक त्रुटि (किसी दिए गए पैरामीटर के) के एक निश्चित गुणक द्वारा दोनों दिशाओं में अनुमान बढ़ाता है; अंतराल को परिभाषित करने वाले दो मान (विश्वास सीमाएँ) आमतौर पर अल्पविराम से अलग किए जाते हैं और कोष्ठक में संलग्न होते हैं।

माध्य के लिए विश्वास अंतराल

सामान्य वितरण का उपयोग करना

यदि नमूना आकार बड़ा है तो नमूना माध्य सामान्य रूप से वितरित किया जाता है, इसलिए आप नमूना माध्य पर विचार करते समय सामान्य वितरण का ज्ञान लागू कर सकते हैं।

विशेष रूप से, नमूना साधनों का 95% वितरण जनसंख्या माध्य के 1.96 मानक विचलन (एसडी) के भीतर है।

जब हमारे पास केवल एक नमूना होता है, तो हम इसे माध्य (एसईएम) की मानक त्रुटि कहते हैं और माध्य के लिए 95% विश्वास अंतराल की गणना निम्नानुसार करते हैं:

यदि हम इस प्रयोग को कई बार दोहराते हैं, तो अंतराल में 95% समय में वास्तविक जनसंख्या शामिल होगी।

आमतौर पर यह एक आत्मविश्वास अंतराल है, जैसे मूल्यों का अंतराल जिसके भीतर वास्तविक जनसंख्या माध्य (सामान्य माध्य) 95% विश्वास संभावना के साथ निहित होता है।

हालाँकि इस तरह से आत्मविश्वास अंतराल की व्याख्या करना पूरी तरह से कठोर नहीं है (जनसंख्या माध्य एक निश्चित मूल्य है और इसलिए इसके साथ कोई संभावना नहीं जुड़ी हो सकती है), इसे समझना वैचारिक रूप से आसान है।

प्रयोग टी-वितरण

यदि आप जनसंख्या में भिन्नता का मान जानते हैं तो आप सामान्य वितरण का उपयोग कर सकते हैं। इसके अलावा, जब नमूना आकार छोटा होता है, तो नमूना माध्य सामान्य वितरण का अनुसरण करता है यदि अंतर्निहित जनसंख्या डेटा सामान्य रूप से वितरित किया जाता है।

यदि जनसंख्या के अंतर्निहित डेटा को सामान्य रूप से वितरित नहीं किया जाता है और/या जनसंख्या भिन्नता अज्ञात है, तो नमूना माध्य का पालन किया जाता है विद्यार्थी का टी-वितरण.

हम सामान्य जनसंख्या माध्य के लिए 95% विश्वास अंतराल की गणना इस प्रकार करते हैं:

प्रतिशत बिंदु (प्रतिशतक) कहां है टी-विद्यार्थी का t वितरण (n-1) स्वतंत्रता की डिग्री के साथ, जो 0.05 की दो-तरफा संभावना देता है।

सामान्य तौर पर, यह सामान्य वितरण का उपयोग करने की तुलना में व्यापक रेंज प्रदान करता है क्योंकि यह जनसंख्या मानक विचलन का अनुमान लगाने और/या छोटे नमूना आकार के कारण उत्पन्न अतिरिक्त अनिश्चितता को ध्यान में रखता है।

जब नमूना आकार बड़ा होता है (100 या अधिक के क्रम पर), तो दो वितरणों के बीच अंतर ( टी छात्रऔर सामान्य) नगण्य है। हालाँकि, वे हमेशा उपयोग करते हैं टी-विश्वास अंतराल की गणना करते समय वितरण, भले ही नमूना आकार बड़ा हो।

आमतौर पर 95% सीआई की सूचना दी जाती है। अन्य आत्मविश्वास अंतरालों की गणना की जा सकती है, जैसे माध्य के लिए 99% सीआई।

मानक त्रुटि और तालिका मान के उत्पाद के बजाय टी-वितरण, जो 0.05 की दो-तरफा संभावना से मेल खाता है, इसे (मानक त्रुटि) उस मान से गुणा करें जो 0.01 की दो-तरफा संभावना से मेल खाता है। यह 95% विश्वास अंतराल की तुलना में एक व्यापक आत्मविश्वास अंतराल है क्योंकि यह बढ़े हुए आत्मविश्वास को दर्शाता है कि अंतराल में वास्तव में जनसंख्या माध्य शामिल है।

अनुपात के लिए विश्वास अंतराल

अनुपातों के नमूना वितरण में द्विपद वितरण होता है। हालाँकि, यदि नमूना आकार एनयथोचित रूप से बड़ा है, तो अनुपात का नमूना वितरण माध्य के साथ लगभग सामान्य है।

हम चयनात्मक अनुपात द्वारा मूल्यांकन करते हैं पी=आर/एन(कहाँ आर- नमूने में हमारे लिए रुचि की विशिष्ट विशेषताओं वाले व्यक्तियों की संख्या), और मानक त्रुटि का अनुमान लगाया गया है:

अनुपात के लिए 95% विश्वास अंतराल अनुमानित है:

यदि नमूना आकार छोटा है (आमतौर पर जब एन.पी.या एन(1-पी)कम 5 ), तो सटीक आत्मविश्वास अंतराल की गणना करने के लिए द्विपद वितरण का उपयोग करना आवश्यक है।

ध्यान दें कि यदि पीफिर, प्रतिशत के रूप में व्यक्त किया गया (1-पी)द्वारा प्रतिस्थापित (100-पी).

आत्मविश्वास अंतराल की व्याख्या

आत्मविश्वास अंतराल की व्याख्या करते समय, हम निम्नलिखित प्रश्नों में रुचि रखते हैं:

आत्मविश्वास अंतराल कितना चौड़ा है?

एक विस्तृत विश्वास अंतराल इंगित करता है कि अनुमान सटीक नहीं है; संकीर्ण एक सटीक अनुमान इंगित करता है।

विश्वास अंतराल की चौड़ाई मानक त्रुटि के आकार पर निर्भर करती है, जो बदले में नमूना आकार पर निर्भर करती है और, संख्यात्मक चर पर विचार करते समय, डेटा की परिवर्तनशीलता कुछ चर के बड़े डेटा सेट के अध्ययन की तुलना में व्यापक विश्वास अंतराल उत्पन्न करती है। .

क्या सीआई में विशेष रुचि का कोई मूल्य शामिल है?

आप जांच सकते हैं कि जनसंख्या पैरामीटर का संभावित मान विश्वास अंतराल के अंतर्गत आता है या नहीं। यदि हां, तो परिणाम इस संभावित मूल्य के अनुरूप हैं। यदि नहीं, तो यह संभावना नहीं है (95% विश्वास अंतराल के लिए संभावना लगभग 5% है) कि पैरामीटर में वह मान है।

"कैटरेन-स्टाइल" चिकित्सा सांख्यिकी पर कॉन्स्टेंटिन क्रावचिक की श्रृंखला का प्रकाशन जारी रखता है। पिछले दो लेखों में, लेखक ने और जैसी अवधारणाओं की व्याख्या की है।

कॉन्स्टेंटिन क्रावचिक

गणितज्ञ-विश्लेषक. चिकित्सा और मानविकी में सांख्यिकीय अनुसंधान में विशेषज्ञ

मास्को शहर

अक्सर नैदानिक ​​​​अध्ययनों पर लेखों में आप एक रहस्यमय वाक्यांश पा सकते हैं: "आत्मविश्वास अंतराल" (95 % सीआई या 95 % सीआई - आत्मविश्वास अंतराल)। उदाहरण के लिए, एक लेख लिख सकता है: "मतभेदों के महत्व का आकलन करने के लिए, 95 % आत्मविश्वास अंतराल की गणना करने के लिए छात्र के टी-टेस्ट का उपयोग किया गया था।"

"95 % विश्वास अंतराल" का मूल्य क्या है और इसकी गणना क्यों करें?

कॉन्फिडेंस इंटरवल क्या है? - यह वह सीमा है जिसके भीतर सच्ची जनसंख्या का मतलब झूठ होता है। क्या कोई "असत्य" औसत हैं? एक अर्थ में, हाँ, वे करते हैं। हमने समझाया कि पूरी आबादी में रुचि के पैरामीटर को मापना असंभव है, इसलिए शोधकर्ता सीमित नमूने से संतुष्ट हैं। इस नमूने में (उदाहरण के लिए, शरीर के वजन के आधार पर) एक औसत मूल्य (एक निश्चित वजन) होता है, जिसके द्वारा हम पूरी आबादी में औसत मूल्य का आकलन करते हैं। हालाँकि, यह संभावना नहीं है कि किसी नमूने (विशेष रूप से छोटे) में औसत वजन सामान्य आबादी में औसत वजन के साथ मेल खाएगा। इसलिए, जनसंख्या के औसत मूल्यों की सीमा की गणना और उपयोग करना अधिक सही है।

उदाहरण के लिए, कल्पना करें कि हीमोग्लोबिन के लिए 95% आत्मविश्वास अंतराल (95% सीआई) 110 से 122 ग्राम/लीटर है। इसका मतलब यह है कि 95% संभावना है कि जनसंख्या में वास्तविक औसत हीमोग्लोबिन मान 110 और 122 ग्राम/लीटर के बीच होगा। दूसरे शब्दों में, हम जनसंख्या में औसत हीमोग्लोबिन मान नहीं जानते हैं, लेकिन हम 95 % संभावना के साथ, इस विशेषता के लिए मूल्यों की एक श्रृंखला का संकेत दे सकते हैं।

कॉन्फिडेंस अंतराल विशेष रूप से समूहों के बीच साधनों में अंतर, या प्रभाव आकार, जैसा कि उन्हें कहा जाता है, के लिए प्रासंगिक हैं।

मान लीजिए कि हमने दो लौह तैयारियों की प्रभावशीलता की तुलना की: एक जो लंबे समय से बाजार में है और एक जो अभी पंजीकृत हुई है। चिकित्सा के पाठ्यक्रम के बाद, हमने रोगियों के अध्ययन किए गए समूहों में हीमोग्लोबिन एकाग्रता का आकलन किया, और सांख्यिकीय कार्यक्रम ने गणना की कि दोनों समूहों के औसत मूल्यों के बीच का अंतर, 95 % संभावना के साथ, 1.72 से लेकर 14.36 ग्राम/लीटर (तालिका 1)।

मेज़ 1. स्वतंत्र नमूनों का परीक्षण करें
(समूहों की तुलना हीमोग्लोबिन स्तर से की जाती है)

इसकी व्याख्या इस प्रकार की जानी चाहिए: सामान्य आबादी के कुछ मरीज़ जो नई दवा लेते हैं, उनमें हीमोग्लोबिन उन लोगों की तुलना में औसतन 1.72-14.36 ग्राम/लीटर अधिक होगा, जिन्होंने पहले से ज्ञात दवा ली थी।

दूसरे शब्दों में, सामान्य आबादी में, समूहों के बीच औसत हीमोग्लोबिन मूल्यों में अंतर 95% संभावना के साथ इन सीमाओं के भीतर है। यह शोधकर्ता पर निर्भर करेगा कि वह यह तय करे कि यह बहुत है या थोड़ा। इन सबका मुद्दा यह है कि हम एक औसत मूल्य के साथ काम नहीं कर रहे हैं, बल्कि मूल्यों की एक श्रृंखला के साथ काम कर रहे हैं, इसलिए, हम समूहों के बीच एक पैरामीटर में अंतर का अधिक विश्वसनीय रूप से अनुमान लगाते हैं।

सांख्यिकीय पैकेजों में, शोधकर्ता के विवेक पर, आप आत्मविश्वास अंतराल की सीमाओं को स्वतंत्र रूप से संकीर्ण या विस्तारित कर सकते हैं। विश्वास अंतराल संभावनाओं को कम करके, हम साधनों की सीमा को सीमित करते हैं। उदाहरण के लिए, 90 % CI पर साधनों की सीमा (या साधनों में अंतर) 95 % से कम होगी।

इसके विपरीत, संभावना को 99 % तक बढ़ाने से मानों की सीमा का विस्तार होता है। समूहों की तुलना करते समय, सीआई की निचली सीमा शून्य अंक को पार कर सकती है। उदाहरण के लिए, यदि हमने कॉन्फिडेंस अंतराल की सीमाओं को 99 % तक विस्तारित किया, तो अंतराल की सीमाएं -1 से 16 ग्राम/लीटर तक थीं। इसका मतलब यह है कि सामान्य आबादी में ऐसे समूह होते हैं, जिनके बीच अध्ययन की जा रही विशेषता के बीच का अंतर 0 (एम = 0) के बराबर होता है।

आत्मविश्वास अंतराल का उपयोग करके, आप सांख्यिकीय परिकल्पनाओं का परीक्षण कर सकते हैं। यदि विश्वास अंतराल शून्य मान को पार कर जाता है, तो शून्य परिकल्पना, जो मानती है कि समूह अध्ययन किए जा रहे पैरामीटर पर भिन्न नहीं हैं, सत्य है। उदाहरण ऊपर वर्णित है जहां हमने सीमाओं को 99 % तक विस्तारित किया है। सामान्य आबादी में कहीं-कहीं हमें ऐसे समूह मिले जो किसी भी तरह से भिन्न नहीं थे।

हीमोग्लोबिन में अंतर का 95% आत्मविश्वास अंतराल, (जी/एल)


यह आंकड़ा दो समूहों के बीच औसत हीमोग्लोबिन मूल्यों में अंतर के लिए 95% विश्वास अंतराल दिखाता है। रेखा शून्य चिह्न से होकर गुजरती है, इसलिए शून्य के माध्य में अंतर होता है, जो शून्य परिकल्पना की पुष्टि करता है कि समूहों में अंतर नहीं है। समूहों के बीच अंतर की सीमा -2 से 5 ग्राम/लीटर तक है। इसका मतलब है कि हीमोग्लोबिन या तो 2 ग्राम/लीटर तक घट सकता है या 5 ग्राम/लीटर तक बढ़ सकता है।

कॉन्फिडेंस इंटरवल एक बहुत ही महत्वपूर्ण संकेतक है। इसके लिए धन्यवाद, आप देख सकते हैं कि समूहों में अंतर वास्तव में साधनों में अंतर के कारण था या बड़े नमूने के कारण, क्योंकि बड़े नमूने में अंतर खोजने की संभावना छोटे नमूने की तुलना में अधिक होती है।

व्यवहार में यह इस तरह दिख सकता है. हमने 1000 लोगों का एक नमूना लिया, हीमोग्लोबिन के स्तर को मापा और पाया कि साधनों में अंतर के लिए आत्मविश्वास अंतराल 1.2 से 1.5 ग्राम/लीटर तक था। इस मामले में सांख्यिकीय महत्व का स्तर पी

हम देखते हैं कि हीमोग्लोबिन एकाग्रता में वृद्धि हुई है, लेकिन लगभग अगोचर रूप से, इसलिए, नमूना आकार के कारण सांख्यिकीय महत्व सटीक रूप से दिखाई दिया।

कॉन्फिडेंस अंतराल की गणना न केवल साधनों के लिए की जा सकती है, बल्कि अनुपात (और जोखिम अनुपात) के लिए भी की जा सकती है। उदाहरण के लिए, हम उन रोगियों के अनुपात के विश्वास अंतराल में रुचि रखते हैं जिन्होंने एक विकसित दवा लेते समय छूट प्राप्त की। आइए मान लें कि अनुपात के लिए 95 % सीआई, यानी ऐसे रोगियों के अनुपात के लिए, 0.60–0.80 की सीमा में है। इस प्रकार, हम कह सकते हैं कि हमारी दवा 60 से 80 % मामलों में चिकित्सीय प्रभाव डालती है।

कोई भी नमूना केवल सामान्य जनसंख्या का एक अनुमानित विचार देता है, और सभी नमूना सांख्यिकीय विशेषताएँ (माध्य, मोड, विचरण...) कुछ सन्निकटन हैं या कहें कि सामान्य मापदंडों का एक अनुमान है, जिसकी ज्यादातर मामलों में गणना करना संभव नहीं है। सामान्य जनसंख्या की दुर्गमता के लिए (चित्र 20)।

चित्र 20. नमूनाकरण त्रुटि

लेकिन आप उस अंतराल को निर्दिष्ट कर सकते हैं जिसमें, एक निश्चित डिग्री की संभावना के साथ, सांख्यिकीय विशेषता का सही (सामान्य) मान निहित है। इस अंतराल को कहा जाता है डी आत्मविश्वास अंतराल (सीआई)।

तो 95% की संभावना के साथ सामान्य औसत मूल्य भीतर निहित है

से, (20)

कहाँ टी - छात्र के परीक्षण का तालिका मूल्य α =0.05 और एफ= एन-1

इस मामले में 99% सीआई भी पाया जा सकता है टी के लिए चयनित α =0,01.

कॉन्फिडेंस इंटरवल का व्यावहारिक महत्व क्या है?

    एक विस्तृत आत्मविश्वास अंतराल इंगित करता है कि नमूना माध्य जनसंख्या माध्य को सटीक रूप से प्रतिबिंबित नहीं करता है। यह आमतौर पर अपर्याप्त नमूना आकार, या इसकी विविधता के कारण होता है, अर्थात। बड़ा फैलाव. दोनों माध्य की एक बड़ी त्रुटि देते हैं और तदनुसार, एक व्यापक सीआई देते हैं। और यही अनुसंधान योजना चरण पर लौटने का आधार है।

    सीआई की ऊपरी और निचली सीमाएं यह अनुमान प्रदान करती हैं कि परिणाम चिकित्सकीय रूप से महत्वपूर्ण होंगे या नहीं

आइए समूह गुणों के अध्ययन के परिणामों के सांख्यिकीय और नैदानिक ​​​​महत्व के प्रश्न पर कुछ विस्तार से ध्यान दें। आइए याद रखें कि सांख्यिकी का कार्य नमूना डेटा के आधार पर सामान्य आबादी में कम से कम कुछ अंतरों का पता लगाना है। चिकित्सकों के लिए चुनौती अंतर का पता लगाना है (सिर्फ कोई नहीं) जो निदान या उपचार में सहायता करेगा। और सांख्यिकीय निष्कर्ष हमेशा नैदानिक ​​​​निष्कर्षों का आधार नहीं होते हैं। इस प्रकार, हीमोग्लोबिन में 3 ग्राम/लीटर की सांख्यिकीय रूप से महत्वपूर्ण कमी चिंता का कारण नहीं है। और, इसके विपरीत, यदि मानव शरीर में कोई समस्या पूरी आबादी के स्तर पर व्यापक नहीं है, तो यह इस समस्या से न निपटने का कोई कारण नहीं है।

आइए इस स्थिति पर नजर डालें उदाहरण.

शोधकर्ताओं को आश्चर्य हुआ कि क्या जो लड़के किसी प्रकार की संक्रामक बीमारी से पीड़ित हैं, वे विकास में अपने साथियों से पीछे रह जाते हैं। इस उद्देश्य के लिए, एक नमूना अध्ययन किया गया जिसमें इस बीमारी से पीड़ित 10 लड़कों ने भाग लिया। परिणाम तालिका 23 में प्रस्तुत किए गए हैं।

तालिका 23. सांख्यिकीय प्रसंस्करण के परिणाम

निचली सीमा

ऊपरी सीमा

मानक (सेमी)

औसत

इन गणनाओं से यह पता चलता है कि किसी संक्रामक बीमारी से पीड़ित 10 वर्षीय लड़कों की नमूना औसत ऊंचाई सामान्य (132.5 सेमी) के करीब है। हालाँकि, आत्मविश्वास अंतराल की निचली सीमा (126.6 सेमी) इंगित करती है कि 95% संभावना है कि इन बच्चों की वास्तविक औसत ऊंचाई "छोटी ऊंचाई" की अवधारणा से मेल खाती है, अर्थात। ये बच्चे अविकसित हैं।

इस उदाहरण में, विश्वास अंतराल गणना के परिणाम चिकित्सकीय रूप से महत्वपूर्ण हैं।

आवृत्तियों और भिन्नों के लिए विश्वास अंतराल

© 2008

राष्ट्रीय सार्वजनिक स्वास्थ्य संस्थान, ओस्लो, नॉर्वे

लेख में वाल्ड, विल्सन, क्लॉपर - पियर्सन विधियों का उपयोग करके, कोणीय परिवर्तन का उपयोग करके और एग्रेस्टी - कूल सुधार के साथ वाल्ड विधि का उपयोग करके आवृत्तियों और अनुपातों के लिए आत्मविश्वास अंतराल की गणना का वर्णन और चर्चा की गई है। प्रस्तुत सामग्री आवृत्तियों और अनुपातों के लिए आत्मविश्वास अंतराल की गणना करने के तरीकों के बारे में सामान्य जानकारी प्रदान करती है और इसका उद्देश्य जर्नल पाठकों में न केवल अपने स्वयं के शोध के परिणामों को प्रस्तुत करते समय आत्मविश्वास अंतराल का उपयोग करने में रुचि जगाना है, बल्कि काम शुरू करने से पहले विशेष साहित्य पढ़ने में भी रुचि जगाना है। भविष्य के प्रकाशनों पर.

कीवर्ड: आत्मविश्वास अंतराल, आवृत्ति, अनुपात

पिछले प्रकाशनों में से एक में गुणात्मक डेटा के विवरण का संक्षेप में उल्लेख किया गया था और बताया गया था कि जनसंख्या में अध्ययन की जा रही विशेषता की घटना की आवृत्ति का वर्णन करने के लिए उनका अंतराल अनुमान बिंदु अनुमान से बेहतर है। दरअसल, चूंकि अनुसंधान नमूना डेटा का उपयोग करके आयोजित किया जाता है, इसलिए जनसंख्या पर परिणामों के प्रक्षेपण में नमूनाकरण अशुद्धता का एक तत्व शामिल होना चाहिए। कॉन्फिडेंस इंटरवल अनुमानित पैरामीटर की सटीकता का एक माप है। यह दिलचस्प है कि डॉक्टरों के लिए बुनियादी आंकड़ों पर कुछ किताबें आवृत्तियों के लिए विश्वास अंतराल के विषय को पूरी तरह से नजरअंदाज कर देती हैं। इस लेख में हम आवृत्तियों के लिए आत्मविश्वास अंतराल की गणना करने के कई तरीकों पर गौर करेंगे, जिसमें गैर-दोहराव और प्रतिनिधित्वशीलता जैसी नमूना विशेषताओं के साथ-साथ एक दूसरे से टिप्पणियों की स्वतंत्रता भी शामिल होगी। इस लेख में, आवृत्ति को एक निरपेक्ष संख्या के रूप में नहीं समझा जाता है जो दर्शाती है कि कुल में एक विशेष मूल्य कितनी बार होता है, बल्कि एक सापेक्ष मूल्य के रूप में जो अध्ययन प्रतिभागियों के अनुपात को निर्धारित करता है जिनमें अध्ययन की गई विशेषता होती है।

बायोमेडिकल अनुसंधान में, 95% आत्मविश्वास अंतराल का सबसे अधिक उपयोग किया जाता है। यह विश्वास अंतराल वह क्षेत्र है जिसके भीतर 95% समय वास्तविक अनुपात गिरता है। दूसरे शब्दों में, हम 95% विश्वसनीयता के साथ कह सकते हैं कि जनसंख्या में किसी लक्षण के घटित होने की आवृत्ति का सही मूल्य 95% विश्वास अंतराल के भीतर होगा।

चिकित्सा शोधकर्ताओं के लिए अधिकांश सांख्यिकी मैनुअल रिपोर्ट करते हैं कि आवृत्ति त्रुटि की गणना सूत्र का उपयोग करके की जाती है

जहाँ p नमूने में विशेषता के घटित होने की आवृत्ति है (मान 0 से 1 तक)। अधिकांश घरेलू वैज्ञानिक लेख एक नमूने (पी) में एक विशेषता की घटना की आवृत्ति, साथ ही पी ± एस के रूप में इसकी त्रुटि (त्रुटि) का संकेत देते हैं। हालाँकि, जनसंख्या में किसी विशेषता की घटना की आवृत्ति के लिए 95% विश्वास अंतराल प्रस्तुत करना अधिक उपयुक्त है, जिसमें मान शामिल होंगे

पहले।

कुछ मैनुअल अनुशंसा करते हैं कि छोटे नमूनों के लिए, एन - 1 डिग्री की स्वतंत्रता के लिए 1.96 के मान को टी के मान से बदलें, जहां एन नमूने में अवलोकनों की संख्या है। टी मान टी-वितरण के लिए तालिकाओं से पाया जाता है, जो लगभग सभी सांख्यिकी पाठ्यपुस्तकों में उपलब्ध है। वाल्ड विधि के लिए टी वितरण का उपयोग नीचे चर्चा की गई अन्य विधियों की तुलना में दृश्यमान लाभ प्रदान नहीं करता है, और इसलिए कुछ लेखकों द्वारा इसकी अनुशंसा नहीं की जाती है।

आवृत्तियों या अनुपातों के लिए विश्वास अंतराल की गणना के लिए ऊपर प्रस्तुत विधि को अब्राहम वाल्ड (1902-1950) के सम्मान में वाल्ड नाम दिया गया है, क्योंकि इसका व्यापक उपयोग 1939 में वाल्ड और वोल्फोविट्ज़ के प्रकाशन के बाद शुरू हुआ था। हालाँकि, यह विधि स्वयं पियरे साइमन लाप्लास (1749-1827) द्वारा 1812 में प्रस्तावित की गई थी।

वाल्ड विधि बहुत लोकप्रिय है, लेकिन इसका अनुप्रयोग महत्वपूर्ण समस्याओं से जुड़ा है। यह विधि छोटे नमूना आकारों के लिए अनुशंसित नहीं है, साथ ही ऐसे मामलों में जहां किसी विशेषता की घटना की आवृत्ति 0 या 1 (0% या 100%) हो जाती है और 0 और 1 की आवृत्तियों के लिए यह असंभव है। इसके अलावा, सामान्य वितरण का सन्निकटन, जिसका उपयोग त्रुटि की गणना करते समय किया जाता है, उन मामलों में "काम नहीं करता" जहां n·p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.



जहां 95% विश्वास अंतराल की गणना करते समय 1.96 मान लिया जाता है, एन अवलोकनों की संख्या है, और पी नमूने में विशेषता की घटना की आवृत्ति है। यह विधि ऑनलाइन कैलकुलेटर में उपलब्ध है, इसलिए इसका उपयोग समस्याग्रस्त नहीं है। और एन पी के लिए इस पद्धति का उपयोग करने की अनुशंसा नहीं करते हैं< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

विल्सन विधि के अलावा, एग्रेस्टी-कोल सुधार के साथ वाल्ड विधि भी आवृत्तियों के लिए विश्वास अंतराल का एक इष्टतम अनुमान प्रदान करने वाली मानी जाती है। एग्रेस्टी-कोल सुधार एक नमूने (पी) में एक विशेषता की घटना की आवृत्ति के वाल्ड सूत्र में पी` द्वारा प्रतिस्थापन है, जिसकी गणना करते समय अंश में 2 जोड़ा जाता है और हर में 4 जोड़ा जाता है, अर्थात, पी` = (एक्स + 2) / (एन + 4), जहां एक्स अध्ययन प्रतिभागियों की संख्या है जिनके पास अध्ययन की जा रही विशेषता है, और एन नमूना आकार है। यह संशोधन विल्सन के फार्मूले के समान परिणाम उत्पन्न करता है, सिवाय इसके कि जब घटना की आवृत्ति 0% या 100% तक पहुंचती है और नमूना छोटा होता है। आवृत्तियों के लिए विश्वास अंतराल की गणना के लिए उपरोक्त तरीकों के अलावा, छोटे नमूनों के लिए वाल्ड और विल्सन दोनों तरीकों के लिए निरंतरता सुधार प्रस्तावित किए गए हैं, लेकिन अध्ययनों से पता चला है कि उनका उपयोग अनुचित है।

आइए दो उदाहरणों का उपयोग करके आत्मविश्वास अंतराल की गणना के लिए उपरोक्त विधियों के अनुप्रयोग पर विचार करें। पहले मामले में, हम 1,000 बेतरतीब ढंग से चुने गए अध्ययन प्रतिभागियों के एक बड़े नमूने का अध्ययन करते हैं, जिनमें से 450 में अध्ययन के तहत विशेषता है (यह एक जोखिम कारक, परिणाम या कोई अन्य विशेषता हो सकती है), जो 0.45 या 45 की आवृत्ति का प्रतिनिधित्व करती है। %. दूसरे मामले में, अध्ययन एक छोटे नमूने का उपयोग करके किया जाता है, मान लीजिए, केवल 20 लोग, और केवल 1 अध्ययन प्रतिभागी (5%) के पास अध्ययन किया जा रहा गुण है। वाल्ड विधि, एग्रेस्टी-कोल सुधार के साथ वाल्ड विधि और विल्सन विधि का उपयोग करके आत्मविश्वास अंतराल की गणना जेफ सोरो (http://www. /wald. htm) द्वारा विकसित एक ऑनलाइन कैलकुलेटर का उपयोग करके की गई थी। विल्सन के निरंतरता-संशोधित आत्मविश्वास अंतराल की गणना वासर स्टैट्स द्वारा प्रदान किए गए कैलकुलेटर का उपयोग करके की गई: सांख्यिकीय गणना के लिए वेब साइट (http://faculty.vassar.edu/lowry/prop1.html)। कोणीय फिशर परिवर्तन गणना क्रमशः 19 और 999 डिग्री स्वतंत्रता के लिए महत्वपूर्ण टी मान का उपयोग करके मैन्युअल रूप से की गई थी। दोनों उदाहरणों के लिए गणना परिणाम तालिका में प्रस्तुत किए गए हैं।

पाठ में वर्णित दो उदाहरणों के लिए छह अलग-अलग तरीकों से आत्मविश्वास अंतराल की गणना की गई

कॉन्फिडेंस अंतराल गणना विधि

पी=0.0500, या 5%

X=450, N=1000, P=0.4500, या 45% के लिए 95% CI

–0,0455–0,2541

एग्रेस्टी-कोल सुधार के साथ वाल्ड

<,0001–0,2541

विल्सन निरंतरता सुधार के साथ

क्लॉपर-पियर्सन "सटीक विधि"

कोणीय परिवर्तन

<0,0001–0,1967

जैसा कि तालिका से देखा जा सकता है, पहले उदाहरण के लिए "आम तौर पर स्वीकृत" वाल्ड पद्धति का उपयोग करके गणना किया गया विश्वास अंतराल नकारात्मक क्षेत्र में प्रवेश करता है, जो आवृत्तियों के मामले में नहीं हो सकता है। दुर्भाग्य से, रूसी साहित्य में ऐसी घटनाएं असामान्य नहीं हैं। आवृत्ति और उसकी त्रुटि के संदर्भ में डेटा प्रस्तुत करने का पारंपरिक तरीका आंशिक रूप से इस समस्या को छुपाता है। उदाहरण के लिए, यदि किसी लक्षण की घटना की आवृत्ति (प्रतिशत में) 2.1 ± 1.4 के रूप में प्रस्तुत की जाती है, तो यह 2.1% (95% सीआई: -0.7; 4.9) के रूप में "आंख के लिए आक्रामक" नहीं है, हालांकि और इसका मतलब है एक ही बात। एग्रेस्टी-कोल सुधार और कोणीय परिवर्तन का उपयोग करके गणना के साथ वाल्ड विधि शून्य की ओर निचली सीमा प्रदान करती है। विल्सन की निरंतरता-सही विधि और "सटीक विधि" विल्सन की विधि की तुलना में व्यापक आत्मविश्वास अंतराल उत्पन्न करती है। दूसरे उदाहरण के लिए, सभी विधियाँ लगभग समान आत्मविश्वास अंतराल देती हैं (अंतर केवल हज़ारवें हिस्से में दिखाई देता है), जो आश्चर्य की बात नहीं है, क्योंकि इस उदाहरण में घटना की आवृत्ति 50% से बहुत अलग नहीं है, और नमूना आकार है काफी बड़ी।

इस समस्या में रुचि रखने वाले पाठकों के लिए, हम आर. जी. न्यूकॉम्ब और ब्राउन, कै और दासगुप्ता के कार्यों की सिफारिश कर सकते हैं, जो क्रमशः आत्मविश्वास अंतराल की गणना के लिए 7 और 10 अलग-अलग तरीकों का उपयोग करने के फायदे और नुकसान प्रदान करते हैं। घरेलू मैनुअल के बीच, हम पुस्तक की अनुशंसा करते हैं और, जो सिद्धांत के विस्तृत विवरण के अलावा, वाल्ड और विल्सन के तरीकों को प्रस्तुत करता है, साथ ही द्विपद आवृत्ति वितरण को ध्यान में रखते हुए आत्मविश्वास अंतराल की गणना करने की एक विधि भी प्रस्तुत करता है। मुफ़्त ऑनलाइन कैलकुलेटर (http://www. /wald. htm और http://faculty. vassar. edu/lowry/prop1.html) के अलावा, आवृत्तियों के लिए आत्मविश्वास अंतराल (और न केवल!) का उपयोग करके गणना की जा सकती है सीआईए प्रोग्राम (कॉन्फिडेंस इंटरवल एनालिसिस), जिसे http://www से डाउनलोड किया जा सकता है। माध्यमिक विद्यालय। soton. एसी। यूके/सीआईए/ .

अगला लेख गुणात्मक डेटा की तुलना करने के एकतरफा तरीकों पर गौर करेगा।

ग्रन्थसूची

बनर्जी ए.स्पष्ट भाषा में चिकित्सा आँकड़े: एक परिचयात्मक पाठ्यक्रम / ए. बनर्जी। - एम.: प्रैक्टिकल मेडिसिन, 2007. - 287 पी. चिकित्सा आँकड़े /। - एम.: चिकित्सा सूचना एजेंसी, 2007. - 475 पी. ग्लैंज़ एस.चिकित्सा और जैविक सांख्यिकी / एस. ग्लान्ज़। - एम.: प्रकृति, 1998। डेटा प्रकार, वितरण परीक्षण और वर्णनात्मक आँकड़े // मानव पारिस्थितिकी - 2008। - नंबर 1. - पी. 52-58। झिझिन के.एस.. चिकित्सा आँकड़े: पाठ्यपुस्तक /। - रोस्तोव एन/डी: फीनिक्स, 2007। - 160 पी। अनुप्रयुक्त चिकित्सा आँकड़े / , . - सेंट पीटर्सबर्ग। : फोलियट, 2003.-428 पी. लैकिन जी.एफ. बॉयोमीट्रिक्स/. - एम.: हायर स्कूल, 1990. - 350 पी. चिकित्सक वी. ए. चिकित्सा में गणितीय आँकड़े / , . - एम.: वित्त और सांख्यिकी, 2007. - 798 पी. नैदानिक ​​अनुसंधान में गणितीय आँकड़े / , . - एम.: जियोटार-मेड, 2001. - 256 पी. जंकेरोव वी. और. चिकित्सा अनुसंधान डेटा का चिकित्सा और सांख्यिकीय प्रसंस्करण / , . - सेंट पीटर्सबर्ग। : वीमेडए, 2002. - 266 पी. एग्रेस्टी ए.द्विपद अनुपातों के अंतराल अनुमान के लिए अनुमानित सटीक से बेहतर है / ए. एग्रेस्टी, बी. कूल // अमेरिकी सांख्यिकीविद्। - 1998. - एन 52. - पी. 119-126। ऑल्टमैन डी.विश्वास के साथ आँकड़े // डी. ऑल्टमैन, डी. मशीन, टी. ब्रायंट, एम.जे. गार्डनर। - लंदन: बीएमजे बुक्स, 2000. - 240 पी। ब्राउन एल.डी.द्विपद अनुपात के लिए अंतराल अनुमान / एल. डी. ब्राउन, टी. टी. कै, ए. दासगुप्ता // सांख्यिकीय विज्ञान। - 2001. - एन 2. - पी. 101-133. क्लॉपर सी.जे.द्विपद / सी.जे. क्लॉपर, ई.एस. पियर्सन // बायोमेट्रिका के मामले में सचित्र आत्मविश्वास या प्रत्ययी सीमाओं का उपयोग। - 1934. - एन 26. - पी. 404-413। गार्सिया-पेरेज़ एम. ए. द्विपद पैरामीटर के लिए विश्वास अंतराल पर / एम. ए. गार्सिया-पेरेज़ // गुणवत्ता और मात्रा। - 2005. - एन 39. - पी. 467-481. मोटुलस्की एच.सहज जैवसांख्यिकी // एच. मोटुलस्की। - ऑक्सफ़ोर्ड: ऑक्सफ़ोर्ड यूनिवर्सिटी प्रेस, 1995. - 386 पी। न्यूकॉम्ब आर.जी.एकल अनुपात के लिए दो तरफा आत्मविश्वास अंतराल: सात तरीकों की तुलना / आर. जी. न्यूकॉम्ब // चिकित्सा में सांख्यिकी। - 1998. - एन. 17. - पी. 857-872. सोरो जे.द्विपद आत्मविश्वास अंतराल का उपयोग करके छोटे नमूनों से पूर्णता दर का अनुमान लगाना: तुलना और सिफारिशें / जे. सोरो, जे. आर. लुईस // मानव कारकों और एर्गोनॉमिक्स सोसायटी की वार्षिक बैठक की कार्यवाही। - ऑरलैंडो, FL, 2005. वाल्ड ए.निरंतर वितरण कार्यों के लिए विश्वास सीमाएँ // ए. वाल्ड, जे. वोल्फोवित्ज़ // गणितीय सांख्यिकी के इतिहास। - 1939. - एन 10. - पी. 105-118. विल्सन ई.बी. संभावित अनुमान, उत्तराधिकार का नियम, और सांख्यिकीय अनुमान / ई.बी. विल्सन // जर्नल ऑफ़ अमेरिकन स्टैटिस्टिकल एसोसिएशन। - 1927. - एन 22. - पी. 209-212।

अनुपात के लिए विश्वास अंतराल

एक। एम. ग्रजीबोव्स्की

राष्ट्रीय सार्वजनिक स्वास्थ्य संस्थान, ओस्लो, नॉर्वे

लेख द्विपद अनुपातों के लिए आत्मविश्वास अंतराल की गणना के लिए कई तरीके प्रस्तुत करता है, अर्थात्, वाल्ड, विल्सन, आर्क्साइन, एग्रेस्टी-कूल और सटीक क्लॉपर-पियर्सन विधियां। यह पेपर द्विपद अनुपात के आत्मविश्वास अंतराल अनुमान की समस्या का केवल एक सामान्य परिचय देता है और इसका उद्देश्य न केवल पाठकों को अपने स्वयं के अनुभवजन्य अनुसंधान के परिणाम प्रस्तुत करते समय आत्मविश्वास अंतराल का उपयोग करने के लिए प्रोत्साहित करना है, बल्कि उन्हें सांख्यिकी पुस्तकों से परामर्श करने के लिए प्रोत्साहित करना भी है। स्वयं के डेटा का विश्लेषण करने और पांडुलिपियाँ तैयार करने से पहले।

मुख्य शब्द: आत्मविश्वास अंतराल, अनुपात

संपर्क जानकारी:

वरिष्ठ सलाहकार, राष्ट्रीय सार्वजनिक स्वास्थ्य संस्थान, ओस्लो, नॉर्वे

पिछले उपखंडों में हमने एक अज्ञात पैरामीटर के आकलन के मुद्दे पर विचार किया था एक नंबर। इसे "बिंदु" अनुमान कहा जाता है। कई कार्यों में, आपको न केवल पैरामीटर खोजने की आवश्यकता है उपयुक्त संख्यात्मक मान, बल्कि इसकी सटीकता और विश्वसनीयता का मूल्यांकन भी करना। आपको यह जानना होगा कि किसी पैरामीटर को बदलने से कौन सी त्रुटियाँ हो सकती हैं इसका बिंदु अनुमान और हम किस हद तक विश्वास के साथ यह उम्मीद कर सकते हैं कि ये त्रुटियाँ ज्ञात सीमाओं से अधिक नहीं होंगी?

इस प्रकार की समस्याएँ विशेष रूप से टिप्पणियों की एक छोटी संख्या के साथ प्रासंगिक होती हैं, जब बिंदु का अनुमान लगाया जाता है और मेंयह काफी हद तक यादृच्छिक है और a द्वारा a का अनुमानित प्रतिस्थापन गंभीर त्रुटियों का कारण बन सकता है।

अनुमान की सटीकता और विश्वसनीयता का अंदाज़ा देना ,

गणितीय आँकड़ों में, तथाकथित आत्मविश्वास अंतराल और आत्मविश्वास संभावनाओं का उपयोग किया जाता है।

पैरामीटर के लिए चलो अनुभव से प्राप्त निष्पक्ष अनुमान एक।हम इस मामले में संभावित त्रुटि का अनुमान लगाना चाहते हैं. आइए हम कुछ पर्याप्त रूप से बड़ी संभाव्यता p निर्दिष्ट करें (उदाहरण के लिए, p = 0.9, 0.95 या 0.99) ताकि संभाव्यता p वाली एक घटना को व्यावहारिक रूप से विश्वसनीय माना जा सके, और एक मान ज्ञात करें जिसके लिए

फिर प्रतिस्थापन के दौरान उत्पन्न होने वाली त्रुटि के व्यावहारिक रूप से संभावित मूल्यों की सीमा पर , ± s होगा; निरपेक्ष मान में बड़ी त्रुटियाँ केवल कम संभावना a = 1 - p के साथ दिखाई देंगी। आइए (14.3.1) को इस प्रकार पुनः लिखें:

समानता (14.3.2) का अर्थ है कि संभाव्यता पी के साथ पैरामीटर का अज्ञात मान अंतराल के अंतर्गत आता है

एक परिस्थिति पर गौर करना जरूरी है. पहले, हमने बार-बार किसी यादृच्छिक चर के किसी दिए गए गैर-यादृच्छिक अंतराल में गिरने की संभावना पर विचार किया है। यहां स्थिति भिन्न है: परिमाण यादृच्छिक नहीं है, लेकिन अंतराल/p यादृच्छिक है। x-अक्ष पर इसकी स्थिति यादृच्छिक है, जो इसके केंद्र द्वारा निर्धारित होती है ; सामान्य तौर पर, अंतराल 2s की लंबाई भी यादृच्छिक होती है, क्योंकि s के मान की गणना, एक नियम के रूप में, प्रयोगात्मक डेटा से की जाती है। इसलिए, इस मामले में, पी मान की व्याख्या बिंदु को "हिट" करने की संभावना के रूप में नहीं करना बेहतर होगा अंतराल / पी में, और संभावना के रूप में कि एक यादृच्छिक अंतराल / पी बिंदु को कवर करेगा (चित्र 14.3.1)।

चावल। 14.3.1

प्रायिकता p को आमतौर पर कहा जाता है आत्मविश्वास की संभावना, और अंतराल / पी - विश्वास अंतराल।अंतराल सीमाएँ अगर। ए एक्स =ए-रेत ए 2 = ए +और बुलाए जाते हैं विश्वास की सीमाएँ.

आइए विश्वास अंतराल की अवधारणा को एक और व्याख्या दें: इसे पैरामीटर मानों के अंतराल के रूप में माना जा सकता है ए,प्रयोगात्मक डेटा के साथ संगत और उनका खंडन नहीं। वास्तव में, यदि हम प्रायिकता a = 1-p वाली किसी घटना पर व्यावहारिक रूप से असंभव विचार करने के लिए सहमत हैं, तो पैरामीटर a के वे मान जिनके लिए ए - ए> s को विरोधाभासी प्रयोगात्मक डेटा के रूप में पहचाना जाना चाहिए, और जिनके लिए |a - ए टी ना 2 .

पैरामीटर के लिए चलो एक निष्पक्ष अनुमान है एक।यदि हम मात्रा के वितरण का नियम जानते , विश्वास अंतराल खोजने का कार्य बहुत सरल होगा: यह एक मान खोजने के लिए पर्याप्त होगा जिसके लिए

कठिनाई यह है कि अनुमानों के वितरण का नियम मात्रा के वितरण नियम पर निर्भर करता है एक्सऔर, इसलिए, इसके अज्ञात मापदंडों पर (विशेष रूप से, पैरामीटर पर ही)। ए)।

इस कठिनाई से निपटने के लिए, आप निम्नलिखित मोटे तौर पर अनुमानित तकनीक का उपयोग कर सकते हैं: एस के लिए अभिव्यक्ति में अज्ञात मापदंडों को उनके बिंदु अनुमानों के साथ बदलें। अपेक्षाकृत बड़ी संख्या में प्रयोगों के साथ पी(लगभग 20...30) यह तकनीक आमतौर पर ऐसे परिणाम देती है जो सटीकता की दृष्टि से संतोषजनक होते हैं।

उदाहरण के तौर पर, गणितीय अपेक्षा के लिए विश्वास अंतराल की समस्या पर विचार करें।

इसका उत्पादन होने दीजिए पी एक्स,जिनकी विशेषताएँ गणितीय अपेक्षा हैं टीऔर विचरण डी- अज्ञात। इन मापदंडों के लिए निम्नलिखित अनुमान प्राप्त किए गए:

गणितीय अपेक्षा के लिए विश्वास संभाव्यता p के अनुरूप एक विश्वास अंतराल / p का निर्माण करना आवश्यक है टीमात्रा एक्स।

इस समस्या को हल करते समय हम इस तथ्य का उपयोग करेंगे कि मात्रा टीयोग का प्रतिनिधित्व करता है पीस्वतंत्र समान रूप से वितरित यादृच्छिक चर Xhऔर केंद्रीय सीमा प्रमेय के अनुसार, पर्याप्त रूप से बड़े के लिए पीइसका वितरण कानून सामान्य के करीब है। व्यवहार में, पदों की अपेक्षाकृत कम संख्या (लगभग 10...20) के साथ भी, योग के वितरण नियम को लगभग सामान्य माना जा सकता है। हम मान लेंगे कि मूल्य टीसामान्य कानून के अनुसार वितरित किया गया। इस नियम की विशेषताएँ - गणितीय अपेक्षा और विचरण - क्रमशः समान हैं टीऔर

(अध्याय 13 उपधारा 13.3 देखें)। आइए मान लें कि मान डीहम जानते हैं और जिसके लिए एक मूल्य ईपी ढूंढेंगे

अध्याय 6 के सूत्र (6.3.5) का उपयोग करके, हम सामान्य वितरण फ़ंक्शन के माध्यम से (14.3.5) के बाईं ओर संभावना व्यक्त करते हैं

अनुमान का मानक विचलन कहां है टी।

Eq से.

Sp का मान ज्ञात करें:

जहां arg Ф* (x) Ф* का व्युत्क्रम फलन है (एक्स),वे। तर्क का ऐसा मान जिसके लिए सामान्य वितरण फलन बराबर है एक्स।

फैलाव डी,जिसके माध्यम से मात्रा व्यक्त की जाती है 1पी, हम ठीक-ठीक नहीं जानते; इसके अनुमानित मूल्य के रूप में, आप अनुमान का उपयोग कर सकते हैं डी(14.3.4) और लगभग लगाएं:

इस प्रकार, विश्वास अंतराल के निर्माण की समस्या लगभग हल हो गई है, जो इसके बराबर है:

जहां जीपी सूत्र (14.3.7) द्वारा निर्धारित किया जाता है।

एसपी की गणना करते समय फ़ंक्शन Ф* (एल) की तालिकाओं में रिवर्स इंटरपोलेशन से बचने के लिए, एक विशेष तालिका (तालिका 14.3.1) संकलित करना सुविधाजनक है, जो मात्रा के मान देता है

आर पर निर्भर करता है मान (पी सामान्य कानून के लिए मानक विचलन की संख्या निर्धारित करता है जिसे फैलाव के केंद्र से दाएं और बाएं ओर प्लॉट किया जाना चाहिए ताकि परिणामी क्षेत्र में आने की संभावना पी के बराबर हो।

मान 7पी का उपयोग करते हुए, विश्वास अंतराल को इस प्रकार व्यक्त किया जाता है:

तालिका 14.3.1

उदाहरण 1. मात्रा पर 20 प्रयोग किये गये एक्स;परिणाम तालिका में दिखाए गए हैं. 14.3.2.

तालिका 14.3.2

मात्रा की गणितीय अपेक्षा के लिए एक अनुमान लगाना आवश्यक है एक्सऔर विश्वास संभावना पी = 0.8 के अनुरूप एक विश्वास अंतराल का निर्माण करें।

समाधान।हमारे पास है:

l: = 10 को संदर्भ बिंदु के रूप में चुनते हुए, तीसरे सूत्र (14.2.14) का उपयोग करके हम निष्पक्ष अनुमान पाते हैं डी :

तालिका के अनुसार 14.3.1 हम पाते हैं

आत्मविश्वास की सीमाएँ:

विश्वास अंतराल:

पैरामीटर मान टी,इस अंतराल में पड़े डेटा तालिका में दिए गए प्रयोगात्मक डेटा के साथ संगत हैं। 14.3.2.

विचरण के लिए एक विश्वास अंतराल का निर्माण इसी तरह से किया जा सकता है।

इसका उत्पादन होने दीजिए पीयादृच्छिक चर पर स्वतंत्र प्रयोग एक्सए और फैलाव दोनों के लिए अज्ञात मापदंडों के साथ डीएक निष्पक्ष अनुमान प्राप्त हुआ:

विचरण के लिए लगभग एक विश्वास अंतराल का निर्माण करना आवश्यक है।

सूत्र (14.3.11) से स्पष्ट है कि मात्रा डीका प्रतिनिधित्व करता है

मात्रा पीप्रपत्र के यादृच्छिक चर. ये मूल्य नहीं हैं

स्वतंत्र, क्योंकि उनमें से किसी में भी मात्रा शामिल है टी,हर किसी पर निर्भर. हालाँकि, इसे बढ़ाकर दिखाया जा सकता है पीउनके योग का वितरण नियम भी सामान्य हो जाता है। लगभग पर पी= 20...30 इसे पहले से ही सामान्य माना जा सकता है।

आइए मान लें कि ऐसा है, और आइए इस कानून की विशेषताएं खोजें: गणितीय अपेक्षा और फैलाव। मूल्यांकन के बाद से डी- फिर निष्पक्ष एम[डी] = डी.

विचरण गणना डी डीअपेक्षाकृत जटिल गणनाओं से जुड़ा है, इसलिए हम इसकी अभिव्यक्ति बिना व्युत्पत्ति के प्रस्तुत करते हैं:

जहां q 4 परिमाण का चौथा केंद्रीय क्षण है एक्स।

इस अभिव्यक्ति का उपयोग करने के लिए, आपको मानों को प्रतिस्थापित करना होगा = 4 और डी(कम से कम करीबी वाले)। के बजाय डीआप उसके मूल्यांकन का उपयोग कर सकते हैं डी।सिद्धांत रूप में, चौथे केंद्रीय क्षण को एक अनुमान से भी बदला जा सकता है, उदाहरण के लिए, फॉर्म का मान:

लेकिन ऐसा प्रतिस्थापन बेहद कम सटीकता देगा, क्योंकि सामान्य तौर पर, सीमित संख्या में प्रयोगों के साथ, उच्च-क्रम के क्षण बड़ी त्रुटियों के साथ निर्धारित किए जाते हैं। हालाँकि, व्यवहार में अक्सर ऐसा होता है कि मात्रा वितरण कानून का प्रकार एक्सपहले से ज्ञात: केवल इसके पैरामीटर अज्ञात हैं। फिर आप μ 4 को व्यक्त करने का प्रयास कर सकते हैं डी।

आइए सबसे आम मामला लें, जब मूल्य एक्ससामान्य कानून के अनुसार वितरित किया गया। फिर इसका चौथा केंद्रीय क्षण फैलाव के संदर्भ में व्यक्त किया जाता है (अध्याय 6, उपधारा 6.2 देखें);

और सूत्र (14.3.12) देता है या

(14.3.14) में अज्ञात को प्रतिस्थापित करना डीउसका मूल्यांकन डी, हम पाते हैं: कहाँ से

क्षण μ 4 के माध्यम से व्यक्त किया जा सकता है डीकुछ अन्य मामलों में भी, जब मूल्य का वितरण होता है एक्सयह सामान्य नहीं है, लेकिन इसका स्वरूप ज्ञात है। उदाहरण के लिए, एकसमान घनत्व के नियम के लिए (अध्याय 5 देखें) हमारे पास है:

जहां (ए, पी) वह अंतराल है जिस पर कानून निर्दिष्ट है।

इस तरह,

सूत्र (14.3.12) का उपयोग करने पर हम पाते हैं: हम लगभग कहां पाते हैं

ऐसे मामलों में जहां मात्रा 26 के लिए वितरण कानून का प्रकार अज्ञात है, मूल्य ए/ का अनुमानित अनुमान लगाते समय अभी भी सूत्र (14.3.16) का उपयोग करने की सिफारिश की जाती है, जब तक कि इस कानून पर विश्वास करने के विशेष कारण न हों सामान्य से बहुत अलग है (ध्यान देने योग्य सकारात्मक या नकारात्मक कर्टोसिस है)।

यदि अनुमानित मान a/) एक या दूसरे तरीके से प्राप्त किया जाता है, तो हम विचरण के लिए एक विश्वास अंतराल का निर्माण उसी तरह कर सकते हैं जैसे हमने इसे गणितीय अपेक्षा के लिए बनाया था:

जहां दी गई प्रायिकता p के आधार पर मान तालिका के अनुसार पाया जाता है। 14.3.1.

उदाहरण 2. एक यादृच्छिक चर के विचरण के लिए लगभग 80% विश्वास अंतराल ज्ञात कीजिए एक्सउदाहरण 1 की शर्तों के तहत, यदि यह ज्ञात है कि मूल्य एक्ससामान्य के करीब कानून के अनुसार वितरित किया गया।

समाधान।मान तालिका के समान ही रहता है. 14.3.1:

सूत्र के अनुसार (14.3.16)

सूत्र (14.3.18) का उपयोग करके हम विश्वास अंतराल पाते हैं:

मानक विचलन मानों की संगत सीमा: (0.21; 0.29)।

14.4. एक सामान्य कानून के अनुसार वितरित यादृच्छिक चर के मापदंडों के लिए विश्वास अंतराल के निर्माण की सटीक विधियाँ

पिछले उपधारा में, हमने गणितीय अपेक्षा और विचरण के लिए विश्वास अंतराल के निर्माण के लिए मोटे तौर पर अनुमानित तरीकों की जांच की। यहां हम उसी समस्या को हल करने के सटीक तरीकों के बारे में जानकारी देंगे। हम इस बात पर जोर देते हैं कि आत्मविश्वास अंतराल को सटीक रूप से खोजने के लिए मात्रा के वितरण कानून के रूप को पहले से जानना नितांत आवश्यक है एक्स,जबकि अनुमानित विधियों के अनुप्रयोग के लिए यह आवश्यक नहीं है।

विश्वास अंतराल के निर्माण के लिए सटीक तरीकों का विचार निम्नलिखित पर आधारित है। कोई भी आत्मविश्वास अंतराल कुछ असमानताओं को पूरा करने की संभावना व्यक्त करने वाली स्थिति से पाया जाता है, जिसमें वह अनुमान शामिल होता है जिसमें हम रुचि रखते हैं एक।मूल्यांकन वितरण का नियम सामान्य स्थिति में मात्रा के अज्ञात मापदंडों पर निर्भर करता है एक्स।हालाँकि, कभी-कभी यादृच्छिक चर से असमानताओं को पार करना संभव होता है प्रेक्षित मूल्यों के किसी अन्य कार्य के लिए एक्स पी एक्स 2, ..., एक्स पी.जिसका वितरण कानून अज्ञात मापदंडों पर निर्भर नहीं करता है, बल्कि केवल प्रयोगों की संख्या और मात्रा के वितरण कानून के प्रकार पर निर्भर करता है एक्स।इस प्रकार के यादृच्छिक चर गणितीय आँकड़ों में महत्वपूर्ण भूमिका निभाते हैं; मात्रा के सामान्य वितरण के मामले में उनका सबसे अधिक विस्तार से अध्ययन किया गया है एक्स।

उदाहरण के लिए, यह सिद्ध हो चुका है कि मूल्य के सामान्य वितरण के साथ एक्सयादृच्छिक मूल्य

तथाकथित का पालन करता है छात्र वितरण कानूनसाथ पी- स्वतंत्रता की 1 डिग्री; इस नियम का घनत्व रूप है

जहां G(x) ज्ञात गामा फ़ंक्शन है:

यह भी सिद्ध हो चुका है कि यादृच्छिक चर

के साथ "%2 वितरण" है पी- स्वतंत्रता की 1 डिग्री (अध्याय 7 देखें), जिसका घनत्व सूत्र द्वारा व्यक्त किया गया है

वितरण (14.4.2) और (14.4.4) की व्युत्पत्तियों पर ध्यान दिए बिना, हम दिखाएंगे कि मापदंडों के लिए विश्वास अंतराल का निर्माण करते समय उन्हें कैसे लागू किया जा सकता है टाई डी.

इसका उत्पादन होने दीजिए पीयादृच्छिक चर पर स्वतंत्र प्रयोग एक्स,आम तौर पर अज्ञात मापदंडों के साथ वितरित किया जाता है को।इन मापदंडों के लिए, अनुमान प्राप्त किए गए थे

कॉन्फिडेंस प्रोबेबिलिटी पी के अनुरूप दोनों मापदंडों के लिए कॉन्फिडेंस अंतराल का निर्माण करना आवश्यक है।

आइए पहले गणितीय अपेक्षा के लिए एक विश्वास अंतराल बनाएं। इस अन्तराल को सन्दर्भ में सममित मानना ​​स्वाभाविक है टी; मान लीजिए कि sp अंतराल की आधी लंबाई को दर्शाता है। मान s p चुना जाना चाहिए ताकि शर्त पूरी हो

आइए यादृच्छिक चर से समानता (14.4.5) के बाईं ओर जाने का प्रयास करें टीएक यादृच्छिक चर के लिए टी,छात्र कानून के अनुसार वितरित किया गया। ऐसा करने के लिए, असमानता के दोनों पक्षों को गुणा करें |m-w?|

सकारात्मक मान से: या, संकेतन (14.4.1) का उपयोग करते हुए,

आइए एक ऐसी संख्या/p ढूंढें जिससे शर्त से/p का मान ज्ञात किया जा सके

सूत्र (14.4.2) से यह स्पष्ट है कि (1) एक सम फलन है, इसलिए (14.4.8) देता है

समानता (14.4.9) पी के आधार पर मूल्य / पी निर्धारित करती है। यदि आपके पास अभिन्न मूल्यों की एक तालिका है

तो /p का मान तालिका में रिवर्स इंटरपोलेशन द्वारा पाया जा सकता है। हालाँकि, पहले से /p मानों की तालिका बनाना अधिक सुविधाजनक है। ऐसी तालिका परिशिष्ट (तालिका 5) में दी गई है। यह तालिका आत्मविश्वास स्तर पी और स्वतंत्रता की डिग्री की संख्या के आधार पर मान दिखाती है पी- 1. तालिका से /p निर्धारित करके। 5 और मान रहे हैं

हम विश्वास अंतराल/पी की आधी चौड़ाई और स्वयं अंतराल ज्ञात करेंगे

उदाहरण 1. एक यादृच्छिक चर पर 5 स्वतंत्र प्रयोग किए गए एक्स,आम तौर पर अज्ञात मापदंडों के साथ वितरित किया जाता है टीऔर के बारे में। प्रयोगों के परिणाम तालिका में दिये गये हैं। 14.4.1.

तालिका 14.4.1

रेटिंग ढूंढें टीगणितीय अपेक्षा के लिए और इसके लिए 90% विश्वास अंतराल/पी का निर्माण करें (अर्थात, विश्वास संभावना पी = 0.9 के अनुरूप अंतराल)।

समाधान।हमारे पास है:

के लिए आवेदन की तालिका 5 के अनुसार पी - 1 = 4 और पी = 0.9 हम पाते हैं कहाँ

कॉन्फिडेंस इंटरवल होगा

उदाहरण 2. उपधारा 14.3 के उदाहरण 1 की शर्तों के लिए, मान मानते हुए एक्ससामान्य रूप से वितरित, सटीक विश्वास अंतराल ज्ञात कीजिए।

समाधान।परिशिष्ट की तालिका 5 के अनुसार हम पाते हैं कि कब पी - 1 = 19ir =

0.8/पी = 1.328; यहाँ से

उपधारा 14.3 (ई पी = 0.072) के उदाहरण 1 के समाधान से तुलना करने पर, हम आश्वस्त हैं कि विसंगति बहुत महत्वहीन है। यदि हम दशमलव के दूसरे स्थान तक सटीकता बनाए रखते हैं, तो सटीक और अनुमानित तरीकों से पाए गए विश्वास अंतराल मेल खाते हैं:

आइए विचरण के लिए एक विश्वास अंतराल के निर्माण की ओर आगे बढ़ें। निष्पक्ष विचरण अनुमानक पर विचार करें

और यादृच्छिक चर को व्यक्त करें डीपरिमाण के माध्यम से वी(14.4.3), वितरण x 2 (14.4.4) वाला:

मात्रा के वितरण के नियम को जानना वी,आप अंतराल /(1) पा सकते हैं जिसमें यह दी गई प्रायिकता पी के साथ आता है।

वितरण का नियम kn_x(v)परिमाण I 7 का रूप चित्र में दिखाया गया है। 14.4.1.

चावल। 14.4.1

सवाल उठता है: अंतराल/पी कैसे चुनें? यदि परिमाण के वितरण का नियम वीसममित था (सामान्य कानून या छात्र वितरण की तरह), गणितीय अपेक्षा के संबंध में अंतराल /पी सममित लेना स्वाभाविक होगा। इस मामले में कानून के पी_एक्स (वी)असममित. आइए हम अंतराल /पी चुनने के लिए सहमत हों ताकि मूल्य की संभावना हो वीदाएं और बाएं अंतराल से परे (चित्र 14.4.1 में छायांकित क्षेत्र) समान और बराबर थे

इस गुण के साथ एक अंतराल /पी बनाने के लिए, हम तालिका का उपयोग करते हैं। 4 अनुप्रयोग: इसमें संख्याएँ होती हैं य)ऐसा है कि

मूल्य के लिए वी,स्वतंत्रता की आर डिग्री के साथ x 2-वितरण होना। हमारे मामले में आर = एन- 1. चलो ठीक करें आर = एन- 1 और तालिका की संगत पंक्ति में खोजें। 4 दो अर्थ एक्स 2 -एक संभाव्यता के अनुरूप है और दूसरा - संभाव्यता आइए इन्हें निरूपित करें

मान दो परऔर एक्सएल?अंतराल है य 2,अपने बाएँ के साथ, और य~दाहिना छोर.

आइए अब हम अंतराल /पी से वांछित आत्मविश्वास अंतराल /| खोजें, सीमाओं डी के साथ फैलाव के लिए, और डी2,जो बिंदु को कवर करता है डीप्रायिकता पी के साथ:

आइए हम एक अंतराल / (, = (?> ь А) बनाएं जो बिंदु को कवर करता है डीयदि और केवल यदि मान वीअंतराल /r में पड़ता है। आइए दिखाते हैं वह अंतराल

इस शर्त को पूरा करता है. दरअसल, असमानताएं असमानताओं के समतुल्य हैं

और ये असमानताएँ प्रायिकता p से संतुष्ट हैं। इस प्रकार, विचरण के लिए विश्वास अंतराल पाया गया है और इसे सूत्र (14.4.13) द्वारा व्यक्त किया गया है।

उदाहरण 3. उपधारा 14.3 के उदाहरण 2 की शर्तों के तहत विचरण के लिए विश्वास अंतराल ज्ञात करें, यदि यह ज्ञात हो कि मान एक्ससामान्य रूप से वितरित।

समाधान।हमारे पास है . परिशिष्ट की तालिका 4 के अनुसार

हम पाते हैं आर = एन - 1 = 19

सूत्र (14.4.13) का उपयोग करके हम विचरण के लिए विश्वास अंतराल पाते हैं

मानक विचलन के लिए संगत अंतराल (0.21; 0.32) है। यह अंतराल अनुमानित विधि का उपयोग करके उपधारा 14.3 के उदाहरण 2 में प्राप्त अंतराल (0.21; 0.29) से थोड़ा ही अधिक है।

  • चित्र 14.3.1 एक विश्वास अंतराल को a के बारे में सममित मानता है। सामान्य तौर पर, जैसा कि हम बाद में देखेंगे, यह आवश्यक नहीं है।
श्रेणियाँ

लोकप्रिय लेख

2023 "kingad.ru" - मानव अंगों की अल्ट्रासाउंड जांच