छात्र के टी परीक्षण का सारणीबद्ध मूल्य। बुनियादी आँकड़े और छात्र का टी-टेस्ट

विद्यार्थी का टी-टेस्ट कब उपयोग किया जा सकता है?

विद्यार्थी का टी-टेस्ट लागू करने के लिए मूल डेटा का होना आवश्यक है सामान्य वितरण. स्वतंत्र नमूनों के लिए दो-नमूना मानदंड लागू करने के मामले में, शर्त को पूरा करना भी आवश्यक है भिन्नताओं की समानता (समरूपता)।.

यदि ये शर्तें पूरी नहीं होती हैं, तो नमूना साधनों की तुलना करते समय समान तरीकों का उपयोग किया जाना चाहिए। गैर-पैरामीट्रिक आँकड़ेजिनमें से सबसे प्रसिद्ध हैं मान-व्हिटनी यू परीक्षण(स्वतंत्र नमूनों के लिए दो-नमूना परीक्षण के रूप में), और साइन मानदंडऔर विलकॉक्सन परीक्षण(आश्रित नमूनों के मामलों में प्रयुक्त)।

औसत मूल्यों की तुलना करने के लिए, छात्र के टी-टेस्ट की गणना निम्नलिखित सूत्र का उपयोग करके की जाती है:

कहाँ एम 1- पहली तुलना की गई जनसंख्या (समूह) का अंकगणितीय माध्य, एम 2- दूसरी तुलना की गई जनसंख्या (समूह) का अंकगणितीय माध्य, मी 1- प्रथम अंकगणित माध्य की औसत त्रुटि, मी 2- दूसरे अंकगणितीय माध्य की औसत त्रुटि।

विद्यार्थी के टी-टेस्ट मान की व्याख्या कैसे करें?

परिणामी छात्र के टी-टेस्ट मान की सही व्याख्या की जानी चाहिए। ऐसा करने के लिए, हमें प्रत्येक समूह में विषयों की संख्या (n 1 और n 2) जानने की आवश्यकता है। स्वतंत्रता की कोटि की संख्या ज्ञात करना एफनिम्नलिखित सूत्र के अनुसार:

एफ = (एन 1 + एन 2) - 2

इसके बाद, हम महत्व के आवश्यक स्तर (उदाहरण के लिए, पी = 0.05) और स्वतंत्रता की दी गई डिग्री के लिए छात्र के टी-टेस्ट का महत्वपूर्ण मूल्य निर्धारित करते हैं। एफतालिका के अनुसार ( नीचे देखें).

हम मानदंड के महत्वपूर्ण और परिकलित मूल्यों की तुलना करते हैं:

· यदि छात्र के टी-टेस्ट का परिकलित मान बराबर या अधिकमहत्वपूर्ण, तालिका से पाया गया, हम निष्कर्ष निकालते हैं कि तुलना किए गए मूल्यों के बीच अंतर सांख्यिकीय रूप से महत्वपूर्ण हैं।

· यदि छात्र के टी-टेस्ट का मान परिकलित किया जाता है कमसारणीबद्ध, जिसका अर्थ है कि तुलना किए गए मूल्यों के बीच अंतर सांख्यिकीय रूप से महत्वपूर्ण नहीं है।

विद्यार्थी के टी-टेस्ट की गणना का उदाहरण

एक नई लौह तैयारी की प्रभावशीलता का अध्ययन करने के लिए, एनीमिया से पीड़ित रोगियों के दो समूहों का चयन किया गया। पहले समूह में, रोगियों को दो सप्ताह के लिए एक नई दवा मिली, और दूसरे समूह में उन्हें प्लेसबो मिला। इसके बाद, परिधीय रक्त में हीमोग्लोबिन का स्तर मापा गया। पहले समूह में, औसत हीमोग्लोबिन स्तर 115.4±1.2 ग्राम/लीटर था, और दूसरे समूह में - 103.7±2.3 ग्राम/लीटर (डेटा प्रारूप में प्रस्तुत किया गया है) म±म), तुलना की जा रही आबादी का वितरण सामान्य है। पहले समूह की संख्या 34 थी, और दूसरे - 40 मरीज़। प्राप्त अंतरों के सांख्यिकीय महत्व और नई लौह तैयारी की प्रभावशीलता के बारे में निष्कर्ष निकालना आवश्यक है।

समाधान:मतभेदों के महत्व का आकलन करने के लिए, हम छात्र के टी-टेस्ट का उपयोग करते हैं, जिसकी गणना वर्ग त्रुटियों के योग से विभाजित औसत मूल्यों में अंतर के रूप में की जाती है:

गणना करने के बाद, टी-परीक्षण मान 4.51 निकला। हम स्वतंत्रता की डिग्री की संख्या (34 + 40) - 2 = 72 के रूप में पाते हैं। हम परिणामी छात्र के टी-टेस्ट मान 4.51 की तुलना तालिका में दर्शाए गए पी = 0.05 पर महत्वपूर्ण मान से करते हैं: 1.993। चूँकि मानदंड का परिकलित मान महत्वपूर्ण मान से अधिक है, हम यह निष्कर्ष निकालते हैं कि देखे गए अंतर सांख्यिकीय रूप से महत्वपूर्ण हैं (महत्व स्तर पी<0,05).

फिशर वितरण एक यादृच्छिक चर का वितरण है

यादृच्छिक चर कहाँ हैं एक्स 1और एक्स 2स्वतंत्र हैं और स्वतंत्रता की डिग्री की संख्या के साथ काई-वर्ग वितरण हैं क 1और क 2क्रमश। उसी समय, युगल (के 1 , के 2)- फिशर वितरण की "स्वतंत्रता की डिग्री" की एक जोड़ी, अर्थात्, क 1अंश की स्वतंत्रता की डिग्री की संख्या है, और क 2– हर की स्वतंत्रता की डिग्री की संख्या. एक यादृच्छिक चर का वितरण एफइसका नाम महान अंग्रेजी सांख्यिकीविद् आर. फिशर (1890-1962) के नाम पर रखा गया, जिन्होंने अपने कार्यों में इसका सक्रिय रूप से उपयोग किया।

फिशर वितरण का उपयोग प्रतिगमन विश्लेषण, भिन्नताओं की समानता और लागू आंकड़ों की अन्य समस्याओं में मॉडल की पर्याप्तता के बारे में परिकल्पना का परीक्षण करते समय किया जाता है।

विद्यार्थी के महत्वपूर्ण मूल्यों की तालिका।

फॉर्म की शुरुआत

स्वतंत्रता की डिग्री की संख्या, एफ विद्यार्थी का t-परीक्षण मान p=0.05 पर
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.040
2.037
2.035
2.032
2.030
2.028
2.026
2.024
40-41 2.021
42-43 2.018
44-45 2.015
46-47 2.013
48-49 2.011
50-51 2.009
52-53 2.007
54-55 2.005
56-57 2.003
58-59 2.002
60-61 2.000
62-63 1.999
64-65 1.998
66-67 1.997
68-69 1.995
70-71 1.994
72-73 1.993
74-75 1.993
76-77 1.992
78-79 1.991
80-89 1.990
90-99 1.987
100-119 1.984
120-139 1.980
140-159 1.977
160-179 1.975
180-199 1.973
1.972
1.960

​छात्र का टी-टेस्ट छात्र वितरण के आधार पर परिकल्पनाओं (सांख्यिकीय परीक्षण) के सांख्यिकीय परीक्षण के तरीकों के एक वर्ग का सामान्य नाम है। टी-टेस्ट के सबसे आम उपयोग में दो नमूनों में साधनों की समानता का परीक्षण करना शामिल है।

1. टी-टेस्ट के विकास का इतिहास

यह मानदंड विकसित किया गया था विलियम गॉसेटगिनीज कंपनी में बीयर की गुणवत्ता का आकलन करने के लिए। व्यापार रहस्यों का खुलासा न करने के संबंध में कंपनी के दायित्वों के कारण, गॉसेट का लेख 1908 में छद्म नाम "स्टूडेंट" के तहत बायोमेट्रिक्स पत्रिका में प्रकाशित हुआ था।

2. विद्यार्थी का टी-टेस्ट किसके लिए प्रयोग किया जाता है?

विद्यार्थी के टी परीक्षण का उपयोग साधनों में अंतर के सांख्यिकीय महत्व को निर्धारित करने के लिए किया जाता है। स्वतंत्र नमूनों की तुलना के मामलों में दोनों का उपयोग किया जा सकता है ( उदाहरण के लिए, मधुमेह रोगियों के समूह और स्वस्थ समूह), और संबंधित आबादी की तुलना करते समय ( उदाहरण के लिए, उन्हीं रोगियों में एंटीरैडमिक दवा लेने से पहले और बाद में औसत हृदय गति).

3. किन मामलों में विद्यार्थी के टी-टेस्ट का उपयोग किया जा सकता है?

विद्यार्थी का टी-टेस्ट लागू करने के लिए मूल डेटा का होना आवश्यक है सामान्य वितरण. स्वतंत्र नमूनों के लिए दो-नमूना मानदंड लागू करने के मामले में, शर्त को पूरा करना भी आवश्यक है भिन्नताओं की समानता (समरूपता)।.

यदि ये शर्तें पूरी नहीं होती हैं, तो नमूना साधनों की तुलना करते समय समान तरीकों का उपयोग किया जाना चाहिए। गैर-पैरामीट्रिक आँकड़ेजिनमें से सबसे प्रसिद्ध हैं मान-व्हिटनी यू परीक्षण(स्वतंत्र नमूनों के लिए दो-नमूना परीक्षण के रूप में), और साइन मानदंडऔर विलकॉक्सन परीक्षण(आश्रित नमूनों के मामलों में प्रयुक्त)।

4. छात्र के टी-टेस्ट की गणना कैसे करें?

औसत मूल्यों की तुलना करने के लिए, छात्र के टी-टेस्ट की गणना निम्नलिखित सूत्र का उपयोग करके की जाती है:

कहाँ एम 1- पहली तुलना की गई जनसंख्या (समूह) का अंकगणितीय माध्य, एम 2- दूसरी तुलना की गई जनसंख्या (समूह) का अंकगणितीय माध्य, मी 1- प्रथम अंकगणित माध्य की औसत त्रुटि, मी 2- दूसरे अंकगणितीय माध्य की औसत त्रुटि।

5. विद्यार्थी के टी-टेस्ट मान की व्याख्या कैसे करें?

परिणामी छात्र के टी-टेस्ट मान की सही व्याख्या की जानी चाहिए। ऐसा करने के लिए, हमें प्रत्येक समूह में विषयों की संख्या (n 1 और n 2) जानने की आवश्यकता है। स्वतंत्रता की कोटि की संख्या ज्ञात करना एफनिम्नलिखित सूत्र के अनुसार:

एफ = (एन 1 + एन 2) - 2

इसके बाद, हम महत्व के आवश्यक स्तर (उदाहरण के लिए, पी = 0.05) और स्वतंत्रता की दी गई डिग्री के लिए छात्र के टी-टेस्ट का महत्वपूर्ण मूल्य निर्धारित करते हैं। एफतालिका के अनुसार ( नीचे देखें).

हम मानदंड के महत्वपूर्ण और परिकलित मूल्यों की तुलना करते हैं:

  • यदि छात्र के टी-टेस्ट का परिकलित मान बराबर या अधिकमहत्वपूर्ण, तालिका से पाया गया, हम निष्कर्ष निकालते हैं कि तुलना किए गए मूल्यों के बीच अंतर सांख्यिकीय रूप से महत्वपूर्ण हैं।
  • यदि छात्र के टी-टेस्ट का मान परिकलित किया जाता है कमसारणीबद्ध, जिसका अर्थ है कि तुलना किए गए मूल्यों के बीच अंतर सांख्यिकीय रूप से महत्वपूर्ण नहीं है।

6. विद्यार्थी के टी-टेस्ट की गणना का उदाहरण

एक नई लौह तैयारी की प्रभावशीलता का अध्ययन करने के लिए, एनीमिया से पीड़ित रोगियों के दो समूहों का चयन किया गया। पहले समूह में, रोगियों को दो सप्ताह के लिए एक नई दवा मिली, और दूसरे समूह में उन्हें प्लेसबो मिला। इसके बाद, परिधीय रक्त में हीमोग्लोबिन का स्तर मापा गया। पहले समूह में, औसत हीमोग्लोबिन स्तर 115.4±1.2 ग्राम/लीटर था, और दूसरे समूह में - 103.7±2.3 ग्राम/लीटर (डेटा प्रारूप में प्रस्तुत किया गया है) म±म), तुलना की जा रही आबादी का वितरण सामान्य है। पहले समूह की संख्या 34 थी, और दूसरे - 40 मरीज़। प्राप्त अंतरों के सांख्यिकीय महत्व और नई लौह तैयारी की प्रभावशीलता के बारे में निष्कर्ष निकालना आवश्यक है।

समाधान:मतभेदों के महत्व का आकलन करने के लिए, हम छात्र के टी-टेस्ट का उपयोग करते हैं, जिसकी गणना वर्ग त्रुटियों के योग से विभाजित औसत मूल्यों में अंतर के रूप में की जाती है:

गणना करने के बाद, टी-परीक्षण मान 4.51 निकला। हम स्वतंत्रता की डिग्री की संख्या (34 + 40) - 2 = 72 के रूप में पाते हैं। हम परिणामी छात्र के टी-टेस्ट मान 4.51 की तुलना तालिका में दर्शाए गए पी = 0.05 पर महत्वपूर्ण मान से करते हैं: 1.993। चूँकि मानदंड का परिकलित मान महत्वपूर्ण मान से अधिक है, हम यह निष्कर्ष निकालते हैं कि देखे गए अंतर सांख्यिकीय रूप से महत्वपूर्ण हैं (महत्व स्तर पी<0,05).

सांख्यिकीय परिकल्पना परीक्षण हमें नमूना डेटा के आधार पर जनसंख्या की विशेषताओं के बारे में मजबूत अनुमान लगाने की अनुमति देता है। अलग-अलग परिकल्पनाएं हैं. उनमें से एक औसत (गणितीय अपेक्षा) के बारे में परिकल्पना है। इसका सार केवल उपलब्ध नमूने के आधार पर एक सही निष्कर्ष निकालना है, जहां सामान्य औसत स्थित हो सकता है या नहीं हो सकता है (हम सटीक सत्य कभी नहीं जान पाएंगे, लेकिन हम खोज को सीमित कर सकते हैं)।

परिकल्पनाओं के परीक्षण के लिए सामान्य दृष्टिकोण का वर्णन किया गया है, तो चलिए सीधे मुद्दे पर आते हैं। आइए पहले मान लें कि नमूना यादृच्छिक चर की सामान्य आबादी से लिया गया है एक्ससामान्य औसत के साथ μ और विचरण σ 2(मुझे पता है, मुझे पता है कि ऐसा नहीं होता है, लेकिन मुझे बीच में मत रोको!)। इस नमूने का अंकगणितीय माध्य स्पष्ट रूप से स्वयं एक यादृच्छिक चर है। यदि आप ऐसे कई नमूने निकालेंगे और उनका औसत निकालेंगे तो उनमें गणितीय अपेक्षा भी होगी μ और

फिर यादृच्छिक चर

सवाल उठता है: क्या 95% संभावना के साथ सामान्य औसत ±1.96 के भीतर होगा? s x̅. दूसरे शब्दों में, यादृच्छिक चर के वितरण हैं

समकक्ष।

यह प्रश्न सबसे पहले डबलिन (आयरलैंड) में गिनीज बियर फैक्ट्री में काम करने वाले एक रसायनज्ञ ने उठाया (और हल किया)। रसायनज्ञ का नाम विलियम सीली गॉसेट था और उसने रासायनिक विश्लेषण के लिए बीयर के नमूने लिए। कुछ बिंदु पर, जाहिरा तौर पर, विलियम को औसत के वितरण के बारे में अस्पष्ट संदेह सताने लगे। यह सामान्य वितरण की तुलना में थोड़ा अधिक धुंधला साबित हुआ।

गणितीय आधार एकत्र करने और उनके द्वारा खोजे गए वितरण फ़ंक्शन के मूल्यों की गणना करने के बाद, डबलिन के रसायनज्ञ विलियम गॉसेट ने एक नोट लिखा जो बायोमेट्रिक्स पत्रिका (मुख्य संपादक - कार्ल पियर्सन) के मार्च 1908 अंक में प्रकाशित हुआ था। क्योंकि गिनीज़ ने शराब बनाने के रहस्यों को बताने से सख्ती से मना किया; गॉसेट ने छद्म नाम स्टूडेंट के साथ हस्ताक्षर किए।

इस तथ्य के बावजूद कि के. पियर्सन ने पहले ही वितरण का आविष्कार कर लिया था, सामान्यता का सामान्य विचार अभी भी हावी था। कोई यह सोचने वाला नहीं था कि नमूना अंकों का वितरण सामान्य नहीं हो सकता है। इसलिए, डब्ल्यू. गोसेट का लेख व्यावहारिक रूप से किसी का ध्यान नहीं गया और भुला दिया गया। और केवल रोनाल्ड फिशर ने गॉसेट की खोज की सराहना की। फिशर ने अपने काम में नए वितरण का उपयोग किया और इसे नाम दिया विद्यार्थी का टी-वितरण. तदनुसार, परिकल्पनाओं के परीक्षण की कसौटी बन गई विद्यार्थी का टी-टेस्ट. इस प्रकार सांख्यिकी में एक "क्रांति" उत्पन्न हुई, जिसने नमूना डेटा के विश्लेषण के युग में कदम रखा। यह इतिहास का एक छोटा सा भ्रमण था।

आइए देखें कि डब्लू. गोसेट क्या देख सका। आइए औसतन 6 अवलोकनों से 20 हजार सामान्य नमूने उत्पन्न करें ( एक्स) 50 और मानक विचलन ( σ ) 10. फिर हम नमूना का उपयोग करके सामान्यीकृत करते हैं सामान्य विचरण:

हम परिणामी 20 हजार औसतों को 0.1 लंबाई के अंतरालों में समूहित करेंगे और आवृत्तियों की गणना करेंगे। आइए हम आरेख पर नमूना साधनों के वास्तविक (नॉर्म) और सैद्धांतिक (ईनॉर्म) आवृत्ति वितरण को चित्रित करें।

बिंदु (अवलोकित आवृत्तियाँ) व्यावहारिक रूप से रेखा (सैद्धांतिक आवृत्तियों) के साथ मेल खाते हैं। यह समझ में आने योग्य है, क्योंकि डेटा एक ही सामान्य जनसंख्या से लिया गया है, और अंतर केवल नमूनाकरण त्रुटियाँ हैं।

आइए एक नया प्रयोग करें. हम औसत का उपयोग करके सामान्यीकरण करते हैं नमूना विचरण.

आइए आवृत्तियों को फिर से गिनें और तुलना के लिए एक मानक सामान्य वितरण रेखा छोड़कर, उन्हें बिंदुओं के रूप में आरेख पर प्लॉट करें। आइए हम औसतों की अनुभवजन्य आवृत्ति को, मान लीजिए, अक्षर से निरूपित करें टी.

यह देखा जा सकता है कि इस बार वितरण बहुत अधिक मेल नहीं खाता है। बंद करें, हाँ, लेकिन वैसा नहीं। पूँछें अधिक "भारी" हो गई हैं।

गॉसेट-स्टूडेंट के पास एमएस एक्सेल का नवीनतम संस्करण नहीं था, लेकिन उसने बिल्कुल यही प्रभाव देखा। ऐसा क्यूँ होता है? स्पष्टीकरण यह है कि यादृच्छिक चर

यह न केवल नमूना त्रुटि (अंशांक) पर निर्भर करता है, बल्कि माध्य (हर) की मानक त्रुटि पर भी निर्भर करता है, जो एक यादृच्छिक चर भी है।

आइए थोड़ा देखें कि ऐसे यादृच्छिक चर का वितरण क्या होना चाहिए। सबसे पहले, आपको गणितीय आँकड़ों से कुछ याद रखना (या सीखना) होगा। फिशर का प्रमेय है, जो बताता है कि सामान्य वितरण से एक नमूने में:

1. मध्यम एक्सऔर नमूना विचरण एस 2स्वतंत्र मात्राएँ हैं;

2. नमूना और जनसंख्या भिन्नता का अनुपात, स्वतंत्रता की डिग्री की संख्या से गुणा करके, एक वितरण होता है χ 2(ची-स्क्वायर) स्वतंत्रता की समान डिग्री के साथ, यानी।

कहाँ - स्वतंत्रता की डिग्री की संख्या (अंग्रेजी में स्वतंत्रता की डिग्री (डी.एफ.))

सामान्य मॉडलों के आँकड़ों में कई अन्य परिणाम इसी नियम पर आधारित होते हैं।

आइए औसत के वितरण पर वापस लौटें। व्यंजक के अंश और हर को विभाजित करें

पर σ एक्स̅. हम पाते हैं

अंश एक मानक सामान्य यादृच्छिक चर है (हम दर्शाते हैं)। ξ (xi)). आइए हम हर को फिशर के प्रमेय से व्यक्त करें।

तब मूल अभिव्यक्ति रूप लेगी

सामान्य रूप में यही है (छात्र संबंध)। आप इसका वितरण फलन सीधे प्राप्त कर सकते हैं, क्योंकि इस अभिव्यक्ति में दोनों यादृच्छिक चर के वितरण ज्ञात हैं। आइए यह आनंद गणितज्ञों पर छोड़ दें।

स्टूडेंट टी-डिस्ट्रीब्यूशन फ़ंक्शन का एक सूत्र है जिसे समझना काफी कठिन है, इसलिए इसका विश्लेषण करने का कोई मतलब नहीं है। वैसे भी कोई इसका उपयोग नहीं करता, क्योंकि... संभाव्यताएँ छात्र वितरण की विशेष तालिकाओं (कभी-कभी छात्र गुणांक की तालिकाएँ भी कहलाती हैं) में दी जाती हैं, या पीसी फ़ार्मुलों में शामिल की जाती हैं।

तो, इस नए ज्ञान से लैस होकर, आप छात्र वितरण की आधिकारिक परिभाषा को समझ सकते हैं।
छात्र वितरण के लिए एक यादृच्छिक चर विषय स्वतंत्रता की डिग्री स्वतंत्र यादृच्छिक चर का अनुपात है

कहाँ ξ मानक सामान्य कानून के अनुसार वितरित, और χ 2 कवितरण का पालन करता है χ 2सी स्वतंत्रता की कोटियां।

इस प्रकार, विद्यार्थी का अंकगणितीय माध्य के लिए परीक्षण सूत्र

छात्र संबंध का एक विशेष मामला है

सूत्र और परिभाषा से यह पता चलता है कि छात्र के टी-टेस्ट का वितरण केवल स्वतंत्रता की डिग्री की संख्या पर निर्भर करता है।

पर > 30 टी-परीक्षण व्यावहारिक रूप से मानक सामान्य वितरण से भिन्न नहीं है।

ची-स्क्वायर के विपरीत, टी-टेस्ट एक-पूंछ या दो-पूंछ वाला हो सकता है। आमतौर पर वे दोतरफा का उपयोग करते हैं, यह मानते हुए कि विचलन औसत से दोनों दिशाओं में हो सकता है। लेकिन यदि समस्या की स्थिति केवल एक दिशा में विचलन की अनुमति देती है, तो एकतरफा मानदंड का उपयोग करना उचित है। इससे शक्ति थोड़ी बढ़ जाती है, क्योंकि... एक निश्चित महत्व स्तर पर, महत्वपूर्ण मान थोड़ा सा शून्य के करीब पहुंचता है।

विद्यार्थी के टी-टेस्ट का उपयोग करने की शर्तें

इस तथ्य के बावजूद कि एक समय में स्टूडेंट की खोज ने सांख्यिकी में क्रांति ला दी थी, टी-टेस्ट अभी भी अपनी अनुप्रयोग संभावनाओं में काफी सीमित है, क्योंकि यह स्वयं मूल डेटा के सामान्य वितरण की धारणा से आता है। यदि डेटा सामान्य नहीं है (जो आमतौर पर मामला है), तो टी-टेस्ट में अब छात्र वितरण नहीं होगा। हालाँकि, केंद्रीय सीमा प्रमेय की कार्रवाई के कारण, असामान्य डेटा के लिए भी औसत जल्दी से घंटी के आकार का वितरण प्राप्त कर लेता है।

उदाहरण के लिए, उस डेटा पर विचार करें जो स्पष्ट रूप से दाईं ओर झुका हुआ है, जैसे कि 5 डिग्री स्वतंत्रता के साथ ची-स्क्वायर वितरण।

आइए अब 20 हजार नमूने बनाएं और देखें कि उनकी मात्रा के आधार पर औसत का वितरण कैसे बदलता है।

15-20 अवलोकनों तक के छोटे नमूनों में अंतर काफी ध्यान देने योग्य है। लेकिन फिर यह जल्दी ही गायब हो जाता है। इस प्रकार, वितरण की गैर-सामान्यता, निश्चित रूप से, अच्छी नहीं है, लेकिन महत्वपूर्ण भी नहीं है।

सबसे बढ़कर, टी-टेस्ट आउटलेर्स से "डरता" है, यानी। असामान्य विचलन. आइए प्रत्येक 15 अवलोकनों के 20 हजार सामान्य नमूने लें और उनमें से कुछ में एक यादृच्छिक आउटलायर जोड़ें।

तस्वीर धूमिल हो गई है. औसत की वास्तविक आवृत्तियाँ सैद्धांतिक आवृत्तियों से बहुत भिन्न होती हैं। ऐसी स्थिति में टी-वितरण का उपयोग करना एक बहुत ही जोखिम भरा कार्य बन जाता है।

इसलिए, बहुत छोटे नमूनों (15 अवलोकनों से) में, टी-परीक्षण मूल डेटा के गैर-सामान्य वितरण के लिए अपेक्षाकृत प्रतिरोधी है। लेकिन डेटा में आउटलेर्स टी-टेस्ट के वितरण को बहुत विकृत कर देते हैं, जिसके परिणामस्वरूप सांख्यिकीय अनुमान में त्रुटियां हो सकती हैं, इसलिए विसंगतिपूर्ण टिप्पणियों को समाप्त किया जाना चाहिए। अक्सर, माध्य से ±2 मानक विचलन के भीतर आने वाले सभी मान नमूने से हटा दिए जाते हैं।

एमएस एक्सेल में छात्र के टी-टेस्ट का उपयोग करके गणितीय अपेक्षा के बारे में एक परिकल्पना का परीक्षण करने का एक उदाहरण

एक्सेल में टी-वितरण से संबंधित कई कार्य हैं। आइए उन पर नजर डालें.

STUDENT.DIST - "शास्त्रीय" वाम-पक्षीय छात्र टी-वितरण। इनपुट टी-मानदंड मान, स्वतंत्रता की डिग्री की संख्या और एक विकल्प (0 या 1) है जो निर्धारित करता है कि क्या गणना करने की आवश्यकता है: घनत्व या फ़ंक्शन मान। आउटपुट पर हम क्रमशः घनत्व या संभावना प्राप्त करते हैं कि यादृच्छिक चर तर्क में निर्दिष्ट टी-मानदंड से कम होगा।

STUDENT.DIST.2X - दोतरफा वितरण। तर्क टी-टेस्ट का पूर्ण मूल्य (मॉड्यूलो) और स्वतंत्रता की डिग्री की संख्या है। परिणामस्वरूप, हम समान या उससे भी अधिक टी-मानदंड मान प्राप्त करने की संभावना प्राप्त करते हैं, अर्थात। वास्तविक महत्व स्तर (पी-स्तर)।

STUDENT.DIST.PH - दाईं ओर टी-वितरण। तो, 1-STUDENT.DIST(2;5;1) = STUDENT.DIST.PH(2;5) = 0.05097। यदि टी-परीक्षण सकारात्मक है, तो परिणामी संभावना पी-स्तर है।

STUDENT.INR - टी-वितरण के बाएं तरफा व्युत्क्रम की गणना करने के लिए उपयोग किया जाता है। तर्क संभावना और स्वतंत्रता की डिग्री की संख्या है। आउटपुट पर हमें इस संभावना के अनुरूप टी-मानदंड मान प्राप्त होता है। संभाव्यता गणना बाईं ओर है. इसलिए, बायीं पूँछ को स्वयं महत्व स्तर की आवश्यकता होती है α , और सही के लिए 1 - α .

STUDENT.OBR.2X - दो तरफा छात्र वितरण के लिए व्युत्क्रम मान, अर्थात। टी-परीक्षण मान (मॉड्यूलो)। इनपुट को महत्व स्तर भी प्रदान किया जाता है α . केवल इस बार गिनती दोनों पक्षों से एक साथ की जाती है, इसलिए संभावना दो पुच्छों में वितरित हो जाती है। तो, STUDENT.ARV(1-0.025;5) = STUDENT.ARV.2X(0.05;5) = 2.57058

STUDENT.TEST दो नमूनों में गणितीय अपेक्षाओं की समानता के बारे में परिकल्पना का परीक्षण करने का एक कार्य है। गणनाओं का एक समूह बदल देता है, क्योंकि यह डेटा और कुछ और मापदंडों के साथ केवल दो श्रेणियां निर्दिष्ट करने के लिए पर्याप्त है। आउटपुट पी-लेवल है।

आत्मविश्वास.छात्र - टी-वितरण को ध्यान में रखते हुए औसत के आत्मविश्वास अंतराल की गणना।

आइए इस प्रशिक्षण उदाहरण पर विचार करें। उद्यम में सीमेंट को 50 किलो बैग में पैक किया जाता है। यादृच्छिकता के कारण, एक बैग में अपेक्षित द्रव्यमान से कुछ विचलन की अनुमति है, लेकिन सामान्य औसत 50 किलोग्राम ही रहना चाहिए। गुणवत्ता नियंत्रण विभाग ने यादृच्छिक रूप से 9 बैगों का वजन किया और निम्नलिखित परिणाम प्राप्त किए: औसत वजन ( एक्स) 50.3 किग्रा था, मानक विचलन ( एस) – 0.5 कि.ग्रा.

क्या यह परिणाम शून्य परिकल्पना के अनुरूप है कि सामान्य माध्य 50 किग्रा है? दूसरे शब्दों में, यदि उपकरण ठीक से काम कर रहा है और औसतन 50 किलोग्राम का भराव उत्पन्न करता है तो क्या शुद्ध संयोग से ऐसा परिणाम प्राप्त करना संभव है? यदि परिकल्पना को अस्वीकार नहीं किया जाता है, तो परिणामी अंतर यादृच्छिक उतार-चढ़ाव की सीमा में फिट बैठता है, लेकिन यदि परिकल्पना को खारिज कर दिया जाता है, तो सबसे अधिक संभावना है कि बैग भरने वाली मशीन की सेटिंग्स में खराबी थी। इसे जांचने और कॉन्फ़िगर करने की आवश्यकता है.

आम तौर पर स्वीकृत नोटेशन में एक संक्षिप्त स्थिति इस तरह दिखती है।

H0: μ = 50 किग्रा

एच1: μ ≠ 50 किग्रा

यह मानने के कई कारण हैं कि बैग अधिभोग का वितरण सामान्य वितरण का अनुसरण करता है (या इससे बहुत अधिक भिन्न नहीं होता है)। तो, गणितीय अपेक्षा की परिकल्पना का परीक्षण करने के लिए, आप छात्र के टी-टेस्ट का उपयोग कर सकते हैं। यादृच्छिक विचलन किसी भी दिशा में हो सकता है, इसलिए दो-पूंछ वाले टी-परीक्षण की आवश्यकता है।

सबसे पहले, हम एंटीडिलुवियन साधन लागू करते हैं: मैन्युअल रूप से टी-टेस्ट की गणना करना और एक महत्वपूर्ण तालिका मान के साथ इसकी तुलना करना। अनुमानित टी-परीक्षण:

अब आइए यह निर्धारित करें कि क्या परिणामी संख्या सार्थकता स्तर पर महत्वपूर्ण स्तर से आगे जाती है या नहीं α = 0.05. आइए विद्यार्थी की टी-वितरण तालिका (सांख्यिकी पर किसी भी पाठ्यपुस्तक में उपलब्ध) का उपयोग करें।

कॉलम वितरण के दाईं ओर की संभावना दर्शाते हैं, पंक्तियाँ स्वतंत्रता की डिग्री की संख्या दर्शाती हैं। हम 0.05 के महत्व स्तर के साथ दो-तरफा टी-परीक्षण में रुचि रखते हैं, जो दाईं ओर महत्व स्तर के आधे के लिए टी-मान के बराबर है: 1 - 0.05 / 2 = 0.975। स्वतंत्रता की डिग्री की संख्या नमूना आकार शून्य से 1 है, अर्थात। 9 - 1 = 8. प्रतिच्छेदन पर हम टी-परीक्षण का तालिका मान पाते हैं - 2.306। यदि हम मानक सामान्य वितरण का उपयोग करते हैं, तो महत्वपूर्ण बिंदु 1.96 होगा, लेकिन यहां यह अधिक है, क्योंकि छोटे नमूनों में टी-वितरण का स्वरूप अधिक चपटा होता है।

आइए वास्तविक (1.8) और तालिका मान (2.306) की तुलना करें। परिकलित मानदंड सारणीबद्ध मानदंड से कम निकला। इसलिए, उपलब्ध डेटा एच 0 परिकल्पना का खंडन नहीं करता है कि सामान्य औसत 50 किलोग्राम है (लेकिन इसे साबित भी नहीं करता है)। तालिकाओं का उपयोग करके हम बस इतना ही सीख सकते हैं। बेशक, आप पी-स्तर खोजने का प्रयास भी कर सकते हैं, लेकिन यह अनुमानित होगा। और, एक नियम के रूप में, यह पी-स्तर है जिसका उपयोग परिकल्पनाओं का परीक्षण करने के लिए किया जाता है। इसलिए, हम आगे एक्सेल की ओर बढ़ते हैं।

एक्सेल में टी-टेस्ट की गणना के लिए कोई तैयार फ़ंक्शन नहीं है। लेकिन यह डरावना नहीं है, क्योंकि छात्र का टी-टेस्ट फॉर्मूला काफी सरल है और इसे एक्सेल सेल में आसानी से बनाया जा सकता है।

वही 1.8 मिला. आइए सबसे पहले क्रांतिक मान ज्ञात करें। हम अल्फ़ा 0.05 लेते हैं, मानदंड दो-पूंछ वाला है। हमें दो-पूंछ वाली परिकल्पना STUDENT.OBR.2X के लिए t-वितरण के व्युत्क्रम मान के एक फ़ंक्शन की आवश्यकता है।

परिणामी मान महत्वपूर्ण क्षेत्र को काट देता है। देखा गया टी-परीक्षण इसमें नहीं आता है, इसलिए परिकल्पना अस्वीकार नहीं की जाती है।

हालाँकि, यह तालिका मान का उपयोग करके किसी परिकल्पना का परीक्षण करने का वही तरीका है। पी-स्तर की गणना करना अधिक जानकारीपूर्ण होगा, अर्थात। यदि यह परिकल्पना सही है तो 50 किग्रा के माध्य से प्रेक्षित या इससे भी अधिक विचलन होने की संभावना है। आपको दोतरफा परिकल्पना STUDENT.DIST.2X के लिए छात्र वितरण फ़ंक्शन की आवश्यकता होगी।

पी-स्तर 0.1096 है, जो स्वीकार्य महत्व स्तर 0.05 से अधिक है - हम परिकल्पना को अस्वीकार नहीं करते हैं। लेकिन अब हम साक्ष्य की डिग्री का आकलन कर सकते हैं। जब परिकल्पना खारिज कर दी जाती है तो पी-स्तर उस स्तर के काफी करीब होता है, और इससे अलग-अलग विचार सामने आते हैं। उदाहरण के लिए, किसी महत्वपूर्ण विचलन का पता लगाने के लिए नमूना बहुत छोटा था।

कुछ समय बाद, नियंत्रण विभाग ने फिर से यह जाँचने का निर्णय लिया कि बैग भरने के मानक को कैसे बनाए रखा जा रहा है। इस बार अधिक विश्वसनीयता के लिए 9 नहीं, बल्कि 25 बैग चुने गए। यह सहज रूप से स्पष्ट है कि औसत का प्रसार कम हो जाएगा, और इसलिए, सिस्टम में विफलता मिलने की संभावना अधिक हो जाएगी।

मान लीजिए कि नमूने के लिए माध्य और मानक विचलन के समान मान पहली बार (क्रमशः 50.3 और 0.5) प्राप्त किए गए थे। आइए टी-टेस्ट की गणना करें।


स्वतंत्रता की 24 डिग्री और α = 0.05 के लिए महत्वपूर्ण मान 2.064 है। नीचे दी गई तस्वीर से पता चलता है कि टी-परीक्षण परिकल्पना अस्वीकृति की सीमा के भीतर आता है।

हम यह निष्कर्ष निकाल सकते हैं कि 95% से अधिक की आत्मविश्वास संभावना के साथ, सामान्य औसत 50 किलोग्राम से भिन्न होता है। अधिक आश्वस्त होने के लिए, आइए पी-स्तर (तालिका में अंतिम पंक्ति) को देखें। यदि परिकल्पना सही है, तो 50 से समान या उससे भी अधिक विचलन के साथ औसत प्राप्त करने की संभावना 0.0062 या 0.62% है, जो एकल माप के साथ व्यावहारिक रूप से असंभव है। सामान्य तौर पर, हम परिकल्पना को असंभावित मानकर अस्वीकार कर देते हैं।

विद्यार्थी के टी-वितरण का उपयोग करके आत्मविश्वास अंतराल की गणना करना

एक अन्य सांख्यिकीय विधि परिकल्पना परीक्षण से निकटता से संबंधित है - आत्मविश्वास अंतराल की गणना. यदि परिणामी अंतराल में शून्य परिकल्पना के अनुरूप मान होता है, तो यह इस तथ्य के बराबर है कि शून्य परिकल्पना अस्वीकार नहीं की जाती है। अन्यथा, परिकल्पना को संबंधित आत्मविश्वास स्तर के साथ खारिज कर दिया जाता है। कुछ मामलों में, विश्लेषक शास्त्रीय रूप में परिकल्पनाओं का बिल्कुल भी परीक्षण नहीं करते हैं, बल्कि केवल आत्मविश्वास अंतराल की गणना करते हैं। यह दृष्टिकोण आपको और भी अधिक उपयोगी जानकारी निकालने की अनुमति देता है।

आइए 9 और 25 प्रेक्षणों के माध्य के लिए विश्वास अंतराल की गणना करें। ऐसा करने के लिए, हम एक्सेल फ़ंक्शन CONFIDENT.STUDENT का उपयोग करेंगे। यहाँ, अजीब तरह से, सब कुछ काफी सरल है। फ़ंक्शन तर्कों को केवल महत्व स्तर को इंगित करने की आवश्यकता है α , नमूना मानक विचलन, और नमूना आकार। आउटपुट पर हमें कॉन्फिडेंस इंटरवल की आधी-चौड़ाई मिलती है, यानी वह मान जिसे औसत के दोनों तरफ रखने की जरूरत होती है। गणना करने और एक दृश्य आरेख बनाने के बाद, हमें निम्नलिखित मिलता है।

जैसा कि आप देख सकते हैं, 9 अवलोकनों के नमूने के साथ, मान 50 विश्वास अंतराल के भीतर आता है (परिकल्पना खारिज नहीं की जाती है), और 25 अवलोकनों के साथ यह आत्मविश्वास अंतराल के भीतर नहीं आता है (परिकल्पना खारिज कर दी जाती है)। इसके अलावा, 25 बैगों के साथ एक प्रयोग में, यह कहा जा सकता है कि 97.5% की संभावना के साथ सामान्य औसत 50.1 किलोग्राम से अधिक है (विश्वास अंतराल की निचली सीमा 50.094 किलोग्राम है)। और यह काफी मूल्यवान जानकारी है.

इस प्रकार, हमने एक ही समस्या को तीन तरीकों से हल किया:

1. एक प्राचीन दृष्टिकोण का उपयोग करते हुए, टी-टेस्ट की गणना और सारणीबद्ध मूल्यों की तुलना करना
2. अधिक आधुनिक, पी-स्तर की गणना करके, परिकल्पना को अस्वीकार करते समय आत्मविश्वास की एक डिग्री जोड़कर।
3. विश्वास अंतराल की गणना करके और सामान्य औसत का न्यूनतम मूल्य प्राप्त करके और भी अधिक जानकारीपूर्ण।

यह याद रखना महत्वपूर्ण है कि टी-टेस्ट पैरामीट्रिक तरीकों को संदर्भित करता है, क्योंकि सामान्य वितरण पर आधारित है (इसके दो पैरामीटर हैं: माध्य और विचरण)। इसलिए, इसके सफल अनुप्रयोग के लिए, प्रारंभिक डेटा की कम से कम अनुमानित सामान्यता और आउटलेर्स की अनुपस्थिति महत्वपूर्ण है।

अंत में, मैं एक्सेल में स्टूडेंट टी-टेस्ट से संबंधित गणना कैसे करें, इस पर एक वीडियो देखने का सुझाव देता हूं।

छात्र वितरण तालिका

संभाव्यता अभिन्न तालिकाओं का उपयोग असीम रूप से बड़ी आबादी से बड़े नमूनों के लिए किया जाता है। लेकिन पहले से ही (एन) पर< 100 получается Несоответствие между

सारणीबद्ध डेटा और सीमा संभावना; पर (एन)< 30 погрешность становится значительной. Несоответствие вызывается главным образом характером распределения единиц генеральной совокупности. При большом объеме выборки особенность распределения в гене-

सामान्य जनसंख्या कोई मायने नहीं रखती, क्योंकि बड़े नमूने के साथ सामान्य विशेषता से नमूना संकेतक के विचलन का वितरण हमेशा सामान्य होता है।

नामांकित. छोटे नमूनों में (एन)< 30 характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибки выборки при небольшом объеме наблюдения (уже менее 100 единиц) отбор должен проводиться из со-

सामान्य वितरण वाली जनसंख्या। छोटे नमूनों का सिद्धांत 20वीं सदी की शुरुआत में अंग्रेजी सांख्यिकीविद् डब्ल्यू. गोसेट (जिन्होंने छद्म नाम स्टूडेंट के तहत लिखा था) द्वारा विकसित किया गया था। में

1908 में, उन्होंने एक विशेष वितरण का निर्माण किया जो छोटे नमूनों के साथ भी (t) और आत्मविश्वास संभावना F(t) को सहसंबंधित करने की अनुमति देता है। (एन) > 100 के लिए, छात्र वितरण तालिकाएँ 30 के लिए लाप्लास संभाव्यता अभिन्न तालिकाओं के समान परिणाम देती हैं< (n ) <

100 अंतर नगण्य हैं. इसलिए, व्यावहारिक रूप से छोटे नमूनों में 30 इकाइयों से कम मात्रा वाले नमूने शामिल होते हैं (बेशक, 100 इकाइयों से अधिक की मात्रा वाला नमूना बड़ा माना जाता है)।

कुछ मामलों में छोटे नमूनों का उपयोग सर्वेक्षण की जा रही जनसंख्या की प्रकृति के कारण होता है। इस प्रकार, प्रजनन कार्य में, कम संख्या के साथ "शुद्ध" अनुभव प्राप्त करना आसान होता है

भूखंड. आर्थिक लागत से जुड़े उत्पादन और आर्थिक प्रयोग भी कम संख्या में परीक्षणों पर किए जाते हैं। जैसा कि पहले ही उल्लेख किया गया है, एक छोटे नमूने के मामले में, केवल सामान्य रूप से वितरित सामान्य आबादी के लिए आत्मविश्वास संभावनाओं और सामान्य माध्य की आत्मविश्वास सीमा दोनों की गणना की जा सकती है।

छात्र वितरण की संभाव्यता घनत्व फ़ंक्शन द्वारा वर्णित है।

1 + टी2

एफ (टी ,एन) := बीएन

एन - 1

टी - वर्तमान चर; एन - नमूना आकार;

B एक मात्रा है जो केवल (n) पर निर्भर करती है।

विद्यार्थी के वितरण का केवल एक पैरामीटर है: (d.f. ) - स्वतंत्रता की डिग्री की संख्या (कभी-कभी (k) द्वारा निरूपित)। यह वितरण, सामान्य की तरह, बिंदु (t) = 0 के संबंध में सममित है, लेकिन यह सपाट है। नमूना आकार में वृद्धि के साथ, और, परिणामस्वरूप, स्वतंत्रता की डिग्री की संख्या में, छात्र का वितरण तेजी से सामान्य हो जाता है। स्वतंत्रता की डिग्री की संख्या उन विशेषताओं के व्यक्तिगत मूल्यों की संख्या के बराबर है जिनकी आवश्यकता है

वांछित विशेषता निर्धारित करने के लिए मान लीजिए। इस प्रकार, विचरण की गणना करने के लिए, औसत मान ज्ञात होना चाहिए। इसलिए, विचरण की गणना करते समय, (d.f.) = n - 1 का उपयोग करें।

छात्र वितरण तालिकाएँ दो संस्करणों में प्रकाशित की जाती हैं:

1. संभाव्यता अभिन्न की तालिकाओं के समान, मान (टी ) और संगत

स्वतंत्रता की डिग्री की विभिन्न संख्याओं के लिए वर्तमान संभावनाएँ F(t);

2. मान (टी) सबसे अधिक उपयोग की जाने वाली आत्मविश्वास संभावनाओं के लिए दिए गए हैं

0.70; 0.75; 0.80; 0.85; 0.90; 0.95 और 0.99 या 1 के लिए - 0.70 = 0.3; 1 - 0.80 = 0.2; …… 1 - 0.99 = 0.01.

3. स्वतंत्रता की विभिन्न कोटि की संख्या के साथ। ऐसी तालिका परिशिष्ट में दी गई है.

(तालिका 1 - 20), साथ ही मूल्य (टी) - 0.7 के महत्व स्तर पर छात्र का परीक्षण

उदाहरण के दौरान, हम काल्पनिक जानकारी का उपयोग करेंगे ताकि पाठक स्वयं आवश्यक परिवर्तन कर सकें।

इसलिए, उदाहरण के लिए, शोध के दौरान, हमने ऊतक सी में पदार्थ बी की सामग्री (एमएमओएल / जी में) और रक्त में पदार्थ डी की एकाग्रता (एमएमओएल / एल में) पर दवा ए के प्रभाव का अध्ययन किया। किसी मानदंड E के अनुसार समान आयतन (n = 10) के 3 समूहों में विभाजित किया गया है। इस काल्पनिक अध्ययन के परिणाम तालिका में दिखाए गए हैं:

पदार्थ बी सामग्री, mmol/g

पदार्थ डी, mmol/l

एकाग्रता में वृद्धि


हम आपको चेतावनी देना चाहते हैं कि डेटा की प्रस्तुति और गणना में आसानी के लिए आकार 10 के नमूनों पर हमारे द्वारा विचार किया जाता है; व्यवहार में, ऐसा नमूना आकार आमतौर पर सांख्यिकीय निष्कर्ष निकालने के लिए पर्याप्त नहीं होता है।

उदाहरण के तौर पर, तालिका के पहले कॉलम के डेटा पर विचार करें।

वर्णनात्मक आँकड़े

नमूना माध्य

अंकगणितीय माध्य, जिसे अक्सर "औसत" के रूप में संदर्भित किया जाता है, सभी मूल्यों को जोड़कर और इस योग को सेट में मूल्यों की संख्या से विभाजित करके प्राप्त किया जाता है। इसे बीजगणितीय सूत्र का उपयोग करके दिखाया जा सकता है। एक चर x के n अवलोकनों के एक सेट को x 1 , x 2 , x 3 , ..., x n के रूप में दर्शाया जा सकता है

प्रेक्षणों का अंकगणितीय माध्य निर्धारित करने का सूत्र (उच्चारण "X डैश के साथ"):

= (एक्स 1 + एक्स 2 + ... + एक्स एन) / एन

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

नमूना विचरण

डेटा के फैलाव को मापने का एक तरीका यह निर्धारित करना है कि प्रत्येक अवलोकन अंकगणितीय माध्य से किस हद तक विचलित होता है। जाहिर है, जितना अधिक विचलन, उतनी अधिक परिवर्तनशीलता, अवलोकनों की परिवर्तनशीलता। हालाँकि, हम इन विचलनों के औसत का उपयोग नहीं कर सकते फैलाव के माप के रूप में, क्योंकि सकारात्मक विचलन नकारात्मक विचलन की भरपाई करते हैं (उनका योग शून्य है)। इस समस्या को हल करने के लिए, हम प्रत्येक विचलन का वर्ग करते हैं और वर्ग विचलन का औसत ज्ञात करते हैं; इस मात्रा को भिन्नता या फैलाव कहा जाता है। आइए n अवलोकन लें x 1, x 2, x 3, ..., x n, औसत जो के बराबर है. विचरण की गणना इसे आमतौर पर कहा जाता हैएस2,ये अवलोकन:

इस सूचक का नमूना विचरण s 2 = 3.2 है।

मानक विचलन

मानक (माध्य वर्ग) विचलन विचरण का धनात्मक वर्गमूल है। उदाहरण के रूप में n अवलोकनों का उपयोग करते हुए, यह इस तरह दिखता है:

हम मानक विचलन को माध्य से प्रेक्षणों के एक प्रकार के औसत विचलन के रूप में सोच सकते हैं। इसकी गणना मूल डेटा के समान इकाइयों (आयामों) में की जाती है।

s = sqrt (s 2) = sqrt (3,2) = 1.79.

भिन्नता का गुणांक

यदि आप मानक विचलन को अंकगणितीय माध्य से विभाजित करते हैं और परिणाम को प्रतिशत के रूप में व्यक्त करते हैं, तो आपको भिन्नता का गुणांक मिलता है।

सीवी = (1.79/13.1) * 100% = 13.7

नमूना माध्य त्रुटि

1.79/वर्ग(10) = 0.57;

विद्यार्थी का t गुणांक (एक-नमूना t-परीक्षण)

औसत मूल्य और कुछ ज्ञात मूल्य एम के बीच अंतर के बारे में परिकल्पना का परीक्षण करने के लिए उपयोग किया जाता है

स्वतंत्रता की कोटि की संख्या की गणना f=n-1 के रूप में की जाती है।

इस मामले में, माध्य के लिए विश्वास अंतराल 11.87 और 14.39 की सीमाओं के बीच है।

95% आत्मविश्वास स्तर के लिए m=11.87 या m=14.39, यानी= |13.1-11.82| = |13.1-14.38| = 1.28

तदनुसार, इस मामले में, स्वतंत्रता की डिग्री की संख्या के लिए f = 10 - 1 = 9 और 95% आत्मविश्वास स्तर t = 2.26 है।

संवाद बुनियादी सांख्यिकी और तालिकाएँ

मॉड्यूल में बुनियादी आँकड़े और तालिकाएँचलो चुनें वर्णनात्मक आँकड़े.

एक डायलॉग बॉक्स खुलेगा वर्णनात्मक आँकड़े.

खेत मेँ चरचलो चुनें समूह 1.

दबाना ठीक है, हम चयनित चर के वर्णनात्मक आँकड़ों के साथ परिणामों की तालिकाएँ प्राप्त करते हैं।

एक डायलॉग बॉक्स खुलेगा एक-नमूना टी-परीक्षण.

मान लीजिए कि हम जानते हैं कि ऊतक C में पदार्थ B की औसत सामग्री 11 है।

वर्णनात्मक आंकड़ों और छात्र के टी-टेस्ट के साथ परिणाम तालिका इस प्रकार है:

हमें इस परिकल्पना को अस्वीकार करना पड़ा कि ऊतक सी में पदार्थ बी की औसत सामग्री 11 है।

चूँकि मानदंड का परिकलित मान सारणीबद्ध मान (2.26) से अधिक है, इसलिए चुने गए महत्व स्तर पर शून्य परिकल्पना को खारिज कर दिया जाता है, और नमूने और ज्ञात मान के बीच के अंतर को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है। इस प्रकार, छात्र के मानदंड का उपयोग करके मतभेदों के अस्तित्व के बारे में निष्कर्ष की पुष्टि इस पद्धति का उपयोग करके की जाती है।

श्रेणियाँ

लोकप्रिय लेख

2023 "kingad.ru" - मानव अंगों की अल्ट्रासाउंड जांच