k के लिए पियर्सन वितरण 19 के बराबर। पियर्सन अच्छाई-की-फिट परीक्षण

कार्य 1।

महत्व स्तर पर पियर्सन परीक्षण का उपयोग करना = 0.05 जांचें कि जनसंख्या के सामान्य वितरण के बारे में परिकल्पना सुसंगत है या नहीं एक्सअनुभवजन्य नमूना आकार वितरण के साथ एन = 200.

समाधान।

1. गणना करें और नमूना मानक विचलन .
2. उसे ध्यान में रखते हुए सैद्धांतिक आवृत्तियों की गणना करें एन = 200, एच= 2, = 4.695, सूत्र के अनुसार
.

आइए एक गणना तालिका बनाएं (फ़ंक्शन के मान जे(एक्स) परिशिष्ट 1 में दिए गए हैं)।


मैं

3. आइए अनुभवजन्य और सैद्धांतिक आवृत्तियों की तुलना करें। आइए एक गणना तालिका बनाएं, जिससे हम मानदंड का मनाया गया मान ज्ञात करेंगे :


मैं
जोड़

महत्वपूर्ण वितरण बिंदुओं की तालिका (परिशिष्ट 6) के अनुसार, महत्व स्तर के अनुसार = 0.05 और स्वतंत्रता की डिग्री की संख्या = एस- 3 = 9 - 3 = 6 हम दाहिनी ओर के क्रांतिक क्षेत्र का क्रांतिक बिंदु पाते हैं (0.05; 6) = 12.6।
चूँकि =22.2 >= 12.6, हम सामान्य जनसंख्या के सामान्य वितरण की परिकल्पना को अस्वीकार करते हैं। दूसरे शब्दों में, अनुभवजन्य और सैद्धांतिक आवृत्तियाँ काफी भिन्न होती हैं।

कार्य2

सांख्यिकीय आँकड़े प्रस्तुत किये गये हैं।

व्यास माप परिणाम एन= पीसने के बाद 200 रोल को तालिका में संक्षेपित किया गया है। (मिमी):
मेज़रोल व्यास की आवृत्ति भिन्नता श्रृंखला

मैं

क्सी, मिमी

क्सी, मिमी

आवश्यक:

1) यदि आवश्यक हो तो इसे क्रमबद्ध करते हुए, एक अलग विविधता श्रृंखला बनाएं;

2) श्रृंखला की मुख्य संख्यात्मक विशेषताएँ निर्धारित करें;

3) वितरण के बहुभुज (हिस्टोग्राम) के रूप में श्रृंखला का ग्राफिकल प्रतिनिधित्व दें;

4) एक सैद्धांतिक सामान्य वितरण वक्र का निर्माण करें और पियर्सन मानदंड का उपयोग करके अनुभवजन्य और सैद्धांतिक वितरण के बीच पत्राचार की जांच करें। वितरण के प्रकार के बारे में सांख्यिकीय परिकल्पना का परीक्षण करते समय, महत्व स्तर a = 0.05 लें

समाधान: हम परिभाषा के अनुसार इस परिवर्तनशील श्रृंखला की मुख्य संख्यात्मक विशेषताएँ पाएंगे। रोल का औसत व्यास (मिमी) है:
एक्ससीपी = = 6.753;
संशोधित फैलाव (मिमी2):
डी = = 0,0009166;
सही मानक विचलन (मिमी):
एस = = 0,03028.


चावल।रोल व्यास का आवृत्ति वितरण

भिन्नता श्रृंखला का प्रारंभिक ("कच्चा") आवृत्ति वितरण, अर्थात। पत्र-व्यवहार नी(क्सी), मूल्यों के एक बड़े प्रसार की विशेषता है नीकुछ काल्पनिक "औसत" वक्र के सापेक्ष (चित्र)। इस मामले में, संगत अंतराल के भीतर आने वाले व्यासों की आवृत्तियों को मिलाकर एक अंतराल भिन्नता श्रृंखला का निर्माण और विश्लेषण करना बेहतर होता है।
अंतराल समूहों की संख्या हम स्टर्गेस सूत्र द्वारा परिभाषित करते हैं:
= 1 + लॉग2 एन= 1 + 3.322 एलजी एन,
कहाँ एन= 200 - नमूना आकार. हमारे मामले में
= 1 + 3.322×lg200 = 1 + 3.322×2.301 = 8.644 » 8.
अंतराल की चौड़ाई (6.83 - 6.68)/8 = 0.01875 » 0.02 मिमी है।
अंतराल भिन्नता श्रृंखला तालिका में प्रस्तुत की गई है।

रोल व्यास की तालिका आवृत्ति अंतराल भिन्नता श्रृंखला।

एक्सके, मिमी

अंतराल श्रृंखला को आवृत्ति वितरण के हिस्टोग्राम के रूप में दर्शाया जा सकता है।


चावल. रोल व्यास का आवृत्ति वितरण। ठोस रेखा एक सामान्य वक्र है।

हिस्टोग्राम का रूप हमें यह धारणा बनाने की अनुमति देता है कि रोल व्यास का वितरण सामान्य कानून का पालन करता है, जिसके अनुसार सैद्धांतिक आवृत्तियों को पाया जा सकता है
एन.के, सिद्धांत = एन× एन(; एस; एक्सके)×डी एक्सके,
जहां, बदले में, सुचारू गाऊसी सामान्य वितरण वक्र इस प्रकार दिया जाता है:
एन(; एस; एक्सके) = .
इन भावों में एक्सकेआवृत्ति अंतराल भिन्नता श्रृंखला में अंतराल के केंद्र हैं।

उदाहरण के लिए, एक्स 1 = (6.68 + 6.70)/2 = 6.69. जैसा कि केंद्र का अनुमान है और गॉसियन वक्र का पैरामीटर लिया जा सकता है:
= एक्ससी एफ
अंजीर से. यह देखा जा सकता है कि समग्र रूप से सामान्य वितरण का गाऊसी वक्र अनुभवजन्य अंतराल वितरण से मेल खाता है। हालाँकि, इस पत्राचार के सांख्यिकीय महत्व को सत्यापित किया जाना चाहिए। आइए हम यह जांचने के लिए फिट सी2 की अच्छाई के पियर्सन के मानदंड का उपयोग करें कि अनुभवजन्य वितरण अनुभवजन्य से मेल खाता है या नहीं। ऐसा करने के लिए, योग के रूप में मानदंड के अनुभवजन्य मूल्य की गणना करें
= ,
कहाँ एन.केऔर एन.के,सिद्धांत क्रमशः अनुभवजन्य और सैद्धांतिक (सामान्य) आवृत्तियाँ हैं। गणना परिणामों को सारणीबद्ध रूप में प्रस्तुत करना सुविधाजनक है:
मेज़पियर्सन मानदंड की गणना


[एक्सके, एक्सके+ 1), मिमी

एक्सके, मिमी

एन.के,या

हम महत्व स्तर ए = 0.05 और स्वतंत्रता की डिग्री की संख्या के लिए पियर्सन तालिका का उपयोग करके मानदंड का महत्वपूर्ण मूल्य पाते हैं। डी.एफ. = – 1 – आर, कहाँ = 8 अंतराल भिन्नता श्रृंखला के अंतरालों की संख्या है; आर= 2 नमूना डेटा (इस मामले में, पैरामीटर) के आधार पर अनुमानित सैद्धांतिक वितरण के मापदंडों की संख्या है और एस). इस प्रकार, डी.एफ. = 5. पियर्सन मानदंड का क्रांतिक मान crit(a) है; डी.एफ.) = 11.1. C2EMP के बाद से< c2крит, заключаем, что согласие между эмпирическим и теоретическим нормальным распределением является статистическим значимым. Иными словами, теоретическое нормальное распределение удовлетворительно описывает эмпирические данные.

कार्य3

चॉकलेट के डिब्बे स्वचालित रूप से पैक हो जाते हैं। लॉट में शामिल 2000 पैकेजों में से 130 को स्व-यादृच्छिक गैर-दोहराई जाने वाली नमूनाकरण योजना के तहत लिया गया था, और उनके वजन पर निम्नलिखित डेटा प्राप्त किया गया था:

परिकल्पना का परीक्षण करने के लिए महत्व स्तर a=0.05 पर पियर्सन परीक्षण का उपयोग करना आवश्यक है कि यादृच्छिक चर X - पैकेजों का वजन - सामान्य कानून के अनुसार वितरित किया जाता है। एक ग्राफ़ पर अनुभवजन्य वितरण और संबंधित सामान्य वक्र का एक हिस्टोग्राम बनाएं।

समाधान

1012,5
= 615,3846

टिप्पणी:

सिद्धांत रूप में, संशोधित नमूना विचरण को सामान्य वितरण के विचरण के रूप में लिया जाना चाहिए। लेकिन फिर प्रेक्षणों की संख्या - 130 काफी बड़ी है, तो "सामान्य" वाला ही काम करेगा।
इस प्रकार, सैद्धांतिक सामान्य वितरण है:

मध्यान्तर

[xi; xi+1]

अनुभवजन्य आवृत्तियाँ

नी

संभावनाओं
अनुकरणीय

सैद्धांतिक आवृत्तियाँ
एनपीआई

(नी-एनपीआई)2

सांख्यिकीय परीक्षण

वह नियम जिसके द्वारा परिकल्पना R0 को अस्वीकार या स्वीकार किया जाता है, कहलाता है सांख्यिकीय मानदंड.मानदंड के नाम में, एक नियम के रूप में, एक अक्षर होता है, जो मानदंड में गणना की गई सांख्यिकीय परिकल्पना परीक्षण एल्गोरिदम (पैराग्राफ 4.1 देखें) के अनुच्छेद 2 से विशेष रूप से संकलित विशेषता को दर्शाता है। इस एल्गोरिदम की शर्तों के तहत, मानदंड को कॉल किया जाएगा "वी-मानदंड"।

सांख्यिकीय परिकल्पनाओं का परीक्षण करते समय, दो प्रकार की त्रुटियाँ संभव हैं:

  • - पहली तरह की त्रुटि(आप परिकल्पना I को अस्वीकार कर सकते हैं जब यह वास्तव में सत्य हो);
  • - टाइप II त्रुटि(आप परिकल्पना I0 को तब स्वीकार कर सकते हैं जब वह वास्तव में सत्य न हो)।

संभावना मेक ए टाइप वन एरर कहा जाता है मानदंड का महत्व स्तर.

यदि के लिए आरटाइप II त्रुटि होने की संभावना को निरूपित करें, फिर (l - आर) -टाइप II त्रुटि न होने की संभावना, जिसे कहा जाता है कसौटी की शक्ति.

अच्छाई-की-फिट x 2 पियर्सन

सांख्यिकीय परिकल्पनाएँ कई प्रकार की होती हैं:

  • - वितरण के नियम के बारे में;
  • - नमूनों की एकरूपता;
  • - वितरण मापदंडों आदि के संख्यात्मक मान।

हम पियर्सन के x 2 अच्छाई-की-फिट परीक्षण के उदाहरण पर वितरण के कानून के बारे में परिकल्पना पर विचार करेंगे।

सामंजस्य की कसौटीअज्ञात वितरण के कथित कानून के बारे में शून्य परिकल्पना के परीक्षण के लिए एक सांख्यिकीय परीक्षण कहा जाता है।

पियर्सन का फिट-ऑफ-फिट परीक्षण एक निश्चित वितरण कानून की धारणा के तहत गणना की गई टिप्पणियों की अनुभवजन्य (अवलोकित) और सैद्धांतिक आवृत्तियों की तुलना पर आधारित है। यहां परिकल्पना # 0 इस प्रकार तैयार की गई है: सामान्य जनसंख्या को सामान्य रूप से अध्ययन के तहत मानदंड के अनुसार वितरित किया जाता है।

मानदंड के लिए सांख्यिकीय परिकल्पना परीक्षण एल्गोरिथम #0 एक्स 1पियर्सन:

  • 1) हमने परिकल्पना आर 0 को सामने रखा - अध्ययन के तहत मानदंड के अनुसार, सामान्य जनसंख्या सामान्य रूप से वितरित की जाती है;
  • 2) नमूना माध्य और नमूना मानक विचलन की गणना करें हेवी;

3) उपलब्ध नमूना मात्रा के अनुसार पीहम एक विशेष रूप से संकलित विशेषता की गणना करते हैं,

कहा पे: मैं, - अनुभवजन्य आवृत्तियाँ, - सैद्धांतिक आवृत्तियाँ,

पी -नमूने का आकार,

एच- अंतराल का मान (दो आसन्न विकल्पों के बीच का अंतर),

देखी गई सुविधा के सामान्यीकृत मान,

- टेबल फ़ंक्शन। सैद्धांतिक आवृत्तियाँ भी

सूत्र के अनुसार मानक एमएस एक्सेल फ़ंक्शन NORMDIST का उपयोग करके गणना की जा सकती है;

4) नमूना वितरण के अनुसार, हम एक विशेष रूप से संकलित विशेषता का महत्वपूर्ण मूल्य निर्धारित करते हैं एक्सएल पी

5) जब परिकल्पना # 0 अस्वीकार कर दी जाती है, जब परिकल्पना # 0 स्वीकार कर ली जाती है।

उदाहरण।संकेत पर विचार करें एक्स- कुछ मनोवैज्ञानिक विशेषताओं के अनुसार सुधारात्मक उपनिवेशों में से एक में दोषियों के लिए परीक्षण संकेतकों का मूल्य, भिन्नता श्रृंखला के रूप में प्रस्तुत किया गया है:

0.05 के महत्व स्तर पर, सामान्य जनसंख्या के सामान्य वितरण की परिकल्पना का परीक्षण करें।

1. अनुभवजन्य वितरण के आधार पर, आप एक परिकल्पना सामने रख सकते हैं एच 0: अध्ययन के तहत मानदंड के अनुसार "किसी दिए गए मनोवैज्ञानिक विशेषता के लिए परीक्षण संकेतक का मूल्य", सामान्य जनसंख्या

बच्चों की संख्या सामान्य रूप से वितरित की जाती है। वैकल्पिक परिकल्पना 1: अध्ययन की गई विशेषता "इस मनोवैज्ञानिक विशेषता के लिए परीक्षण संकेतक का मूल्य" के अनुसार, दोषियों की सामान्य आबादी सामान्य रूप से वितरित नहीं होती है।

2. संख्यात्मक नमूना विशेषताओं की गणना करें:

अंतराल

एक्स वाई वाई

एक्स) एसएच

3. एक विशेष रूप से रचित विशेषता जे 2 की गणना करें। ऐसा करने के लिए, पिछली तालिका के अंतिम कॉलम में, हम सूत्र का उपयोग करके सैद्धांतिक आवृत्तियाँ पाते हैं, और अंतिम कॉलम में

आइए विशेषता % 2 की गणना करें। हम पाते हैं एक्स 2 = 0,185.

स्पष्टता के लिए, हम सैद्धांतिक आवृत्तियों के अनुसार अनुभवजन्य वितरण के बहुभुज और एक सामान्य वक्र का निर्माण करेंगे (चित्र 6)।

चावल। 6.

4. स्वतंत्रता की कोटियों की संख्या निर्धारित करें एस: के = 5, टी = 2, एस = 5-2-1 = 2।

तालिका के अनुसार या स्वतंत्रता की डिग्री की संख्या 5 = 2 और महत्व स्तर के लिए मानक एमएस एक्सेल फ़ंक्शन "XI20BR" का उपयोग करना ए = 0.05 मानदंड का क्रांतिक मान ज्ञात कीजिए एक्सएल पी.=5,99. महत्व स्तर के लिए = मानदंड का 0.01 क्रांतिक मान एक्स%। = 9,2.

5. कसौटी का अवलोकित मूल्य एक्स=0.185 सभी पाए गए मानों से कम एचसी आर.->इसलिए, परिकल्पना आर 0 दोनों महत्व स्तरों पर स्वीकार की जाती है। अनुभवजन्य और सैद्धांतिक आवृत्तियों के बीच विसंगति नगण्य है। इसलिए, अवलोकन संबंधी डेटा सामान्य जनसंख्या वितरण की परिकल्पना के अनुरूप हैं। इस प्रकार, अध्ययन की गई विशेषता "इस मनोवैज्ञानिक विशेषता के लिए परीक्षण संकेतक का मूल्य" के अनुसार, दोषियों की सामान्य आबादी सामान्य रूप से वितरित की जाती है।

  • 1. कोर्याचको ए.वी., कुलिचेंको ए.जी. मनोविज्ञान में उच्च गणित और गणितीय तरीके: मनोविज्ञान संकाय के छात्रों के लिए व्यावहारिक अध्ययन के लिए एक मार्गदर्शिका। रियाज़ान, 1994।
  • 2. नास्लेडोव ए.डी. मनोवैज्ञानिक अनुसंधान के गणितीय तरीके। डेटा का विश्लेषण और व्याख्या: पाठ्यपुस्तक, मैनुअल। एसपीबी., 2008.
  • 3. सिडोरेंको ई.वी. मनोविज्ञान में गणितीय प्रसंस्करण के तरीके। एसपीबी., 2010.
  • 4. सोशनिकोवा एल.ए. और अन्य। अर्थव्यवस्था में बहुभिन्नरूपी सांख्यिकीय विश्लेषण: पाठ्यपुस्तक, विश्वविद्यालयों के लिए मैनुअल। एम., 1999.
  • 5. सुखोदोल्स्की ई.वी. मनोविज्ञान में गणितीय तरीके. खार्कोव, 2004.
  • 6. श्मोयलोवा आर.ए., मिनाश्किन वी.ई., सदोवनिकोवा एन.ए. सांख्यिकी के सिद्धांत पर कार्यशाला: पाठ्यपुस्तक, मैनुअल। एम., 2009.
  • गमुरमन वी.ई. संभाव्यता और गणितीय सांख्यिकी का सिद्धांत। एस. 465.
मानदंड χ 2 का उद्देश्य - पियर्सन का मानदंड मानदंड χ 2 का उपयोग दो उद्देश्यों के लिए किया जाता है: 1) किसी विशेषता के अनुभवजन्य वितरण की सैद्धांतिक एक के साथ तुलना करना - समान, सामान्य या कुछ अन्य; 2) एक ही विशेषता के दो, तीन या अधिक अनुभवजन्य वितरणों की तुलना करना। मानदंड का विवरण χ 2 मानदंड इस प्रश्न का उत्तर देता है कि क्या किसी विशेषता के विभिन्न मान अनुभवजन्य और सैद्धांतिक वितरण में या दो या दो से अधिक अनुभवजन्य वितरण में समान आवृत्ति के साथ होते हैं। विधि का लाभ यह है कि यह नामों के पैमाने से शुरू करके, किसी भी पैमाने में प्रस्तुत सुविधाओं के वितरण की तुलना करने की अनुमति देता है। वैकल्पिक वितरण के सबसे सरल मामले में "हां - नहीं", "विवाह की अनुमति - विवाह की अनुमति नहीं", "समस्या का समाधान - समस्या का समाधान नहीं", आदि, हम पहले से ही मानदंड χ 2 लागू कर सकते हैं। दो तुलनीय वितरणों के बीच विसंगति जितनी अधिक होगी, χ 2 का अनुभवजन्य मूल्य उतना ही अधिक होगा। χ 2 - पियर्सन की कसौटी की स्वचालित गणना χ 2 - पियर्सन की कसौटी की स्वचालित गणना करने के लिए, दो चरणों का पालन करना आवश्यक है: स्टेप 1. अनुभवजन्य वितरणों की संख्या निर्दिष्ट करें (1 से 10 तक); चरण दो. तालिका में अनुभवजन्य आवृत्तियाँ दर्ज करें; चरण 3. उत्तर पाएं।

पियर्सन मानदंड का लाभ इसकी सार्वभौमिकता है: इसका उपयोग विभिन्न वितरण कानूनों के बारे में परिकल्पनाओं का परीक्षण करने के लिए किया जा सकता है।

1. सामान्य वितरण की परिकल्पना का परीक्षण करना।

मान लीजिए कि पर्याप्त बड़े आकार का एक नमूना प्राप्त किया गया है पीबहुत सारे विभिन्न प्रकार के मूल्यों के साथ। इसके प्रसंस्करण की सुविधा के लिए, हम वैरिएंट के सबसे छोटे से सबसे बड़े मान तक के अंतराल को विभाजित करते हैं एससमान भाग और हम मान लेंगे कि प्रत्येक अंतराल में आने वाले विकल्पों का मान लगभग उस संख्या के बराबर है जो अंतराल के मध्य को निर्दिष्ट करता है। प्रत्येक अंतराल में आने वाले विकल्पों की संख्या गिनने के बाद, हम तथाकथित समूहीकृत नमूना बनाएंगे:

विकल्प……….. एक्स 1 एक्स 2 … एक्स एस

आवृत्तियाँ…………. पी 1 पी 2 … एन एस ,

कहाँ एक्स मैंअंतरालों के मध्यबिंदुओं के मान हैं, और एन मैंइसमें शामिल विकल्पों की संख्या है मैंवें अंतराल (अनुभवजन्य आवृत्तियाँ)।



प्राप्त आंकड़ों के आधार पर, नमूना माध्य और नमूना मानक विचलन की गणना करना संभव है σ बी. आइए इस धारणा की जाँच करें कि सामान्य जनसंख्या को मापदंडों के साथ सामान्य कानून के अनुसार वितरित किया जाता है एम(एक्स) = , डी(एक्स) = . फिर आप वॉल्यूम नमूने से संख्याओं की संख्या ज्ञात कर सकते हैं पी, जो इस धारणा के तहत प्रत्येक अंतराल में होना चाहिए (अर्थात, सैद्धांतिक आवृत्तियाँ)। ऐसा करने के लिए, लाप्लास फ़ंक्शन के मानों की तालिका का उपयोग करके, हम हिट होने की संभावना पाते हैं मैं-वां अंतराल:

,

कहाँ एक मैंऔर बी मैं- सीमाओं मैं-वें अंतराल. परिणामी संभावनाओं को नमूना आकार n से गुणा करने पर, हम सैद्धांतिक आवृत्तियाँ पाते हैं: पी आई =एन पी आई.हमारा लक्ष्य अनुभवजन्य और सैद्धांतिक आवृत्तियों की तुलना करना है, जो निश्चित रूप से एक-दूसरे से भिन्न हैं, और यह पता लगाना है कि क्या ये अंतर महत्वहीन हैं, अध्ययन के तहत यादृच्छिक चर के सामान्य वितरण की परिकल्पना का खंडन नहीं करते हैं, या क्या वे हैं बड़ी बात यह है कि वे इस परिकल्पना का खंडन करते हैं। इसके लिए यादृच्छिक चर के रूप में एक मानदंड का उपयोग किया जाता है

. (20.1)

इसका अर्थ स्पष्ट है: भागों को संक्षेप में प्रस्तुत किया गया है, जो संबंधित सैद्धांतिक आवृत्तियों से सैद्धांतिक आवृत्तियों के विचलन के वर्ग हैं। यह साबित किया जा सकता है कि, सामान्य जनसंख्या के वास्तविक वितरण कानून की परवाह किए बिना, यादृच्छिक चर (20.1) का वितरण कानून स्वतंत्रता की डिग्री की संख्या के साथ वितरण कानून (व्याख्यान 12 देखें) की ओर जाता है। के = एस - 1 – आर, कहाँ आरनमूना डेटा से अनुमानित वितरण के मापदंडों की संख्या है। सामान्य वितरण की विशेषता दो पैरामीटर हैं, इसलिए के = एस - 3. चयनित मानदंड के लिए, एक दाएं हाथ के महत्वपूर्ण क्षेत्र का निर्माण किया जाता है, जो स्थिति द्वारा निर्धारित होता है

(20.2)

कहाँ α - महत्वपूर्ण स्तर। इसलिए, महत्वपूर्ण क्षेत्र असमानता द्वारा दिया गया है और परिकल्पना का स्वीकृति क्षेत्र है।

तो, शून्य परिकल्पना का परीक्षण करने के लिए एच 0: जनसंख्या सामान्य रूप से वितरित है - आपको नमूने से मानदंड के देखे गए मान की गणना करने की आवश्यकता है:

, (20.1`)

और वितरण के महत्वपूर्ण बिंदुओं की तालिका के अनुसार χ 2 α और के ज्ञात मानों का उपयोग करके महत्वपूर्ण बिंदु खोजें के = एस - 3. यदि - शून्य परिकल्पना स्वीकृत हो, यदि अस्वीकृत हो।

2. समान वितरण की परिकल्पना का परीक्षण।

अनुमानित संभाव्यता घनत्व के साथ सामान्य जनसंख्या के एक समान वितरण की परिकल्पना का परीक्षण करने के लिए पियर्सन परीक्षण का उपयोग करते समय

मापदंडों का अनुमान लगाने के लिए, उपलब्ध नमूने से मूल्य की गणना करना आवश्यक है और बीसूत्रों के अनुसार:

कहाँ ए*और बी*- अनुमान और बी. दरअसल, एक समान वितरण के लिए एम(एक्स) = , , जहां से आप निर्धारण के लिए एक प्रणाली प्राप्त कर सकते हैं ए*और बी*: , जिसका समाधान भाव (20.3) है।

फिर, ऐसा मानकर , आप सूत्रों का उपयोग करके सैद्धांतिक आवृत्तियाँ पा सकते हैं

यहाँ एसअंतरालों की संख्या है जिसमें नमूना विभाजित है।

पियर्सन मानदंड के देखे गए मूल्य की गणना सूत्र (20.1`) द्वारा की जाती है, और महत्वपूर्ण मूल्य की गणना तालिका से की जाती है, इस तथ्य को ध्यान में रखते हुए कि स्वतंत्रता की डिग्री की संख्या के = एस - 3. उसके बाद, क्रांतिक क्षेत्र की सीमाएं उसी तरह निर्धारित की जाती हैं जैसे सामान्य वितरण की परिकल्पना के परीक्षण के लिए।

3. घातीय वितरण के बारे में परिकल्पना का परीक्षण करना।

इस मामले में, मौजूदा नमूने को समान लंबाई के अंतराल में विभाजित करते हुए, हम एक दूसरे से समान दूरी पर विकल्पों के अनुक्रम पर विचार करते हैं (हम मानते हैं कि सभी विकल्प जो इसमें आते हैं मैं-वें अंतराल, इसके मध्य से मेल खाने वाला मान लें), और उनकी संगत आवृत्तियाँ एन मैं(इसमें शामिल नमूना विकल्पों की संख्या मैं-वें अंतराल). हम इन आंकड़ों से गणना करते हैं और पैरामीटर के अनुमान के रूप में लेते हैं λ कीमत । फिर सैद्धांतिक आवृत्तियों की गणना सूत्र द्वारा की जाती है

फिर पियर्सन मानदंड के देखे गए और महत्वपूर्ण मूल्यों की तुलना की जाती है, यह ध्यान में रखते हुए कि स्वतंत्रता की डिग्री की संख्या के = एस - 2.

अध्ययन के तहत यादृच्छिक चर के वितरण कानून के बारे में परिकल्पना का परीक्षण करने के लिए समझौता मानदंड। कई व्यावहारिक समस्याओं में, सटीक वितरण कानून अज्ञात है। इसलिए, मौजूदा अनुभवजन्य कानून के पत्राचार के बारे में एक परिकल्पना सामने रखी गई है, जो टिप्पणियों पर आधारित है, कुछ सैद्धांतिक के लिए। इस परिकल्पना के लिए सांख्यिकीय सत्यापन की आवश्यकता है, जिसके परिणाम या तो पुष्टि करेंगे, या खंडन करेंगे।

माना कि अध्ययन के अंतर्गत X यादृच्छिक चर है। परिकल्पना H0 का परीक्षण करने के लिए यह आवश्यक है कि यह यादृच्छिक चर वितरण नियम F(x) का पालन करता है। ऐसा करने के लिए, एन स्वतंत्र अवलोकनों का एक नमूना बनाना और अनुभवजन्य वितरण कानून एफ "(एक्स) बनाने के लिए इसका उपयोग करना आवश्यक है। अनुभवजन्य और काल्पनिक कानूनों की तुलना करने के लिए, फिट की अच्छाई नामक नियम का उपयोग किया जाता है। इनमें से एक सबसे लोकप्रिय है के. पियर्सन की फिट की काई-स्क्वायर अच्छाई।

यह ची-स्क्वायर आँकड़ा की गणना करता है:

,

जहां N अंतराल की संख्या है जिसके अनुसार अनुभवजन्य वितरण कानून बनाया गया था (संबंधित हिस्टोग्राम के स्तंभों की संख्या), i अंतराल की संख्या है, p t i संभावना है कि एक यादृच्छिक चर का मान i में आता है सैद्धांतिक वितरण कानून के लिए -वां अंतराल, पी ई i संभावना है कि एक यादृच्छिक चर का मान अनुभवजन्य वितरण कानून के लिए i वें अंतराल में आता है। इसे ची-स्क्वायर वितरण का पालन करना होगा।

यदि आँकड़ों का परिकलित मान किसी दिए गए महत्व स्तर के लिए स्वतंत्रता की k-p-1 डिग्री के साथ ची-वर्ग वितरण मात्रा से अधिक है, तो परिकल्पना H 0 को अस्वीकार कर दिया जाता है। अन्यथा, इसे दिए गए महत्व स्तर पर स्वीकार किया जाता है। यहाँ k है अवलोकनों की संख्या, पी वितरण कानून के अनुमानित मापदंडों की संख्या है।

पियर्सन आपको एक सुविधा के अनुभवजन्य और सैद्धांतिक (या अन्य अनुभवजन्य) वितरण का परीक्षण करने की अनुमति देता है। यह मानदंड मुख्यतः दो मामलों में लागू होता है:

किसी गुण के अनुभवजन्य वितरण की सैद्धांतिक वितरण (सामान्य, घातीय, समान, या कोई अन्य कानून) के साथ तुलना करना;

एक ही गुण के दो अनुभवजन्य वितरणों की तुलना करना।

विधि का विचार संबंधित आवृत्तियों n i और के विचलन की डिग्री निर्धारित करना है; यह विसंगति जितनी अधिक होगी, मूल्य उतना ही अधिक होगा

नमूना आकार कम से कम 50 होना चाहिए और आवृत्तियों का योग बराबर होना चाहिए

शून्य परिकल्पना एच 0 = (दो वितरण व्यावहारिक रूप से एक दूसरे से भिन्न नहीं हैं); वैकल्पिक परिकल्पना - एच 1 = (वितरण के बीच विसंगति महत्वपूर्ण है)।

यहां दो अनुभवजन्य वितरणों की तुलना के लिए मानदंड लागू करने की एक योजना है:

मानदंड - परिकल्पना का परीक्षण करने के लिए एक सांख्यिकीय मानदंड कि मनाया गया यादृच्छिक चर कुछ सैद्धांतिक वितरण कानून का पालन करता है।


मानदंड के मूल्य के आधार पर, परिकल्पना को स्वीकार या अस्वीकार किया जा सकता है:

§ , परिकल्पना पूर्ण होती है।

§ (वितरण के बाएँ "पूंछ" में पड़ता है)। इसलिए, सैद्धांतिक और व्यावहारिक मूल्य बहुत करीब हैं। यदि, उदाहरण के लिए, एक यादृच्छिक संख्या जनरेटर की जाँच की जाती है जो एक खंड से n संख्याएँ उत्पन्न करता है और परिकल्पना है: नमूना समान रूप से वितरित किया जाता है, तो जनरेटर को यादृच्छिक नहीं कहा जा सकता है (यादृच्छिकता परिकल्पना संतुष्ट नहीं है), क्योंकि नमूना बहुत समान रूप से वितरित है, लेकिन परिकल्पना संतुष्ट है।

§ (वितरण की दाहिनी "पूंछ" में आता है) परिकल्पना खारिज कर दी जाती है।

परिभाषा: मान लीजिए कि एक यादृच्छिक चर X दिया गया है।

परिकल्पना: साथ। वी X वितरण के नियम का पालन करता है।

परिकल्पना का परीक्षण करने के लिए, आर.वी. के n स्वतंत्र अवलोकनों से युक्त एक नमूने पर विचार करें। एक्स: । नमूने के आधार पर, हम आर.वी. पियर्सन के फिट-ऑफ-फिट परीक्षण (मानदंड) पर विचार करें:

परिकल्पना: X n फ़ंक्शन द्वारा उत्पन्न होता है।

k गैर-अतिव्यापी अंतरालों में विभाजित करें ;

मान लीजिए कि j-वें अंतराल में प्रेक्षणों की संख्या है: ;

परिकल्पना पूरी होने पर किसी अवलोकन के जे-वें अंतराल में आने की संभावना;

- जे-वें अंतराल में हिट की अपेक्षित संख्या;

सांख्यिकी: - स्वतंत्रता की k-1 डिग्री के साथ ची-वर्ग वितरण।

कम-आवृत्ति (दुर्लभ) घटनाओं वाले नमूनों पर मानदंड गलत है। इस समस्या को कम-आवृत्ति घटनाओं को त्यागकर, या उन्हें अन्य घटनाओं के साथ जोड़कर हल किया जा सकता है। इस विधि को येट्स का सुधार कहा जाता है।

पियर्सन की अच्छाई-की-फिट परीक्षण (χ 2) का उपयोग इस परिकल्पना का परीक्षण करने के लिए किया जाता है कि अनुभवजन्य वितरण बड़े नमूना आकार (एन ≥ 100) के साथ अपेक्षित सैद्धांतिक वितरण एफ (एक्स) से मेल खाता है। मानदंड किसी भी प्रकार के फ़ंक्शन F(x) के लिए लागू होता है, यहां तक ​​कि उनके मापदंडों के अज्ञात मूल्यों के साथ भी, जो आमतौर पर यांत्रिक परीक्षणों के परिणामों का विश्लेषण करते समय होता है। यहीं इसकी बहुमुखी प्रतिभा निहित है।

χ 2 मानदंड के उपयोग में नमूना भिन्नता की सीमा को अंतरालों में विभाजित करना और प्रत्येक के लिए अवलोकनों (आवृत्ति) एन जे की संख्या निर्धारित करना शामिल है। अंतराल. वितरण मापदंडों का अनुमान लगाने की सुविधा के लिए, अंतरालों को समान लंबाई का चुना जाता है।

अंतरालों की संख्या नमूना आकार पर निर्भर करती है। आमतौर पर स्वीकार किया जाता है: n = 100 पर = 10 ÷ 15, n = 200 पर = 15 ÷ 20, n = 400 पर = 25 ÷ 30, n = 1000 पर = 35 ÷ 40.

पाँच से कम अवलोकनों वाले अंतरालों को पड़ोसी अवलोकनों के साथ जोड़ दिया जाता है। हालाँकि, यदि ऐसे अंतरालों की संख्या उनकी कुल संख्या के 20% से कम है, तो n j ≥ 2 की आवृत्ति वाले अंतरालों की अनुमति है।

पियर्सन परीक्षण आँकड़ा मूल्य है
, (3.91)
जहां पी जे संभावना है कि अध्ययन के तहत यादृच्छिक चर जे-वें अंतराल में आता है, जिसकी गणना काल्पनिक वितरण कानून एफ (एक्स) के अनुसार की जाती है। संभाव्यता पी जे की गणना करते समय, किसी को यह ध्यान रखना चाहिए कि पहले अंतराल की बाईं सीमा और अंतिम की दाईं सीमा को यादृच्छिक चर के संभावित मूल्यों के क्षेत्र की सीमाओं के साथ मेल खाना चाहिए। उदाहरण के लिए, एक सामान्य के साथ वितरण, पहला अंतराल -∞ तक विस्तारित है, और अंतिम - +∞ तक।

सैद्धांतिक कानून एफ (एक्स) के साथ नमूना वितरण के अनुपालन के बारे में शून्य परिकल्पना की जाँच तालिका से पाए गए महत्वपूर्ण मूल्य χ 2 α के साथ सूत्र (3.91) द्वारा गणना किए गए मूल्य की तुलना करके की जाती है। महत्व स्तर α और स्वतंत्रता की डिग्री की संख्या k = के लिए आवेदन VI 1 - एम - 1. यहाँ 1 - विलय के बाद अंतराल की संख्या; मी विचाराधीन नमूने से अनुमानित मापदंडों की संख्या है। यदि असमानता है
χ 2 ≤ χ 2 α (3.92)
तो शून्य परिकल्पना अस्वीकार नहीं की जाती है। यदि निर्दिष्ट असमानता नहीं देखी जाती है, तो एक वैकल्पिक परिकल्पना स्वीकार की जाती है कि नमूना अज्ञात वितरण से संबंधित है।

पियर्सन के फिट-ऑफ-फिट परीक्षण का नुकसान अवलोकन परिणामों को अंतरालों में समूहित करने और व्यक्तिगत अंतरालों को कम संख्या में अवलोकनों के साथ संयोजित करने की आवश्यकता से जुड़ी कुछ प्रारंभिक जानकारी का नुकसान है। इस संबंध में, पूरक की सिफारिश की जाती है अन्य मानदंडों के साथ χ 2 मानदंड द्वारा वितरण के पत्राचार का सत्यापन। यह अपेक्षाकृत छोटी मात्रा के नमूनों (एन ≈ 100) के साथ विशेष रूप से आवश्यक है।

तालिका स्वतंत्रता की डिग्री की दी गई संख्या के साथ ची-वर्ग वितरण के महत्वपूर्ण मूल्यों को दिखाती है। वांछित मान कॉलम के चौराहे पर संबंधित संभाव्यता मान और पंक्ति के साथ स्वतंत्रता की डिग्री की संख्या के साथ है। उदाहरण के लिए, 0.25 की संभावना के लिए 4 डिग्री स्वतंत्रता के साथ ची-वर्ग वितरण का महत्वपूर्ण मान 5.38527 है। इसका मतलब यह है कि 5.38527 के मान के दाईं ओर 4 डिग्री स्वतंत्रता के साथ ची-वर्ग वितरण के घनत्व वक्र के तहत क्षेत्र 0.25 है।

ओडीएअज्ञात वितरण के प्रस्तावित कानून के बारे में परिकल्पना का परीक्षण करने की कसौटी को उपयुक्तता की कसौटी कहा जाता है।

फिट मानदंड की कई अच्छाइयां हैं: $\chi ^2$ (ची-स्क्वायर) के. पियर्सन, कोलमोगोरोव, स्मिरनोव और अन्य द्वारा।

आमतौर पर सैद्धांतिक और अनुभवजन्य आवृत्तियाँ भिन्न होती हैं। विसंगति का मामला यादृच्छिक नहीं हो सकता है, जिसका अर्थ है कि यह इस तथ्य से समझाया गया है कि परिकल्पना सही ढंग से नहीं चुनी गई है। पियर्सन मानदंड प्रश्न का उत्तर देता है, लेकिन, किसी भी मानदंड की तरह, यह कुछ भी साबित नहीं करता है, बल्कि केवल महत्व के स्वीकृत स्तर पर अवलोकन डेटा के साथ अपनी सहमति या असहमति स्थापित करता है।

ओडीएपर्याप्त रूप से छोटी संभावना जिस पर किसी घटना को लगभग असंभव माना जा सकता है, उसे महत्व का स्तर कहा जाता है।

व्यवहार में 0.01 और 0.05 के बीच महत्व स्तर लेना आम बात है, $\alpha =0.05$ $5 ( \% ) $ महत्व स्तर है।

परिकल्पना के परीक्षण के लिए एक मानदंड के रूप में, हम मान लेते हैं \begin(eqation) \label ( eq1 ) \chi ^2=\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) \ qquad (1) \ अंत(समीकरण)

यहाँ $n_i -$ नमूने से प्राप्त अनुभवजन्य आवृत्तियाँ, $n_i'' -$ सैद्धांतिक रूप से प्राप्त सैद्धांतिक आवृत्तियाँ।

यह सिद्ध है कि $n\to \infty $ के लिए यादृच्छिक चर (1) के वितरण का नियम, सामान्य जनसंख्या के वितरण कानून की परवाह किए बिना, कानून $\chi ^2$ (chi-square) की ओर जाता है $k$ स्वतंत्रता की डिग्री।

ओडीएस्वतंत्रता की डिग्री की संख्या समीकरण $k=S-1-r$ द्वारा पाई जाती है जहां $S-$ अंतराल समूहों की संख्या है, $r-$ मापदंडों की संख्या है।

1) समान वितरण: $r=2, k=S-3 $

2) सामान्य वितरण: $r=2, k=S-3 $

3) घातीय वितरण: $r=1, k=S-2$।

नियम . पियर्सन की कसौटी पर परिकल्पना का परीक्षण करना।

  1. परिकल्पना का परीक्षण करने के लिए, सैद्धांतिक आवृत्तियों की गणना की जाती है और $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i"))^2 ) ( n_i" ) ) $
  2. महत्वपूर्ण वितरण बिंदुओं की तालिका के अनुसार $\chi ^2$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$ दिए गए महत्व स्तर $\alpha $ और डिग्री की संख्या से पाया जाता है आज़ादी $k$.
  3. यदि $\chi _ ( अवलोकन ) ^2<\chi _ { кр } ^2 $ то нет оснований отвергать гипотезу, если не выполняется данное условие - то отвергают.

टिप्पणीगणनाओं को नियंत्रित करने के लिए, $\chi ^2$ के लिए सूत्र का उपयोग $\chi _ ( obs ) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) $ के रूप में करें।

समान वितरण की परिकल्पना का परीक्षण

$X$ के समान वितरण के घनत्व फ़ंक्शन का रूप $f(x)=\frac ( 1 ) ( b-a ) x\in \left[ ( a,b )\right]$ है।

इस परिकल्पना का परीक्षण करने के लिए कि एक सतत यादृच्छिक चर को $\alpha $ के महत्व स्तर पर समान रूप से वितरित किया जाता है, यह आवश्यक है:

1) दिए गए अनुभवजन्य वितरण से नमूना माध्य $\overline ( x_b ) $ और $\sigma _b =\sqrt ( D_b ) $ ज्ञात करें। पैरामीटर $a$ और $b$ के अनुमान के रूप में मात्राएँ लें

$a = \overline x _b -\sqrt 3 \sigma _b $, $b = \overline x _b +\sqrt 3 \sigma _b $

2) सूत्र $ P_i =P(( x_i) का उपयोग करके एक यादृच्छिक चर $

3) सूत्र $n_i" =np_i $ का उपयोग करके सैद्धांतिक (समतुल्य) आवृत्तियों का पता लगाएं।

4) तालिकाओं $\chi ^2$ से स्वतंत्रता की डिग्री की संख्या $k=S-3$ और महत्व स्तर $\alpha =0.05$ मानते हुए, हम $\chi _ ( cr ) ^2 $ पाते हैं $\alpha $ और $k$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$ दिया गया है।

5) सूत्र $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ का उपयोग करते हुए $ जहां $n_i $ अनुभवजन्य आवृत्तियां हैं, हम प्रेक्षित पाते हैं मूल्य $\ chi _ (obs ) ^2 $.

6) यदि $\chi _ ( अवलोकन ) ^2<\chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу.

आइए हमारे उदाहरण पर परिकल्पना का परीक्षण करें।

1) $\overline x _b =13.00\,\,\sigma _b =\sqrt ( D_b ) = 6.51$

2) $a=13.00-\sqrt 3 \cdot 6.51=13.00-1.732\cdot 6.51=1.72468$

$b=13.00+1.732\cdot 6.51=24.27532$

$b-a=24.27532-1.72468=22.55064$

3) $P_i =P((x_i

$P_2 =((3

$P_3 =((7

$P_4 =((11

$P_5 =((15

$P_6 =((19

एक समान वितरण में, यदि अंतराल की लंबाई समान है, तो $P_i -$ समान हैं।

4) $n_i" =np_i $ खोजें।

5) $\sum ( \frac ( (( n_i -n_i' ))^2 ) ( n_i' ) ) $ खोजें और $\chi _ ( obs ) ^2 $ खोजें।

आइए सभी प्राप्त मूल्यों को तालिका में रखें

\begin(array) ( |l|l|l|l|l|l|l| ) \hline i& n_i & n_i" =np_i & n_i -n_i" & (( n_i -n_i"))^2& \frac ( (( n_i -n_i")^2 ) ( n_i" ) और नियंत्रण~ \frac ( n_i^2 ) ( n_i" ) \\ \hline 1& 1& 4.43438& -3.43438& 11.7950& 2.659898& 0.22551 \\ \hline 2& 6& 4.43438& 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 3& 3& 4.43438& -1.43438& 2.05744& 0.471463& 2.0296 \\ \hline 4& 3& 4 .43438& - 1.43438& 2.05744& 0.471463& 2.0296 \\ \एचलाइन 5&6& 4.43438& 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 6& 6& 4.43438& 1, 56562&2, 45117& 0.552765& 8.11838 \\ \hline & & & & & & \sum = \chi _ (obs ) ^2 =3.261 119& \chi _ ( अवलोकन ) ^2 =\sum ( \frac ( n_i^2 ) ( n_i' ) -n ) =3.63985 \\ \hline \end(array)

$\chi _ ( cr ) ^2 (( 0.05.3 ))=7.8$

$\ची _ ( अवलोकन ) ^2<\chi _ { кр } ^2 =3,26<7,8$

निष्कर्षपरिकल्पना को अस्वीकार करने का कोई कारण नहीं है।

श्रेणियाँ

लोकप्रिय लेख

2023 "kingad.ru" - मानव अंगों की अल्ट्रासाउंड जांच