एक अंतराल भिन्नता वितरण श्रृंखला बनाएं। सांख्यिकीय सारांश और समूहन

यदि अध्ययन के तहत यादृच्छिक चर निरंतर है, तो देखे गए मूल्यों की रैंकिंग और समूहीकरण अक्सर इसके मूल्यों में भिन्नता की विशिष्ट विशेषताओं की पहचान करने की अनुमति नहीं देता है। यह इस तथ्य से समझाया गया है कि यादृच्छिक चर के अलग-अलग मान एक-दूसरे से इच्छानुसार कम भिन्न हो सकते हैं, और इसलिए, देखे गए डेटा की समग्रता में, किसी मात्रा के समान मान शायद ही कभी हो सकते हैं, और की आवृत्तियाँ वैरिएंट एक दूसरे से बहुत कम भिन्न होते हैं।

असतत यादृच्छिक चर के लिए असतत श्रृंखला का निर्माण करना भी अव्यावहारिक है, जिसके संभावित मानों की संख्या बड़ी है। ऐसे मामलों में, आपको निर्माण करना चाहिए अंतराल भिन्नता श्रृंखला वितरण.

ऐसी श्रृंखला का निर्माण करने के लिए, यादृच्छिक चर के देखे गए मानों की भिन्नता के पूरे अंतराल को एक श्रृंखला में विभाजित किया जाता है आंशिक अंतराल और प्रत्येक आंशिक अंतराल में मूल्य मानों की घटना की आवृत्ति की गणना करना।

अंतराल भिन्नता श्रृंखलाएक यादृच्छिक चर के अलग-अलग मानों के अंतरालों के एक क्रमबद्ध सेट को संबंधित आवृत्तियों या उनमें से प्रत्येक में आने वाले चर के मूल्यों की सापेक्ष आवृत्तियों के साथ कॉल करें।

एक अंतराल श्रृंखला बनाने के लिए आपको चाहिए:

  1. परिभाषित करना आकार आंशिक अंतराल;
  2. परिभाषित करना चौड़ाई अंतराल;
  3. इसे प्रत्येक अंतराल के लिए सेट करें शीर्ष और निचली सीमा ;
  4. अवलोकन परिणामों को समूहित करें।

1 . समूहीकरण अंतरालों की संख्या और चौड़ाई चुनने का प्रश्न प्रत्येक विशिष्ट मामले के आधार पर तय किया जाना है लक्ष्य अनुसंधान, आयतन नमूने और भिन्नता की डिग्री नमूने में विशेषता.

अंतरालों की अनुमानित संख्या केवल नमूना आकार के आधार पर अनुमान लगाया जा सकता है एन निम्नलिखित में से किसी एक तरीके से:

  • सूत्र के अनुसार स्टर्गेस : के = 1 + 3.32 लॉग एन ;
  • तालिका 1 का उपयोग करना।

तालिका नंबर एक

2 . आम तौर पर समान चौड़ाई वाले स्थानों को प्राथमिकता दी जाती है। अंतराल की चौड़ाई निर्धारित करने के लिए एच गणना करें:

  • भिन्नता की सीमा आर - नमूना मान: आर = एक्स अधिकतम - एक्स मिनट ,

कहाँ xmax और xmin - अधिकतम और न्यूनतम नमूनाकरण विकल्प;

  • प्रत्येक अंतराल की चौड़ाई एच निम्नलिखित सूत्र द्वारा निर्धारित: एच = आर/के .

3 . जमीनी स्तर पहला अंतराल एक्स एच1 न्यूनतम नमूना विकल्प इसलिए चुना गया है xmin लगभग इस अंतराल के मध्य में गिरा: x h1 = x मिनट - 0.5 घंटे .

मध्यवर्ती अंतरालपिछले अंतराल के अंत में आंशिक अंतराल की लंबाई जोड़कर प्राप्त किया गया एच :

x हाय = x हाय-1 +h.

अंतराल सीमाओं की गणना के आधार पर अंतराल पैमाने का निर्माण मान तक जारी रहता है एक्स हाय संबंध को संतुष्ट करता है:

एक्स हाय< x max + 0,5·h .

4 . अंतराल पैमाने के अनुसार, विशेषता मानों को समूहीकृत किया जाता है - प्रत्येक आंशिक अंतराल के लिए आवृत्तियों के योग की गणना की जाती है एन मैं विकल्प शामिल है मैं वें अंतराल. इस मामले में, अंतराल में यादृच्छिक चर के मान शामिल होते हैं जो निचली सीमा से अधिक या उसके बराबर होते हैं और अंतराल की ऊपरी सीमा से कम होते हैं।

बहुभुज और हिस्टोग्राम

स्पष्टता के लिए, विभिन्न सांख्यिकीय वितरण ग्राफ़ बनाए गए हैं।

एक असतत भिन्नता श्रृंखला के डेटा के आधार पर, वे निर्माण करते हैं बहुभुज आवृत्तियाँ या सापेक्ष आवृत्तियाँ।

आवृत्ति बहुभुज एक्स 1 ; एन 1 ), (एक्स 2 ; एन 2 ), ..., (एक्स क ; एन के ). बारंबारता बहुभुज का निर्माण करने के लिए, भुज अक्ष पर विकल्प आलेखित किए जाते हैं। एक्स मैं , और कोटि पर - संगत आवृत्तियाँ एन मैं . अंक ( एक्स मैं ; एन मैं ) सीधे खंडों से जुड़े होते हैं और एक आवृत्ति बहुभुज प्राप्त होता है (चित्र 1)।

सापेक्ष आवृत्तियों का बहुभुजएक टूटी हुई रेखा कहलाती है जिसके खंड बिंदुओं को जोड़ते हैं ( एक्स 1 ; डब्ल्यू 1 ), (एक्स 2 ; डब्ल्यू 2 ), ..., (एक्स क ; सप्त ). सापेक्ष आवृत्तियों का बहुभुज बनाने के लिए, भुज अक्ष पर विकल्प प्लॉट किए जाते हैं एक्स मैं , और कोटि पर - संगत सापेक्ष आवृत्तियाँ डब्ल्यू मैं . अंक ( एक्स मैं ; डब्ल्यू मैं ) सीधे खंडों से जुड़े होते हैं और सापेक्ष आवृत्तियों का एक बहुभुज प्राप्त होता है।

कब निरंतर संकेत निर्माण करना उचित है हिस्टोग्राम .

आवृत्ति हिस्टोग्रामइसे आयतों से बनी एक चरणबद्ध आकृति कहा जाता है, जिसके आधार लंबाई के आंशिक अंतराल होते हैं एच , और ऊंचाइयां अनुपात के बराबर हैं एनआईएच (आवृत्ति घनत्व)।

फ़्रीक्वेंसी हिस्टोग्राम बनाने के लिए, एब्सिस्सा अक्ष पर आंशिक अंतराल बिछाए जाते हैं, और एब्सिस्सा अक्ष के समानांतर खंड उनके ऊपर कुछ दूरी पर खींचे जाते हैं। एनआईएच .

समूहों की संख्या (अंतराल)लगभग स्टर्गेस सूत्र द्वारा निर्धारित किया जाता है:

एम = 1 + 3.322 × लॉग(एन)

जहां n अवलोकन इकाइयों की कुल संख्या है (जनसंख्या में तत्वों की कुल संख्या, आदि), log(n) n का दशमलव लघुगणक है।

प्राप्त स्टर्गेस सूत्र के अनुसार, मान को आमतौर पर निकटतम पूर्ण संख्या में पूर्णांकित किया जाता हैसंख्याएँ, चूँकि समूहों की संख्या भिन्नात्मक संख्या नहीं हो सकती।

यदि इतने सारे समूहों वाली एक अंतराल श्रृंखला कुछ मानदंडों के लिए संतोषजनक नहीं है, तो आप पूर्णांक बनाकर दूसरी अंतराल श्रृंखला बना सकते हैं एमएक छोटे पूर्णांक के लिए और दो पंक्तियों में से अधिक उपयुक्त एक का चयन करें।

समूहों की संख्या 15 से अधिक नहीं होनी चाहिए।

यदि दशमलव लघुगणक की गणना करना बिल्कुल भी संभव नहीं है तो आप निम्न तालिका का भी उपयोग कर सकते हैं।

    अंतराल की चौड़ाई का निर्धारण

अंतराल की चौड़ाईसमान अंतराल वाली अंतराल भिन्नता श्रृंखला के लिए सूत्र द्वारा निर्धारित किया जाता है:

जहां X अधिकतम, x i के मानों में से अधिकतम है, X min, x i के मानों में से न्यूनतम है; एम - समूहों की संख्या (अंतराल)।

अंतराल का आकार (मैं ) को आमतौर पर निकटतम पूर्ण संख्या में पूर्णांकित किया जाता है,एकमात्र अपवाद ऐसे मामले हैं जब किसी विशेषता के मामूली उतार-चढ़ाव का अध्ययन किया जाता है (उदाहरण के लिए, जब नाममात्र मूल्य से विचलन के आकार के अनुसार भागों को समूहीकृत किया जाता है, जिसे एक मिलीमीटर के अंशों में मापा जाता है)।

निम्नलिखित नियम अक्सर प्रयोग किया जाता है:

दशमलव स्थानों की संख्या

अल्पविराम के बाद अनेक चिह्न

सूत्र का उपयोग करके अंतराल चौड़ाई का उदाहरण

हम किस चिन्ह पर गोल करते हैं?

गोलाकार रिक्ति चौड़ाई का उदाहरण

    अंतरालों की सीमाएँ निर्धारित करना

निचली सीमा पहला अंतरालविशेषता के न्यूनतम मान के बराबर लिया जाता है (अक्सर इसे पहले अंतराल की चौड़ाई के समान रैंक के साथ एक छोटे पूर्णांक संख्या में पूर्णांकित किया जाता है)। उदाहरण के लिए, x मिनट = 15, i=130, पहले अंतराल का x n = 10।

x n1 ≈ x मिनट

ऊपरी सीमापहला अंतराल मान (Xmin +) से मेल खाता है मैं).

दूसरे अंतराल की निचली सीमा हमेशा पहले अंतराल की ऊपरी सीमा के बराबर होती है। बाद के समूहों के लिए, सीमाएँ समान रूप से निर्धारित की जाती हैं, अर्थात अंतराल मान क्रमिक रूप से जोड़ा जाता है।

एक्स वी मैं = एक्स एन मैं +मैं

एक्स एन मैं = एक्स वी मैं -1

    अंतरालों की आवृत्तियाँ निर्धारित करें।

हम गिनते हैं कि प्रत्येक अंतराल में कितने मान आते हैं। साथ ही, हमें याद है कि यदि किसी इकाई का विशेषता मान अंतराल की ऊपरी सीमा के मान के बराबर है, तो उसे अगले अंतराल को सौंपा जाना चाहिए।

    हम एक तालिका के रूप में एक अंतराल श्रृंखला बनाते हैं।

    अंतरालों के मध्यबिंदु निर्धारित करें.

अंतराल श्रृंखला के आगे के विश्लेषण के लिए, आपको प्रत्येक अंतराल के लिए एक विशिष्ट मान का चयन करना होगा। यह विशेषता मान इस अंतराल के अंतर्गत आने वाली सभी अवलोकन इकाइयों के लिए सामान्य होगा। वे। व्यक्तिगत तत्व अपने व्यक्तिगत विशेषता मान "खो" देते हैं और उन्हें एक सामान्य विशेषता मान सौंपा जाता है। यह सामान्य अर्थ है अंतराल के मध्य, जिसे दर्शाया गया है एक्स" मैं .

बच्चों के विकास के उदाहरण का उपयोग करते हुए, आइए देखें कि समान अंतराल वाली अंतराल श्रृंखला कैसे बनाई जाए।

प्रारंभिक डेटा उपलब्ध है.

90, 91, 92, 93, 94, 95, 96, 97, 98, 99 , 92, 93, 94, 95, 96, 98 , , 100, 101, 102, 103, 104, 105, 106, 107, 108, 109 , 100, 101, 102, 104 , 110, 112, 114, 116, 117, 120, 122, 123, 124, 129, 110, 111, 113, 115, 116, 117, 121, 125, 126, 127 , 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129 , 111, 113, 116, 127 , 123, 122, 130, 131, 132, 133, 134, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150 , 131, 133, 135, 136, 138, 139, 140, 141, 142, 143, 145, 146, 147, 148

कई मामलों में, जब एक सांख्यिकीय आबादी में एक बड़ी या उससे भी अधिक अनंत संख्या में वेरिएंट शामिल होते हैं, जो अक्सर निरंतर भिन्नता के साथ होते हैं, तो प्रत्येक वेरिएंट के लिए इकाइयों का एक समूह बनाना व्यावहारिक रूप से असंभव और अव्यावहारिक होता है। ऐसे मामलों में, सांख्यिकीय इकाइयों को समूहों में संयोजित करना केवल एक अंतराल के आधार पर संभव है, अर्थात। ऐसा समूह जिसमें विभिन्न विशेषताओं के मूल्यों के लिए कुछ सीमाएँ होती हैं। इन सीमाओं को दो संख्याओं द्वारा दर्शाया जाता है जो प्रत्येक समूह की ऊपरी और निचली सीमाओं को दर्शाती हैं। अंतरालों के उपयोग से अंतराल वितरण श्रृंखला का निर्माण होता है।

अंतराल रेडएक विविधता शृंखला है, जिसके विभिन्न रूप अंतरालों के रूप में प्रस्तुत किए जाते हैं।

एक अंतराल श्रृंखला समान और असमान अंतरालों के साथ बनाई जा सकती है, जबकि इस श्रृंखला के निर्माण के लिए सिद्धांत का चुनाव मुख्य रूप से सांख्यिकीय आबादी की प्रतिनिधित्वशीलता और सुविधा की डिग्री पर निर्भर करता है। यदि जनसंख्या इकाइयों की संख्या के संदर्भ में काफी बड़ी (प्रतिनिधि) है और इसकी संरचना में पूरी तरह से सजातीय है, तो अंतराल श्रृंखला के गठन को अंतराल की समानता पर आधारित करने की सलाह दी जाती है। आमतौर पर, इस सिद्धांत का उपयोग करके, उन आबादी के लिए एक अंतराल श्रृंखला बनाई जाती है जहां भिन्नता की सीमा अपेक्षाकृत छोटी होती है, यानी। अधिकतम और न्यूनतम विकल्प आमतौर पर कई बार एक-दूसरे से भिन्न होते हैं। इस मामले में, समान अंतरालों के मान की गणना किसी विशेषता की भिन्नता की सीमा और गठित अंतरालों की दी गई संख्या के अनुपात से की जाती है। बराबर निर्धारित करना औरअंतराल, स्टर्गेस सूत्र का उपयोग किया जा सकता है (आमतौर पर अंतराल विशेषताओं की एक छोटी भिन्नता और सांख्यिकीय आबादी में बड़ी संख्या में इकाइयों के साथ):

कहां एक्स मैं - समान अंतराल मान; एक्स अधिकतम, एक्स न्यूनतम - सांख्यिकीय समुच्चय में अधिकतम और न्यूनतम विकल्प; एन . - कुल इकाइयों की संख्या.

उदाहरण. सीज़ियम के साथ रेडियोधर्मी संदूषण के घनत्व के लिए एक समान अंतराल के आकार की गणना करने की सलाह दी जाती है - मोगिलेव क्षेत्र के क्रास्नोपोलस्की जिले की 100 बस्तियों में 137, यदि यह ज्ञात हो कि प्रारंभिक (न्यूनतम) विकल्प I किमी / के बराबर है किमी 2, अंतिम (अधिकतम) - 65 कि/किमी 2. सूत्र 5.1 का उपयोग करना। हम पाते हैं:

नतीजतन, सीज़ियम संदूषण के घनत्व के संदर्भ में समान अंतराल के साथ एक अंतराल श्रृंखला बनाने के लिए - क्रास्नोपोलस्की क्षेत्र में 137 बस्तियां, समान अंतराल का आकार 8 Ki/km 2 हो सकता है।

असमान वितरण की स्थितियों में, अर्थात्। जब अधिकतम और न्यूनतम विकल्प सैकड़ों बार होते हैं, तो अंतराल श्रृंखला बनाते समय, आप सिद्धांत लागू कर सकते हैं असमानअंतराल. जैसे-जैसे हम विशेषता के बड़े मूल्यों की ओर बढ़ते हैं, असमान अंतराल आमतौर पर बढ़ते जाते हैं।

अंतरालों का आकार बंद या खुला हो सकता है। बंद किया हुआऐसे अंतरालों को कॉल करने की प्रथा है जिनमें निचली और ऊपरी दोनों सीमाएँ होती हैं। खुलाअंतरालों की केवल एक सीमा होती है: पहले अंतराल में एक ऊपरी सीमा होती है, अंतिम में एक निचली सीमा होती है।

अंतराल श्रृंखला का मूल्यांकन करने की सलाह दी जाती है, विशेषकर असमान अंतरालों को ध्यान में रखते हुए वितरण घनत्व, जिसकी गणना करने का सबसे सरल तरीका स्थानीय आवृत्ति (या आवृत्ति) और अंतराल के आकार का अनुपात है।

व्यावहारिक रूप से एक अंतराल श्रृंखला बनाने के लिए, आप तालिका लेआउट का उपयोग कर सकते हैं। 5.3.

तालिका 5.3. सीज़ियम -137 के साथ रेडियोधर्मी संदूषण के घनत्व के अनुसार क्रास्नोपोलस्की क्षेत्र में बस्तियों की एक अंतराल श्रृंखला बनाने की प्रक्रिया

अंतराल श्रृंखला का मुख्य लाभ इसकी अधिकतमता है सघनता.उसी समय, अंतराल वितरण श्रृंखला में, विशेषता के अलग-अलग प्रकार संबंधित अंतराल में छिपे होते हैं

जब आयताकार निर्देशांक की एक प्रणाली में एक अंतराल श्रृंखला को ग्राफिक रूप से चित्रित किया जाता है, तो अंतराल की ऊपरी सीमाओं को एब्सिस्सा अक्ष पर प्लॉट किया जाता है, और श्रृंखला की स्थानीय आवृत्तियों को कोर्डिनेट अक्ष पर प्लॉट किया जाता है। एक अंतराल श्रृंखला का ग्राफिकल निर्माण एक वितरण बहुभुज के निर्माण से भिन्न होता है जिसमें प्रत्येक अंतराल में निचली और ऊपरी सीमाएं होती हैं, और दो एब्सिस्सा एक कोटि मान के अनुरूप होते हैं। इसलिए, एक अंतराल श्रृंखला के ग्राफ़ पर, एक बिंदु को चिह्नित नहीं किया जाता है, जैसा कि बहुभुज में होता है, बल्कि दो बिंदुओं को जोड़ने वाली एक रेखा को चिह्नित किया जाता है। इन क्षैतिज रेखाओं को ऊर्ध्वाधर रेखाओं द्वारा एक दूसरे से जोड़ा जाता है और एक चरणबद्ध बहुभुज की आकृति प्राप्त होती है, जिसे सामान्यतः कहा जाता है हिस्टोग्रामवितरण (चित्र 5.3)।

पर्याप्त रूप से बड़ी सांख्यिकीय आबादी के लिए ग्राफ़िक रूप से एक अंतराल श्रृंखला का निर्माण करते समय, हिस्टोग्राम दृष्टिकोण आता है सममितवितरण का स्वरूप. उन मामलों में जहां सांख्यिकीय जनसंख्या छोटी है, एक नियम के रूप में, विषमबार चार्ट।

कुछ मामलों में, कई संचित आवृत्तियों को बनाने की सलाह दी जाती है, अर्थात। संचयीपंक्ति। असतत या अंतराल वितरण श्रृंखला के आधार पर एक संचयी श्रृंखला बनाई जा सकती है। जब आयताकार निर्देशांक की एक प्रणाली में संचयी श्रृंखला को ग्राफिक रूप से चित्रित किया जाता है, तो वेरिएंट को एब्सिस्सा अक्ष पर प्लॉट किया जाता है, और संचित आवृत्तियों (आवृत्तियों) को ऑर्डिनेट अक्ष पर प्लॉट किया जाता है। परिणामी घुमावदार रेखा को आमतौर पर कहा जाता है संचयीवितरण (चित्र 5.4)।

विभिन्न प्रकार की भिन्नता श्रृंखलाओं का गठन और चित्रमय प्रतिनिधित्व मुख्य सांख्यिकीय विशेषताओं की सरलीकृत गणना में योगदान देता है, जिन पर विषय 6 में विस्तार से चर्चा की गई है, और सांख्यिकीय जनसंख्या के वितरण कानूनों के सार को बेहतर ढंग से समझने में मदद मिलती है। भिन्नता श्रृंखला का विश्लेषण उन मामलों में विशेष महत्व प्राप्त करता है जहां विकल्पों और आवृत्तियों (आवृत्तियों) के बीच संबंध को पहचानना और पता लगाना आवश्यक होता है। यह निर्भरता इस तथ्य में प्रकट होती है कि प्रति विकल्प मामलों की संख्या एक निश्चित तरीके से इस विकल्प के आकार से संबंधित होती है, अर्थात। अलग-अलग विशेषताओं के बढ़ते मूल्यों के साथ, इन मूल्यों की आवृत्तियों (आवृत्तियों) में निश्चित, व्यवस्थित परिवर्तन का अनुभव होता है। इसका मतलब यह है कि फ़्रीक्वेंसी (आवृत्ति) कॉलम में संख्याएँ अव्यवस्थित रूप से उतार-चढ़ाव नहीं करती हैं, बल्कि एक निश्चित दिशा में, एक निश्चित क्रम और अनुक्रम में बदलती हैं।

यदि आवृत्तियाँ अपने परिवर्तनों में एक निश्चित व्यवस्थितता दिखाती हैं, तो इसका मतलब है कि हम एक पैटर्न की पहचान करने की राह पर हैं। आवृत्तियों में परिवर्तन की प्रणाली, क्रम, अनुक्रम सामान्य कारणों, संपूर्ण जनसंख्या की सामान्य स्थितियों की विशेषता का प्रतिबिंब है।

यह नहीं माना जाना चाहिए कि वितरण पैटर्न हमेशा तैयार रूप में दिया जाता है। ऐसी बहुत सी विविधता श्रृंखलाएँ हैं जिनमें आवृत्तियाँ विचित्र रूप से उछलती हैं, कभी बढ़ती हैं, कभी घटती हैं। ऐसे मामलों में, यह पता लगाना उचित है कि शोधकर्ता किस प्रकार के वितरण से निपट रहा है: या तो इस वितरण में कोई अंतर्निहित पैटर्न नहीं है, या इसकी प्रकृति अभी तक सामने नहीं आई है: पहला मामला दुर्लभ है, लेकिन दूसरा यह मामला काफी सामान्य और बहुत व्यापक घटना है।

इस प्रकार, एक अंतराल श्रृंखला बनाते समय, सांख्यिकीय इकाइयों की कुल संख्या छोटी हो सकती है, और प्रत्येक अंतराल में छोटी संख्या में वेरिएंट होते हैं (उदाहरण के लिए, 1-3 इकाइयाँ)। ऐसे मामलों में, किसी भी पैटर्न के प्रकट होने पर भरोसा नहीं किया जा सकता है। यादृच्छिक अवलोकनों के आधार पर एक प्राकृतिक परिणाम प्राप्त करने के लिए, बड़ी संख्या का नियम लागू होना चाहिए, अर्थात। ताकि प्रत्येक अंतराल के लिए कई नहीं, बल्कि दसियों और सैकड़ों सांख्यिकीय इकाइयाँ हों। इस प्रयोजन के लिए, हमें यथासंभव अवलोकनों की संख्या बढ़ाने का प्रयास करना चाहिए। यह सामूहिक प्रक्रियाओं में पैटर्न का पता लगाने का सबसे अचूक तरीका है। यदि प्रेक्षणों की संख्या बढ़ाने का कोई वास्तविक अवसर नहीं है, तो वितरण श्रृंखला में अंतरालों की संख्या को कम करके एक पैटर्न की पहचान प्राप्त की जा सकती है। भिन्नता श्रृंखला में अंतरालों की संख्या कम करने से, प्रत्येक अंतराल में आवृत्तियों की संख्या बढ़ जाती है। इसका मतलब यह है कि प्रत्येक सांख्यिकीय इकाई के यादृच्छिक उतार-चढ़ाव एक-दूसरे पर आरोपित होते हैं, "सुचारू" होते हैं, एक पैटर्न में बदल जाते हैं।

भिन्नता श्रृंखला का गठन और निर्माण हमें सांख्यिकीय जनसंख्या के वितरण की केवल एक सामान्य, अनुमानित तस्वीर प्राप्त करने की अनुमति देता है। उदाहरण के लिए, एक हिस्टोग्राम केवल मोटे रूप में किसी विशेषता के मूल्यों और उसकी आवृत्तियों (आवृत्तियों) के बीच संबंध को व्यक्त करता है। इसलिए, भिन्नता श्रृंखला अनिवार्य रूप से स्थैतिक की आंतरिक नियमितता के आगे, गहन अध्ययन का आधार है वितरण।

विषय 5 के लिए परीक्षण प्रश्न

1. भिन्नता क्या है? सांख्यिकीय जनसंख्या में किसी विशेषता में भिन्नता का क्या कारण है?

2. सांख्यिकी में किस प्रकार की भिन्न विशेषताएँ हो सकती हैं?

3. विविधता श्रृंखला क्या है? विविधता श्रृंखला किस प्रकार की हो सकती है?

4. रैंक श्रृंखला क्या है? इसके फायदे और नुकसान क्या हैं?

5. असतत श्रृंखला क्या है और इसके फायदे और नुकसान क्या हैं?

6. अंतराल श्रृंखला बनाने की प्रक्रिया क्या है, इसके फायदे और नुकसान क्या हैं?

7. क्रमबद्ध, पृथक, अंतराल वितरण श्रृंखला का ग्राफिकल प्रतिनिधित्व क्या है?

8. वितरण का संचय क्या है और इसकी विशेषता क्या है?

गणित के आँकड़े- गणित की एक शाखा जो वैज्ञानिक और व्यावहारिक निष्कर्षों के लिए सांख्यिकीय डेटा के प्रसंस्करण, व्यवस्थितकरण और उपयोग के गणितीय तरीकों के लिए समर्पित है।

3.1. गणितीय सांख्यिकी की बुनियादी अवधारणाएँ

चिकित्सा और जैविक समस्याओं में, बहुत बड़ी संख्या में व्यक्तियों के लिए किसी विशेष विशेषता के वितरण का अध्ययन करना अक्सर आवश्यक होता है। इस विशेषता के अलग-अलग व्यक्तियों के लिए अलग-अलग अर्थ हैं, इसलिए यह एक यादृच्छिक चर है। उदाहरण के लिए, किसी भी चिकित्सीय दवा को अलग-अलग रोगियों पर लागू करने पर उसकी प्रभावशीलता अलग-अलग होती है। हालाँकि, इस दवा की प्रभावशीलता का अंदाजा लगाने के लिए इसे लागू करने की आवश्यकता नहीं है सब लोगबीमार। रोगियों के अपेक्षाकृत छोटे समूह में दवा के उपयोग के परिणामों का पता लगाना और प्राप्त आंकड़ों के आधार पर उपचार प्रक्रिया की आवश्यक विशेषताओं (प्रभावकारिता, मतभेद) की पहचान करना संभव है।

जनसंख्या- अध्ययन किए जाने वाले कुछ गुणों से युक्त सजातीय तत्वों का एक समूह। यह चिन्ह है निरंतरवितरण घनत्व के साथ यादृच्छिक चर एफ(एक्स).

उदाहरण के लिए, यदि हम किसी निश्चित क्षेत्र में किसी बीमारी की व्यापकता में रुचि रखते हैं, तो सामान्य जनसंख्या उस क्षेत्र की संपूर्ण जनसंख्या है। यदि हम इस बीमारी के प्रति पुरुषों और महिलाओं की संवेदनशीलता का अलग-अलग पता लगाना चाहते हैं, तो हमें दो सामान्य आबादी पर विचार करना चाहिए।

किसी सामान्य जनसंख्या के गुणों का अध्ययन करने के लिए उसके तत्वों के एक निश्चित भाग का चयन किया जाता है।

नमूना- सामान्य जनसंख्या का हिस्सा जांच (उपचार) के लिए चुना गया।

यदि इससे भ्रम की स्थिति न हो तो एक नमूना मंगाया जाता है वस्तुओं का एक सेट,सर्वेक्षण के लिए चयनित, और समग्रता

मानपरीक्षा के दौरान प्राप्त अध्ययन की गई विशेषता। इन मूल्यों को कई तरीकों से दर्शाया जा सकता है।

सरल सांख्यिकीय श्रृंखला -अध्ययन की जा रही विशेषता के मूल्यों को उसी क्रम में दर्ज किया गया है जिसमें उन्हें प्राप्त किया गया था।

20 रोगियों में माथे की त्वचा में सतह तरंग वेग (एम/एस) को मापकर प्राप्त एक सरल सांख्यिकीय श्रृंखला का एक उदाहरण तालिका में दिया गया है। 3.1.

तालिका 3.1.सरल सांख्यिकीय श्रृंखला

एक सरल सांख्यिकीय श्रृंखला सर्वेक्षण परिणामों को रिकॉर्ड करने का मुख्य और सबसे संपूर्ण तरीका है। इसमें सैकड़ों तत्व शामिल हो सकते हैं। इतनी समग्रता को एक नज़र में देखना बहुत कठिन है। इसलिए, बड़े नमूनों को आमतौर पर समूहों में विभाजित किया जाता है। ऐसा करने के लिए, विशेषता में परिवर्तन के क्षेत्र को कई (एन) में विभाजित किया गया है अंतरालसमान चौड़ाई और इन अंतरालों में आने वाली विशेषता की सापेक्ष आवृत्तियों (एन/एन) की गणना करें। प्रत्येक अंतराल की चौड़ाई है:

अंतराल सीमाओं के निम्नलिखित अर्थ हैं:

यदि कोई नमूना तत्व दो आसन्न अंतरालों के बीच की सीमा है, तो उसे इस प्रकार वर्गीकृत किया जाता है बाएंमध्यान्तर। इस प्रकार समूहित किये गये डेटा को कहा जाता है अंतराल सांख्यिकीय श्रृंखला.

एक तालिका है जो विशेषता मानों के अंतराल और इन अंतरालों के भीतर विशेषता की घटना की सापेक्ष आवृत्तियों को दर्शाती है।

हमारे मामले में, उदाहरण के लिए, हम निम्नलिखित अंतराल सांख्यिकीय श्रृंखला बना सकते हैं (एन = 5, डी= 4), टेबल. 3.2.

तालिका 3.2.अंतराल सांख्यिकीय श्रृंखला

यहां, अंतराल 28-32 में 28 के बराबर दो मान शामिल हैं (तालिका 3.1), और अंतराल 32-36 में 32, 33, 34 और 35 के मान शामिल हैं।

एक अंतराल सांख्यिकीय श्रृंखला को ग्राफ़िक रूप से दर्शाया जा सकता है। ऐसा करने के लिए, विशेषता मानों के अंतराल को एब्सिस्सा अक्ष के साथ प्लॉट किया जाता है और उनमें से प्रत्येक पर, आधार की तरह, सापेक्ष आवृत्ति के बराबर ऊंचाई के साथ एक आयत बनाया जाता है। परिणामी बार चार्ट को कहा जाता है हिस्टोग्राम.

चावल। 3.1.बार चार्ट

हिस्टोग्राम में, विशेषता के वितरण के सांख्यिकीय पैटर्न काफी स्पष्ट रूप से दिखाई देते हैं।

बड़े नमूना आकार (कई हजार) और छोटे कॉलम की चौड़ाई के साथ, हिस्टोग्राम का आकार ग्राफ़ के आकार के करीब है वितरण घनत्वसंकेत।

निम्न सूत्र का उपयोग करके हिस्टोग्राम स्तंभों की संख्या का चयन किया जा सकता है:

मैन्युअल रूप से हिस्टोग्राम बनाना एक लंबी प्रक्रिया है। इसलिए, इन्हें स्वचालित रूप से बनाने के लिए कंप्यूटर प्रोग्राम विकसित किए गए हैं।

3.2. सांख्यिकीय श्रृंखला की संख्यात्मक विशेषताएँ

कई सांख्यिकीय प्रक्रियाएं जनसंख्या अपेक्षा और विचरण (या एमएसई) के लिए नमूना अनुमान का उपयोग करती हैं।

नमूना माध्य(एक्स) एक साधारण सांख्यिकीय श्रृंखला के सभी तत्वों का अंकगणितीय माध्य है:

हमारे उदाहरण के लिए एक्स= 37.05 (एम/एस)।

नमूना माध्य हैसर्वश्रेष्ठसामान्य औसत अनुमानएम।

नमूना विचरण एस 2नमूना माध्य से तत्वों के वर्ग विचलन के योग के बराबर, से विभाजित एन- 1:

हमारे उदाहरण में, s 2 = 25.2 (m/s) 2।

कृपया ध्यान दें कि नमूना विचरण की गणना करते समय, सूत्र का हर नमूना आकार n नहीं, बल्कि n-1 होता है। यह इस तथ्य के कारण है कि सूत्र (3.3) में विचलन की गणना करते समय अज्ञात गणितीय अपेक्षा के स्थान पर इसके अनुमान का उपयोग किया जाता है - नमूना माध्य।

नमूना भिन्नता है सर्वश्रेष्ठसामान्य विचरण का अनुमान (σ 2)।

नमूना मानक विचलन(s) नमूना विचरण का वर्गमूल है:

हमारे उदाहरण के लिए एस= 5.02 (एम/एस)।

चयनात्मक वर्गमूल औसत का वर्गविचलन सामान्य मानक विचलन (σ) का सर्वोत्तम अनुमान है।

नमूना आकार में असीमित वृद्धि के साथ, सभी नमूना विशेषताएँ सामान्य जनसंख्या की संगत विशेषताओं की ओर प्रवृत्त होती हैं।

नमूना विशेषताओं की गणना के लिए कंप्यूटर सूत्रों का उपयोग किया जाता है। एक्सेल में, ये गणनाएँ औसत, भिन्नता जैसे सांख्यिकीय कार्य करती हैं। मानक विचलन

3.3. अंतराल मूल्यांकन

सभी नमूना विशेषताएँ हैं यादृच्छिक चर।इसका मतलब यह है कि समान आकार के दूसरे नमूने के लिए, नमूना विशेषताओं के मान भिन्न होंगे। इस प्रकार, चयनात्मक

विशेषताएँ ही हैं अनुमानजनसंख्या की प्रासंगिक विशेषताएँ।

चयनात्मक मूल्यांकन के नुकसान की भरपाई किसके द्वारा की जाती है? अंतराल अनुमान,का प्रतिनिधित्व संख्यात्मक अंतरालजिसके अंदर एक निश्चित संभावना के साथ आर डीअनुमानित पैरामीटर का सही मान पाया जाता है।

होने देना यू आर - सामान्य जनसंख्या के कुछ पैरामीटर (सामान्य माध्य, सामान्य विचरण, आदि)।

अंतराल अनुमानपैरामीटर यू आर को अंतराल कहा जाता है (यू 1, यू 2),शर्त को पूरा करना:

पी(यू < Ur < U2) = Рд. (3.5)

संभावना आर डीबुलाया आत्मविश्वास की संभावना.

आत्मविश्वास संभाव्यता पीडी - संभावना है कि अनुमानित मात्रा का सही मूल्य है अंदरनिर्दिष्ट अंतराल.

इस मामले में, अंतराल (यू 1, यू 2)बुलाया विश्वास अंतरालअनुमानित पैरामीटर के लिए.

अक्सर, विश्वास संभाव्यता के बजाय, संबंधित मान α = 1 - Р d का उपयोग किया जाता है, जिसे कहा जाता है स्तर का महत्व।

महत्वपूर्ण स्तरसंभावना है कि अनुमानित पैरामीटर का सही मान है बाहरविश्वास अंतराल।

कभी-कभी α और P d को प्रतिशत के रूप में व्यक्त किया जाता है, उदाहरण के लिए, 0.05 के बजाय 5% और 0.95 के बजाय 95%।

अंतराल आकलन में सबसे पहले उपयुक्त का चयन करें आत्मविश्वास की संभावना(आमतौर पर 0.95 या 0.99), और फिर अनुमानित पैरामीटर के लिए मानों की उचित सीमा ढूंढें।

आइए हम अंतराल अनुमानों के कुछ सामान्य गुणों पर ध्यान दें।

1. महत्व का स्तर जितना कम होगा (उतना अधिक)। आर डी),अंतराल अनुमान जितना व्यापक होगा. इसलिए, यदि 0.05 के महत्व स्तर पर सामान्य माध्य का अंतराल अनुमान 34.7 है< एम< 39,4, то для уровня 0,01 она будет гораздо шире: 33,85 < एम< 40,25.

2. नमूना आकार जितना बड़ा होगा एन,चयनित महत्व स्तर के साथ अंतराल अनुमान जितना कम होगा। उदाहरण के लिए, मान लें कि 20 तत्वों के नमूने से प्राप्त सामान्य औसत (β = 0.05) का प्रतिशत अनुमान 5 है, तो 34.7< एम< 39,4.

नमूना आकार को 80 तक बढ़ाने पर, हमें समान महत्व स्तर पर अधिक सटीक अनुमान मिलता है: 35.5< एम< 38,6.

सामान्य तौर पर, विश्वसनीय आत्मविश्वास अनुमानों के निर्माण के लिए उस कानून के ज्ञान की आवश्यकता होती है जिसके अनुसार अनुमानित यादृच्छिक विशेषता को जनसंख्या में वितरित किया जाता है। आइए देखें कि अंतराल अनुमान कैसे बनाया जाता है सामान्य औसतवह विशेषता जिसके अनुसार जनसंख्या में वितरित किया जाता है सामान्यकानून।

3.4. सामान्य वितरण कानून के लिए सामान्य औसत का अंतराल अनुमान

सामान्य वितरण कानून वाली जनसंख्या के लिए सामान्य औसत एम के अंतराल अनुमान का निर्माण निम्नलिखित संपत्ति पर आधारित है। नमूना मात्रा के लिए एननज़रिया

स्वतंत्रता की डिग्री की संख्या के साथ छात्र वितरण का पालन करता है ν = एन- 1.

यहाँ एक्स- नमूना माध्य, और एस- चयनात्मक मानक विचलन.

छात्र वितरण तालिकाओं या उनके कंप्यूटर समकक्ष का उपयोग करके, आप एक सीमा मान पा सकते हैं, जो किसी दिए गए आत्मविश्वास की संभावना के साथ, निम्नलिखित असमानता रखती है:

यह असमानता एम के लिए असमानता से मेल खाती है:

कहाँ ε - विश्वास अंतराल की आधी चौड़ाई।

इस प्रकार, एम के लिए विश्वास अंतराल का निर्माण निम्नलिखित क्रम में किया जाता है।

1. एक आत्मविश्वास संभाव्यता Р d (आमतौर पर 0.95 या 0.99) का चयन करें और इसके लिए, छात्र वितरण तालिका का उपयोग करके, पैरामीटर t ढूंढें

2. विश्वास अंतराल की आधी-चौड़ाई की गणना करें ε:

3. चयनित आत्मविश्वास संभावना के साथ सामान्य औसत का अंतराल अनुमान प्राप्त करें:

संक्षेप में इसे इस प्रकार लिखा गया है:

अंतराल अनुमान खोजने के लिए कंप्यूटर प्रक्रियाएं विकसित की गई हैं।

आइए हम बताएं कि छात्र वितरण तालिका का उपयोग कैसे करें। इस तालिका में दो "प्रवेश द्वार" हैं: बायां स्तंभ, जिसे स्वतंत्रता की डिग्री की संख्या ν = कहा जाता है एन- 1, और शीर्ष रेखा महत्व स्तर α है। संगत पंक्ति और स्तंभ के प्रतिच्छेदन पर, छात्र गुणांक ज्ञात करें टी।

आइए इस विधि को अपने नमूने पर लागू करें। छात्र वितरण तालिका का एक अंश नीचे प्रस्तुत किया गया है।

तालिका 3.3. छात्र वितरण तालिका का टुकड़ा

20 लोगों के नमूने के लिए एक सरल सांख्यिकीय श्रृंखला (एन= 20, ν =19) तालिका में प्रस्तुत किया गया है। 3.1. इस श्रृंखला के लिए, सूत्रों (3.1-3.3) का उपयोग करके गणना दी गई है: एक्स= 37,05; एस= 5,02.

आइए चुनें α = 0.05 (पी डी = 0.95)। पंक्ति "19" और स्तंभ "0.05" के प्रतिच्छेदन पर हम पाते हैं टी= 2,09.

आइए हम सूत्र (3.6) का उपयोग करके अनुमान की सटीकता की गणना करें: ε = 2.09?5.02/λ /20 = 2.34।

आइए एक अंतराल अनुमान बनाएं: 95% की संभावना के साथ, अज्ञात सामान्य माध्य असमानता को संतुष्ट करता है:

37,05 - 2,34 < एम< 37,05 + 2,34, или एम= 37.05 ± 2.34 (एम/एस), आर डी = 0.95।

3.5. सांख्यिकीय परिकल्पनाओं के परीक्षण की विधियाँ

सांख्यिकीय परिकल्पनाएँ

सांख्यिकीय परिकल्पना क्या है, इसे तैयार करने से पहले, निम्नलिखित उदाहरण पर विचार करें।

एक निश्चित बीमारी के इलाज के दो तरीकों की तुलना करने के लिए, 20-20 लोगों के रोगियों के दो समूहों का चयन किया गया और इन तरीकों का उपयोग करके इलाज किया गया। प्रत्येक मरीज के लिए इसे रिकॉर्ड किया गया था प्रक्रियाओं की संख्या,जिसके बाद सकारात्मक प्रभाव प्राप्त हुआ। इन आंकड़ों के आधार पर, प्रत्येक समूह के लिए नमूना माध्य (X), नमूना भिन्नताएं पाई गईं (एस 2)और नमूना मानक विचलन (एस)।

परिणाम तालिका में प्रस्तुत किये गये हैं। 3.4.

तालिका 3.4

सकारात्मक प्रभाव प्राप्त करने के लिए आवश्यक प्रक्रियाओं की संख्या एक यादृच्छिक चर है, जिसके बारे में सभी जानकारी वर्तमान में दिए गए नमूने में निहित है।

मेज से 3.4 दर्शाता है कि पहले समूह में नमूना औसत दूसरे की तुलना में कम है। क्या इसका मतलब यह है कि सामान्य औसत के लिए भी यही संबंध है: एम 1< М 2 ? Достаточно ли статистических данных для такого вывода? Ответы на эти вопросы и дает परिकल्पनाओं का सांख्यिकीय परीक्षण।

सांख्यिकीय परिकल्पना- यह आबादी के गुणों के बारे में एक धारणा है।

हम संपत्तियों के बारे में परिकल्पनाओं पर विचार करेंगे दोसामान्य आबादी.

यदि आबादी है प्रसिद्ध, समानअनुमानित मूल्य का वितरण, और धारणाएँ मूल्यों से संबंधित हैं कुछ पैरामीटरइस वितरण के बाद, परिकल्पनाओं को कहा जाता है पैरामीट्रिक.उदाहरण के लिए, नमूने आबादी से लिए गए हैं सामान्य कानूनवितरण और समान विचरण. पता लगाने की जरूरत है क्या यह वही हैइन आबादी का सामान्य औसत।

यदि सामान्य जनसंख्या के वितरण के नियमों के बारे में कुछ भी ज्ञात न हो तो उनके गुणों के बारे में परिकल्पनाएँ कही जाती हैं अपैरामीट्रिक.उदाहरण के लिए, क्या यह वही हैसामान्य आबादी के वितरण के नियम जिनसे नमूने लिए जाते हैं।

शून्य और वैकल्पिक परिकल्पनाएँ.

परिकल्पनाओं के परीक्षण का कार्य। महत्वपूर्ण स्तर

आइए परिकल्पनाओं का परीक्षण करते समय प्रयुक्त शब्दावली से परिचित हों।

एच0 - शून्य परिकल्पना (संशयवादी परिकल्पना) एक परिकल्पना है मतभेदों की अनुपस्थिति के बारे मेंतुलना किए गए नमूनों के बीच। संशयवादी का मानना ​​है कि शोध परिणामों से प्राप्त नमूना अनुमानों के बीच अंतर यादृच्छिक हैं;

एच 1- वैकल्पिक परिकल्पना (आशावादी परिकल्पना) तुलना किए गए नमूनों के बीच अंतर की उपस्थिति के बारे में एक परिकल्पना है। एक आशावादी का मानना ​​है कि नमूना अनुमानों के बीच अंतर वस्तुनिष्ठ कारणों से होता है और सामान्य आबादी में अंतर के अनुरूप होता है।

सांख्यिकीय परिकल्पनाओं का परीक्षण तभी संभव है जब कुछ का निर्माण करना संभव हो आकार(मानदंड), जिसका वितरण कानून निष्पक्षता की स्थिति में हो एच 0प्रसिद्ध। फिर इस मात्रा के लिए हम निर्दिष्ट कर सकते हैं विश्वास अंतराल,जिसमें एक दी गई संभावना के साथ आर डीउसका मूल्य गिर जाता है. इस अंतराल को कहा जाता है महत्वपूर्ण क्षेत्र.यदि मानदंड मान क्रांतिक क्षेत्र में आता है तो परिकल्पना स्वीकार कर ली जाती है एन 0.अन्यथा परिकल्पना H1 स्वीकृत की जाती है।

चिकित्सा अनुसंधान में, P d = 0.95 या P d = 0.99 का उपयोग किया जाता है। ये मूल्य मेल खाते हैं महत्व स्तरα = 0.05 या α = 0.01.

सांख्यिकीय परिकल्पनाओं का परीक्षण करते समयस्तर का महत्व(α) सत्य होने पर शून्य परिकल्पना को अस्वीकार करने की संभावना है।

कृपया ध्यान दें कि, इसके मूल में, परिकल्पना परीक्षण प्रक्रिया का उद्देश्य है मतभेदों का पता लगानाऔर उनकी अनुपस्थिति की पुष्टि करने के लिए नहीं. जब मानदंड का मान महत्वपूर्ण क्षेत्र से आगे चला जाता है, तो हम शुद्ध हृदय से "संशयवादी" से कह सकते हैं - अच्छा, आप और क्या चाहते हैं?! यदि कोई मतभेद नहीं थे, तो 95% (या 99%) की संभावना के साथ गणना मूल्य निर्दिष्ट सीमा के भीतर होगा। लेकिन कोई नहीं!..

खैर, यदि मानदंड का मान महत्वपूर्ण क्षेत्र में आता है, तो यह मानने का कोई कारण नहीं है कि परिकल्पना एच 0 सही है। यह संभवतः दो संभावित कारणों में से एक की ओर इशारा करता है।

1. अंतर का पता लगाने के लिए नमूना आकार पर्याप्त बड़ा नहीं है। संभावना है कि निरंतर प्रयोग से सफलता मिलेगी.

2. मतभेद हैं. लेकिन ये इतने छोटे हैं कि इनका कोई व्यावहारिक महत्व नहीं है. ऐसे में प्रयोग जारी रखने का कोई मतलब नहीं बनता.

आइए चिकित्सा अनुसंधान में उपयोग की जाने वाली कुछ सांख्यिकीय परिकल्पनाओं पर विचार करें।

3.6. भिन्नताओं की समानता, फिशर के एफ-मानदंड के बारे में परिकल्पना का परीक्षण

कुछ नैदानिक ​​अध्ययनों में, सकारात्मक प्रभाव इतना अधिक प्रमाणित नहीं हुआ है परिमाणजिस पैरामीटर का अध्ययन किया जा रहा है, वह कितना है स्थिरीकरण,इसके उतार-चढ़ाव को कम करना। इस मामले में, नमूना सर्वेक्षण के परिणामों के आधार पर दो सामान्य भिन्नताओं की तुलना करने का प्रश्न उठता है। के प्रयोग से इस समस्या का समाधान किया जा सकता है फिशर का परीक्षण.

समस्या का निरूपण

सामान्य कानूनवितरण. नमूना आकार -

एन 1और n2,नमूना भिन्नताएँबराबर एस 1 और एस 2 2 सामान्य भिन्नताएँ.

परीक्षण योग्य परिकल्पनाएँ:

एच 0- सामान्य भिन्नताएँ समान हैं;

एच 1- सामान्य भिन्नताएँ कुछ अलग हैं।

यदि नमूने आबादी से लिए गए हैं तो दिखाया गया है सामान्य कानूनवितरण, यदि परिकल्पना सत्य है एच 0नमूना भिन्नताओं का अनुपात फिशर वितरण का अनुसरण करता है। इसलिए, निष्पक्षता की जाँच के लिए एक मानदंड के रूप में एच 0मान लिया गया है एफ,सूत्र द्वारा गणना:

कहाँ एस 1 और एस 2 नमूना भिन्नताएं हैं।

यह अनुपात अंश ν 1 = की स्वतंत्रता की डिग्री की संख्या के साथ फिशर वितरण का पालन करता है एन 1- 1 और हर की स्वतंत्रता की डिग्री की संख्या ν 2 = n 2 - 1. महत्वपूर्ण क्षेत्र की सीमाएं फिशर वितरण तालिकाओं का उपयोग करके या कंप्यूटर फ़ंक्शन BRASPOBR का उपयोग करके पाई जाती हैं।

तालिका में प्रस्तुत उदाहरण के लिए. 3.4, हम पाते हैं: ν 1 = ν 2 = 20 - 1 = 19; एफ= 2.16/4.05 = 0.53. α = 0.05 पर, क्रांतिक क्षेत्र की सीमाएँ क्रमशः हैं: = 0.40, = 2.53।

मानदंड मान क्रांतिक क्षेत्र में आता है, इसलिए परिकल्पना स्वीकार की जाती है एच 0:सामान्य नमूना भिन्नताएँ समान हैं।

3.7. साधनों की समानता के संबंध में परिकल्पनाओं का परीक्षण, छात्र टी-मानदंड

तुलना कार्य औसतव्यावहारिक महत्व सटीक होने पर दो सामान्य आबादी उत्पन्न होती है परिमाणविशेषता का अध्ययन किया जा रहा है। उदाहरण के लिए, जब दो अलग-अलग तरीकों से उपचार की अवधि या उनके उपयोग से उत्पन्न होने वाली जटिलताओं की संख्या की तुलना की जाती है। इस मामले में, आप विद्यार्थी के टी-टेस्ट का उपयोग कर सकते हैं।

समस्या का निरूपण

सामान्य आबादी से निकाले गए दो नमूने (एक्स 1) और (एक्स 2) प्राप्त किए गए सामान्य कानूनवितरण और समान भिन्नताएँ.नमूना आकार - एन 1 और एन 2, नमूना का मतलब है X 1 और X 2 के बराबर हैं, और नमूना भिन्नताएँ- एस 1 2 और एस 2 2क्रमश। तुलना करने की जरूरत है सामान्य औसत.

परीक्षण योग्य परिकल्पनाएँ:

एच 0- सामान्य औसत समान हैं;

एच 1- सामान्य औसत कुछ अलग हैं।

यह दर्शाया गया है कि यदि परिकल्पना सत्य है एच 0 t मान सूत्र द्वारा परिकलित:

स्वतंत्रता की डिग्री की संख्या के साथ छात्र के कानून के अनुसार वितरित ν = ν 1 + + ν2 - 2।

यहाँ जहाँ ν 1 = एन 1 - 1 - पहले नमूने के लिए स्वतंत्रता की डिग्री की संख्या; ν 2 = एन 2 - 1 - दूसरे नमूने के लिए स्वतंत्रता की डिग्री की संख्या।

महत्वपूर्ण क्षेत्र की सीमाएं टी-वितरण तालिकाओं का उपयोग करके या कंप्यूटर फ़ंक्शन STUDRIST का उपयोग करके पाई जाती हैं। विद्यार्थी वितरण शून्य के बारे में सममित है, इसलिए क्रांतिक क्षेत्र की बाएँ और दाएँ सीमाएँ परिमाण में समान और चिह्न में विपरीत हैं: -और

तालिका में प्रस्तुत उदाहरण के लिए. 3.4, हमें मिलता है:

ν 1 = ν 2 = 20 - 1 = 19; ν = 38, टी= -2.51. α = 0.05 = 2.02 पर।

मानदंड मान क्रांतिक क्षेत्र की बाईं सीमा से आगे जाता है, इसलिए हम परिकल्पना को स्वीकार करते हैं एच 1:सामान्य औसत कुछ अलग हैं।इसी समय, जनसंख्या औसत पहला नमूनाकम।

विद्यार्थी के टी-टेस्ट की प्रयोज्यता

विद्यार्थी का टी परीक्षण केवल नमूनों पर लागू होता है सामान्यके साथ एकत्रित होता है समान सामान्य भिन्नताएँ।यदि शर्तों में से कम से कम एक का उल्लंघन किया जाता है, तो मानदंड की प्रयोज्यता संदिग्ध है। आम जनता की सामान्य स्थिति की आवश्यकता का हवाला देकर आमतौर पर इसे नजरअंदाज कर दिया जाता है केंद्रीय सीमा प्रमेय।वास्तव में, अंश (3.10) में नमूना माध्य के बीच के अंतर को ν > 30 के लिए सामान्य रूप से वितरित माना जा सकता है। लेकिन भिन्नताओं की समानता के प्रश्न को सत्यापित नहीं किया जा सकता है, और इस तथ्य का संदर्भ नहीं लिया जा सकता है कि फिशर परीक्षण ने अंतर का पता नहीं लगाया है खाते में। हालाँकि, जनसंख्या के साधनों में अंतर का पता लगाने के लिए टी-टेस्ट का व्यापक रूप से उपयोग किया जाता है, हालांकि पर्याप्त सबूत के बिना।

नीचे चर्चा की गई है गैरपैरामीट्रिक मानदंड,जिसका उपयोग उन्हीं उद्देश्यों के लिए सफलतापूर्वक किया जाता है और जिसके लिए किसी की आवश्यकता नहीं होती है सामान्यता,कोई भी नहीं भिन्नताओं की समानता.

3.8. दो नमूनों की गैर-पैरामीट्रिक तुलना: मैन-व्हिटनी मानदंड

गैर-पैरामीट्रिक परीक्षण दो आबादी के वितरण कानूनों में अंतर का पता लगाने के लिए डिज़ाइन किए गए हैं। मानदंड जो सामान्य रूप से मतभेदों के प्रति संवेदनशील हैं औसत,मानदंड कहलाते हैं बदलावमानदंड जो सामान्य रूप से मतभेदों के प्रति संवेदनशील हैं फैलाव,मानदंड कहलाते हैं पैमाना।मैन-व्हिटनी परीक्षण मानदंड को संदर्भित करता है बदलावऔर इसका उपयोग दो आबादी के साधनों में अंतर का पता लगाने के लिए किया जाता है, जिनमें से नमूने प्रस्तुत किए गए हैं रैंकिंग पैमाना.मापी गई विशेषताओं को इस पैमाने पर आरोही क्रम में स्थित किया जाता है, और फिर पूर्णांक 1, 2 के साथ क्रमांकित किया जाता है... इन संख्याओं को कहा जाता है रैंक.समान मात्राओं को समान रैंक दी गई है। यह केवल विशेषता का मूल्य नहीं है जो मायने रखता है सामान्य स्थानजिसे यह अन्य मात्राओं में स्थान देता है।

तालिका में 3.5. तालिका 3.4 से पहला समूह विस्तारित रूप (पंक्ति 1), रैंक (पंक्ति 2) में प्रस्तुत किया गया है, और फिर समान मूल्यों की रैंक को अंकगणितीय औसत से बदल दिया जाता है। उदाहरण के लिए, पहली पंक्ति में आइटम 4 और 4 को रैंक 2 और 3 दिए गए थे, जिन्हें बाद में 2.5 के समान मानों से बदल दिया गया था।

तालिका 3.5

समस्या का निरूपण

स्वतंत्र नमूने (एक्स 1)और (एक्स 2)अज्ञात वितरण कानूनों के साथ सामान्य आबादी से निकाला गया। नमूना आकार एन 1और एन 2क्रमश। नमूना तत्वों के मान प्रस्तुत किए गए हैं रैंकिंग पैमाना.यह जांचना ज़रूरी है कि क्या ये सामान्य आबादी एक-दूसरे से भिन्न हैं?

परीक्षण योग्य परिकल्पनाएँ:

एच 0- नमूने समान सामान्य जनसंख्या के हैं; एच 1- नमूने विभिन्न सामान्य आबादी के हैं।

ऐसी परिकल्पनाओं का परीक्षण करने के लिए (/-मैन-व्हिटनी परीक्षण का उपयोग किया जाता है।

सबसे पहले, दो नमूनों से एक संयुक्त नमूना (एक्स) संकलित किया जाता है, जिसके तत्वों को क्रमबद्ध किया जाता है। फिर पहले नमूने के तत्वों के अनुरूप रैंकों का योग पाया जाता है। यह राशि परिकल्पनाओं के परीक्षण की कसौटी है।

यू= पहले नमूने की रैंकों का योग. (3.11)

स्वतंत्र नमूनों के लिए जिनकी मात्रा 20 से अधिक है, मान यूसामान्य वितरण का पालन करता है, गणितीय अपेक्षा और मानक विचलन इसके बराबर हैं:

इसलिए, क्रांतिक क्षेत्र की सीमाएँ सामान्य वितरण तालिकाओं के अनुसार पाई जाती हैं।

तालिका में प्रस्तुत उदाहरण के लिए. 3.4, हम पाते हैं: ν 1 = ν 2 = 20 - 1 = 19, यू= 339, μ = 410, σ = 37। α = 0.05 के लिए हमें मिलता है: बाएँ = 338 और दाएँ = 482।

मानदंड का मान महत्वपूर्ण क्षेत्र की बाईं सीमा से परे जाता है, इसलिए परिकल्पना एच 1 को स्वीकार किया जाता है: सामान्य आबादी में अलग-अलग वितरण कानून होते हैं। इसी समय, जनसंख्या औसत पहला नमूनाकम।

अंतराल वितरण श्रृंखला का निर्माण करते समय, तीन प्रश्न हल किए जाते हैं:

  • 1. मुझे कितने अंतराल लेने चाहिए?
  • 2. अंतराल की लंबाई क्या है?
  • 3. जनसंख्या इकाइयों को अंतराल की सीमाओं के भीतर शामिल करने की प्रक्रिया क्या है?
  • 1. अंतरालों की संख्याद्वारा निर्धारित किया जा सकता है स्टर्गेस सूत्र:

2. अंतराल की लंबाई, या अंतराल चरण, आमतौर पर सूत्र द्वारा निर्धारित किया जाता है

कहाँ आर-भिन्नता की सीमा.

3. अंतराल की सीमाओं के भीतर जनसंख्या इकाइयों को शामिल करने का क्रम

भिन्न हो सकते हैं, लेकिन अंतराल श्रृंखला का निर्माण करते समय, वितरण को सख्ती से परिभाषित किया जाना चाहिए।

उदाहरण के लिए, यह: [), जिसमें जनसंख्या इकाइयों को निचली सीमाओं में शामिल किया जाता है, लेकिन ऊपरी सीमाओं में शामिल नहीं किया जाता है, बल्कि अगले अंतराल में स्थानांतरित कर दिया जाता है। इस नियम का अपवाद अंतिम अंतराल है, जिसकी ऊपरी सीमा में रैंक की गई श्रृंखला की अंतिम संख्या शामिल है।

अंतराल सीमाएँ हैं:

  • बंद - विशेषता के दो चरम मूल्यों के साथ;
  • खुला - विशेषता के एक चरम मूल्य के साथ (पहलेऐसी और ऐसी संख्या या ऊपरऐसी और ऐसी संख्या)।

सैद्धांतिक सामग्री को आत्मसात करने के लिए, हम परिचय देते हैं पृष्ठभूमि की जानकारीसमाधान के लिए अंत-से-अंत कार्य.

बिक्री प्रबंधकों की औसत संख्या, उनके द्वारा बेचे गए समान सामानों की मात्रा, इस उत्पाद के लिए व्यक्तिगत बाजार मूल्य, साथ ही पहले रूसी संघ के क्षेत्रों में से एक में 30 कंपनियों की बिक्री की मात्रा पर सशर्त डेटा हैं। रिपोर्टिंग वर्ष की तिमाही (तालिका 2.1)।

तालिका 2.1

क्रॉस-कटिंग कार्य के लिए प्रारंभिक जानकारी

संख्या

प्रबंधक,

कीमत, हजार रूबल

बिक्री की मात्रा, मिलियन रूबल।

संख्या

प्रबंधक,

बेचे गए माल की मात्रा, पीसी।

कीमत, हजार रूबल

बिक्री की मात्रा, मिलियन रूबल।

प्रारंभिक जानकारी के साथ-साथ अतिरिक्त जानकारी के आधार पर, हम अलग-अलग कार्य निर्धारित करेंगे। फिर हम उन्हें हल करने की पद्धति और स्वयं समाधान प्रस्तुत करेंगे।

क्रॉस-कटिंग कार्य. कार्य 2.1

तालिका से प्रारंभिक डेटा का उपयोग करना। 2.1 आवश्यकबेची गई वस्तुओं की मात्रा के आधार पर फर्मों के वितरण की एक अलग श्रृंखला बनाएं (तालिका 2.2)।

समाधान:

तालिका 2.2

रिपोर्टिंग वर्ष की पहली तिमाही में रूसी संघ के क्षेत्रों में से किसी एक में बेची गई वस्तुओं की मात्रा के आधार पर फर्मों के वितरण की अलग श्रृंखला

क्रॉस-कटिंग कार्य. कार्य 2.2

आवश्यकप्रबंधकों की औसत संख्या के अनुसार 30 फर्मों की एक रैंक श्रृंखला बनाएं।

समाधान:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

क्रॉस-कटिंग कार्य. कार्य 2.3

तालिका से प्रारंभिक डेटा का उपयोग करना। 2.1, आवश्यक:

  • 1. प्रबंधकों की संख्या के आधार पर फर्मों के वितरण की एक अंतराल श्रृंखला बनाएं।
  • 2. फर्मों की वितरण श्रृंखला की आवृत्तियों की गणना करें।
  • 3. निष्कर्ष निकालें.

समाधान:

आइए स्टर्गेस सूत्र (2.5) का उपयोग करके गणना करें अंतरालों की संख्या:

इस प्रकार, हम 6 अंतराल (समूह) लेते हैं।

अंतराल की लंबाई, या अंतराल चरण, सूत्र का उपयोग करके गणना करें

टिप्पणी।अंतराल की सीमाओं में जनसंख्या इकाइयों को शामिल करने का क्रम इस प्रकार है: I), जिसमें जनसंख्या इकाइयों को निचली सीमाओं में शामिल किया जाता है, लेकिन ऊपरी सीमाओं में शामिल नहीं किया जाता है, बल्कि अगले अंतराल में स्थानांतरित कर दिया जाता है। इस नियम का अपवाद अंतिम अंतराल I] है, जिसकी ऊपरी सीमा में रैंक की गई श्रृंखला की अंतिम संख्या शामिल है।

हम एक अंतराल श्रृंखला बनाते हैं (तालिका 2.3)।

रिपोर्टिंग वर्ष की पहली तिमाही में रूसी संघ के क्षेत्रों में से एक में फर्मों के वितरण की अंतराल श्रृंखला और प्रबंधकों की औसत संख्या

निष्कर्ष।फर्मों का सबसे बड़ा समूह 25-30 लोगों की औसत संख्या वाले प्रबंधकों वाला समूह है, जिसमें 8 फर्म (27%) शामिल हैं; 40-45 लोगों के प्रबंधकों की औसत संख्या वाले सबसे छोटे समूह में केवल एक कंपनी (3%) शामिल है।

तालिका से प्रारंभिक डेटा का उपयोग करना। 2.1, साथ ही प्रबंधकों की संख्या के आधार पर फर्मों के वितरण की एक अंतराल श्रृंखला (तालिका 2.3), आवश्यकप्रबंधकों की संख्या और फर्मों की बिक्री की मात्रा के बीच संबंधों का एक विश्लेषणात्मक समूह बनाएं और इसके आधार पर, इन विशेषताओं के बीच संबंध की उपस्थिति (या अनुपस्थिति) के बारे में निष्कर्ष निकालें।

समाधान:

विश्लेषणात्मक समूहन कारक विशेषताओं पर आधारित है। हमारी समस्या में, कारक विशेषता (x) प्रबंधकों की संख्या है, और परिणामी विशेषता (y) बिक्री की मात्रा है (तालिका 2.4)।

आइए अब निर्माण करें विश्लेषणात्मक समूहन(सारणी 2.5).

निष्कर्ष।निर्मित विश्लेषणात्मक समूह के आंकड़ों के आधार पर, हम कह सकते हैं कि बिक्री प्रबंधकों की संख्या में वृद्धि के साथ, समूह में कंपनी की औसत बिक्री मात्रा भी बढ़ जाती है, जो इन विशेषताओं के बीच सीधा संबंध की उपस्थिति को इंगित करता है।

तालिका 2.4

विश्लेषणात्मक समूहन के निर्माण के लिए सहायक तालिका

प्रबंधकों, लोगों की संख्या,

कंपनी संख्या

बिक्री की मात्रा, मिलियन रूबल, वाई

" = 59 एफ = 9.97

मैं-™ 4 -यू.22

74 '25 1पीवाई1

उ4 = 7 = 10,61

पर = ’ =10,31 30

तालिका 2.5

रिपोर्टिंग वर्ष की पहली तिमाही में रूसी संघ के किसी एक क्षेत्र में कंपनी प्रबंधकों की संख्या पर बिक्री की मात्रा की निर्भरता

नियंत्रण प्रश्न
  • 1. सांख्यिकीय अवलोकन का सार क्या है?
  • 2. सांख्यिकीय अवलोकन के चरणों का नाम बताइए।
  • 3. सांख्यिकीय अवलोकन के संगठनात्मक रूप क्या हैं?
  • 4. सांख्यिकीय अवलोकन के प्रकारों के नाम बताइए।
  • 5. सांख्यिकीय सारांश क्या है?
  • 6. सांख्यिकीय रिपोर्ट के प्रकारों के नाम बताइए।
  • 7. सांख्यिकीय समूहन क्या है?
  • 8. सांख्यिकीय समूहों के प्रकारों के नाम बताइए।
  • 9. वितरण श्रृंखला क्या है?
  • 10. वितरण पंक्ति के संरचनात्मक तत्वों के नाम बताइए।
  • 11. वितरण श्रृंखला के निर्माण की प्रक्रिया क्या है?
श्रेणियाँ

लोकप्रिय लेख

2023 "kingad.ru" - मानव अंगों की अल्ट्रासाउंड जांच