वितरण रैंक। विशेषता और भिन्नता वितरण श्रृंखला

भिन्नता के सांख्यिकीय अध्ययन में पहला कदम निर्माण है विविधता श्रृंखला - विशेषता के मूल्यों में वृद्धि (अधिक बार) या घटते (कम अक्सर) के अनुसार जनसंख्या की इकाइयों के वितरण का आदेश दिया और विशेषता के एक या दूसरे मूल्य के साथ इकाइयों की संख्या की गणना की।

एक विविधता श्रृंखला के तीन रूप हैं: एक श्रेणीबद्ध श्रृंखला, एक असतत श्रृंखला, एक अंतराल श्रृंखला। विविधता श्रृंखला को अक्सर कहा जाता है वितरण के निकट।इस शब्द का प्रयोग मात्रात्मक और गैर-मात्रात्मक दोनों लक्षणों में भिन्नता के अध्ययन में किया जाता है। वितरण श्रृंखला है संरचनात्मक समूहन(अध्याय 6 देखें)।

रैंक की गई पंक्ति -यह अध्ययन के तहत विशेषता के आरोही (अवरोही) क्रम में जनसंख्या की व्यक्तिगत इकाइयों की एक सूची है।

तालिका 1 एक क्रमबद्ध श्रृंखला के उदाहरण के रूप में काम कर सकती है। 5.5.

तालिका 5.5

सेंट पीटर्सबर्ग के बड़े किनारे, आकार के अनुसार क्रमबद्ध01.07.96 . तक अपनी पूंजी

यदि जनसंख्या इकाइयों की संख्या काफी बड़ी है, तो रैंक की गई श्रृंखला बोझिल हो जाती है, और इसके निर्माण में, यहां तक ​​​​कि कंप्यूटर की मदद से भी, एक लंबा समय लगता है। ऐसे मामलों में, अध्ययन के तहत विशेषता के मूल्यों के अनुसार जनसंख्या की इकाइयों को समूहीकृत करके भिन्नता श्रृंखला का निर्माण किया जाता है।

यदि विशेषता कम संख्या में मान लेती है, तो एक असतत परिवर्तनशील श्रृंखला बनाई जाती है। इस तरह की श्रृंखला का एक उदाहरण फुटबॉल मैचों का स्कोर किए गए गोलों की संख्या से वितरण है (तालिका 5.1)। असतत भिन्नता श्रृंखला -यह एक तालिका है जिसमें दो पंक्तियाँ या एक ग्राफ़ होता है: एक चर विशेषता के विशिष्ट मान एक्समैंऔर सुविधा के दिए गए मान के साथ जनसंख्या इकाइयों की संख्या फाईआवृत्तियों (f अंग्रेजी शब्द आवृत्ति का प्रारंभिक अक्षर है)।

समूहों की संख्या का निर्धारण

असतत भिन्नता श्रृंखला में समूहों की संख्या चर विशेषता के वास्तव में मौजूदा मूल्यों की संख्या से निर्धारित होती है। यदि विशेषता असतत मूल्यों पर ले सकती है, लेकिन उनकी संख्या बहुत बड़ी है (उदाहरण के लिए, विभिन्न कृषि उद्यमों में वर्ष के 1 जनवरी को पशुधन की संख्या शून्य से लेकर दसियों हज़ार सिर तक हो सकती है), तो अंतराल भिन्नता श्रृंखला बनाया गया है। एक अंतराल परिवर्तनशील श्रृंखला का निर्माण उन विशेषताओं का अध्ययन करने के लिए भी किया जाता है जो अपने अस्तित्व के क्षेत्र में किसी भी, दोनों पूर्णांक और भिन्नात्मक मूल्यों को ले सकते हैं। उदाहरण के लिए, बेचे गए उत्पादों की लाभप्रदता, उत्पादन की एक इकाई की लागत, एक शहर के प्रति 1 निवासी की आय, विभिन्न क्षेत्रों की आबादी के बीच उच्च शिक्षा वाले लोगों का अनुपात, और सामान्य तौर पर सभी माध्यमिक विशेषताएं हैं। जिनमें से मूल्यों की गणना एक प्राथमिक विशेषता के मूल्य को दूसरे के मूल्य से विभाजित करके की जाती है (अध्याय 3 देखें)।

अंतराल भिन्नता श्रृंखलाएक तालिका है (दो स्तंभों (या रेखाओं से मिलकर) - विशेषता के अंतराल, जिसकी भिन्नता का अध्ययन किया जा रहा है, और इस अंतराल (आवृत्तियों) में आने वाली जनसंख्या की इकाइयों की संख्या, या इस संख्या का अनुपात कुल जनसंख्या (आवृत्ति)।

अंतराल भिन्नता श्रृंखला का निर्माण करते समय, समूहों की इष्टतम संख्या (चरित्र अंतराल) चुनना और अंतराल की लंबाई निर्धारित करना आवश्यक है। चूंकि एक परिवर्तनशील श्रृंखला का विश्लेषण करते समय, विभिन्न अंतरालों में आवृत्तियों की तुलना की जाती है, इसलिए यह आवश्यक है कि अंतराल का मान स्थिर हो। समूहों की इष्टतम संख्या इस तरह से चुनी जाती है कि समुच्चय में विशेषता मूल्यों की विविधता पर्याप्त रूप से परिलक्षित होती है और साथ ही, वितरण की नियमितता, इसका आकार यादृच्छिक आवृत्ति उतार-चढ़ाव से विकृत नहीं होता है। यदि बहुत कम समूह हैं, तो भिन्नता का कोई पैटर्न नहीं होगा; यदि बहुत अधिक समूह हैं, तो यादृच्छिक आवृत्ति छलांग वितरण के आकार को विकृत कर देगी।

अक्सर, परिवर्तनशील श्रृंखला में समूहों की संख्या अमेरिकी सांख्यिकीविद् स्टर्गेस द्वारा अनुशंसित सूत्र का पालन करके निर्धारित की जाती है। (स्टर्गेस):

कहाँ पे - समूहों की संख्या; एन- जनसंख्या का आकार।

यह सूत्र दर्शाता है कि समूहों की संख्या डेटा की मात्रा का एक फलन है।

मान लीजिए कि एक निश्चित वर्ष के लिए अनाज फसलों की उपज के अनुसार क्षेत्र में उद्यमों के वितरण की एक भिन्न श्रृंखला बनाना आवश्यक है। अनाज फसलों वाले कृषि उद्यमों की संख्या 143 थी; न्यूनतम उपज मूल्य 10.7 c/ha है, उच्चतम 53.1 c/ha है। हमारे पास है:

चूंकि समूहों की संख्या पूर्णांक है, इसलिए 8 या 9 समूह बनाने की अनुशंसा की जाती है।

अंतराल के आकार का निर्धारण

समूहों की संख्या जानने के बाद, अंतराल के मूल्य की गणना करें:

हमारे उदाहरण में, अंतराल मान है:

क) 8 समूहों के साथ

बी) 9 समूहों के साथ

एक श्रृंखला बनाने और भिन्नता का विश्लेषण करने के लिए, यदि संभव हो तो अंतराल के आकार और उसकी सीमाओं के गोल मान होना बेहतर है। इसलिए, सबसे अच्छा समाधान यह होगा कि 5 q/ha के अंतराल के साथ 9 समूहों के साथ एक विविधता श्रृंखला बनाई जाए। यह भिन्नता श्रृंखला तालिका में दी गई है। 5.6, और इसका ग्राफिक प्रतिनिधित्व अंजीर में दिया गया है। 5.1.

अंतराल की सीमाओं को अलग-अलग तरीकों से निर्दिष्ट किया जा सकता है: पिछले अंतराल की ऊपरी सीमा अगले एक की निचली सीमा को दोहराती है, जैसा कि तालिका में दिखाया गया है। 5.6, या दोहराना नहीं है।

बाद के मामले में, दूसरे अंतराल को 15.1-20, तीसरे को 20.1-25, आदि के रूप में नामित किया जाएगा, अर्थात। यह माना जाता है कि सभी उपज मूल्यों को आवश्यक रूप से एक दसवें तक गोल किया जाता है। इसके अलावा, अंतराल 15.1-20 के मध्य के साथ एक अवांछनीय जटिलता उत्पन्न होती है, जो कड़ाई से बोलते हुए, पहले से ही 17.5 के बराबर नहीं, बल्कि 17.55 के बराबर होगी; तदनुसार, जब गोल अंतराल 40-60 को 40.1-6.0 से प्रतिस्थापित किया जाता है, तो इसके मध्य 50 के गोल मान के बजाय, हमें 50.5 मिलता है। इसलिए, अंतराल को दोहराए जाने वाले गोल सीमा के साथ छोड़ना बेहतर है और सहमत हैं कि जनसंख्या इकाइयाँ अंतराल की सीमा के बराबर एक विशेषता मान है, अंतराल में शामिल हैं जहां यह सटीक मान पहली बार रिपोर्ट किया गया है। इस प्रकार, पहले समूह में 15 सेंटीमीटर प्रति हेक्टेयर की उपज वाला एक खेत शामिल है, दूसरे में 20 सेंटीमीटर प्रति हेक्टेयर का मूल्य शामिल है, और इसी तरह।

चावल। 5.1. उपज द्वारा खेतों का वितरण

तालिका 5.6

अनाज फसलों की उपज के अनुसार क्षेत्र में खेतों का वितरण

उपज द्वारा खेतों के समूह,

ग/हे एक्सजे

खेतों की संख्या

अंतराल के बीच

ग/हे एक्सजे"

संचित आवृत्ति f'j

विविधता श्रृंखला का ग्राफिक प्रतिनिधित्व

परिवर्तनशील श्रृंखला और उसके गुणों के विश्लेषण में महत्वपूर्ण सहायता एक चित्रमय प्रतिनिधित्व द्वारा प्रदान की जाती है। अंतराल श्रृंखला को एक बार ग्राफ द्वारा दर्शाया जाता है, जिसमें एब्सिसा अक्ष पर स्थित सलाखों के आधार भिन्न विशेषता के मूल्यों के अंतराल होते हैं, और सलाखों की ऊंचाई पैमाने के अनुरूप आवृत्तियां होती हैं y-अक्ष के अनुदिश। अनाज की फसल की पैदावार के संदर्भ में क्षेत्र में खेतों के वितरण का एक ग्राफिक प्रतिनिधित्व अंजीर में दिखाया गया है। 5.1. इस तरह के आरेख को अक्सर कहा जाता है हिस्टोग्राम(ग्रीक शब्द "हिस्टोस" से - ऊतक, संरचना)।

तालिका डेटा। 5.5 और अंजीर। 5.1 कई संकेतों के वितरण विशेषता के रूप को दिखाएं: संकेत के औसत अंतराल के मान अधिक सामान्य हैं, कम अक्सर - चरम; सुविधा के छोटे और बड़े मूल्य। इस वितरण का रूप गणितीय आँकड़ों के दौरान माना जाने वाले सामान्य वितरण के कानून के करीब है। महान रूसी गणितज्ञ ए.एम. ल्यपुनोव (1857 - 1918) ने साबित किया कि एक सामान्य वितरण बनता है यदि एक चर चर बड़ी संख्या में कारकों से प्रभावित होता है, जिनमें से किसी का भी प्रमुख प्रभाव नहीं होता है। कई लगभग समान कारकों का एक यादृच्छिक संयोजन जो अनाज फसलों की उपज में भिन्नता को प्रभावित करता है, दोनों प्राकृतिक और कृषि-तकनीकी, आर्थिक, सामान्य वितरण कानून के करीब उपज द्वारा क्षेत्र के खेतों का वितरण बनाता है।

यदि कोई असतत परिवर्तनशील श्रृंखला है या अंतराल के मध्य बिंदुओं का उपयोग किया जाता है, तो ऐसी परिवर्तनशील श्रृंखला के चित्रमय प्रतिनिधित्व को कहा जाता है बहुभुज(ग्रीक शब्दों से - एक बहुभुज)। आप में से प्रत्येक निर्देशांक के साथ बिंदुओं को सीधी रेखाओं से जोड़कर आसानी से इस ग्राफ का निर्माण कर सकता है एक्स,तथा /।

लगभग 5:8 के अनुपात में किसी बहुभुज या चार्ट की ऊंचाई और उसके आधार के अनुपात की अनुशंसा की जाती है।

आवृत्ति की अवधारणा

यदि तालिका में 5.6 कुल के प्रतिशत के रूप में उत्पादकता के एक या दूसरे स्तर के साथ खेतों की संख्या व्यक्त करें, खेतों की पूरी संख्या (143) को 100% के रूप में लेते हुए, औसत उपज की गणना निम्नानुसार की जा सकती है:

कहाँ पे वू- विविधता श्रृंखला की 7 वीं श्रेणी की आवृत्ति;

संचयी बटवारा

विविधता श्रृंखला का रूपांतरित रूप है संचित आवृत्तियों की एक संख्या,तालिका में दिया गया। 5.6, कॉलम 5। यह आबादी में इकाइयों की संख्या के लिए मूल्यों की एक श्रृंखला है जो विशेषता के संबंधित अंतराल मूल्यों की निचली सीमा से कम और बराबर है। ऐसी श्रृंखला कहलाती है संचयी।आप संचयी वितरण "से कम नहीं" बना सकते हैं, या आप "इससे अधिक" बना सकते हैं। पहले मामले में, संचयी वितरण प्लॉट को कहा जाता है संचय करना,क्षण में - औजाइव(चित्र 5.2)।

घनत्व, वितरण

यदि आपको असमान अंतरालों वाली एक परिवर्तनशील श्रृंखला से निपटना है, तो तुलनीयता के लिए आपको अंतराल की इकाई में आवृत्ति या आवृत्ति लाने की आवश्यकता है। परिणामी अनुपात कहलाता है वितरण घनत्व:

वितरण घनत्व का उपयोग सामान्यीकरण संकेतकों की गणना के लिए और असमान अंतरालों के साथ भिन्नता श्रृंखला के चित्रमय प्रतिनिधित्व के लिए किया जाता है।

चावल। 5.2. ओजिवा और संचयी उपज वितरण

5.7. विविधता की संरचनात्मक विशेषताएं पंक्ति

वितरण माध्यिका

भिन्नता का अध्ययन करते समय, परिवर्तनशील श्रृंखला की ऐसी विशेषताओं का उपयोग किया जाता है जो मात्रात्मक रूप से इसकी संरचना, संरचना का वर्णन करती हैं। ऐसा है, उदाहरण के लिए, माध्यिका-जनसंख्या को दो समान भागों में विभाजित करने वाले चर विशेषता का मान ~ माध्यिका से कम विशेषता मान और माध्यिका से अधिक विशेषता मानों के साथ (तालिका 5.5 में पाँच का तीसरा बैंक, अर्थात 196 बिलियन रूबल)।

तालिका के उदाहरण पर। 5.5 माध्यिका और औसत के बीच मूलभूत अंतर को दर्शाता है। माध्यिका श्रेणीबद्ध श्रृंखला के किनारों पर विशेषता मानों पर निर्भर नहीं करती है। भले ही सेंट पीटर्सबर्ग में सबसे बड़े बैंक की राजधानी दस गुना बड़ी हो, लेकिन औसत मूल्य नहीं बदलेगा। इसलिए, माध्य का उपयोग अक्सर अंकगणित माध्य की तुलना में किसी विशेषता के विशिष्ट मूल्य के अधिक विश्वसनीय संकेतक के रूप में किया जाता है, यदि मानों की श्रृंखला विषम है, तो माध्य से तेज विचलन शामिल हैं। इस श्रृंखला में, इक्विटी का औसत मूल्य, 269 बिलियन रूबल के बराबर, सबसे बड़े विकल्प के मजबूत प्रभाव के तहत बनाया गया था। 80% बैंकों के पास औसत से कम पूंजी है और केवल 20% के पास अधिक है। यह संभावना नहीं है कि इस तरह के औसत को एक विशिष्ट मूल्य माना जा सकता है। जनसंख्या इकाइयों की एक समान संख्या के साथ, माध्यिका को दो केंद्रीय विकल्पों के अंकगणितीय औसत के रूप में लिया जाता है, उदाहरण के लिए, विशेषता के दस मानों के साथ, क्रमबद्ध श्रृंखला में पांचवें और छठे मूल्यों का औसत।

अंतराल परिवर्तनशील श्रृंखला में माध्यिका ज्ञात करने के लिए सूत्र (5.14) का प्रयोग किया जाता है।

जहाँ मैं माध्यिका हूँ;

एक्स 0 -अंतराल की निचली सीमा जिसमें माध्यिका स्थित है;

एफएम ई-1 - माध्यिका से पहले के अंतराल में संचित आवृत्ति;

एफ मी- मध्य अंतराल में आवृत्ति;

मैं- अंतराल मूल्य;

- समूहों की संख्या।

तालिका में। 5.6 माध्यिका 143 मानों का औसत है, अर्थात। उत्पादकता की श्रृंखला मूल्य की शुरुआत से बहत्तर सेकंड। जैसा कि संचित आवृत्तियों की संख्या से देखा जा सकता है, यह चौथे अंतराल में है। फिर

जनसंख्या इकाइयों की एक विषम संख्या के साथ, माध्यिका संख्या, जैसा कि हम देखते हैं, not . के बराबर है , सूत्र (5.14), a . के रूप में , लेकिन यह अंतर महत्वपूर्ण नहीं है और आमतौर पर व्यवहार में इसे नजरअंदाज कर दिया जाता है।

एक असतत परिवर्तनशील श्रृंखला में, माध्यिका को उस समूह में विशेषता का मान माना जाना चाहिए जिसमें संचित आवृत्ति;

आधी से अधिक आबादी। उदाहरण के लिए, तालिका में डेटा के लिए। 5.1 प्रति गेम बनाए गए गोलों की औसत संख्या 2 होगी।

वितरण चतुर्थक

इसी तरह, माध्यिका के समान, विशेषता के मूल्यों की गणना की जाती है, जनसंख्या को इकाइयों की संख्या के बराबर चार भागों में विभाजित किया जाता है। इन राशियों को कहा जाता है चतुर्थकोंऔर एक राजधानी लैटिन "अक्षर" द्वारा निरूपित किया जाता है क्यूएक हस्ताक्षरित चतुर्थक संख्या बैज के साथ। यह स्पष्ट है कि क्यू 2 मुझसे मेल खाता है। पहले और तीसरे चतुर्थक के लिए, हम तालिका के अनुसार सूत्र और गणना प्रस्तुत करते हैं। 5.6.

इसलिये क्यू 2 = Me = 29.5 c/ha, यह देखा जा सकता है कि प्रथम चतुर्थक और माध्यिका के बीच का अंतर माध्यिका और तृतीय चतुर्थक के बीच की तुलना में कम है। यह तथ्य वितरण के मध्य क्षेत्र में कुछ विषमता की उपस्थिति को इंगित करता है, जो अंजीर में भी ध्यान देने योग्य है। 5.1.

श्रृंखला को पांच बराबर भागों में विभाजित करने वाले विशेषता मान कहलाते हैं Quintilesदस भागों में दशमांश,एक सौ भाग शतमक।चूंकि इन विशेषताओं का उपयोग केवल तभी किया जाता है जब परिवर्तनशील श्रृंखला की संरचना का विस्तार से अध्ययन करना आवश्यक हो, हम उनके सूत्र और गणना नहीं देंगे।

वितरण मोड

निस्संदेह, एक विशेषता का ऐसा मूल्य जो अध्ययन की गई श्रृंखला में होता है, कुल मिलाकर सबसे अधिक बार, बहुत महत्व का होता है। इस मात्रा को कहा जाता है फ़ैशनऔर मो. एक असतत श्रृंखला में, उच्चतम आवृत्ति वाले फीचर के मूल्य के रूप में गणना के बिना मोड निर्धारित किया जाता है। उदाहरण के लिए, तालिका के अनुसार। 5.1 सबसे अधिक बार एक फुटबॉल मैच में 2 गोल किए गए - 71 बार। मोड संख्या 2 है। आमतौर पर विशेषता के एक मोडल मान वाली पंक्तियाँ होती हैं। यदि किसी विशेषता के दो या अधिक समान (और यहां तक ​​कि कई भिन्न, लेकिन पड़ोसी से अधिक) मान भिन्नता श्रृंखला में मौजूद हैं, तो इसे क्रमशः बिमोडल ("ऊंट जैसा") या मल्टीमॉडल माना जाता है। यह सेट की विविधता को इंगित करता है, संभवतः विभिन्न मोड के साथ कई सेटों के कुल का प्रतिनिधित्व करता है।

तो विभिन्न देशों से आए पर्यटकों की भीड़ में, स्थानीय निवासियों के बीच प्रचलित एक फैशनेबल कपड़ों के बजाय, आप दुनिया के विभिन्न लोगों द्वारा अपनाए गए विभिन्न "फैशन" का मिश्रण पा सकते हैं।

एक अंतराल भिन्नता श्रृंखला में, विशेष रूप से एक विशेषता की निरंतर भिन्नता के साथ, कड़ाई से बोलते हुए, सुविधा का प्रत्येक मान केवल एक बार होता है। मोडल अंतराल उच्चतम आवृत्ति वाला अंतराल है। इस अंतराल के भीतर, विशेषता का सशर्त मान पाया जाता है, जिसके पास वितरण घनत्व, यानी। एक चर विशेषता की माप की प्रति इकाई जनसंख्या इकाइयों की संख्या अधिकतम तक पहुंच जाती है। यह एक सशर्त मान है और माना जाता है डॉट फैशन।यह मान लेना तर्कसंगत है कि ऐसा बिंदु मोड अंतराल की सीमाओं के करीब स्थित है, जिसके आगे पड़ोसी अंतराल में आवृत्ति मोडल अंतराल की अन्य सीमा से परे अंतराल में आवृत्ति से अधिक है। इसलिए हमारे पास आमतौर पर इस्तेमाल किया जाने वाला सूत्र (5.15) है:

कहाँ पे एक्स 0 - मोडल अंतराल की निचली सीमा;

च मो - मोडल अंतराल में आवृत्ति;

च मो -1 - पिछले अंतराल में आवृत्ति;

च मो +1 - मोडल के बाद अगले अंतराल में आवृत्ति;

मैं - अंतराल मूल्य।

तालिका के अनुसार। 5.6 फैशन की गणना करें:

अंतराल श्रृंखला में बहुलक की गणना बल्कि सशर्त है। लगभग Mo को आलेखीय रूप से निर्धारित किया जा सकता है (देखिए आकृति 5.1)।

अंकगणित माध्य मान भी परिवर्तनशील श्रृंखला की संरचना के अध्ययन के लिए प्रासंगिक है, हालांकि इस सामान्यीकरण संकेतक का मुख्य मूल्य अलग है। उपज द्वारा खेतों की वितरण श्रृंखला में (तालिका 5.6), औसत उपज की गणना अंतराल के आवृत्ति-भारित मध्य के रूप में की जाती है एक्स(सूत्र द्वारा (5.2)):

माध्य, माध्यिका और बहुलक के बीच संबंध

इस बंटन में अंकगणित माध्य, माध्यिका और बहुलक के बीच का अंतर छोटा है। यदि आकार में वितरण सामान्य नियम के करीब है, तो माध्य बहुलक और माध्य मान के बीच होता है, और बहुलक की तुलना में माध्य के अधिक निकट होता है।

दाएं तरफा विषमता के साथ एक्स̅ > मैं > मो;

बाएं तरफा विषमता के साथ एक्स̅ < मैं< Mo.

मध्यम विषम वितरण के लिए, समानता सत्य है:

5.8. आकार और तीव्रता के उपाय विविधताओं

भिन्नता के पूर्ण माध्य आकार

समुच्चय में विशेषता की भिन्नता के अध्ययन में अगला चरण बल की विशेषताओं का मापन, भिन्नता का परिमाण है। उनमें से सबसे सरल हो सकता है दायराया भिन्नता आयाम -मूल्यों के अध्ययन किए गए सेट में उपलब्ध मूल्यों से किसी विशेषता के अधिकतम और न्यूनतम मूल्यों के बीच पूर्ण अंतर। इस प्रकार, भिन्नता की सीमा की गणना सूत्र द्वारा की जाती है

चूंकि सीमा का परिमाण विशेषता के मूल्यों में केवल अधिकतम अंतर को दर्शाता है, यह पूरी आबादी में इसकी भिन्नता की नियमित ताकत को माप नहीं सकता है। इस उद्देश्य के लिए अभिप्रेत संकेतक को बिना किसी अपवाद के, कुल में विशेषता के मूल्यों में सभी अंतरों को ध्यान में रखना चाहिए और सामान्य करना चाहिए। ऐसे अंतरों की संख्या जनसंख्या की सभी इकाइयों में से दो के संयोजनों की संख्या के बराबर होती है; तालिका के अनुसार। 5.6 यह होगा: सी ^= 10 153. हालांकि, सभी विचलनों पर विचार करने, गणना करने और औसत करने की कोई आवश्यकता नहीं है। विशेषता के अंकगणितीय माध्य मान से व्यक्तिगत विशेषता मानों के विचलन के औसत का उपयोग करना आसान है, और उनमें से केवल 143 हैं। लेकिन अंकगणित माध्य मान से विशेषता मानों का औसत विचलन, के अनुसार उत्तरार्द्ध की प्रसिद्ध संपत्ति के लिए, शून्य है। इसलिए, भिन्नता की ताकत का संकेतक विचलन का बीजगणितीय औसत नहीं है, लेकिन विचलन का औसत मापांक:

तालिका के अनुसार। 5.6 मध्य मॉड्यूल, या औसत रैखिक विचलन,निरपेक्ष मान में एक आवृत्ति-भारित विचलन मॉड्यूलो के रूप में गणना की जाती है, अंकगणितीय माध्य से अंतराल के मध्य बिंदु, अर्थात। सूत्र के अनुसार

इसका मतलब यह है कि, औसतन, खेतों के अध्ययन किए गए सेट में उपज क्षेत्र में औसत उपज से 6.85 c/ha से विचलित होती है। गणना और व्याख्या की सरलता इस सूचक के सकारात्मक पहलू हैं, हालांकि, मॉड्यूल के गणितीय गुण "खराब" हैं: उन्हेंसामान्य वितरण सहित किसी भी संभाव्य कानून के अनुरूप नहीं लाया जा सकता है, जिसका पैरामीटर औसत विचलन मॉड्यूल नहीं है, लेकिन मानक विचलन(अंग्रेजी कंप्यूटर प्रोग्राम में "मानक विचलन" कहा जाता है, संक्षेप में "s.d." या बस « एस», रूसी भाषी में - एनकेओ)। सांख्यिकीय साहित्य में, औसत मूल्य से मानक विचलन को आमतौर पर एक छोटे (लोअरकेस) ग्रीक अक्षर सिग्मा (सेंट) या द्वारा दर्शाया जाता है। एस(अध्याय 7 देखें):

रैंकिंग श्रृंखला के लिए

अंतराल श्रृंखला के लिए

तालिका के अनुसार। 5.6 अनाज की उपज का मानक विचलन था:

यह ध्यान दिया जाना चाहिए कि औसत मूल्य और अंतराल के मध्य बिंदुओं के कुछ गोलाई, उदाहरण के लिए, पूर्णांक वाले के लिए, σ के मूल्य पर बहुत कम प्रभाव पड़ता है, जो तब 8.55 सी / हेक्टेयर होगा।

वास्तविक आबादी में परिमाण में मानक विचलन हमेशा औसत विचलन मॉड्यूल से अधिक होता है। अनुपात (पर: एकसमुच्चय में तेज, प्रमुख विचलन की उपस्थिति पर निर्भर करता है और मुख्य द्रव्यमान के साथ विषम तत्वों के साथ समुच्चय के "संदूषण" के संकेतक के रूप में काम कर सकता है: यह अनुपात जितना बड़ा होगा, उतना ही मजबूत "संदूषण" होगा। सामान्य वितरण कानून के लिए : ए = 1,2.

फैलाव की अवधारणा

मानक विचलन का वर्ग मान देता है फैलाव 2 .फैलाव सूत्र:

सरल (अवर्गीकृत डेटा के लिए):

भारित (समूहीकृत डेटा के लिए):

गणितीय आँकड़ों की लगभग सभी विधियाँ परिक्षेपण पर आधारित होती हैं। प्रसरणों को जोड़ने का नियम बहुत व्यावहारिक महत्व का है (अध्याय 6 देखें)।

भिन्नता के अन्य उपाय

भिन्नता की ताकत का एक और संकेतक, जो इसे पूरी आबादी में नहीं, बल्कि केवल इसके मध्य भाग में दर्शाता है औसत तिमाही दूरी,वे। चतुर्थक के बीच अंतर का औसत मूल्य, नीचे दर्शाया गया है क्यू:

तालिका में उपज द्वारा कृषि उद्यमों के वितरण के लिए। 5.2

क्यू\u003d (36.25 - 25.09): 2 \u003d 5.58 किग्रा / हेक्टेयर। जनसंख्या के मध्य भाग में भिन्नता की ताकत, एक नियम के रूप में, पूरी आबादी की तुलना में कम है। विचलन के औसत मॉड्यूल और औसत त्रैमासिक विचलन के बीच का अनुपात भी भिन्नता की संरचना का अध्ययन करने के लिए कार्य करता है: इस अनुपात का एक बड़ा मूल्य कमजोर रूप से भिन्न "कोर" और इस कोर के चारों ओर एक दृढ़ता से बिखरे हुए वातावरण की उपस्थिति को इंगित करता है, या "प्रभामंडल "अध्ययनित आबादी में। तालिका में डेटा के लिए। 5.6 अनुपात ए: क्यू= 1.23, जो जनसंख्या के मध्य भाग और उसकी परिधि में भिन्नता की ताकत में एक छोटे से अंतर को दर्शाता है।

भिन्नता की तीव्रता का आकलन करने के लिए और विभिन्न आबादी में इसकी तुलना करने के लिए, और इससे भी अधिक विभिन्न लक्षणों के लिए, यह आवश्यक है भिन्नता के सापेक्ष संकेतक।उनकी गणना भिन्नता की ताकत के निरपेक्ष संकेतकों के अनुपात के रूप में की जाती है, जिसकी चर्चा पहले की गई थी, विशेषता के अंकगणितीय माध्य मान से। हमें निम्नलिखित संकेतक मिलते हैं:

1) भिन्नता की सापेक्ष सीमा p:

2) सापेक्ष विचलन मोडुलो टी:

3) सापेक्ष वर्ग विचलन के रूप में भिन्नता का गुणांक वी:

4) सापेक्ष तिमाही दूरी डी:

कहाँ पे क्यू - माध्य चतुर्थक दूरी।

तालिका के अनुसार उपज को अलग करने के लिए। 5.6 ये संकेतक हैं:

ρ = 42.4: 30.3 = 1.4, या 140%;

टी= 6.85: 30.3 = 0.226, या 22.6%;

वी = 8.44: 30.3 = 0.279, या 27.9%;

डी= 5.58: 30.3 = 0.184, या 18.4%।

भिन्नता की तीव्रता की डिग्री का आकलन केवल एक निश्चित संरचना की आबादी की प्रत्येक व्यक्तिगत विशेषता के लिए संभव है। तो, कृषि उद्यमों के एक समूह के लिए, एक ही प्राकृतिक क्षेत्र में उपज में भिन्नता का आकलन कमजोर के रूप में किया जा सकता है यदि वी < 10%, умеренная при 10% < वी < 25% и сильная при वी > 25%.

इसके विपरीत, पहले से ही 7% ​​के गुणांक पर वयस्क पुरुषों या महिलाओं की आबादी में ऊंचाई में भिन्नता का आकलन किया जाना चाहिए और लोगों द्वारा इसे मजबूत माना जाना चाहिए। इस प्रकार, भिन्नता की तीव्रता के आकलन में प्रेक्षित भिन्नता की तुलना इसकी कुछ सामान्य तीव्रता के साथ की जाती है, जिसे मानक के रूप में लिया जाता है। हम इस तथ्य के आदी हैं कि उत्पादकता, आय या प्रति व्यक्ति आय, एक इमारत में रहने वाले कमरों की संख्या कई या दसियों गुना भिन्न हो सकती है, लेकिन लोगों की ऊंचाई में कम से कम डेढ़ गुना का अंतर पहले से ही माना जाता है बहुत ताकतवर।

विभिन्न शक्ति, तीव्रता भिन्नताएँ वस्तुनिष्ठ कारणों से होती हैं। उदाहरण के लिए, 24 जनवरी, 1997 को सेंट पीटर्सबर्ग में वाणिज्यिक बैंकों में अमेरिकी डॉलर की बिक्री मूल्य 5675 से 5640 रूबल तक भिन्न था। 5664 रूबल की औसत कीमत पर। भिन्नता की सापेक्ष सीमा ρ = 35:5664 = 0.6%। इस तरह की एक छोटी सी भिन्नता इस तथ्य के कारण है कि डॉलर विनिमय दर में महत्वपूर्ण अंतर के साथ, "महंगे" बैंक से "सस्ता" लोगों के लिए खरीदारों का बहिर्वाह तुरंत होगा। इसके विपरीत, रूस के विभिन्न क्षेत्रों में एक किलोग्राम आलू या गोमांस की कीमत बहुत भिन्न होती है - दसियों प्रतिशत या उससे अधिक। यह उत्पादक क्षेत्र से उपभोक्ता क्षेत्र तक माल की डिलीवरी के लिए अलग-अलग लागतों के कारण है, अर्थात। कहावत "विदेश में एक बछिया आधा है, लेकिन एक रूबल ले जाया जाता है।"

5.9. वितरण और संकेतक के क्षण इसके रूप

वितरण केंद्रीय क्षण

भिन्नता की प्रकृति के आगे के अध्ययन के लिए, इसके अंकगणितीय माध्य मान से एक विशेषता के अलग-अलग मूल्यों के विचलन के विभिन्न डिग्री के औसत मूल्यों का उपयोग किया जाता है। इन संकेतकों को कहा जाता है केंद्रीय क्षणउस शक्ति के अनुरूप क्रम का वितरण जिससे विचलन उठाया जाता है (तालिका 5.7), या केवल क्षण (गैर-केंद्रीय क्षण शायद ही कभी उपयोग किए जाते हैं और यहां पर विचार नहीं किया जाएगा)। तीसरे क्षण ts- का मान, इसके चिन्ह की तरह, ऋणात्मक घनों पर विचलन के धनात्मक घनों की प्रबलता पर या इसके विपरीत पर निर्भर करता है। सामान्य और किसी भी अन्य सख्ती से सममित वितरण के तहत, सकारात्मक घनों का योग ऋणात्मक घनों के योग के बराबर होता है।

विषमता संकेतक

तीसरे क्रम के क्षण के आधार पर, वितरण की विषमता की डिग्री को दर्शाने वाले एक संकेतक का निर्माण करना संभव है:

जैसाबुलाया विषमता कारक।इसकी गणना समूहीकृत और अवर्गीकृत दोनों प्रकार के आंकड़ों से की जा सकती है। तालिका के अनुसार। 5.6 विषमता सूचकांक था:

वे। विषमता मामूली है। अंग्रेजी सांख्यिकीविद् के. पियर्सन ने औसत मूल्य और बहुलक के बीच के अंतर के आधार पर विषमता का एक और संकेतक प्रस्तावित किया

तालिका 5.7

केंद्रीय क्षण

तालिका के अनुसार। 5.6 पियर्सन का सूचकांक था:

पियर्सन सूचकांक वितरण श्रृंखला के मध्य भाग में विषमता की डिग्री पर निर्भर करता है, और विषमता सूचकांक, तीसरे क्रम के क्षण के आधार पर, विशेषता के चरम मूल्यों पर निर्भर करता है। इस प्रकार, हमारे उदाहरण में, वितरण के मध्य भाग में, विषमता अधिक महत्वपूर्ण है, जिसे ग्राफ से भी देखा जा सकता है (चित्र 5.1)। मजबूत दाएं तरफा और बाएं तरफा (सकारात्मक और नकारात्मक) विषमता वाले वितरण अंजीर में दिखाए गए हैं। 5.3.

वितरण के कर्टोसिस की विशेषता

चौथे क्रम के आघूर्ण की सहायता से, विषमता की तुलना में वितरण श्रृंखला का और भी अधिक जटिल गुण कहलाता है कर्टोसिस


चावल। 5.3. विषमता, वितरण

कुर्टोसिस संकेतक की गणना सूत्र द्वारा की जाती है

(5.30)

अक्सर कर्टोसिस की व्याख्या वितरण की "स्थिरता" के रूप में की जाती है, लेकिन यह सटीक और अपूर्ण है। वितरण ग्राफ विशेषता भिन्नता की ताकत के आधार पर मनमाने ढंग से खड़ी दिख सकता है: कमजोर भिन्नता, किसी दिए गए पैमाने पर वितरण वक्र तेज होता है। इस तथ्य का उल्लेख नहीं करने के लिए कि एब्सिस्सा और कोर्डिनेट के साथ तराजू को बदलकर, किसी भी वितरण को कृत्रिम रूप से "खड़ी" और "ढलान" बनाया जा सकता है। यह दिखाने के लिए कि वितरण का कर्टोसिस क्या है और इसकी सही व्याख्या करने के लिए, आपको श्रृंखला की तुलना भिन्नता की समान शक्ति (σ का समान मान) और कुर्टोसिस के विभिन्न संकेतकों के साथ करने की आवश्यकता है। कर्टोसिस को तिरछापन के साथ भ्रमित न करने के लिए, सभी तुलना की गई पंक्तियों को सममित होना चाहिए। ऐसी तुलना अंजीर में दिखाई गई है। 5.4.

चित्र 5.4। वितरण कुर्टोसिस

एक सामान्य वितरण के साथ एक परिवर्तनशील श्रृंखला के लिए, मान मैं कुर्टोसिस संकेतक, सूत्र (5.30) द्वारा परिकलित, j तीन के बराबर है।

हालांकि, ऐसे संकेतक को "कुर्टोसिस" शब्द नहीं कहा जाना चाहिए, जिसका अर्थ अनुवाद में "अतिरिक्त" है। शब्द "कुर्टोसिस" को सूत्र (5.30) के अनुसार अनुपात में ही लागू नहीं किया जाना चाहिए, लेकिन सामान्य वितरण के दिए गए अनुपात के मूल्य के साथ अध्ययन के तहत वितरण के लिए इस तरह के अनुपात की तुलना करने के लिए, अर्थात। 3 के मान के साथ। इसलिए कर्टोसिस इंडिकेटर के लिए अंतिम सूत्र, अर्थात। भिन्नता की समान शक्ति के साथ सामान्य वितरण की तुलना में अधिकता का रूप है:

रैंकिंग श्रृंखला के लिए

अंतराल और असतत भिन्नता श्रृंखला के लिए

एक सकारात्मक कुर्टोसिस की उपस्थिति, साथ ही एक छोटी त्रैमासिक दूरी और एक बड़े मानक विचलन के बीच पहले से उल्लेखनीय महत्वपूर्ण अंतर का मतलब है कि घटना के अध्ययन किए गए द्रव्यमान में एक "कोर" होता है जो इस विशेषता में थोड़ा भिन्न होता है, जो एक से घिरा होता है बिखरा हुआ "प्रभामंडल"। एक महत्वपूर्ण नकारात्मक कुर्टोसिस के साथ, ऐसा कोई "कोर" बिल्कुल नहीं है।

वितरण के तिरछेपन और कर्टोसिस के संकेतकों के मूल्यों से, कोई वितरण की निकटता को सामान्य से आंक सकता है, जो सहसंबंध और प्रतिगमन विश्लेषण के परिणामों का मूल्यांकन करने के लिए आवश्यक है, पूर्वानुमानों के संभाव्य मूल्यांकन की संभावनाएं ( अध्याय 7,8,9 देखें)। वितरण को सामान्य माना जा सकता है, या अधिक सटीक रूप से, सामान्य वितरण के साथ वास्तविक वितरण की समानता की परिकल्पना को अस्वीकार नहीं किया जा सकता है यदि तिरछापन और कुर्टोसिस संकेतक उनके दो गुना मानक विचलन सेमी से अधिक नहीं हैं। इन मानक विचलन की गणना सूत्रों द्वारा की जाती है:

5.10. अधिकतम संभव मान भिन्नता संकेतक और उनका अनुप्रयोग

किसी भी प्रकार के सांख्यिकीय संकेतकों को लागू करते समय, यह जानना उपयोगी होता है कि अध्ययन के तहत सिस्टम के लिए दिए गए संकेतक के अधिकतम संभव मूल्य क्या हैं और वास्तव में देखे गए मूल्यों का अधिकतम संभव अनुपात क्या है। वॉल्यूम संकेतकों की भिन्नता का अध्ययन करते समय यह समस्या विशेष रूप से प्रासंगिक है, जैसे कि एक निश्चित प्रकार के उत्पाद के उत्पादन की मात्रा, कुछ संसाधनों की उपलब्धता, पूंजी निवेश का वितरण, आय और लाभ। आइए हम सैद्धांतिक और व्यावहारिक रूप से इस मुद्दे पर क्षेत्र में कृषि उद्यमों के बीच सब्जी उत्पादन के वितरण के उदाहरण पर विचार करें।

यह स्पष्ट है कि भिन्नता संकेतकों का न्यूनतम संभव मूल्य जनसंख्या की सभी इकाइयों के बीच मात्रा विशेषता के कड़ाई से समान वितरण के साथ प्राप्त किया जाता है, अर्थात, प्रत्येक कृषि उद्यम में उत्पादन की समान मात्रा के साथ। इस तरह के एक सीमित (बेशक, व्यवहार में बहुत ही असंभव) वितरण में, कोई भिन्नता नहीं है और सभी संकेतक, विविधताएं शून्य के बराबर हैं।

विविधता संकेतकों का अधिकतम संभव मूल्य जनसंख्या में मात्रा विशेषता के इस तरह के वितरण के साथ प्राप्त किया जाता है, जिसमें इसकी पूरी मात्रा जनसंख्या की एक इकाई में केंद्रित होती है; उदाहरण के लिए, सब्जी उत्पादन की पूरी मात्रा - जिले के एक कृषि उद्यम में अन्य खेतों में उनके उत्पादन के अभाव में। जनसंख्या की एक इकाई में किसी विशेषता के आयतन की इतनी संभव सांद्रता की संभावना इतनी कम नहीं है; किसी भी मामले में, यह कड़ाई से समान वितरण की संभावना से बहुत अधिक है।

इसके अधिकतम के संकेतित सीमित मामले के लिए भिन्नता घातांक पर विचार करें। आइए हम जनसंख्या इकाइयों की संख्या को निरूपित करें पी,विशेषता का औसत मूल्य एक्स̅ , तो कुल में सुविधा की कुल मात्रा के रूप में व्यक्त किया जाएगा एक्स̅ पी।यह सारा आयतन जनसंख्या की एक इकाई में केंद्रित है, ताकि एक्समैक्स= एक्स̅ पी. एक्समिनट = 0, यह इस प्रकार है कि आयाम का अधिकतम मान (भिन्नता की सीमा) के बराबर है:

माध्य मोडुलो और द्विघात विचलन के अधिकतम मूल्यों की गणना करने के लिए, हम विचलन की एक तालिका (तालिका 5.8) का निर्माण करेंगे।

तालिका 5.8

औसत से विचलन के मॉड्यूल और वर्ग अधिकतमसंभावित भिन्नता

जनसंख्या इकाई संख्या

फ़ीचर मान

माध्य से विचलन

एक्स मैं - एक्स̅

विचलन मॉड्यूल

|एक्स मैं - एक्स̅|

विचलन वर्ग

(एक्समैं- एक्स̅ ) 2

एक्स̅ पी

एक्स̅ (पी - 1)

-एक्स̅

-एक्स̅

-एक्स̅

एक्स̅ (पी - 1)

एक्स̅

एक्स̅

एक्स̅

एक्स̅ 2 (पी - 1) 2

एक्स̅ 2

एक्स̅ 2

एक्स̅ 2

एक्स̅ पी

2एक्स̅ (पी - 1)

एक्स̅ 2 [(पी - 1) 2 +(एन-1)]

तालिका की अंतिम पंक्ति में भावों के आधार पर। 5.8, हम भिन्नता संकेतकों के निम्नलिखित अधिकतम संभव मान प्राप्त करते हैं।

विचलन का औसत मॉड्यूल, या औसत रैखिक विचलन:

मानक विचलन:

सापेक्ष मॉड्यूलर (रैखिक) विचलन:

भिन्नता का गुणांक:

त्रैमासिक दूरी के लिए, अधिकतम संभव भिन्नता वाले सिस्टम में सुविधा वितरण की एक पतित संरचना होती है, जिसमें संरचना की कोई ("काम न करें") विशेषताएं नहीं होती हैं: माध्यिका, चतुर्थक, और इसी तरह।

भिन्नता के मुख्य संकेतकों के अधिकतम संभव मूल्यों के लिए प्राप्त सूत्रों के आधार पर, निष्कर्ष जनसंख्या की मात्रा पर इन मूल्यों की निर्भरता के बारे में है। पी।इस निर्भरता को तालिका में संक्षेपित किया गया है। 5.9.

परिवर्तन की सबसे संकीर्ण सीमाएँ और जनसंख्या के आकार पर एक कमजोर निर्भरता औसत मापांक और सापेक्ष रैखिक विचलन को प्रकट करती है। इसके विपरीत, मानक विचलन और भिन्नता का गुणांक जनसंख्या इकाइयों की संख्या पर बहुत अधिक निर्भर करता है। विभिन्न आकारों की आबादी में भिन्नता की तीव्रता की तुलना करते समय इस निर्भरता को ध्यान में रखा जाना चाहिए। यदि छह उद्यमों के योग में उत्पादन की मात्रा में भिन्नता का गुणांक 0.58 था, और कुल 20 उद्यमों में यह 0.72 था, तो क्या यह निष्कर्ष निकालना उचित है कि दूसरी आबादी में उत्पादन की मात्रा अधिक असमान है? दरअसल, पहले, छोटे वाले में, यह अधिकतम संभव का 0.58: 2.24 = 25.9% था, यानी। सीमा, छह में से एक उद्यम में उत्पादन की एकाग्रता का स्तर, और दूसरे, बड़े सेट में, भिन्नता का मनाया गया गुणांक अधिकतम संभव का केवल 0.72: 4.36 = 16.5% था।

तालिका 5.9

जनसंख्या के विभिन्न आकारों के लिए वॉल्यूमेट्रिक विशेषता की भिन्नता के संकेतकों के मूल्यों को सीमित करना

जनगणना

संकेतकों का अधिकतम मान

एक्स̅

एक्स̅

1,5एक्स̅

1,73एक्स̅

1,67एक्स̅

2,24एक्स̅

1,80एक्स̅

3एक्स̅

1,90एक्स̅

4,36एक्स̅

1,96एक्स̅

7एक्स̅

1,98एक्स̅

9,95एक्स̅

2एक्स̅

व्यावहारिक महत्व का ऐसा संकेतक है जो वास्तविक औसत विचलन मॉड्यूल के अनुपात को अधिकतम संभव बनाता है। इस प्रकार, कुल छह उद्यमों के लिए, यह अनुपात था: 0.47: 1.67 = 0.281, या 28.1%। प्राप्त संकेतक की व्याख्या इस प्रकार है: उद्यमों के बीच उत्पादन के देखे गए वितरण से एक समान वितरण में जाने के लिए, पुनर्वितरण करना आवश्यक होगा

, या कुल उत्पादन का 23.4%। यदि उत्पादन की वास्तविक एकाग्रता की डिग्री (σ या . का वास्तविक मूल्य) वी) एक उद्यम में उत्पादन के एकाधिकार के मामले में सीमांत मूल्य का एक निश्चित अंश है, तो वास्तविक संकेतक का सीमांत अनुपात उत्पादन की एकाग्रता (या एकाधिकार) की डिग्री को चिह्नित कर सकता है।

संरचना में परिवर्तन या परिवर्तन के संकेतकों के वास्तविक मूल्यों के अनुपात को अधिकतम संभव के लिए संरचनात्मक बदलावों के विश्लेषण में भी उपयोग किया जाता है (अध्याय 11 देखें)।

1. जेनी के.औसत मान। - एम .: सांख्यिकी, 1970।

2. क्रिवेनकोवा एल.एन., युज़बाशेव एम.एम.भिन्नता संकेतकों के अस्तित्व का क्षेत्र और उसका अनुप्रयोग // सांख्यिकी का बुलेटिन। - 1991. - नंबर 6। - एस 66-70।

3. पास्खावर आई. एस.आंकड़ों में औसत मूल्य। - एम .: सांख्यिकी। 1979.

4. शूराकोव वी। वी।, दयातबेगोव डी। एम। और अन्य।सांख्यिकीय डेटा प्रोसेसिंग के लिए स्वचालित वर्कस्टेशन (अध्याय 4. प्रारंभिक सांख्यिकीय डेटा प्रोसेसिंग)। - एम .: वित्त और सांख्यिकी, 1990।

लेकर- किसी वस्तु को उनके कुछ गुणों के आरोही या अवरोही क्रम में क्रमित करने की प्रक्रिया, बशर्ते कि उनके पास यह गुण हो।

आप रैंक कर सकते हैं:

जीवन स्तर, जन्म दर, बेरोजगारी के आधार पर राज्य;

प्रतिष्ठा द्वारा पेशे;

उपभोक्ता वरीयता के अनुसार माल;

राजनीतिक गतिविधि, वित्तीय स्थिति से उत्तरदाताओं;

रैंकिंग ऑब्जेक्ट वे ऑब्जेक्ट हैं जिन्हें सीधे ऑर्डर किया जाता है। आधार रैंकिंग(रैंकिंग विशेषता) - वह संपत्ति जिसके द्वारा वस्तुओं का आदेश दिया जाता है। रैंकिंग के परिणामस्वरूप, हमें एक क्रमबद्ध श्रृंखला मिलती है, जिसमें प्रत्येक वस्तु को अपना स्वयं का व्यक्ति सौंपा जाता है पद- क्रमबद्ध पंक्ति में वस्तु का स्थान। स्थानों की संख्या और, तदनुसार, क्रमबद्ध श्रृंखला में रैंकों की संख्या वस्तुओं की संख्या के बराबर होती है।

श्रेणीबद्ध श्रृंखला के प्रकार:

1) प्रत्येक वस्तु का एक विशेषता मान होता है जो अन्य वस्तुओं की विशेषता के मूल्यों से भिन्न होता है, फिर क्रमबद्ध श्रृंखला की प्रत्येक वस्तु को अपनी स्वयं की रैंक सौंपी जाती है, जो किसी अन्य वस्तु से भिन्न होती है;

2) कई वस्तुओं में एक ही विशेषता मान होता है, फिर रैंक की गई श्रृंखला में इन वस्तुओं को एक ही रैंक दिया जाता है, एक निश्चित सूत्र के अनुसार गणना की जाती है। इस मामले में, रैंक की गई श्रृंखला को संबद्ध रैंक वाली रैंक वाली श्रृंखला कहा जाता है। समस्याओं को हल करते समय, हम फीचर के उच्चतम मूल्य के लिए पहली रैंक प्रदान करेंगे। संबंधित रैंक की गणना उन वस्तुओं द्वारा कब्जा किए गए स्थानों के औसत के रूप में की जाती है जिनमें समान विशेषता मान होता है। 2 या अधिक रैंक वाली श्रृंखला के लिए एक सांख्यिकीय संबंध की स्थापना का उपयोग करके किया जाता है कनेक्शन के रैंक गुणांक- ऐसे गुणांक जो आपको दो अलग-अलग आधारों (सुविधाओं) पर समान वस्तुओं की रैंकिंग में स्थिरता की डिग्री की गणना करने की अनुमति देते हैं। रैंक कनेक्शन (रैंक सहसंबंध) का सबसे आम गुणांक ρ-स्पीयरमैन गुणांक है।

मान लीजिए कि n ऑब्जेक्ट्स को विशेषता x के अनुसार और विशेषता y के अनुसार क्रमबद्ध किया गया है। होने देना

i-th ऑब्जेक्ट के रैंकों के बेमेल का माप: d i = R x i - R y i

गुण:

-1 से 1 की सीमा में परिवर्तन;

पो = 1 यदि रैंक की गई श्रृंखला की पूर्ण स्थिरता है; एक और एक ही वस्तु के पद दो आधारों पर समान होते हैं।

पो = -1 यदि रैंक की गई श्रृंखला की पूर्ण असंगति है; यह स्थिति तब उत्पन्न होती है जब रैंकिंग श्रृंखला की विपरीत दिशा होती है: R x i - 1 2 3 4 5; आर वाई आई - 5 4 3 2 1.

नोट: दो प्रकार के बराबर के लिए गणना की जा सकती है (यदि प्रत्येक वस्तु की अपनी रैंक है और यदि संबंधित रैंक हैं)।

-स्पीयरमैन गुणांक के सांख्यिकीय महत्व के बारे में परिकल्पना का परीक्षण करना।

एच 0: जीएस = 0

एच 1: जीएस ≠ 0

शून्य परिकल्पना हमेशा बताती है कि ρ 0 के बराबर है। वैकल्पिक परिकल्पना यह है कि ρ का मान 0 से भिन्न होता है।

आकस्मिक तालिकाओं के रूप में महत्व स्तर।

राज्य लेकिन बी पर जी डी तथा वू और
जीवन की गुणवत्ता 6,8 7,0 6,5 5,9 4,6 5,7 4,5 5,8 4,0
बेरोजगारी 20,3 18,0 19,8 23,4 21,6 20,8
रैंक x
रैंक आप
|डी मैं |
घ 2 मैं
डी 2 आई

- केंडलजनसंख्या से यादृच्छिक रूप से खींची गई दो टिप्पणियों के लिए सही और गलत क्रम की संभावनाओं के बीच का अंतर है, बशर्ते कि कोई संबद्ध रैंक न हो। गुण:

-1 से 1 में परिवर्तन;

यदि गुण x और y सांख्यिकीय रूप से स्वतंत्र हैं, तो गुणांक 0 हो जाता है; यदि 0 के बराबर है, तो इसका मतलब यह नहीं है कि विशेषताएं सांख्यिकीय रूप से स्वतंत्र हैं;

यदि 1 के बराबर है, तो इसका मतलब है कि सुविधाओं के बीच एक पूर्ण प्रत्यक्ष सांख्यिकीय संबंध है या रैंक की गई श्रृंखला पूरी तरह से संगत है; यदि -1 है, तो इसका मतलब है कि एक पूर्ण सांख्यिकीय प्रतिलोम संबंध है, या रैंक की गई श्रृंखला असंगत है।

S दोनों वस्तुओं के लिए एक सुसंगत सही क्रम वाली वस्तुओं के जोड़े की कुल संख्या है। डी दोनों वस्तुओं के लिए असंगत गलत क्रम वाली वस्तुओं के जोड़े की कुल संख्या है।

गुणांक के सांख्यिकीय महत्व के बारे में परिकल्पना का परीक्षण:

एच 0: जीएस = 0

एच 1: जीएस 0

गुणांक सांख्यिकीय रूप से महत्वपूर्ण है यदि HS के लिए इसका मान 0 से भिन्न है।

|जेड एच | > जेड करोड़ => एच 1

यदि हम कम संख्या में वस्तुओं के लिए एक क्रमबद्ध श्रृंखला का निर्माण करते हैं, तो शून्य परिकल्पना की पुष्टि हमें बताती है कि हमें बड़ी संख्या में वस्तुओं का अध्ययन करने की आवश्यकता है।

यदि पर्याप्त संख्या में वस्तुओं का अध्ययन किया गया है, तो शून्य परिकल्पना की पुष्टि इंगित करती है कि सुविधाओं के बीच कोई संबंध नहीं है।

एकाधिक रैंक लिंक गुणांक

इसका उपयोग उन मामलों में किया जाता है जहां 2 से अधिक रैंक वाली श्रृंखलाओं के बीच संबंध को मापना आवश्यक होता है (उदाहरण के लिए, जब हम रेटिंग 1 और समान वस्तुओं पर विशेषज्ञ राय (2 से अधिक) की स्थिरता का आकलन करना चाहते हैं)।

S संपूर्ण जनसंख्या के लिए औसत रैंक से पंक्ति के लिए रैंक मानों के वर्ग विचलन का योग है। k 2 - चरों की संख्या (विशेषज्ञों की संख्या)। n रैंक की गई वस्तुओं की संख्या है।

सारांश, समूहीकरण, वर्गीकरण की अवधारणा

सारांश- व्यवस्थितकरण और सारांश: मौसम की रिपोर्ट, खेतों से सारांश। सारांश जानकारी के विस्तृत विश्लेषण की अनुमति नहीं देता है। कोई भी सारांश डेटा ग्रुपिंग पर आधारित होना चाहिए, अर्थात। पहले समूह बनाना, फिर डेटा को सारांशित करना।

समूहीकरण- सबसे महत्वपूर्ण विशेषताओं के अनुसार कई समूहों में आबादी का विभाजन।

गुणात्मक और मात्रात्मक समूहन के बीच भेद। गुणवत्ता- जिम्मेदार मात्रात्मक- उतार-चढ़ाव। बदले में, परिवर्तनशील को संरचनात्मक और विश्लेषणात्मक में विभाजित किया गया है . संरचनात्मकसमूहीकरण में प्रत्येक समूह के अनुपात की गणना करना शामिल है। उदाहरण: एक उद्यम में, 80% कर्मचारी हैं, 20% कर्मचारी हैं, जिनमें से 5% प्रबंधक हैं, 3% कर्मचारी हैं, 12% विशेषज्ञ हैं। लक्ष्य विश्लेषणात्मकसमूह - संकेतों के बीच संबंध की पहचान करने के लिए: कार्य अनुभव और औसत कमाई, अनुभव और आउटपुट, और अन्य।

समूह बनाते समय, आपको यह करना होगा:

अध्ययन के तहत घटना की प्रकृति का व्यापक विश्लेषण करना;

समूहीकरण विशेषता की पहचान (एक या अधिक);

समूहों की सीमाएँ इस प्रकार निर्धारित करें कि समूह एक-दूसरे से महत्वपूर्ण रूप से भिन्न हों, और प्रत्येक समूह में सजातीय तत्व संयुक्त हों।

जटिलता की डिग्री के अनुसार, समूह सरल और संयोजन (सुविधाओं के अनुसार) हो सकते हैं।

प्रारंभिक जानकारी के अनुसार, प्राथमिक और माध्यमिक समूहों को प्रतिष्ठित किया जाता है, मुख्यप्रारंभिक अवलोकन डेटा के आधार पर किया गया, माध्यमिकप्राथमिक समूहन डेटा का उपयोग करता है।

समूहों की संख्या निर्धारित है स्टर्गेस सूत्र के अनुसार:

कहाँ पे एन- समूहों की संख्या, एन- सामान्य जनसंख्या।

यदि समान अंतराल का उपयोग किया जाता है, तो अंतराल मूल्यके बराबर है .

अंतरालबराबर हो भी सकता है और नहीं भी। उत्तरार्द्ध, बदले में, उन लोगों में विभाजित हैं जो अंकगणित या ज्यामितीय प्रगति के नियम के अनुसार बदलते हैं। पहला और आखिरी अंतराल खुला या बंद हो सकता है। बंद अंतराल में अंतराल सीमाएं शामिल हैं या नहीं।

यदि अंतराल बंद हैं, और ऊपरी सीमाओं को शामिल करने के बारे में कुछ नहीं कहा जाता है, तो हम मानते हैं कि ऊपरी सीमाएं शामिल हैं।

यदि अंतराल खुले हैं, तो हमें अंतिम अंतराल द्वारा निर्देशित किया जाता है।

इन अंतरालों में एक चिन्ह को अलग-अलग और लगातार (यानी, विभाजित) मापा जा सकता है। निरंतर संकेत के साथ, सीमाएं 1-10, 10-20, 20-30 बंद हो जाती हैं; यदि विशेषता अलग-अलग बदलती है, तो निम्न प्रविष्टि का उपयोग किया जा सकता है: 1 - 10, 11 - 20, 21 - 30।

यदि अंतराल खुले हैं, तो अंतिम अंतराल का मान पिछले एक के बराबर है, और पहले का मान - दूसरे के बराबर है।

वर्गीकरणगुणवत्ता के आधार पर समूहीकरण। यह अपेक्षाकृत स्थिर, मानकीकृत और राज्य सांख्यिकी अधिकारियों द्वारा अनुमोदित है।


3.2. वितरण रैंक: प्रकार और मुख्य विशेषताएं

नीचे वितरण के निकटडेटा की एक श्रृंखला को संदर्भित करता है जो एक आधार पर किसी भी सामाजिक-आर्थिक घटना की विशेषता है। यह दो आधारों पर समूहीकरण का सबसे सरल प्रकार है।

वितरण श्रृंखला को असतत और निरंतर सुविधा वितरण के साथ गुणात्मक और मात्रात्मक, रैंक और रैंक नहीं, समूहीकृत और समूहीकृत नहीं किया जाता है।

एक असमूहीकृत, बिना रैंक वाली वेतन श्रृंखला का एक उदाहरण पेरोल है। उसी समय, कर्मचारियों की सूची को वर्णानुक्रम में या कर्मियों की संख्या के आधार पर क्रमबद्ध किया जा सकता है। रैंकिंग श्रृंखला का एक उदाहरण टीमों की सूची, टेनिस खिलाड़ियों की रैंकिंग है।

रैंक की गई पंक्तिवितरण - एक विशेषता के अवरोही या आरोही क्रम में व्यवस्थित डेटा की एक श्रृंखला।

वर्गीकृत श्रेणीबद्ध श्रृंखला के लिए, निम्नलिखित विशेषताओं को प्रतिष्ठित किया जाता है: भिन्न, आवृत्ति या आवृत्ति, संचयी और वितरण घनत्व।

संस्करण ()सुविधा का औसत अंतराल मान है। इसलिये समूह बनाते समय, प्रत्येक अंतराल में एक विशेषता के समान वितरण के सिद्धांत का पालन किया जाना चाहिए, फिर भिन्नता की गणना अंतराल की सीमाओं के आधे योग के रूप में की जा सकती है।

आवृत्ति() दिखाता है कि दी गई फीचर वैल्यू कितनी बार आती है। आपेक्षिक आवृत्ति व्यंजक है आवृत्ति(.) , अर्थात। अंश, आवृत्तियों के योग से विशिष्ट भार।

संचयी() - संचयी आवृत्ति या आवृत्ति, संचयी गणना। मात्रा, लागत, आय की गणना संचयी रूप से की जाती है, अर्थात। गतिविधि के परिणाम।

तालिका एक

ऑपरेटिंग क्रेडिट संस्थानों का समूहन
पंजीकृत अधिकृत पूंजी की राशि से

2008 में रूस में

भिन्नता के सांख्यिकीय अध्ययन में पहला कदम एक भिन्नता श्रृंखला का निर्माण है - एक विशेषता के बढ़ते (अधिक बार) या घटते (कम अक्सर) मूल्यों के अनुसार जनसंख्या इकाइयों का एक क्रमबद्ध वितरण और एक के साथ इकाइयों की संख्या की गणना करना या सुविधा का कोई अन्य मूल्य।

विविधता श्रृंखला के तीन रूप हैं: श्रेणीबद्ध, असतत, अंतराल। एक परिवर्तनशील श्रृंखला को अक्सर वितरण श्रृंखला कहा जाता है। मात्रात्मक और गैर-मात्रात्मक दोनों लक्षणों की भिन्नता का अध्ययन करते समय इस शब्द का उपयोग किया जाता है। वितरण श्रृंखला एक संरचनात्मक समूह है (अध्याय 6)।

एक क्रमबद्ध श्रृंखला अध्ययन के तहत विशेषता के आरोही (अवरोही) क्रम में जनसंख्या की व्यक्तिगत इकाइयों की एक सूची है।

नीचे सेंट पीटर्सबर्ग के बड़े बैंकों के बारे में जानकारी दी गई है, जिन्हें इक्विटी पूंजी द्वारा 01.10.1999 के रूप में स्थान दिया गया है।

बैंक का नाम इक्विटी पूंजी, मिलियन रूबल

बाल्टोनेक्सिम बैंक 169

बैंक सेंट पीटर्सबर्ग 237

पेत्रोव्स्की 268

बाल्टिक 290

प्रोमस्ट्रॉयबैंक 1007

यदि जनसंख्या इकाइयों की संख्या काफी बड़ी है, तो रैंक की गई श्रृंखला बोझिल हो जाती है, और इसके निर्माण में, यहां तक ​​​​कि कंप्यूटर की मदद से भी, एक लंबा समय लगता है। ऐसे मामलों में, अध्ययन के तहत विशेषता के मूल्यों के अनुसार जनसंख्या की इकाइयों को समूहीकृत करके भिन्नता श्रृंखला का निर्माण किया जाता है।

समूहों की संख्या का निर्धारण

असतत भिन्नता श्रृंखला में समूहों की संख्या चर विशेषता के वास्तव में मौजूदा मूल्यों की संख्या से निर्धारित होती है। यदि विशेषता असतत मान लेती है, लेकिन उनकी संख्या बहुत बड़ी है (उदाहरण के लिए, विभिन्न कृषि उद्यमों में वर्ष के 1 जनवरी को पशुधन की संख्या शून्य से लेकर दसियों हज़ार सिर तक हो सकती है), तो अंतराल भिन्नता श्रृंखला बनाई जाती है . एक अंतराल परिवर्तनशील श्रृंखला का निर्माण उन विशेषताओं का अध्ययन करने के लिए भी किया जाता है जो अपने अस्तित्व के क्षेत्र में किसी भी, दोनों पूर्णांक और भिन्नात्मक मानों को ले सकते हैं। उदाहरण के लिए, बेचे गए उत्पादों की लाभप्रदता, उत्पादन की एक इकाई की लागत, प्रति शहर निवासी आय, विभिन्न क्षेत्रों की आबादी के बीच उच्च शिक्षा वाले लोगों का अनुपात, और सामान्य तौर पर सभी माध्यमिक विशेषताओं, मूल्य हैं जिनमें से एक प्राथमिक विशेषता के मूल्य को दूसरे के मूल्य से विभाजित करके गणना की जाती है (अध्याय 3 देखें)।

अंतराल भिन्नता श्रृंखला दो स्तंभों (या पंक्तियों) से युक्त एक तालिका है - विशेषता के अंतराल जिनकी भिन्नता का अध्ययन किया जा रहा है, और इस अंतराल (आवृत्तियों) में आने वाली जनसंख्या की इकाइयों की संख्या, या इस संख्या का अनुपात कुल जनसंख्या (आवृत्ति)।

दो प्रकार के अंतराल भिन्नता श्रृंखला का सबसे अधिक उपयोग किया जाता है: समान-अंतराल और समान-आवृत्ति। समान-अंतराल श्रृंखला का उपयोग किया जाता है यदि विशेषता की भिन्नता बहुत मजबूत नहीं है, अर्थात। एक सजातीय आबादी के लिए, जिसका वितरण किसी दिए गए गुण के अनुसार सामान्य कानून के करीब है। (ऐसी श्रृंखला तालिका 5.6 में प्रस्तुत की गई है।) एक समान आवृत्ति श्रृंखला का उपयोग किया जाता है यदि विशेषता भिन्नता बहुत मजबूत है, लेकिन वितरण सामान्य नहीं है, लेकिन, उदाहरण के लिए, अतिशयोक्तिपूर्ण (तालिका 5.5)।

एक समान-अंतराल श्रृंखला का निर्माण करते समय, समूहों की संख्या को चुना जाता है ताकि समुच्चय में विशेषता मूल्यों की विविधता पर्याप्त रूप से परिलक्षित हो और साथ ही, वितरण की नियमितता, इसका आकार यादृच्छिक रूप से विकृत न हो आवृत्ति में उतार-चढ़ाव। यदि बहुत कम समूह हैं, तो भिन्नता का कोई पैटर्न नहीं होगा; यदि बहुत अधिक समूह हैं, तो यादृच्छिक आवृत्ति छलांग वितरण के आकार को विकृत कर देगी।


अंतराल की सीमाओं को अलग-अलग तरीकों से निर्दिष्ट किया जा सकता है: पिछले अंतराल की ऊपरी सीमा अगले एक की निचली सीमा को दोहराती है, जैसा कि तालिका में दिखाया गया है। 5.5, या दोहराना नहीं है।

बाद के मामले में, दूसरा अंतराल 15.1-20, तीसरा - 20.1-25, आदि के रूप में नामित किया जाएगा, अर्थात। यह माना जाता है कि सभी उपज मूल्यों को आवश्यक रूप से एक दसवें तक गोल किया जाता है। इसके अलावा, अंतराल 15.1-20 के मध्य के साथ एक अवांछनीय जटिलता उत्पन्न होती है, जो कड़ाई से बोलते हुए, पहले से ही 17.5 के बराबर नहीं, बल्कि 17.55 के बराबर होगी; तदनुसार, जब गोल अंतराल 40-60 को 40.1-60 के साथ प्रतिस्थापित किया जाता है, तो इसके मध्य 50 के गोल मान के बजाय, हमें 50.5 मिलता है। इसलिए, अंतरालों को दोहराई जाने वाली गोल सीमा के साथ छोड़ना बेहतर है और सहमत हैं कि जनसंख्या इकाइयाँ जिनका अंतराल सीमा के बराबर एक विशेषता मान है, उस अंतराल में शामिल हैं जहाँ यह सटीक मान पहली बार रिपोर्ट किया गया है। इस प्रकार, पहले समूह में 15 सेंटीमीटर प्रति हेक्टेयर की उपज वाला एक खेत शामिल है, दूसरे में 20 सेंटीमीटर प्रति हेक्टेयर का मूल्य शामिल है, और इसी तरह।

एक समान-आवृत्ति भिन्नता श्रृंखला एक विशेषता के बहुत मजबूत भिन्नता के साथ आवश्यक है क्योंकि, समान-अंतराल वितरण के साथ, अधिकांश जनसंख्या इकाइयाँ हैं

तालिका 5.5

01.01.2000 के अनुसार संपत्ति के शेष मूल्यांकन के अनुसार 100 रूसी बैंकों का वितरण

समान वितरण के लिए अंतराल की सीमाएं बैंकों पर पहले, दसवें, ग्यारहवें, बीसवें आदि की संपत्ति के वास्तविक मूल्य हैं।

विविधता श्रृंखला का ग्राफिक प्रतिनिधित्व

परिवर्तनशील श्रृंखला और उसके गुणों के विश्लेषण में महत्वपूर्ण सहायता एक चित्रमय प्रतिनिधित्व द्वारा प्रदान की जाती है। अंतराल श्रृंखला को एक बार ग्राफ द्वारा दर्शाया जाता है, जिसमें एब्सिस्सा अक्ष पर स्थित सलाखों के आधार अलग-अलग विशेषता के मूल्यों के अंतराल होते हैं, और सलाखों की ऊंचाई पैमाने के अनुरूप आवृत्तियां होती हैं वाई-अक्ष। अनाज की फसल की पैदावार के संदर्भ में क्षेत्र में खेतों के वितरण का एक ग्राफिक प्रतिनिधित्व अंजीर में दिखाया गया है। 5.1. इस प्रकार के आरेख को अक्सर हिस्टोग्राम (जीआर हिस्टोस - ऊतक) कहा जाता है।

तालिका डेटा। 5.6 और अंजीर। 5.1 कई लक्षणों के वितरण विशेषता का रूप दिखाते हैं: विशेषता के औसत अंतराल के मूल्य अधिक सामान्य होते हैं, कम अक्सर विशेषता के चरम, छोटे और बड़े मूल्य। इस वितरण का रूप गणितीय आँकड़ों के दौरान माना जाने वाले सामान्य वितरण के कानून के करीब है। महान रूसी गणितज्ञ ए.एम. ल्यपुनोव (1857-1918) ने साबित किया कि सामान्य

तालिका 5.6 अनाज की फसल की उपज द्वारा क्षेत्र में खेतों का वितरण

एक छोटा वितरण तब बनता है जब एक चर बड़ी संख्या में कारकों से प्रभावित होता है, जिनमें से किसी का भी प्रमुख प्रभाव नहीं होता है। अनाज फसलों की उपज विविधताओं को प्रभावित करने वाले कई लगभग समान कारकों का एक यादृच्छिक संयोजन, दोनों प्राकृतिक और कृषि तकनीकी, आर्थिक, सामान्य वितरण कानून के करीब उपज के मामले में क्षेत्र के खेतों का वितरण बनाता है।

चावल। 5.2. उपज द्वारा खेतों का संचयी और अंडाणु वितरण

ऐसी श्रृंखला को संचयी कहा जाता है। आप संचयी वितरण "से कम नहीं" बना सकते हैं, या आप "इससे अधिक" बना सकते हैं। पहले मामले में, संचयी वितरण के ग्राफ को संचयी कहा जाता है, दूसरे में - तोरण (चित्र। 5.2)।

वितरण घनत्व

यदि आपको असमान अंतराल के साथ एक परिवर्तनशील श्रृंखला से निपटना है, तो तुलनीयता के लिए आपको अंतराल की इकाई में आवृत्ति, या आवृत्ति लाने की आवश्यकता है। परिणामी अनुपात को वितरण घनत्व कहा जाता है:

वितरण घनत्व का उपयोग सामान्यीकरण संकेतकों की गणना के लिए और असमान अंतरालों के साथ भिन्नता श्रृंखला के चित्रमय प्रतिनिधित्व के लिए किया जाता है।

आलू उत्पादन सांख्यिकीय रैंकिंग

तालिका 2 में संकेतकों के आधार पर, हम प्रति 100 हेक्टेयर कृषि योग्य भूमि में आलू के उत्पादन के लिए क्रमबद्ध पंक्तियों को संकलित करते हैं; आलू की उपज पर; लागत पर। इन संकेतकों के बीच संबंध को ग्राफिक रूप से दर्शाया गया है।

भिन्नता के सांख्यिकीय अध्ययन में पहला कदम एक भिन्नता श्रृंखला का निर्माण है - एक विशेषता के मूल्यों में वृद्धि (अधिक बार) या घटते (कम अक्सर) के अनुसार जनसंख्या इकाइयों का एक क्रमबद्ध वितरण।

एक विविधता श्रृंखला के तीन रूप हैं: एक श्रेणीबद्ध श्रृंखला, एक असतत श्रृंखला, एक अंतराल श्रृंखला। एक परिवर्तनशील श्रृंखला को अक्सर वितरण श्रृंखला कहा जाता है।

एक क्रमबद्ध श्रृंखला अध्ययन के तहत विशेषता के आरोही (अवरोही) क्रम में जनसंख्या की व्यक्तिगत इकाइयों की एक सूची है

रैंकिंग अध्ययन की वस्तुओं को क्रमबद्ध करने की एक प्रक्रिया है, जो वरीयता के आधार पर की जाती है। भिन्नता की सीमा दर्शाती है कि जनसंख्या की इकाइयों के बीच का अंतर कितना बड़ा है।

रैंक उनके मूल्यों के आरोही या अवरोही क्रम में व्यवस्थित विशेषता मानों की क्रमिक संख्या है। यदि विशेषता के मूल्य का एक ही मात्रात्मक मूल्यांकन है, तो इन सभी मूल्यों की रैंक निर्धारित किए गए स्थानों की इसी संख्या के अंकगणितीय माध्य के बराबर ली जाती है। इन रैंकों को कनेक्टेड कहा जाता है।

आँकड़ों में रेखांकन ज्यामितीय आकृतियों और संकेतों, रेखाचित्रों या योजनाबद्ध मानचित्रों के रूप में सांख्यिकीय संकेतकों को देखने का एक तरीका है। एक दृश्य छवि सूचना की धारणा की सुविधा प्रदान करती है, आपको इंटरकनेक्शन में संकेतकों के एक सेट को कवर करने, विकास के रुझान और संकेतकों के विशिष्ट अनुपात की पहचान करने की अनुमति देती है।

डायनामिक्स संकेतक प्रदर्शित करने के लिए, लाइन ग्राफ़ या बार चार्ट का उपयोग करने की सलाह दी जाती है। ग्राफ दृश्य, समझने योग्य, पढ़ने में आसान और यदि संभव हो तो कलात्मक रूप से डिजाइन किया जाना चाहिए, जो इस पर ध्यान आकर्षित करेगा।

स्कैटर प्लॉट का निर्माण करते समय, बिंदुओं के एक सेट का उपयोग ग्राफिक नमूने के रूप में किया जाता है; रैखिक - रेखाओं का निर्माण करते समय। चार्टिंग हमेशा एक रचनात्मक प्रक्रिया है। यहां कुछ खोज की जरूरत है। कई मसौदा संस्करणों को संकलित और तुलना करने के बाद ही, ग्राफ की सही संरचना का निर्धारण करना संभव है, ग्राफ फ़ील्ड पर पैमाने और संकेतों का स्थान निर्धारित करना संभव है।

प्रति 100 हेक्टेयर कृषि योग्य भूमि में आलू उत्पादन के लिए क्रमबद्ध पंक्ति से, निम्नलिखित निष्कर्ष निकाला जा सकता है कि सबसे कम उत्पादन बालगांस्की जिले में देखा गया है, और अंगार्स्क जिले में 100 हेक्टेयर कृषि योग्य भूमि से आलू की उच्चतम उत्पादकता है।

सबसे कम उपज काचुगस्की जिले में थी - 10 सेंटीमीटर / हेक्टेयर, और उसोल्स्की में सबसे ज्यादा - 195.5 सेंटीमीटर / हेक्टेयर।

चुनस्की जिले में, प्रति 100 हेक्टेयर कृषि योग्य भूमि में उच्च आलू उत्पादन के साथ, 1 सी की सबसे कम लागत। अधिकतम लागत निज़ने-इलिम्स्क क्षेत्र में देखी जाती है। एक सेंटीमीटर आलू की कीमत में भिन्नता की सीमा बहुत बड़ी है और 1161.01 रूबल के बराबर है।

अन्य प्रकाशन

उद्यम की आर्थिक गतिविधि का विश्लेषण
एक बाजार अर्थव्यवस्था में संक्रमण के लिए एक उद्यम की आवश्यकता होती है जो उत्पादन की दक्षता, उत्पादों और सेवाओं की प्रतिस्पर्धात्मकता को आर्थिक प्रबंधन और उत्पादन प्रबंधन के प्रभावी रूपों, वैज्ञानिक और तकनीकी प्रगति की उपलब्धियों, और की सक्रियता के माध्यम से बढ़ाए ...

JSC TransContainer की वित्तीय और आर्थिक गतिविधियों का विश्लेषण
वित्तीय विश्लेषण भविष्य की स्थितियों और प्रदर्शन का आकलन करने के लिए उद्यम की वित्तीय स्थिति और अतीत में उसकी गतिविधियों के परिणामों पर डेटा के अध्ययन पर आधारित एक प्रक्रिया है। इस प्रकार, वित्तीय विश्लेषण का मुख्य कार्य है ...

श्रेणियाँ

लोकप्रिय लेख

2022 "kingad.ru" - मानव अंगों की अल्ट्रासाउंड परीक्षा