Samostatné funkcie na zostavenie sérií distribúcie variácií. Konštrukcia intervalových variačných sérií pre spojité kvantitatívne údaje

Ak máme k dispozícii štatistické pozorovacie údaje charakterizujúce konkrétny jav, je potrebné ich v prvom rade usporiadať, t.j. dať systematický charakter

anglický štatistik. UJReichman o neusporiadaných zbierkach obrazne povedal, že stretnutie s množstvom nezobecnených údajov sa rovná situácii, keď je človek bez kompasu hodený do húštiny. Aká je systematizácia štatistických údajov vo forme distribučných radov?

Štatistické rady rozdelenia sú usporiadané štatistické agregáty (tabuľka 17). Najjednoduchším typom štatistického distribučného radu je rad zoradených, t.j. rad čísel vo vzostupnom alebo zostupnom poradí, ktoré menia charakteristiky. Takýto rad neumožňuje posúdiť vzorce obsiahnuté v distribuovaných údajoch: ktorá hodnota má zoskupenú väčšinu ukazovateľov, aké sú odchýlky od tejto hodnoty; ako aj celkový obraz distribúcie. Na tento účel sú údaje zoskupené a ukazujú, ako často sa jednotlivé pozorovania vyskytujú v ich celkovom počte (schéma 1a 1).

. Tabuľka 17

. Všeobecný pohľad na štatistické distribučné rady

. Schéma 1. Štatistická schéma distribučná séria

Rozdelenie populačných jednotiek podľa charakteristík, ktoré nemajú kvantitatívne vyjadrenie, sa nazýva tzv atribútový rad(napríklad rozdelenie podnikov podľa ich výrobnej oblasti)

Rad rozdelenia jednotiek obyvateľstva podľa charakteristík, majú kvantitatívne vyjadrenie, sú tzv variačná séria. V takýchto radoch sú hodnoty charakteristiky (možnosti) vo vzostupnom alebo zostupnom poradí

Vo variačnom distribučnom rade sa rozlišujú dva prvky: variant a frekvencia . Možnosť- toto je samostatný význam charakteristík zoskupenia frekvencia- číslo, ktoré ukazuje, koľkokrát sa každá možnosť vyskytne

V matematickej štatistike sa počíta ešte jeden prvok variačného radu - čiastočne. Ten je definovaný ako pomer frekvencie prípadov daného intervalu k celkovému súčtu frekvencií; časť je určená v zlomkoch jednotky, percento (%) v ppm (% o)

Séria distribúcie variácií je teda séria, v ktorej sú možnosti usporiadané vo vzostupnom alebo zostupnom poradí a sú uvedené ich frekvencie alebo frekvencie. Variačné rady sú diskrétne (intervaly) a ostatné intervaly (spojité).

. Séria diskrétnych variácií- ide o distribučné rady, v ktorých variant ako hodnota kvantitatívnej charakteristiky môže nadobudnúť len určitú hodnotu. Možnosti sa navzájom líšia jednou alebo viacerými jednotkami

Počet vyrobených dielov za zmenu konkrétnym pracovníkom teda môže byť vyjadrený len jedným konkrétnym číslom (6, 10, 12 atď.). Príkladom série diskrétnych variácií môže byť rozdelenie pracovníkov podľa počtu vyrobených dielov (tabuľka 18 18).

. Tabuľka 18

. Diskrétna sériová distribúcia _

. Intervalové (kontinuálne) série variácií- také distribučné rady, v ktorých sa hodnota opcií uvádza vo forme intervalov, t.j. hodnoty vlastností sa môžu navzájom líšiť o ľubovoľne malé množstvo. Pri konštrukcii série variácií perivariantných charakteristík NEP nie je možné označiť každú hodnotu variantu, takže populácia je rozdelená do intervalov. Posledné môžu byť rovnaké alebo nerovnaké. Pre každý z nich sú uvedené frekvencie alebo frekvencie (tabuľka 1 9 19).

V intervalových distribučných radoch s nerovnakými intervalmi sa vypočítajú matematické charakteristiky, ako je hustota distribúcie a relatívna hustota distribúcie na danom intervale. Prvá charakteristika je určená pomerom frekvencie k hodnote toho istého intervalu, druhá - pomerom frekvencie k hodnote toho istého intervalu. Vo vyššie uvedenom príklade bude hustota distribúcie v prvom intervale 3: 5 = 0,6 a relatívna hustota v tomto intervale je 7,5: 5 = 1,55 %.

. Tabuľka 19

. Intervalové distribučné série _

Opis zmien premennej charakteristiky sa vykonáva pomocou distribučných radov.

Štatistické distribučné rady- ide o usporiadané rozdelenie jednotiek štatistickej populácie do samostatných skupín podľa určitej premennej charakteristiky.

Štatistické rady postavené na kvalitatívnom základe sú tzv prívlastkový. Ak je distribučný rad založený na kvantitatívnej charakteristike, potom je tento rad variačný.

Variačné série sa delia na diskrétne a intervalové. V jadre diskrétne riadok distribúcie leží diskrétny (nespojitý) atribút, ktorý nadobúda špecifické číselné hodnoty (počet trestných činov, počet občanov hľadajúcich právnu pomoc). Interval distribučný rad je konštruovaný na základe súvislého atribútu, ktorý môže nadobudnúť ľubovoľnú hodnotu z daného rozsahu (vek odsúdeného, ​​trest odňatia slobody atď.)

Každý štatistický distribučný rad obsahuje dva povinné prvky – sériu a možnosti frekvencie. možnosti (x i) – jednotlivé hodnoty charakteristiky, ktorú nadobúda v distribučnom rade. Frekvencie (f i) sú číselné hodnoty, ktoré ukazujú, koľkokrát sa určité možnosti vyskytujú v distribučnom rade. Súčet všetkých frekvencií sa nazýva objem populácie.

Frekvencie vyjadrené v relatívnych jednotkách (zlomky alebo percentá) sa nazývajú frekvencie ( w i). Súčet frekvencií sa rovná jednej, ak sú frekvencie vyjadrené ako zlomky jednotky, alebo 100, ak sú vyjadrené v percentách. Použitie frekvencií umožňuje porovnávať série variácií s rôznymi veľkosťami populácie. Frekvencie sa určujú podľa nasledujúceho vzorca:

Na vytvorenie diskrétnej série sa zoradia všetky jednotlivé hodnoty charakteristiky vyskytujúcej sa v sérii a potom sa vypočíta frekvencia opakovaní každej hodnoty. Distribučná séria je zostavená v myšlienke tabuľky pozostávajúcej z dvoch riadkov a stĺpcov, z ktorých jeden obsahuje hodnoty variantov série x i, v druhej – hodnoty frekvencie fi.

Uvažujme o príklade konštrukcie diskrétneho variačného radu.

Príklad 3.1 . Podľa ministerstva vnútra sú evidované trestné činy spáchané v meste N maloletými.

17 13 15 16 17 15 15 14 16 13 14 17 14 15 15 16 16 15 14 15 15 14 16 16 14 17 16 15 16 15 13 15 15 13 15 14 15 13 17 14.

Zostrojte diskrétny distribučný rad.

Riešenie .

Najprv je potrebné zoradiť údaje o veku maloletých, t.j. zapíšte ich vo vzostupnom poradí.

13 13 13 13 13 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 15 15 15 15 15 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17



Tabuľka 3.1

Frekvencie teda odrážajú počet ľudí v danom veku, napríklad 5 ľudí má 13 rokov, 8 ľudí má 14 rokov atď.

Stavebníctvo interval distribučné rady sa uskutočňujú podobne ako rovnomerné intervalové zoskupovanie podľa kvantitatívneho kritéria, to znamená, že najprv sa určí optimálny počet skupín, do ktorých bude populácia rozdelená, stanovia sa hranice intervalov podľa skupín a vypočítajú sa frekvencie .

Ilustrujme konštrukciu intervalového distribučného radu na nasledujúcom príklade.

Príklad 3.2 .

Zostavte intervalový rad na základe nasledujúceho štatistického agregátu - plat právnika v kancelárii, tisíc rubľov:

16,0 22,2 25,1 24,3 30,5 32,0 17,0 23,0 19,8 27,5 22,0 18,9 31,0 21,5 26,0 27,4

Riešenie.

Zoberme si optimálny počet skupín s rovnakým intervalom pre danú štatistickú populáciu 4 (máme 16 možností). Preto sa veľkosť každej skupiny rovná:

a hodnota každého intervalu sa bude rovnať:

Hranice intervalov sú určené vzorcami:

,

kde sú dolné a horné hranice i-tého intervalu, resp.

Po vynechaní medzivýpočtov hraníc intervalov zadáme ich hodnoty (možnosti) a počet právnikov (frekvencie) s platmi v rámci každého intervalu do tabuľky 3.2, ktorá znázorňuje výsledný rad intervalov.

Tabuľka 3.2

Analýza štatistických distribučných radov sa môže uskutočniť pomocou grafickej metódy. Grafické znázornenie distribučných radov vám umožňuje jasne ilustrovať vzorce distribúcie skúmanej populácie jej zobrazením vo forme polygónu, histogramu a kumulácie. Pozrime sa na každý z uvedených grafov.

Polygón– prerušovaná čiara, ktorej segmenty spájajú body so súradnicami ( x i;f i). Typicky sa polygón používa na zobrazenie diskrétnych distribučných radov. Na jej konštrukciu sa zoradené jednotlivé hodnoty charakteristiky vynesú na os x. x i, na zvislej osi - frekvencie zodpovedajúce týmto hodnotám. Výsledkom je, že spojením bodov zodpovedajúcich údajom označeným pozdĺž osi x a ordinátov segmentmi sa získa prerušovaná čiara, ktorá sa nazýva mnohouholník. Uveďme príklad konštrukcie frekvenčného mnohouholníka.

Na ilustráciu konštrukcie mnohouholníka si zoberme výsledok riešenia príkladu 3.1 na zostrojenie diskrétneho radu - obrázok 1. Vek odsúdených je vynesený pozdĺž osi x a počet mladistvých odsúdených v danom veku je vynesený pozdĺž osi x. ordinátnej osi. Analýzou tohto testovacieho miesta môžeme povedať, že najväčší počet odsúdených – 14 osôb – má 15 rokov.

Obrázok 3.1 – Frekvenčný rozsah diskrétnej série.

Mnohouholník možno skonštruovať aj pre rad intervalov; v tomto prípade sa stredy intervalov vynesú pozdĺž osi x a zodpovedajúce frekvencie sa vynesú pozdĺž osi y.

stĺpcový graf– stupňovitý útvar pozostávajúci z obdĺžnikov, ktorých základňami sú intervaly hodnoty atribútu a výšky sa rovnajú príslušným frekvenciám. Histogram sa používa len na zobrazenie intervalových distribučných radov. Ak sú intervaly nerovnaké, potom na zostavenie histogramu nie sú na osi y vynesené frekvencie, ale pomer frekvencie k šírke zodpovedajúceho intervalu. Histogram možno previesť na distribučný mnohouholník, ak sú stredy jeho pruhov navzájom spojené segmentmi.

Na ilustráciu konštrukcie histogramu si zoberme výsledky konštrukcie intervalového radu z príkladu 3.2 – obrázok 3.2.

Obrázok 3.2 – Histogram rozdelenia platov právnikov.

Pre grafické znázornenie variačných radov sa používa aj kumulovať. Kumuluje sa– krivka zobrazujúca sériu nahromadených frekvencií a spájajúcich bodov so súradnicami ( x i;f i nak). Kumulatívne frekvencie sa vypočítavajú postupným sčítaním všetkých frekvencií distribučného radu a zobrazujú počet jednotiek populácie, ktorých charakteristická hodnota nie je väčšia ako špecifikovaná hodnota. Znázornime výpočet akumulovaných frekvencií pre variačný intervalový rad uvedený v príklade 3.2 - tabuľka 3.3.

Tabuľka 3.3

Na vytvorenie kumulácií diskrétnych distribučných radov sa zoradené jednotlivé hodnoty atribútu vynesú pozdĺž osi x a im zodpovedajúce akumulované frekvencie sa vynesú pozdĺž osi y. Pri konštrukcii kumulatívnej krivky intervalového radu bude mať prvý bod úsečku rovnajúcu sa dolnej hranici prvého intervalu a ordinátu rovnú 0. Všetky nasledujúce body musia zodpovedať hornej hranici intervalov. Zostavme kumuláciu pomocou údajov z Tabuľky 3.3 - Obrázok 3.3.

Obrázok 3.3 – Krivka kumulatívneho rozdelenia miezd pre právnikov.

Kontrolné otázky

1. Pojem štatistického distribučného radu, jeho hlavné prvky.

2. Typy štatistických distribučných radov. Ich stručný popis.

3. Diskrétne a intervalové distribučné rady.

4. Metodika konštrukcie diskrétnych distribučných radov.

5. Metodika konštrukcie intervalových distribučných radov.

6. Grafické znázornenie diskrétnych distribučných radov.

7. Grafické znázornenie intervalových distribučných radov.

Úlohy

Problém 1. K dispozícii sú nasledujúce údaje o výkone 25 študentov v skupine TGP na reláciu: 5, 4, 4, 4, 3, 2, 5, 3, 4, 4, 4, 3, 2, 5, 2, 5, 5, 2, 3, 3, 5, 4, 2, 3, 3. Zostrojte diskrétny variačný rad rozdelenia študentov podľa známok získaných počas relácie. Pre výslednú sériu vypočítajte frekvencie, akumulované frekvencie, akumulované frekvencie. Vyvodiť závery.

Problém 2. V kolónii je 1 000 odsúdených, ich rozdelenie podľa veku je uvedené v tabuľke:

Nakreslite túto sériu graficky. Vyvodiť závery.

Problém 3. K dispozícii sú nasledujúce údaje o podmienkach uväznenia väzňov:

5; 4; 2; 1; 6; 3; 4; 3; 2; 2; 3; 1; 17; 6; 2; 8; 5; 11; 9; 3; 5; 6; 4; 3; 10; 5; 25; 1; 12; 3; 3; 4; 9; 6; 5; 3; 4; 3; 5; 12; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 3; 12; 6.

Zostrojte intervalovú sériu rozdelenia väzňov podľa dĺžky trestu odňatia slobody. Vyvodiť závery.

Problém 4. O rozložení odsúdených v kraji za sledované obdobie podľa vekových skupín sú dostupné tieto údaje:

Nakreslite túto sériu graficky a vyvodzujte závery.

Vyššie odborné vzdelanie

„RUSKÁ AKADÉMIA NÁRODNÉHO HOSPODÁRSTVA A

ŠTÁTNA SLUŽBA ZA PREZIDENTA

RUSKÁ FEDERÁCIA"

(pobočka Kaluga)

Katedra prírodných vied a matematiky

TEST

V disciplíne "štatistika"

Študent___Mayboroda Galina Yurievna______

Oddelenie korešpondencie Fakulta štátnej a obecnej správy skupina G-12-B

Učiteľ _____________________ Hamer G.V.

Kandidát pedagogických vied, docent

Kaluga-2013

Úloha 1.

Úloha 1.1. 4

Problém 1.2. 16

Problém 1.3. 24

Problém 1.4. 33

Úloha 2.

Úloha 2.1. 43

Problém 2.2. 48

Problém 2.3. 53

Problém 2.4. 58

Úloha 3.

Úloha 3.1. 63

Problém 3.2. 68

Problém 3.3. 73

Problém 3.4. 79

Úloha 4.

Problém 4.1. 85

Problém 4.2. 88

Problém 4.3. 90

Problém 4.4. 93

Zoznam použitých zdrojov. 96

Úloha 1.

Úloha 1.1.

K dispozícii sú nasledujúce údaje o produkcii produktov a výške zisku regionálnych podnikov (tabuľka 1).

stôl 1

Údaje o produkcii a výške zisku podľa podnikov

Podnik č. Výstup produktu, milióny rubľov. Zisk, milióny rubľov Podnik č. Výstup produktu, milióny rubľov. Zisk, milióny rubľov
63,0 6,7 56,0 7,2
48,0 6,2 81,0 9,6
39,0 6,5 55,0 6,3
28,0 3,0 76,0 9,1
72,0 8,2 54,0 6,0
61,0 7,6 53,0 6,4
47,0 5,9 68,0 8,5
37,0 4,2 52,0 6,5
25,0 2,8 44,0 5,0
60,0 7,9 51,0 6,4
46,0 5,5 50,0 5,8
34,0 3,8 65,0 6,7
21,0 2,1 49,0 6,1
58,0 8,0 42,0 4,8
45,0 5,7 32,0 4,6

Podľa pôvodných údajov:

1. Zostrojte štatistický rad distribúcie podnikov podľa produkcie, tvoriaci päť skupín s rovnakými intervalmi.

Zostrojte grafy distribučných radov: polygón, histogram, kumulácia. Graficky určte hodnotu módu a mediánu.

2. Vypočítajte charakteristiky distribučných radov podnikov podľa produkcie: aritmetický priemer, rozptyl, smerodajnú odchýlku, variačný koeficient.

Vyvodiť záver.

3. Pomocou metódy analytického zoskupovania zistite prítomnosť a povahu korelácie medzi nákladmi na vyrobené produkty a výškou zisku na podnik.

4. Pomocou empirického korelačného pomeru zmerajte tesnosť korelácie medzi výrobnými nákladmi a výškou zisku.

Vyvodiť všeobecné závery.

Riešenie:

Zostrojme štatistický distribučný rad

Na zostavenie intervalového variačného radu charakterizujúceho rozdelenie podnikov podľa objemu výroby je potrebné vypočítať hodnotu a hranice intervalov radu.

Pri konštrukcii radu s rovnakými intervalmi veľkosť intervalu h určený podľa vzorca:

x max A x min– najväčšie a najmenšie hodnoty atribútu v populácii skúmaných podnikov;

k- počet skupín intervalových sérií.

Počet skupín kšpecifikované v podmienke úlohy. k= 5.

x max= 81 miliónov rubľov, x min= 21 miliónov rubľov.

Výpočet veľkosti intervalu:

miliónov rubľov

Postupným pridávaním hodnoty intervalu h = 12 miliónov rubľov. k dolnej hranici intervalu získame tieto skupiny:

Skupina 1: 21 – 33 miliónov rubľov.

Skupina 2: 33 – 45 miliónov rubľov;

Skupina 3: 45 – 57 miliónov rubľov.

Skupina 4: 57 – 69 miliónov rubľov.

Skupina 5: 69 – 81 miliónov rubľov.

Na zostavenie intervalového radu je potrebné spočítať počet podnikov zahrnutých v každej skupine ( frekvenčné skupiny).

Proces zoskupovania podnikov podľa objemu výroby je uvedený v pomocnej tabuľke 2. Stĺpec 4 tejto tabuľky je potrebný na zostavenie analytického zoskupenia (bod 3 úlohy).

tabuľka 2

Tabuľka na zostavenie intervalových distribučných radov a

analytická skupina

Skupiny podnikov podľa objemu výroby, milióny rubľov. Podnik č. Výstup produktu, milióny rubľov. Zisk, milióny rubľov
21-33 21,0 2,1
25,0 2,8
28,0 3,0
32,0 4,6
Celkom 106,0 12,5
33-45 34,0 3,8
37,0 4,2
39,0 6,5
42,0 4,8
44,0 5,0
Celkom 196,0 24,3
45-57 45,0 5,7
46,0 5,5
47,0 5,9
48,0 6,2
49,0 6,1
50,0 5,8
51,0 6,4
52,0 6,5
53,0 6,4
54,0 6,0
55,0 6,3
56,0 7,2
Celkom 606,0 74,0
57-69 58,0 8,0
60,0 7,9
61,0 7,6
63,0 6,7
65,0 6,7
68,0 8,5
Celkom 375,0 45,4
69-81 72,0 8,2
76,0 9,1
81,0 9,6
Celkom 229,0 26,9
Celkom 183,1

Na základe skupinových súčtových riadkov „Súčet“ tabuľky 3 je vytvorená výsledná tabuľka 3, ktorá predstavuje intervalový rad rozdelenia podnikov podľa objemu výroby.

Tabuľka 3

Distribučné rady podnikov podľa objemu výroby

Záver. Zostrojené zoskupenie ukazuje, že rozdelenie podnikov podľa objemu výroby nie je jednotné. Najbežnejšie sú podniky s objemom výroby 45 až 57 miliónov rubľov. (12 podnikov). Najmenej bežné sú podniky s objemom výroby 69 až 81 miliónov rubľov. (3 podniky).

Nakreslíme grafy distribučných radov.

Polygón častejšie sa používa na zobrazenie diskrétnych sérií. Na vytvorenie mnohouholníka v pravouhlom súradnicovom systéme sa hodnoty argumentu vynesú na os x, t.j. možnosti (pre sériu variácií intervalu sa ako argument berie stred intervalu) a hodnoty frekvencie sú na zvislej osi. Ďalej sú v tomto súradnicovom systéme zostrojené body, ktorých súradnice sú dvojice zodpovedajúcich čísel z variačného radu. Výsledné body sú postupne spojené priamymi úsečkami. Polygón je znázornený na obrázku 1.

stĺpcový graf - stĺpcový graf. Umožňuje vám posúdiť symetriu rozloženia. Histogram je znázornený na obrázku 2.

Obrázok 1 – Polygón pre rozdelenie podnikov podľa objemu

uvoľnenie produktu

Móda

Obrázok 2 – Histogram rozdelenia podnikov podľa objemu

uvoľnenie produktu

Móda– hodnota atribútu, ktorý sa v skúmanej populácii vyskytuje najčastejšie.

Pre intervalové série možno režim určiť graficky z histogramu (obrázok 2). Na tento účel sa vyberie najvyšší obdĺžnik, ktorý je v tomto prípade modálny (45 - 57 miliónov rubľov). Pravý vrchol modálneho obdĺžnika je potom pripojený k pravému hornému rohu predchádzajúceho obdĺžnika. A ľavý vrchol modálneho obdĺžnika - s ľavým horným rohom nasledujúceho obdĺžnika. Ďalej sa z bodu ich priesečníka spustí kolmica na os x. Abscisa priesečníka týchto čiar bude režim distribúcie.

miliónov trieť.

Záver. V súbore posudzovaných podnikov sú najbežnejšie podniky s produkciou produktu 52 miliónov rubľov.

Kumuluje sa – lomená krivka. Je zostavený pomocou akumulovaných frekvencií (vypočítaných v tabuľke 4). Kumulácia začína od spodnej hranice prvého intervalu (21 miliónov rubľov), akumulovaná frekvencia sa ukladá na hornú hranicu intervalu. Kumulácia je znázornená na obrázku 3.

Medián

Obrázok 3 - Kumulatívne rozdelenie podnikov podľa objemu

uvoľnenie produktu

Medián Ja– toto je hodnota atribútu spadajúca do stredu hodnoteného radu. Na oboch stranách mediánu je rovnaký počet jednotiek obyvateľstva.

V intervalovom rade je možné medián určiť graficky pomocou kumulatívnej krivky. Na určenie mediánu z bodu na akumulovanej frekvenčnej škále zodpovedajúceho 50 % (30:2 = 15) nakreslite priamku rovnobežnú s osou x, kým sa nepretína s kumuláciou. Potom sa z priesečníka naznačenej čiary s kumuláciou zníži kolmica na os x. Úsečka priesečníka je stred.

miliónov trieť.

Záver. V súbore posudzovaných podnikov má polovica podnikov objem výroby nie viac ako 52 miliónov rubľov a druhá polovica - nie menej ako 52 miliónov rubľov.


Súvisiace informácie.


Pri konštrukcii intervalového distribučného radu sú vyriešené tri otázky:

  • 1. Koľko intervalov by som mal užívať?
  • 2. Aká je dĺžka intervalov?
  • 3. Aký je postup pri zaraďovaní jednotiek obyvateľstva do hraníc intervalov?
  • 1. Počet intervalov možno určiť podľa Sturgessov vzorec:

2. Dĺžka intervalu alebo krok intervalu, zvyčajne určený vzorcom

Kde R- rozsah variácií.

3. Poradie zaradenia jednotiek populácie v rámci hraníc intervalu

môžu byť rôzne, ale pri konštrukcii intervalového radu musí byť rozdelenie striktne definované.

Napríklad toto: [), v ktorom sú populačné jednotky zahrnuté v dolných hraniciach, ale nie sú zahrnuté v horných hraniciach, ale sú prenesené do ďalšieho intervalu. Výnimkou z tohto pravidla je posledný interval, ktorého horná hranica zahŕňa posledné číslo hodnotenej série.

Hranice intervalov sú:

  • uzavreté - s dvoma extrémnymi hodnotami atribútu;
  • open - s jednou extrémnou hodnotou atribútu (predtým taký a taký počet resp cez také a také číslo).

Za účelom asimilácie teoretického materiálu uvádzame informácie o pozadí pre riešenia end-to-end úloha.

Existujú podmienené údaje o priemernom počte manažérov predaja, množstve nimi predávaného podobného tovaru, individuálnej trhovej cene tohto produktu, ako aj objeme predaja 30 spoločností v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka (tabuľka 2.1).

Tabuľka 2.1

Počiatočné informácie pre prierezovú úlohu

číslo

manažéri,

Cena, tisíc rubľov

Objem predaja, milióny rubľov.

číslo

manažéri,

Množstvo predaného tovaru, ks.

Cena, tisíc rubľov

Objem predaja, milióny rubľov.

Na základe prvotných informácií, ale aj doplňujúcich informácií nastavíme jednotlivé úlohy. Následne predstavíme metodiku ich riešenia a samotné riešenia.

Prierezová úloha. Úloha 2.1

Použitie počiatočných údajov z tabuľky. 2.1 zostrojiť diskrétnu sériu rozdelenia firiem podľa množstva predaného tovaru (tabuľka 2.2).

Riešenie:

Tabuľka 2.2

Samostatné série distribúcie firiem podľa množstva predaného tovaru v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka

Prierezová úloha. Úloha 2.2

požadovaný zostaviť zoradený rad 30 firiem podľa priemerného počtu manažérov.

Riešenie:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

Prierezová úloha. Úloha 2.3

Použitie počiatočných údajov z tabuľky. 2.1, požadovaný:

  • 1. Zostrojte intervalový rad rozmiestnenia firiem podľa počtu manažérov.
  • 2. Vypočítajte frekvencie distribučných radov firiem.
  • 3. Vyvodiť závery.

Riešenie:

Vypočítajme pomocou Sturgessovho vzorca (2.5) počet intervalov:

Zoberieme teda 6 intervalov (skupín).

Dĺžka intervalu, alebo intervalový krok, vypočítajte pomocou vzorca

Poznámka. Poradie zaraďovania populačných jednotiek do hraníc intervalu je nasledovné: I), v ktorom populačné jednotky sú zahrnuté v dolných hraniciach, ale nie sú zahrnuté v horných hraniciach, ale sú prenesené do ďalšieho intervalu. Výnimkou z tohto pravidla je posledný interval I ], ktorého horná hranica zahŕňa posledné číslo zoradeného radu.

Zostavíme intervalový rad (tabuľka 2.3).

Intervalová séria distribúcie firiem a priemerný počet manažérov v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka

Záver. Najväčšiu skupinu firiem tvorí skupina s priemerným počtom manažérov 25 – 30 osôb, do ktorej patrí 8 firiem (27 %); Do najmenšej skupiny s priemerným počtom manažérov 40 – 45 osôb patrí len jedna firma (3 %).

Použitie počiatočných údajov z tabuľky. 2.1, ako aj intervalový rad rozdelenia firiem podľa počtu manažérov (tabuľka 2.3), požadovaný vybudovať analytické zoskupenie vzťahu medzi počtom manažérov a objemom predaja firiem a na základe toho vyvodiť záver o prítomnosti (alebo absencii) vzťahu medzi týmito charakteristikami.

Riešenie:

Analytické zoskupovanie je založené na faktorových charakteristikách. V našom probléme je faktorová charakteristika (x) počet manažérov a výsledná charakteristika (y) je objem predaja (tabuľka 2.4).

Poďme teraz stavať analytické zoskupenie(Tabuľka 2.5).

Záver. Na základe údajov vybudovaného analytického zoskupenia môžeme povedať, že s nárastom počtu obchodných manažérov sa zvyšuje aj priemerný objem predaja spoločnosti v skupine, čo naznačuje prítomnosť priameho spojenia medzi týmito charakteristikami.

Tabuľka 2.4

Pomocná tabuľka na zostavenie analytického zoskupenia

Počet manažérov, ľudí,

Číslo firmy

Objem predaja, milióny rubľov, y

" = 59 f = 9,97

I-™ 4 - Yu.22

74 '25 1PY1

U 4 = 7 = 10,61

pri = ’ =10,31 30

Tabuľka 2.5

Závislosť objemu predaja od počtu manažérov spoločnosti v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka

KONTROLNÉ OTÁZKY
  • 1. Čo je podstatou štatistického pozorovania?
  • 2. Vymenujte etapy štatistického pozorovania.
  • 3. Aké sú organizačné formy štatistického pozorovania?
  • 4. Vymenujte druhy štatistického pozorovania.
  • 5. Čo je to štatistický súhrn?
  • 6. Vymenujte typy štatistických výkazov.
  • 7. Čo je štatistické zoskupovanie?
  • 8. Vymenujte typy štatistických zoskupení.
  • 9. Čo je distribučná séria?
  • 10. Vymenujte konštrukčné prvky rozvodného radu.
  • 11. Aký je postup pri zostavovaní distribučnej série?

Najdôležitejšou etapou pri skúmaní sociálno-ekonomických javov a procesov je systematizácia primárnych údajov a na tomto základe získanie súhrnnej charakteristiky celého objektu pomocou všeobecných ukazovateľov, čo sa dosiahne sumarizáciou a zoskupením primárneho štatistického materiálu.

Štatistické zhrnutie - ide o komplex sekvenčných operácií na zovšeobecnenie konkrétnych individuálnych faktov, ktoré tvoria súbor s cieľom identifikovať typické znaky a vzorce vlastné skúmanému javu ako celku. Vykonanie štatistického súhrnu zahŕňa nasledujúce kroky :

  • výber charakteristík zoskupenia;
  • určenie poradia formovania skupiny;
  • vývoj systému štatistických ukazovateľov na charakterizáciu skupín a objektu ako celku;
  • vývoj rozložení štatistických tabuliek na prezentáciu súhrnných výsledkov.

Štatistické zoskupenie sa nazýva rozdelenie skúmaných jednotiek populácie do homogénnych skupín podľa určitých pre ne podstatných vlastností. Zoskupenia sú najdôležitejšou štatistickou metódou na sumarizáciu štatistických údajov, základom pre správny výpočet štatistických ukazovateľov.

Rozlišujú sa tieto typy zoskupení: typologické, štrukturálne, analytické. Všetky tieto zoskupenia spája skutočnosť, že jednotky objektu sú rozdelené do skupín podľa nejakej charakteristiky.

Funkcia zoskupovania je charakteristika, podľa ktorej sa jednotky populácie delia do samostatných skupín. Závery štatistickej štúdie závisia od správneho výberu charakteristiky zoskupenia. Ako základ pre zoskupovanie je potrebné použiť významné, teoreticky podložené charakteristiky (kvantitatívne alebo kvalitatívne).

Kvantitatívne charakteristiky zoskupovania mať číselné vyjadrenie (objem obchodov, vek osoby, rodinný príjem atď.) a kvalitatívne znaky zoskupenia odráža stav jednotky obyvateľstva (pohlavie, rodinný stav, odvetvie podniku, jeho forma vlastníctva atď.).

Po určení základu zoskupenia je potrebné rozhodnúť o otázke počtu skupín, do ktorých by sa mala skúmaná populácia rozdeliť. Počet skupín závisí od cieľov štúdie a typu ukazovateľa, ktorý je základom zoskupenia, od objemu populácie a od stupňa variácie charakteristiky.

Napríklad zoskupenie podnikov podľa druhu vlastníctva zohľadňuje obecný, federálny a federálny subjektový majetok. Ak sa zoskupovanie vykonáva podľa kvantitatívneho kritéria, potom je potrebné venovať osobitnú pozornosť počtu jednotiek skúmaného objektu a stupňu kolísania charakteristiky zoskupenia.

Po určení počtu skupín sa musia určiť intervaly zoskupovania. Interval - to sú hodnoty rôznych charakteristík, ktoré ležia v určitých hraniciach. Každý interval má svoju hodnotu, hornú a dolnú hranicu alebo aspoň jednu z nich.

Dolná hranica intervalu sa nazýva najmenšia hodnota charakteristiky v intervale, a Horná hranica - najvyššia hodnota charakteristiky v intervale. Hodnota intervalu je rozdiel medzi hornou a dolnou hranicou.

Intervaly zoskupovania v závislosti od ich veľkosti sú: rovnaké a nerovnaké. Ak sa variácia charakteristiky prejavuje v relatívne úzkych hraniciach a distribúcia je rovnomerná, potom sa skupina vytvára v rovnakých intervaloch. Hodnota rovnakého intervalu je určená nasledujúcim vzorcom :

kde Xmax, Xmin sú maximálne a minimálne hodnoty charakteristiky v súhrne; n - počet skupín.

Najjednoduchšie zoskupenie, v ktorom je každá vybraná skupina charakterizovaná jedným ukazovateľom, predstavuje distribučný rad.

Štatistické distribučné rady - ide o usporiadané rozdelenie jednotiek obyvateľstva do skupín podľa určitej charakteristiky. V závislosti od charakteristiky, ktorá je základom tvorby distribučných radov, sa rozlišujú atribútové a variačné distribučné rady.

Prívlastkový sa nazývajú distribučné rady zostavené podľa kvalitatívnych charakteristík, teda charakteristík, ktoré nemajú číselné vyjadrenie (rozdelenie podľa druhu práce, podľa pohlavia, podľa profesie atď.). Atributívne distribučné rady charakterizujú zloženie populácie podľa určitých podstatných charakteristík. Tieto údaje získané z niekoľkých období umožňujú študovať zmeny v štruktúre.

Variačné série sa nazývajú distribučné série konštruované na kvantitatívnom základe. Každá séria variácií pozostáva z dvoch prvkov: možností a frekvencií. možnosti nazývajú sa jednotlivé hodnoty charakteristiky, ktorú má vo variačnom rade, to znamená špecifická hodnota premennej charakteristiky.

Frekvencie sa nazývajú čísla jednotlivých variantov alebo každej skupiny variačného radu, to znamená, že ide o čísla, ktoré ukazujú, ako často sa určité varianty vyskytujú v distribučnom rade. Súčet všetkých frekvencií určuje veľkosť celej populácie, jej objem. Frekvencie sa nazývajú frekvencie vyjadrené v zlomkoch jednotky alebo ako percento z celku. V súlade s tým sa súčet frekvencií rovná 1 alebo 100 %.

V závislosti od povahy variácie charakteristiky sa rozlišujú tri formy variačných radov: radový rad, diskrétny rad a intervalový rad.

Hodnotené série variácií - ide o rozloženie jednotlivých jednotiek populácie vo vzostupnom alebo zostupnom poradí podľa skúmanej charakteristiky. Hodnotenie umožňuje jednoducho rozdeliť kvantitatívne údaje do skupín, okamžite zistiť najmenšie a najväčšie hodnoty charakteristiky a zvýrazniť hodnoty, ktoré sa najčastejšie opakujú.

Séria diskrétnych variácií charakterizuje rozdelenie jednotiek populácie podľa diskrétnej charakteristiky, ktorá nadobúda iba celočíselné hodnoty. Napríklad tarifná kategória, počet detí v rodine, počet zamestnancov v podniku atď.

Ak má charakteristika kontinuálnu zmenu, ktorá v rámci určitých limitov môže nadobúdať ľubovoľné hodnoty („od - do“), potom je pre túto charakteristiku potrebné postaviť intervalové variačné série . Napríklad výška príjmu, dĺžka služby, cena dlhodobého majetku podniku atď.

Príklady riešenia problémov na tému „Štatistický súhrn a zoskupovanie“

Problém 1 . Existujú informácie o počte kníh, ktoré študenti dostali prostredníctvom predplatného za posledný akademický rok.

Zostavte zoradené a diskrétne série distribúcie variácií, ktoré označujú prvky série.

Riešenie

Táto sada predstavuje veľa možností pre počet kníh, ktoré študenti dostanú. Spočítajme počet takýchto možností a usporiadame ich vo forme variačných zoradených a variačných diskrétnych distribučných radov.

Problém 2 . Existujú údaje o nákladoch na fixné aktíva pre 50 podnikov, tisíc rubľov.

Vytvorte distribučný rad, zvýraznite 5 skupín podnikov (v rovnakých intervaloch).

Riešenie

Na riešenie vyberieme najväčšiu a najmenšiu hodnotu hodnoty fixných aktív podnikov. Ide o 30,0 a 10,2 tisíc rubľov.

Zistime veľkosť intervalu: h = (30,0-10,2):5= 3,96 tisíc rubľov.

Potom prvá skupina bude zahŕňať podniky, ktorých fixný majetok je od 10,2 tisíc rubľov. až 10,2 + 3,96 = 14,16 tisíc rubľov. Takýchto podnikov bude 9. Druhá skupina bude zahŕňať podniky, ktorých fixné aktíva sú od 14,16 tisíc rubľov. až 14,16 + 3,96 = 18,12 tisíc rubľov. Takýchto podnikov bude 16. Podobne zistíme počet podnikov zaradených do tretej, štvrtej a piatej skupiny.

Výsledný distribučný rad umiestnime do tabuľky.

Problém 3 . Nasledujúce údaje boli získané pre niekoľko podnikov ľahkého priemyslu:

Zoskupte podniky podľa počtu pracovníkov a vytvorte 6 skupín v rovnakých intervaloch. Vypočítajte pre každú skupinu:

1. počet podnikov
2. počet pracovníkov
3. objem vyrobených produktov za rok
4. priemerný skutočný výkon na pracovníka
5. objem fixných aktív
6. priemerná veľkosť fixných aktív jedného podniku
7. priemerná hodnota výrobkov vyrobených jedným podnikom

Výsledky výpočtu prezentujte v tabuľkách. Vyvodiť závery.

Riešenie

Na vyriešenie vyberieme najväčšie a najmenšie hodnoty priemerného počtu pracovníkov v podniku. Toto je 43 a 256.

Zistime veľkosť intervalu: h = (256-43):6 = 35,5

Potom do prvej skupiny patria podniky, ktorých priemerný počet pracovníkov je od 43 do 43 + 35,5 = 78,5 osôb. Takýchto podnikov bude 5. Do druhej skupiny budú zaradené podniky, ktorých priemerný počet pracovníkov bude od 78,5 do 78,5+35,5=114 osôb. Takýchto podnikov bude 12. Podobne zistíme počet podnikov zaradených do tretej, štvrtej, piatej a šiestej skupiny.

Výsledné distribučné série umiestnime do tabuľky a vypočítame potrebné ukazovatele pre každú skupinu:

Záver : Ako vidno z tabuľky, druhá skupina podnikov je najpočetnejšia. Zahŕňa 12 podnikov. Najmenšou skupinou sú piata a šiesta skupina (po dva podniky). Ide o najväčšie podniky (z hľadiska počtu pracovníkov).

Keďže druhá skupina je najväčšia, objem produktov vyrobených za rok podnikmi tejto skupiny a objem fixných aktív sú výrazne vyššie ako ostatné. Priemerný skutočný výkon na pracovníka v podnikoch tejto skupiny zároveň nie je najvyšší. Vedú tu podniky štvrtej skupiny. Na túto skupinu pripadá aj dosť veľký objem fixných aktív.

Na záver konštatujeme, že priemerná veľkosť fixných aktív a priemerné množstvo produkcie vyprodukovanej jedným podnikom sú priamo úmerné veľkosti podniku (z hľadiska počtu pracovníkov).

KATEGÓRIE

POPULÁRNE ČLÁNKY

2023 „kingad.ru“ - ultrazvukové vyšetrenie ľudských orgánov