Vytvorte sériu intervalového rozdelenia. Konštrukcia intervalových variačných sérií pre spojité kvantitatívne údaje

zoskupenie- ide o rozdelenie obyvateľstva do skupín, ktoré sú istým spôsobom homogénne.

Pridelenie služby. Pomocou online kalkulačky môžete:

  • zostavte sériu variácií, zostavte histogram a mnohouholník;
  • nájsť ukazovatele variácie (priemer, modus (vrátane grafických), medián, rozsah variácie, kvartily, decily, kvartilový koeficient diferenciácie, koeficient variácie a iné ukazovatele);

Inštrukcia. Ak chcete zoskupiť sériu, musíte vybrať typ výslednej série variácií (diskrétne alebo intervalové) a určiť množstvo údajov (počet riadkov). Výsledné riešenie sa uloží do súboru Word (pozri príklad zoskupenia štatistických údajov).

Počet vstupných údajov
",0);">

Ak už bolo zoskupenie vykonané a diskrétne variačné série alebo intervalové série, potom musíte použiť online kalkulačku Indikátory variácií. Testovanie hypotézy o type distribúcie vyrobené pomocou služby Štúdium formy distribúcie.

Typy štatistických zoskupení

Variačné série. V prípade pozorovaní diskrétnej náhodnej premennej sa s rovnakou hodnotou možno stretnúť niekoľkokrát. Takéto hodnoty náhodnej premennej x i sa zaznamenávajú a označujú n i, koľkokrát sa objaví v n pozorovaniach, toto je frekvencia tejto hodnoty.
V prípade spojitej náhodnej veličiny sa v praxi používa zoskupovanie.
  1. Typologické zoskupenie- ide o rozdelenie skúmanej kvalitatívne heterogénnej populácie na triedy, socioekonomické typy, homogénne skupiny jednotiek. Na vytvorenie tohto zoskupenia použite parameter Diskrétna variačná séria.
  2. Štrukturálne zoskupenie je tzv, v ktorej je homogénna populácia rozdelená do skupín, ktoré charakterizujú jej štruktúru podľa nejakého premenlivého znaku. Na vytvorenie tohto zoskupenia použite parameter série intervalov.
  3. Zoskupenie, ktoré odhaľuje vzťah medzi skúmanými javmi a ich znakmi, sa nazýva tzv analytická skupina(pozri analytické zoskupenie sérií).

Princípy budovania štatistických zoskupení

Séria pozorovaní zoradených vo vzostupnom poradí sa nazýva variačná séria. znak zoskupenia je znak, ktorým sa obyvateľstvo delí na samostatné skupiny. Nazýva sa základom skupiny. Zoskupovanie môže byť založené na kvantitatívnych aj kvalitatívnych charakteristikách.
Po určení základu zoskupenia by sa malo rozhodnúť o počte skupín, do ktorých by mala byť študovaná populácia rozdelená.

Pri použití osobných počítačov na spracovanie štatistických údajov sa zoskupovanie jednotiek objektu vykonáva štandardnými postupmi.
Jeden takýto postup je založený na použití Sturgessovho vzorca na určenie optimálneho počtu skupín:

k = 1+3,322*lg(N)

Kde k je počet skupín, N je počet jednotiek populácie.

Dĺžka čiastkových intervalov sa vypočíta ako h=(x max -x min)/k

Potom spočítajte počet zásahov pozorovaní v týchto intervaloch, ktoré sa berú ako frekvencie n i . Málo frekvencií, ktorých hodnoty sú menšie ako 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Stredy intervalov x i = (c i-1 + c i)/2 sa berú ako nové hodnoty.

Odoslanie dobrej práce do databázy znalostí je jednoduché. Použite nižšie uvedený formulár

Študenti, postgraduálni študenti, mladí vedci, ktorí pri štúdiu a práci využívajú vedomostnú základňu, vám budú veľmi vďační.

Uverejnené dňa http://www.allbest.ru/

ÚLOHA1

O mzdách zamestnancov v podniku máme tieto údaje:

Tabuľka 1.1

Výška miezd v konv. Brloh. Jednotky

Je potrebné vytvoriť intervalový rad distribúcie, podľa ktorého sa má nájsť;

1) priemerná mzda;

2) priemerná lineárna odchýlka;

4) štandardná odchýlka;

5) rozsah variácií;

6) koeficient oscilácie;

7) lineárny variačný koeficient;

8) jednoduchý variačný koeficient;

10) medián;

11) koeficient asymetrie;

12) Pearsonov index asymetrie;

13) koeficient špičatosti.

Riešenie

Ako viete, možnosti (rozpoznané hodnoty) sú usporiadané vo vzostupnom poradí diskrétne variačné série. S veľkým počtom variant (viac ako 10), aj v prípade diskrétnej variácie sa budujú intervalové rady.

Ak je intervalový rad zostavený s párnymi intervalmi, potom sa rozsah variácie vydelí určeným počtom intervalov. V tomto prípade, ak je získaná hodnota celočíselná a jednoznačná (čo je zriedkavé), potom sa dĺžka intervalu rovná tomuto číslu. V iných prípadoch vyrobené zaokrúhľovanie Nevyhnutne V strane zväčšenie, Takže do posledná zostávajúca číslica bola párna. Je zrejmé, že s nárastom dĺžky intervalu, rozsah variácie o hodnotu rovnajúcu sa súčinu počtu intervalov: o rozdiel medzi vypočítanou a počiatočnou dĺžkou intervalu

A) Ak je hodnota rozšírenia rozsahu variácie nevýznamná, potom sa buď pripočíta k najväčšej alebo odpočíta od najmenšej hodnoty atribútu;

b) Ak je veľkosť rozšírenia rozsahu variácie hmatateľná, potom, aby sa predišlo zmiešaniu stredu rozsahu, rozdelí sa zhruba na polovicu, pričom sa súčasne pridá k najväčším a odpočíta sa od najmenších hodnôt rozsahu. atribút.

Ak je intervalový rad zostavený s nerovnakými intervalmi, potom sa proces zjednoduší, ale ako predtým, dĺžka intervalov musí byť vyjadrená ako číslo s poslednou párnou číslicou, čo výrazne zjednodušuje následné výpočty číselných charakteristík.

30 - veľkosť vzorky.

Zostavme intervalový distribučný rad pomocou Sturgesovho vzorca:

K \u003d 1 + 3,32 * lg n,

K - počet skupín;

K \u003d 1 + 3,32 * lg 30 \u003d 5,91 \u003d 6

Rozpätie znamienka - mzdy zamestnancov v podniku - (x) zistíme podľa vzorca

R \u003d xmax - xmin a delenie 6; R=195-112=83

Potom bude dĺžka intervalu l dráha = 83:6 = 13,83

Začiatok prvého intervalu bude 112. Pridáva sa k 112 l ras=13,83, dostaneme jeho konečnú hodnotu 125,83, čo je zároveň začiatok druhého intervalu atď. koniec piateho intervalu je 195.

Pri hľadaní frekvencií by sme sa mali riadiť pravidlom: "ak sa hodnota znaku zhoduje s hranicou vnútorného intervalu, potom by sa mala vzťahovať na predchádzajúci interval."

Získame intervalový rad frekvencií a kumulatívnu frekvenciu.

Tabuľka 1.2

Platy teda majú 3 zamestnanci. platba od 112 do 125,83 konvenčných jednotiek. Najvyšší plat platba od 181,15 do 195 konvenčných jednotiek. len 6 robotníkov.

Na výpočet numerických charakteristík konvertujeme intervalový rad na diskrétny, pričom ako variant berieme stred intervalov:

Tabuľka 1.3

14131,83

Podľa vzorca váženého aritmetického priemeru

cond.mon.un.

Priemerná lineárna odchýlka:

kde xi je hodnota študovaného znaku v i-tej jednotke populácie,

Priemerná hodnota študovaného znaku.

Uverejnené dňa http://www.allbest.ru/

LPoslané dňa http://www.allbest.ru/

Peňažná jednotka

štandardná odchýlka:

Rozptyl:

Relatívny rozsah variácie (koeficient oscilácie): c=R:,

Relatívna lineárna odchýlka: q = L:

Variačný koeficient: V = y:

Koeficient oscilácie ukazuje relatívne kolísanie extrémnych hodnôt vlastnosti okolo aritmetického priemeru a koeficient variácie charakterizuje stupeň a homogenitu populácie.

c \u003d R: \u003d 83 / 159,485 * 100 % \u003d 52,043 %

Rozdiel medzi extrémnymi hodnotami je teda o 5,16 % (= 94,84 % – 100 %) nižší ako priemerná mzda zamestnancov v podniku.

q \u003d L: \u003d 17,765 / 159,485 * 100 % \u003d 11,139 %

V \u003d y: \u003d 21,704 / 159,485 * 100 % \u003d 13,609 %

Variačný koeficient je menší ako 33 %, čo naznačuje slabé kolísanie miezd zamestnancov v podniku, t.j. že priemer je typickou charakteristikou miezd pracovníkov (homogénny agregát).

V intervalovom distribučnom rade móda sa určuje podľa vzorca -

Frekvencia modálneho intervalu, t. j. intervalu obsahujúceho najväčší počet možností;

Frekvencia intervalu pred modálom;

Frekvencia intervalu nasledujúceho po spôsobe;

dĺžka modálneho intervalu;

Dolná hranica modálneho intervalu.

Na určenie mediány v intervalovom rade použijeme vzorec

kde je kumulatívna (kumulatívna) frekvencia intervalu predchádzajúceho mediánu;

Dolná hranica stredného intervalu;

Frekvencia stredného intervalu;

Dĺžka stredného intervalu.

Stredný interval- interval, ktorého akumulovaná frekvencia (=3+3+5+7) presahuje polovicu súčtu frekvencií - (153,49; 167,32).

Vypočítajme šikmosť a špičatosť, pre ktoré zostavíme nový pracovný list:

Tabuľka 1.4

Faktické údaje

Odhadované údaje

Vypočítajte moment tretieho rádu

Preto je asymetria

Od 0,3553 0,25 sa asymetria považuje za významnú.

Vypočítajte moment štvrtého rádu

Preto je špičatosť

Pretože< 0, то эксцесс является плосковершинным.

Stupeň šikmosti možno určiť pomocou Pearsonovho koeficientu šikmosti (As): oscilácia vzorka obrat nákladov

kde je aritmetický priemer distribučného radu; -- móda; -- štandardná odchýlka.

Pri symetrickom (normálnom) rozdelení = Mo je teda koeficient asymetrie nulový. Ak Аs > 0, potom existuje viac módov, preto existuje pravostranná asymetria.

Ak As< 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.

Rozloženie nie je symetrické, ale má ľavostrannú asymetriu.

ÚLOHA 2

Aká by mala byť veľkosť vzorky, aby bola pravdepodobnosť 0,954, že výberová chyba nepresiahne 0,04, ak je rozptyl z predchádzajúcich prieskumov známy ako 0,24?

Riešenie

Veľkosť vzorky pre neopakované vzorkovanie sa vypočíta podľa vzorca:

t - koeficient spoľahlivosti (s pravdepodobnosťou 0,954 sa rovná 2,0; určený z tabuliek integrálov pravdepodobnosti),

y2 = 0,24 - štandardná odchýlka;

10 000 ľudí - veľkosť vzorky;

Dx =0,04 - hraničná chyba priemeru vzorky.

S pravdepodobnosťou 95,4% možno tvrdiť, že veľkosť vzorky, ktorá poskytuje relatívnu chybu nie väčšiu ako 0,04, by mala byť aspoň 566 rodín.

ÚLOHA3

K dispozícii sú nasledujúce údaje o príjmoch z hlavnej činnosti podniku, milióny rubľov.

Ak chcete analyzovať sériu dynamiky, určte nasledujúce ukazovatele:

1) reťaz a základné:

Absolútne zisky;

miery rastu;

miery rastu;

2) stredná

Úroveň dynamického rozsahu;

Absolútny rast;

Tempo rastu;

Miera nárastu;

3) absolútna hodnota 1% rastu.

Riešenie

1. Absolútny rast (Dy)- toto je rozdiel medzi ďalšou úrovňou série a predchádzajúcou (alebo základnou):

reťaz: Du \u003d yi - yi-1,

základné: Du \u003d yi - y0,

yi - úroveň riadkov,

i - číslo úrovne riadku,

y0 - úroveň základného roka.

2. Miera rastu (Tu) je pomer ďalšej úrovne série a predchádzajúcej úrovne (alebo základného roku 2001):

reťazec: Tu = ;

základné: Tu =

3. Rýchlosť rastu (TD) - ide o pomer absolútneho rastu k predchádzajúcej úrovni, vyjadrený v %.

reťazec: Tu = ;

základné: Tu =

4. Absolútna hodnota zvýšenia o 1 % (A)- je pomer absolútneho rastu reťazca k tempu rastu, vyjadrený v %.

A =

Úroveň stredného radu vypočítané pomocou vzorca aritmetického priemeru.

Priemerná úroveň príjmu z hlavných činností za 4 roky:

Priemerný absolútny rast vypočítané podľa vzorca:

kde n je počet úrovní v rade.

V priemere za rok vzrástli príjmy z hlavných činností o 3,333 milióna rubľov.

Priemerná ročná miera rastu vypočítané podľa geometrického priemeru:

уn - posledná úroveň série,

y0 - počiatočná úroveň série.

Ut \u003d 100 % \u003d 102,174 %

Priemerná ročná miera rastu vypočítané podľa vzorca:

T? \u003d Tu - 100 % \u003d 102,74 % - 100 % \u003d 2,74 %.

V priemere za rok tak príjmy z hlavnej činnosti podniku vzrástli o 2,74 %.

ÚLOHYA4

Vypočítať:

1. Individuálne cenové indexy;

2. všeobecný index obratu;

3. Súhrnný cenový index;

4. Súhrnný index fyzického objemu predaja tovaru;

5. Absolútny nárast hodnoty obratu a rozklad podľa faktorov (v dôsledku zmien cien a počtu predaných tovarov);

6. Urobte stručné závery o všetkých získaných ukazovateľoch.

Riešenie

1. Jednotlivé cenové indexy produktov A, B, C podľa stavu predstavovali -

ipA = 1,20; ipB = 1,15; iрВ = 1,00.

2. Celkový index obratu sa vypočíta podľa vzorca:

I w \u003d \u003d 1470/1045 * 100 % \u003d 140,67 %

Obchodný obrat vzrástol o 40,67 % (140,67 % -100 %).

V priemere ceny komodít vzrástli o 10,24 %.

Výška dodatočných nákladov pre kupujúcich v dôsledku zvýšenia ceny:

w(p) = ? p1q1-? p0q1 \u003d 1470 - 1333,478 \u003d 136,522 milióna rubľov.

V dôsledku rastúcich cien museli kupujúci minúť ďalších 136,522 milióna rubľov.

4. Všeobecný index fyzického objemu obchodu:

Fyzický objem obchodu vzrástol o 27,61 %.

5. Určme celkovú zmenu obratu v druhom období v porovnaní s prvým obdobím:

w \u003d 1470- 1045 \u003d 425 miliónov rubľov.

z dôvodu zmeny cien:

W(p) \u003d 1470 - 1333,478 \u003d 136,522 milióna rubľov.

zmenou fyzického objemu:

w(q) \u003d 1333,478 - 1045 \u003d 288,478 milióna rubľov.

Tržby za tovar vzrástli o 40,67 %. Ceny v priemere za 3 tovary vzrástli o 10,24 %. Fyzický objem obchodu vzrástol o 27,61 %.

Vo všeobecnosti sa objem predaja zvýšil o 425 miliónov rubľov, a to aj v dôsledku rastúcich cien, zvýšil sa o 136,522 milióna rubľov a v dôsledku zvýšenia objemu predaja - o 288,478 milióna rubľov.

ÚLOHA5

Pre 10 závodov v jednom odvetví sú k dispozícii nasledujúce údaje.

Továreň č.

Výstup, tisíc kusov (X)

Na základe uvedených údajov:

I) potvrdiť ustanovenia logickej analýzy o prítomnosti lineárnej korelácie medzi znakom faktora (výrobný výkon) a výsledným znakom (spotreba elektrickej energie), vykresliť počiatočné údaje do grafu korelačného poľa a vyvodiť závery o forma vzťahu, uveďte jeho vzorec;

2) určiť parametre rovnice spojenia a vyniesť výslednú teoretickú čiaru do grafu korelačného poľa;

3) vypočítajte koeficient lineárnej korelácie,

4) vysvetlite hodnoty ukazovateľov získaných v odsekoch 2) a 3);

5) pomocou získaného modelu urobte predpoveď o možnej spotrebe elektriny v závode s objemom výroby 4,5 tisíc kusov.

Riešenie

Znakové údaje - objem výstupu (faktor), označený хi; znak - spotreba elektriny (výsledok) cez ui; body so súradnicami (x, y) sú vynesené do korelačného poľa OXY.

Body korelačného poľa sú umiestnené pozdĺž nejakej priamky. Preto je súvislosť lineárna, regresnú rovnicu budeme hľadať v tvare priamky Yx=ax+b. Aby sme to našli, používame systém normálnych rovníc:

Vytvorme si tabuľku.

Na základe zistených priemerov zostavíme systém a vyriešime ho s ohľadom na parametre a a b:

Takže dostaneme regresnú rovnicu pre y na x: \u003d 3,57692 x + 3,19231

Na korelačnom poli postavíme regresnú priamku.

Dosadením hodnôt x zo stĺpca 2 do regresnej rovnice získame vypočítané hodnoty (stĺpec 7) a porovnáme ich s údajmi y, čo sa odráža v stĺpci 8. Mimochodom, správnosť výpočtov je tiež potvrdená zhodou priemerných hodnôt y a.

Koeficientlineárna korelácia vyhodnotí tesnosť vzťahu medzi znakmi x a y a vypočíta sa podľa vzorca

Uhlový koeficient priamej regresie a (v x) charakterizuje smer identifikovanéhozávislostiznaky: pre a>0 sú rovnaké, pre a<0- противоположны. Jeho absolútna hodnota - miera zmeny výsledného znamienka pri zmene znamienka faktora na jednotku merania.

Voľný člen priamej regresie odhaľuje smer a jeho absolútnu hodnotu - kvantitatívnu mieru vplyvu na efektívny znak všetkých ostatných faktorov.

Ak< 0, potom sa zdroj atribútu faktora jednotlivého objektu použije s menej a kedy>0 svyšší výkon ako je priemer pre celú množinu objektov.

Urobme postregresnú analýzu.

Koeficient pri x priamej regresie je 3,57692 > 0, preto s nárastom (poklesom) výkonu rastie (klesá) spotreba elektriny. Zvýšenie produkcie o 1 tisíc kusov. udáva priemerný nárast spotreby elektriny o 3,57692 tisíc kWh.

2. Voľný člen priamej regresie je rovný 3,19231, teda vplyvom ostatných faktorov sa vplyv výkonu na spotrebu elektriny v absolútnom vyjadrení zvýši o 3,19231 tis. kWh.

3. Korelačný koeficient 0,8235 odhaľuje veľmi úzku závislosť spotreby elektriny od výkonu.

Je ľahké robiť predpovede pomocou rovnice regresného modelu. Na tento účel sa do regresnej rovnice nahradia hodnoty x ako objem výstupu a predpovedá sa spotreba elektriny. V tomto prípade môžu byť hodnoty x prijaté nielen v rámci daného rozsahu, ale aj mimo neho.

Urobme predpoveď o možnej spotrebe elektriny v závode s objemom výroby 4,5 tisíc kusov.

3,57692*4,5 + 3,19231= 19,288 45 tisíc kWh.

ZOZNAM POUŽITÝCH ZDROJOV

1. Zacharenkov S.N. Sociálno-ekonomická štatistika: Študijná príručka. - Minsk: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumyantsev V.N. Všeobecná teória štatistiky. - M.: INFRA - M., 2000.

3. Eliseeva I.I. Štatistiky. - M.: Prospekt, 2002.

4. Všeobecná teória štatistiky / Ed. vyd. O.E. Bashina, A.A. Spirín. - M.: Financie a štatistika, 2000.

5. Sociálno-ekonomická štatistika: Učebnica.-prac. príspevok / Zacharenkov S.N. atď. - Minsk: YSU, 2004.

6. Sociálno-ekonomická štatistika: Proc. príspevok. / Ed. Nesterovič S.R. - Minsk: BSEU, 2003.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Statistics. - Minsk, 2000.

8. Charčenko L.P. Štatistiky. - M.: INFRA - M, 2002.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. Štatistiky. - M.: INFRA - M, 1999.

10. Ekonomická štatistika / Ed. Yu.N. Ivanova - M., 2000.

Hostené na Allbest.ru

...

Podobné dokumenty

    Výpočet aritmetického priemeru intervalového distribučného radu. Stanovenie všeobecného indexu fyzického objemu obchodu. Analýza absolútnej zmeny celkových výrobných nákladov v dôsledku zmien fyzického objemu. Výpočet variačného koeficientu.

    test, pridané 19.07.2010

    Podstata veľkoobchodu, maloobchodu a verejného obchodu. Vzorce na výpočet individuálnych, súhrnných indexov obratu. Výpočet charakteristík intervalového distribučného radu - aritmetický priemer, modus a medián, variačný koeficient.

    ročníková práca, pridaná 5.10.2013

    Výpočet plánovaného a skutočného objemu predaja, percento plánu, absolútna zmena obratu. Stanovenie absolútneho rastu, priemerných temp rastu a rastu peňažných príjmov. Výpočet štrukturálnych priemerov: mody, mediány, kvartily.

    test, pridané 24.02.2012

    Intervalové rady rozdelenia bánk podľa objemu zisku. Zistenie modu a mediánu získaných intervalových distribučných radov grafickou metódou a výpočtom. Výpočet charakteristík intervalového distribučného radu. Výpočet aritmetického priemeru.

    test, pridaný 15.12.2010

    Vzorce na určenie priemerných hodnôt intervalových sérií - režimy, mediány, rozptyly. Výpočet analytických ukazovateľov časových radov podľa reťazových a základných schém, temp rastu a rastu. Pojem zloženého indexu nákladov, cien, nákladov a obratu.

    ročníková práca, pridaná 27.02.2011

    Pojem a účel, poradie a pravidlá na zostavenie variačného radu. Analýza homogenity údajov v skupinách. Indikátory variácie (kolísania) vlastnosti. Stanovenie strednej lineárnej a štvorcovej odchýlky, koeficientu oscilácie a variácie.

    test, pridané 26.04.2010

    Pojem modus a medián ako typické charakteristiky, poradie a kritériá na ich určenie. Nájdenie módu a mediánu v sérii diskrétnych a intervalových variácií. Kvartily a decily ako dodatočné charakteristiky variačných štatistických radov.

    test, pridané 9.11.2010

    Konštrukcia intervalového radu distribúcie na základe zoskupenia. Charakterizácia odchýlky frekvenčného rozloženia od symetrického tvaru, výpočet ukazovateľov špičatosti a asymetrie. Analýza ukazovateľov súvahy alebo výkazu ziskov a strát.

    kontrolné práce, doplnené 19.10.2014

    Transformácia empirických radov na diskrétne a intervalové. Stanovenie priemernej hodnoty v diskrétnom rade pomocou jeho vlastností. Výpočet diskrétnej série módov, mediánov, variačných ukazovateľov (disperzia, odchýlka, oscilačný koeficient).

    test, pridané 17.04.2011

    Konštrukcia štatistického radu rozloženia organizácií. Grafická definícia hodnoty módu a mediánu. Tesnosť korelácie s použitím koeficientu determinácie. Stanovenie výberovej chyby priemerného počtu zamestnancov.

Ak je skúmaná náhodná premenná spojitá, potom klasifikácia a zoskupenie pozorovaných hodnôt nám často neumožňujú zdôrazniť charakteristické črty variácie jej hodnôt. Vysvetľuje to skutočnosť, že jednotlivé hodnoty náhodnej premennej sa môžu od seba líšiť tak málo, ako je to žiaduce, a preto sa v súhrne pozorovaných údajov zriedkavo môžu vyskytnúť rovnaké hodnoty množstva a frekvencie variantov sa navzájom málo líšia.

Je tiež nepraktické zostaviť diskrétnu sériu pre diskrétnu náhodnú premennú, ktorej počet možných hodnôt je veľký. V takýchto prípadoch by sa malo stavať intervalové variačné série distribúcia.

Na vytvorenie takejto série je celý interval variácií pozorovaných hodnôt náhodnej premennej rozdelený do série čiastkové intervaly a počítanie frekvencie výskytu hodnôt magnitúdy v každom čiastočnom intervale.

Intervalové variačné série nazývaný usporiadaný súbor intervalov variácií hodnôt náhodnej premennej so zodpovedajúcimi frekvenciami alebo relatívnymi frekvenciami zásahov v každej z hodnôt hodnoty.

Na zostavenie intervalovej série potrebujete:

  1. definovať hodnotu čiastočné intervaly;
  2. definovať šírka intervaly;
  3. nastavte pre každý interval to top A nižšia hranica ;
  4. zoskupiť výsledky pozorovania.

1 . O otázke výberu počtu a šírky intervalov zoskupovania je potrebné rozhodnúť v každom konkrétnom prípade na základe Ciele výskum, objem odber vzoriek a stupeň variácie funkcia vo vzorke.

Približný počet intervalov k možno len odhadnúť z veľkosti vzorky n jedným z nasledujúcich spôsobov:

  • podľa vzorca Sturges : k = 1 + 3,32 log n ;
  • pomocou tabuľky 1.

stôl 1

2 . Vo všeobecnosti sú preferované intervaly rovnakej šírky. Na určenie šírky intervalov h vypočítať:

  • rozsah variácií R - vzorové hodnoty: R = x max - x min ,

Kde xmax A xmin - možnosti maximálnej a minimálnej vzorky;

  • šírka každého intervalu h určuje sa podľa nasledujúceho vzorca: h = R/k .

3 . Spodná čiara prvý interval x h1 sa volí tak, aby minimálny vzorový variant xmin klesol približne v strede tohto intervalu: x h1 = x min - 0,5 h .

Intervaly získaná pripočítaním dĺžky čiastkového intervalu ku koncu predchádzajúceho intervalu h :

xhi = xhi-1 + h.

Konštrukcia škály intervalov na základe výpočtu hraníc intervalov pokračuje až do hodnoty x ahoj vyhovuje vzťahu:

x ahoj< x max + 0,5·h .

4 . V súlade so stupnicou intervalov sú hodnoty atribútu zoskupené - pre každý čiastkový interval sa vypočíta súčet frekvencií n i zachytený variant i -tý interval. V tomto prípade interval obsahuje hodnoty náhodnej premennej väčšie alebo rovné dolnej hranici a menšie ako horná hranica intervalu.

Polygón a histogram

Pre prehľadnosť sú zostavené rôzne grafy štatistického rozdelenia.

Na základe údajov diskrétnych variačných radov konštruujeme mnohouholník frekvencie alebo relatívnej frekvencie.

Frekvenčný polygón x 1 ; n 1 ), (x2 ; n 2 ), ..., (x k ; nk ). Na vytvorenie mnohouholníka frekvencií na osi x sú možnosti vyčlenené x i a na osi y - zodpovedajúce frekvencie n i . Body ( x i ; n i ) sú spojené segmentmi priamych čiar a získa sa frekvenčný mnohouholník (obr. 1).

Polygón relatívnej frekvencie sa nazýva lomená čiara, ktorej segmenty spájajú body ( x 1 ; W 1 ), (x2 ; W2 ), ..., (x k ; Wk ). Ak chcete vytvoriť mnohouholník relatívnych frekvencií na úsečke, zrušte možnosti x i a na osi y - im zodpovedajúce relatívne frekvencie Wi . Body ( x i ; Wi ) sú spojené segmentmi priamych čiar a získa sa mnohouholník relatívnych frekvencií.

Kedy súvislá vlastnosť je účelné stavať histogram .

frekvenčný histogram nazývaný stupňovitý útvar pozostávajúci z obdĺžnikov, ktorých základňami sú čiastkové intervaly dĺžky h a výšky sa rovnajú pomeru NIH (hustota frekvencie).

Na vytvorenie histogramu frekvencií sa na os x vynesú čiastočné intervaly a nad nimi sa nakreslia segmenty rovnobežne s osou x vo vzdialenosti NIH .

Pri konštrukcii intervalového distribučného radu sa riešia tri otázky:

  • 1. Koľko intervalov by som mal užívať?
  • 2. Aká je dĺžka intervalov?
  • 3. Aký je postup pri zaraďovaní jednotiek obyvateľstva do hraníc intervalov?
  • 1. Počet intervalov možno určiť podľa Sturgessov vzorec:

2. Dĺžka intervalu alebo krok intervalu, sa zvyčajne určuje podľa vzorca

Kde R- rozsah variácií.

3. Poradie zaradenia jednotiek populácie do hraníc intervalu

môžu byť rôzne, ale pri konštrukcii intervalového radu je rozdelenie nevyhnutne striktne definované.

Napríklad toto: [), v ktorom sú jednotky populácie zahrnuté v dolných hraniciach a nie sú zahrnuté v horných hraniciach, ale sú prenesené do ďalšieho intervalu. Výnimkou z tohto pravidla je posledný interval , ktorého horná hranica zahŕňa posledné číslo zoradeného radu.

Hranice intervalov sú:

  • uzavreté - s dvoma extrémnymi hodnotami atribútu;
  • open - s jednou extrémnou hodnotou atribútu (predtým nejaké číslo resp cez takéto číslo).

Za účelom asimilácie teoretického materiálu uvádzame informácie o pozadí pre riešenia cez úlohy.

Existujú podmienené údaje o priemernom počte manažérov predaja, počte nimi predaných tovarov jednej kvality, individuálnej trhovej cene tohto produktu, ako aj objeme predaja 30 firiem v jednom z regiónov Ruskej federácie v roku prvý štvrťrok vykazovaného roka (tabuľka 2.1).

Tabuľka 2.1

Počiatočné informácie pre prierezovú úlohu

populácia

manažérov

Cena, tisíc rubľov

Objem predaja, milióny rubľov

populácia

manažérov

Množstvo predaného tovaru, ks.

Cena, tisíc rubľov

Objem predaja, milióny rubľov

Na základe prvotných informácií, ale aj doplňujúcich informácií nastavíme jednotlivé úlohy. Následne uvádzame metodiku ich riešenia a samotné riešenia.

Prierezová úloha. Úloha 2.1

Pomocou pôvodnej tabuľky údajov. 2.1 vytvoriť diskrétnu sériu distribúcie firiem podľa počtu predaných tovarov (tabuľka 2.2).

Riešenie:

Tabuľka 2.2

Samostatná séria distribúcie firiem podľa počtu predaných tovarov v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka

Prierezová úloha. Úloha 2.2

požadovaný vytvoriť rad 30 firiem podľa priemerného počtu manažérov.

Riešenie:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

Prierezová úloha. Úloha 2.3

Pomocou pôvodnej tabuľky údajov. 2.1, požadovaný:

  • 1. Zostrojte intervalový rad pre rozdelenie firiem podľa počtu manažérov.
  • 2. Vypočítajte frekvencie distribučných radov firiem.
  • 3. Vyvodiť závery.

Riešenie:

Vypočítajte pomocou Sturgessovho vzorca (2.5) počet intervalov:

Zoberieme teda 6 intervalov (skupín).

Dĺžka intervalu, alebo intervalový krok, vypočítajte podľa vzorca

Poznámka. Poradie zaradenia jednotiek populácie do hraníc intervalu je nasledovné: I), v ktorom sú jednotky populácie zahrnuté v dolných hraniciach a nie sú zahrnuté v horných hraniciach, ale prenášajú sa do ďalšej interval. Výnimkou z tohto pravidla je posledný interval I ], ktorého horná hranica zahŕňa posledné číslo zoradeného radu.

Zostavíme intervalový rad (tabuľka 2.3).

Intervalové rady rozmiestnenia firiem, ale priemerný počet manažérov v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka

Záver. Najpočetnejšou skupinou firiem je skupina s priemerným počtom manažérov 25-30 osôb, do ktorej patrí 8 firiem (27 %); do najmenšej skupiny s priemerným počtom manažérov 40-45 osôb patrí len jedna firma (3%).

Pomocou pôvodnej tabuľky údajov. 2.1, ako aj intervalové rady rozdelenia firiem podľa počtu manažérov (tabuľka 2.3), požadovaný vytvoriť analytické zoskupenie vzťahu medzi počtom manažérov a objemom predaja firiem a na základe toho vyvodiť záver o prítomnosti (alebo neprítomnosti) vzťahu medzi uvedenými znakmi.

Riešenie:

Analytické zoskupovanie je postavené na faktorovom základe. V našom probléme je znak faktora (x) počet manažérov a výsledný znak (y) je objem predaja (tabuľka 2.4).

Poďme teraz stavať analytické zoskupenie(Tabuľka 2.5).

Záver. Na základe údajov konštruovaného analytického zoskupenia možno povedať, že s nárastom počtu manažérov predaja sa zvyšuje aj priemerný objem predaja spoločnosti v skupine, čo naznačuje prítomnosť priameho vzťahu medzi týmito vlastnosťami.

Tabuľka 2.4

Pomocná tabuľka na vytvorenie analytického zoskupenia

Počet manažérov, osôb,

Číslo firmy

Objem predaja, milióny rubľov, y

» = 59 f = 9,97

I-™ 4 - Yu.22

74 '25 1PY1

U 4 = 7 = 10,61

pri = ’ =10,31 30

Tabuľka 2.5

Závislosť objemu predaja od počtu manažérov spoločnosti v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka

KONTROLNÉ OTÁZKY
  • 1. Čo je podstatou štatistického pozorovania?
  • 2. Vymenujte etapy štatistického pozorovania.
  • 3. Aké sú organizačné formy štatistického pozorovania?
  • 4. Vymenujte druhy štatistického pozorovania.
  • 5. Čo je to štatistický súhrn?
  • 6. Vymenujte typy štatistických výkazov.
  • 7. Čo je štatistické zoskupenie?
  • 8. Vymenujte typy štatistických zoskupení.
  • 9. Čo je distribučná séria?
  • 10. Vymenujte konštrukčné prvky distribučného radu.
  • 11. Aký je postup pri zostavovaní distribučnej série?

Sú prezentované vo forme distribučných sérií a sú formátované ako .

Distribučný rad je jedným typom zoskupenia.

Rozsah distribúcie- predstavuje usporiadané rozloženie jednotiek skúmanej populácie do skupín podľa určitého premenlivého atribútu.

V závislosti od znaku, ktorý je základom tvorby distribučnej série, existujú atribútové a variačné distribučné hodnosti:

  • prívlastkový- nazývať distribučné série postavené na kvalitatívnych základoch.
  • Nazývajú sa distribučné série zostavené vo vzostupnom alebo zostupnom poradí hodnôt kvantitatívneho atribútu variačný.
Séria variácií distribúcie pozostáva z dvoch stĺpcov:

Prvý stĺpec obsahuje kvantitatívne hodnoty premennej charakteristiky, ktoré sa nazývajú možnosti a sú označené. Diskrétny variant – vyjadrený ako celé číslo. Možnosť intervalu je v rozsahu od a do. V závislosti od typu variantov je možné zostaviť diskrétny alebo intervalový variačný rad.
Druhý stĺpec obsahuje počet konkrétnych možností vyjadrené ako frekvencie alebo frekvencie:

Frekvencie- sú to absolútne čísla, ktoré ukazujú, koľkokrát sa v súhrne vyskytuje daná hodnota prvku, ktoré označujú . Súčet všetkých frekvencií by sa mal rovnať počtu jednotiek celej populácie.

Frekvencie() sú frekvencie vyjadrené ako percento z celku. Súčet všetkých frekvencií vyjadrený v percentách sa musí rovnať 100 % v zlomkoch jednej.

Grafické znázornenie distribučných radov

Distribučné série sú vizualizované pomocou grafických obrázkov.

Distribučné série sú zobrazené ako:
  • Polygón
  • Histogramy
  • Kumuluje sa
  • ogives

Polygón

Pri konštrukcii mnohouholníka sú na vodorovnej osi (abscisa) vynesené hodnoty premenného atribútu a na zvislej osi (ordináta) - frekvencie alebo frekvencie.

Polygón na obr. 6.1 bola postavená podľa mikrosčítania obyvateľov Ruska v roku 1994.

6.1. Rozdelenie domácností podľa veľkosti

Podmienka: Uvádzajú sa údaje o rozložení 25 zamestnancov jedného z podnikov podľa tarifných kategórií:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Úloha: Zostavte samostatnú variačnú sériu a graficky ju znázornite ako distribučný mnohouholník.
Riešenie:
V tomto príklade sú možnosti mzdovou kategóriou pracovníka. Na určenie frekvencií je potrebné vypočítať počet zamestnancov s príslušnou mzdovou kategóriou.

Polygón sa používa pre série diskrétnych variácií.

Na zostavenie distribučného polygónu (obr. 1) pozdĺž vodorovnej osi (X) vykreslíme kvantitatívne hodnoty rôzneho znaku - varianty a pozdĺž zvislej osi - frekvencie alebo frekvencie.

Ak sú charakteristické hodnoty vyjadrené ako intervaly, potom sa takáto séria nazýva intervalová séria.
intervalové série distribúcie sú zobrazené graficky ako histogram, kumulácia alebo ogive.

Štatistická tabuľka

Podmienka: Údaje o veľkosti vkladov 20 jednotlivcov v jednej banke (tisíc rubľov) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Úloha: Zostavte sériu variácií intervalov s rovnakými intervalmi.
Riešenie:

  1. Počiatočná populácia pozostáva z 20 jednotiek (N = 20).
  2. Pomocou Sturgessovho vzorca určíme potrebný počet použitých skupín: n=1+3,322*lg20=5
  3. Vypočítajme hodnotu rovnakého intervalu: i=(152 - 2) /5 = 30 tisíc rubľov
  4. Počiatočnú populáciu rozdeľujeme do 5 skupín s intervalom 30 000 rubľov.
  5. Výsledky zoskupenia sú uvedené v tabuľke:

Pri takomto zaznamenávaní súvislého znaku, keď sa rovnaká hodnota vyskytne dvakrát (ako horná hranica jedného intervalu a dolná hranica iného intervalu), potom táto hodnota patrí do skupiny, kde táto hodnota pôsobí ako horná hranica.

stĺpcový graf

Na zostavenie histogramu pozdĺž vodorovnej osi označte hodnoty hraníc intervalov a na ich základe vytvorte obdĺžniky, ktorých výška je úmerná frekvenciám (alebo frekvenciám).

Na obr. 6.2. je zobrazený histogram rozloženia obyvateľstva Ruska v roku 1997 podľa vekových skupín.

Ryža. 6.2. Rozdelenie obyvateľstva Ruska podľa vekových skupín

Podmienka: Uvedené je rozdelenie 30 zamestnancov firmy podľa veľkosti mesačnej mzdy

Úloha: Zobrazenie série variácií intervalu graficky ako histogram a sčítanie.
Riešenie:

  1. Neznáma hranica otvoreného (prvého) intervalu je určená hodnotou druhého intervalu: 7000 - 5000 = 2000 rubľov. S rovnakou hodnotou nájdeme spodnú hranicu prvého intervalu: 5000 - 2000 = 3000 rubľov.
  2. Na vytvorenie histogramu v pravouhlom súradnicovom systéme pozdĺž osi x vyčleníme segmenty, ktorých hodnoty zodpovedajú intervalom variantného radu.
    Tieto segmenty slúžia ako spodná základňa a zodpovedajúca frekvencia (frekvencia) slúži ako výška vytvorených obdĺžnikov.
  3. Zostavme si histogram:

Na zostavenie kumulácie je potrebné vypočítať akumulované frekvencie (frekvencie). Sú určené postupným sčítaním frekvencií (frekvencií) predchádzajúcich intervalov a sú označené S. Akumulované frekvencie ukazujú, koľko jednotiek populácie má hodnotu znaku, ktorá nie je väčšia ako tá, o ktorej sa uvažuje.

Kumulovať

Rozdelenie vlastnosti vo variačnom rade podľa akumulovaných frekvencií (frekvencií) je znázornené pomocou kumulácie.

Kumulovať alebo kumulatívna krivka, na rozdiel od polygónu, je postavená na akumulovaných frekvenciách alebo frekvenciách. Súčasne sú hodnoty znaku umiestnené na vodorovnej osi a nahromadené frekvencie alebo frekvencie sú umiestnené na osi y (obr. 6.3).

Ryža. 6.3. Kumulatívne rozdelenie domácností podľa veľkosti

4. Vypočítajte akumulované frekvencie:
Frekvencia kolena prvého intervalu sa vypočíta takto: 0 + 4 = 4, pre druhý: 4 + 12 = 16; pre tretinu: 4 + 12 + 8 = 24 atď.

Pri konštrukcii kumulácie sa akumulovaná frekvencia (frekvencia) zodpovedajúceho intervalu priradí k jeho hornej hranici:

Ogiva

Ogiva je konštruovaný podobne ako kumulácia s jediným rozdielom, že akumulované frekvencie sú umiestnené na osi x a hodnoty vlastností sú umiestnené na osi y.

Obmenou kumulácie je krivka koncentrácie alebo Lorenzov graf. Na vykreslenie koncentračnej krivky sú obe osi pravouhlého súradnicového systému upravené v percentách od 0 do 100. V tomto prípade osi x označujú akumulované frekvencie a osi y znázorňujú akumulované hodnoty podielu (v percent) podľa objemu prvku.

Rovnomerné rozloženie znamienka zodpovedá uhlopriečke štvorca na grafe (obr. 6.4). Pri nerovnomernom rozložení je graf konkávna krivka v závislosti od úrovne koncentrácie znaku.

6.4. koncentračná krivka
KATEGÓRIE

POPULÁRNE ČLÁNKY

2023 "kingad.ru" - ultrazvukové vyšetrenie ľudských orgánov