Zostrojte intervalový distribučný rad. Konštrukcia intervalových variačných sérií pre spojité kvantitatívne údaje

Zoskupovanie- ide o rozdelenie populácie do skupín, ktoré sú homogénne podľa nejakej charakteristiky.

Účel služby. Pomocou online kalkulačky môžete:

  • zostavte sériu variácií, zostavte histogram a polygón;
  • nájsť variačné ukazovatele (priemer, modus (vrátane grafických), medián, variačný rozsah, kvartily, decily, kvartilový diferenciačný koeficient, variačný koeficient a iné ukazovatele);

Inštrukcie. Ak chcete zoskupiť sériu, musíte vybrať typ získanej série variácií (diskrétne alebo intervalové) a uviesť množstvo údajov (počet riadkov). Výsledné riešenie sa uloží do súboru Word (pozri príklad zoskupenia štatistických údajov).

Počet vstupných údajov
",0);">

Ak už bolo zoskupenie vykonané a diskrétne variačné série alebo intervalové série, potom musíte použiť online kalkulačku Variačné indexy. Testovanie hypotézy o type distribúcie sa realizuje pomocou služby Preštudovanie distribučného formulára.

Typy štatistických zoskupení

Variačné série. V prípade pozorovaní diskrétnej náhodnej premennej sa s rovnakou hodnotou možno stretnúť niekoľkokrát. Takéto hodnoty x i náhodnej premennej sú zaznamenané, čo znamená, že n i koľkokrát sa objaví v n pozorovaniach, to je frekvencia tejto hodnoty.
V prípade spojitej náhodnej veličiny sa v praxi používa zoskupovanie.
  1. Typologické zoskupenie- ide o rozdelenie skúmanej kvalitatívne heterogénnej populácie na triedy, sociálno-ekonomické typy, homogénne skupiny jednotiek. Ak chcete vytvoriť toto zoskupenie, použite parameter série diskrétnych variácií.
  2. Zoskupenie sa nazýva štrukturálne, v ktorej je homogénna populácia rozdelená do skupín, ktoré charakterizujú jej štruktúru podľa nejakej meniacej sa charakteristiky. Na vytvorenie tohto zoskupenia použite parameter série intervalov.
  3. Zoskupenie, ktoré odhaľuje vzťahy medzi skúmanými javmi a ich charakteristikami, sa nazýva analytická skupina(pozri analytické zoskupenie sérií).

Princípy konštrukcie štatistických zoskupení

Séria pozorovaní zoradených vo vzostupnom poradí sa nazýva variačná séria. Funkcia zoskupovania je charakteristika, podľa ktorej sa populácia delí na samostatné skupiny. Hovorí sa tomu základ skupiny. Zoskupenie môže byť založené na kvantitatívnych aj kvalitatívnych charakteristikách.
Po určení základu zoskupenia by sa malo rozhodnúť o počte skupín, do ktorých by sa mala skúmaná populácia rozdeliť.

Pri použití osobných počítačov na spracovanie štatistických údajov sa zoskupovanie objektových jednotiek uskutočňuje štandardnými postupmi.
Jeden takýto postup je založený na použití Sturgessovho vzorca na určenie optimálneho počtu skupín:

k = 1+3,322*log(N)

Kde k je počet skupín, N je počet jednotiek populácie.

Dĺžka čiastkových intervalov sa vypočíta ako h=(x max -x min)/k

Potom sa spočítajú počty pozorovaní spadajúce do týchto intervalov, ktoré sa berú ako frekvencie n i . Málo frekvencií, ktorých hodnoty sú menšie ako 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Stredné hodnoty intervalov x i =(c i-1 +c i)/2 sa berú ako nové hodnoty.

Odoslanie dobrej práce do databázy znalostí je jednoduché. Použite nižšie uvedený formulár

Študenti, postgraduálni študenti, mladí vedci, ktorí pri štúdiu a práci využívajú vedomostnú základňu, vám budú veľmi vďační.

Uverejnené dňa http://www.allbest.ru/

ÚLOHA1

K dispozícii sú nasledujúce údaje o mzdách zamestnancov v podniku:

Tabuľka 1.1

Výška mzdy v konvenčnom vyjadrení. Brloh. Jednotky

Je potrebné skonštruovať intervalový distribučný rad, podľa ktorého sa má nájsť;

1) priemerná mzda;

2) priemerná lineárna odchýlka;

4) štandardná odchýlka;

5) rozsah variácií;

6) koeficient oscilácie;

7) lineárny variačný koeficient;

8) jednoduchý variačný koeficient;

10) medián;

11) koeficient asymetrie;

12) Pearsonov index asymetrie;

13) koeficient špičatosti.

Riešenie

Ako viete, možnosti (rozpoznané hodnoty) sú usporiadané vo vzostupnom poradí diskrétne variačné série. S veľkým počtom možnosť (viac ako 10), aj v prípade diskrétnej variácie sa zostavujú intervalové rady.

Ak je intervalový rad zostavený s párnymi intervalmi, potom sa rozsah variácie vydelí určeným počtom intervalov. Navyše, ak je výsledná hodnota celé číslo a je jednoznačná (čo je zriedkavé), potom sa predpokladá, že dĺžka intervalu sa rovná tomuto číslu. V iných prípadoch vyrobené zaokrúhľovanie Nevyhnutne V strane zvýšiť, Takže do posledná zostávajúca číslica bola párna. Je zrejmé, že ako sa dĺžka intervalu zvyšuje, rozsah variácie o hodnotu rovnajúcu sa súčinu počtu intervalov: o rozdiel medzi vypočítanou a počiatočnou dĺžkou intervalu

A) Ak je veľkosť rozšírenia rozsahu variácie nevýznamná, potom sa buď pripočíta k najväčšej alebo odpočíta od najmenšej hodnoty charakteristiky;

b) Ak je viditeľná veľkosť rozšírenia rozsahu variácie, potom, aby sa predišlo zámene stredu rozsahu, rozdelí sa zhruba na polovicu súčasným pripočítaním k najväčším a odčítaním od najmenších hodnôt charakteristika.

Ak sa zostavuje intervalový rad s nerovnakými intervalmi, tak sa proces zjednoduší, no aj tak treba dĺžku intervalov vyjadriť ako číslo s poslednou párnou číslicou, čo značne zjednodušuje následné výpočty číselných charakteristík.

30 je veľkosť vzorky.

Vytvorme intervalový distribučný rad pomocou Sturgesovho vzorca:

K = 1 + 3,32 x log n,

K - počet skupín;

K = 1 + 3,32 x lg30 = 5,91 = 6

Pomocou vzorca zistíme rozsah atribútu - mzdy pracovníkov v podniku - (x).

R= xmax - xmin a deliť 6; R = 195-112 = 83

Potom bude dĺžka intervalu l dráha = 83:6 = 13,83

Začiatok prvého intervalu bude 112. Pridáva sa k 112 l ras = 13,83, dostaneme jeho konečnú hodnotu 125,83, čo je zároveň začiatok druhého intervalu atď. koniec piateho intervalu - 195.

Pri hľadaní frekvencií by sme sa mali riadiť pravidlom: „ak sa hodnota funkcie zhoduje s hranicou vnútorného intervalu, mala by sa pripísať predchádzajúcemu intervalu“.

Získame intervalový rad frekvencií a kumulatívnu frekvenciu.

Tabuľka 1.2

Mzdu teda majú 3 zamestnanci. poplatok od 112 do 125,83 konvenčných peňažných jednotiek. Najvyšší plat poplatok od 181,15 do 195 konvenčných peňažných jednotiek. len 6 zamestnancov.

Na výpočet numerických charakteristík transformujeme intervalový rad na diskrétny rad, pričom ako možnosť berieme stred intervalov:

Tabuľka 1.3

14131,83

Použitie vzorca váženého aritmetického priemeru

konvenčné peňažné jednotky

Priemerná lineárna odchýlka:

kde xi je hodnota sledovanej charakteristiky pre i-tú jednotku populácie,

Priemerná hodnota študovaného znaku.

Uverejnené dňa http://www.allbest.ru/

LPoslané dňa http://www.allbest.ru/

Konvenčné peňažné jednotky

štandardná odchýlka:

Rozptyl:

Relatívny rozsah variácie (koeficient oscilácie): c= R:,

Relatívna lineárna odchýlka: q = L:

Variačný koeficient: V = y:

Koeficient oscilácie ukazuje relatívne kolísanie extrémnych hodnôt charakteristiky okolo aritmetického priemeru a koeficient variácie charakterizuje stupeň a homogenitu populácie.

c= R: = 83 / 159,485 x 100 % = 52,043 %

Rozdiel medzi extrémnymi hodnotami je teda o 5,16% (=94,84%-100%) menší ako priemerná mzda zamestnancov v podniku.

q = L: = 17,765/ 159,485 * 100 % = 11,139 %

V = y: = 21,704/ 159,485 * 100 % = 13,609 %

Variačný koeficient je menší ako 33 %, čo naznačuje slabé kolísanie miezd pracovníkov v podniku, t.j. že priemerná hodnota je typickou charakteristikou miezd pracovníkov (obyvateľstvo je homogénne).

V intervalových distribučných radoch móda určený vzorcom -

Frekvencia modálneho intervalu, t. j. intervalu obsahujúceho najväčší počet možností;

Frekvencia intervalu pred modálom;

Frekvencia intervalu nasledujúceho po spôsobe;

Dĺžka modálneho intervalu;

Spodná hranica modálneho intervalu.

Na určenie mediány v intervalovom rade používame vzorec

kde je kumulatívna (akumulovaná) frekvencia intervalu predchádzajúceho mediánu;

Dolná hranica stredného intervalu;

Stredná intervalová frekvencia;

Dĺžka stredného intervalu.

Stredný interval- interval, ktorého akumulovaná frekvencia (=3+3+5+7) presahuje polovicu súčtu frekvencií - (153,49; 167,32).

Vypočítajme asymetriu a špičatosť, pre ktoré vytvoríme nový pracovný hárok:

Tabuľka 1.4

Faktické údaje

Vypočítané údaje

Vypočítajme moment tretieho rádu

Preto sa asymetria rovná

Od 0,3553 0,25 sa asymetria považuje za významnú.

Vypočítajme moment štvrtého rádu

Preto sa špičatosť rovná

Pretože< 0, то эксцесс является плосковершинным.

Stupeň asymetrie možno určiť pomocou Pearsonovho koeficientu asymetrie (As): oscilácia hodnota vzorky obrat

kde je aritmetický priemer distribučného radu; -- móda; -- štandardná odchýlka.

Pri symetrickom (normálnom) rozdelení = Mo je teda koeficient asymetrie nulový. Ak As > 0, potom existuje viac módov, preto existuje pravotočivá asymetria.

Ak As< 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.

Rozloženie nie je symetrické, ale má ľavostrannú asymetriu.

ÚLOHA 2

Aká by mala byť veľkosť vzorky, aby s pravdepodobnosťou 0,954 výberová chyba nepresiahla 0,04, ak je na základe predchádzajúcich prieskumov známe, že rozptyl je 0,24?

Riešenie

Veľkosť vzorky pre neopakované vzorkovanie sa vypočíta pomocou vzorca:

t - koeficient spoľahlivosti (s pravdepodobnosťou 0,954 sa rovná 2,0; určený z tabuliek integrálov pravdepodobnosti),

y2 = 0,24 - štandardná odchýlka;

10 000 ľudí - veľkosť vzorky;

Dx =0,04 - maximálna chyba priemeru vzorky.

S pravdepodobnosťou 95,4 % je možné konštatovať, že veľkosť vzorky zabezpečujúca relatívnu chybu najviac 0,04 by mala byť aspoň 566 rodín.

ÚLOHA3

K dispozícii sú nasledujúce údaje o príjmoch z hlavných činností podniku, milióny rubľov.

Ak chcete analyzovať sériu dynamiky, určte nasledujúce ukazovatele:

1) reťaz a základné:

Absolútne zvýšenie;

miery rastu;

Tempo rastu;

2) priemer

Úroveň riadku dynamiky;

Absolútny nárast;

Tempo rastu;

Miera nárastu;

3) absolútna hodnota zvýšenia o 1 %.

Riešenie

1. Absolútny nárast (Dy)- toto je rozdiel medzi ďalšou úrovňou série a predchádzajúcou (alebo základnou):

reťazec: DN = yi - yi-1,

základné: DN = yi - y0,

уi - úroveň riadkov,

i - číslo úrovne riadku,

y0 - úroveň základného roka.

2. Miera rastu (Tu) je pomer nasledujúcej úrovne série a predchádzajúcej úrovne (alebo základného roku 2001):

reťazec: Tu = ;

základné: Tu =

3. Rýchlosť rastu (TD) je pomer absolútneho rastu k predchádzajúcej úrovni, vyjadrený v %.

reťazec: Tu = ;

základné: Tu =

4. Absolútna hodnota zvýšenia o 1 % (A)- ide o pomer absolútneho rastu reťazca k rýchlosti rastu, vyjadrený v %.

A =

Priemerná úroveň riadkov vypočítané pomocou vzorca aritmetického priemeru.

Priemerná úroveň príjmu z hlavných činností za 4 roky:

Priemerný absolútny nárast vypočítané podľa vzorca:

kde n je počet úrovní série.

V priemere za rok vzrástli príjmy z hlavných činností o 3,333 milióna rubľov.

Priemerná ročná miera rastu vypočítané pomocou geometrického priemeru:

уn je posledná úroveň riadku,

y0 je počiatočná úroveň série.

Tu = 100 % = 102,174 %

Priemerná ročná miera rastu vypočítané podľa vzorca:

T? = Tu - 100 % = 102,74 % - 100 % = 2,74 %.

V priemere za rok sa tak výnosy z hlavnej činnosti podniku zvýšili o 2,74 %.

ÚLOHYA4

Vypočítať:

1. Individuálne cenové indexy;

2. Index všeobecného obchodného obratu;

3. Súhrnný cenový index;

4. Súhrnný index fyzického objemu predaja tovaru;

5. Rozčleniť absolútny nárast hodnoty obchodného obratu podľa faktorov (v dôsledku zmien cien a počtu predaných tovarov);

6. Vyvodiť stručné závery o všetkých získaných ukazovateľoch.

Riešenie

1. Jednotlivé cenové indexy produktov A, B, C podľa podmienky predstavovali -

ipA = 1,20; iрБ=1,15; iрВ = 1,00.

2. Všeobecný index obchodného obratu vypočítame pomocou vzorca:

I w = = 1470/1045*100 % = 140,67 %

Obchodný obrat vzrástol o 40,67 % (140,67 % -100 %).

V priemere ceny komodít vzrástli o 10,24 %.

Výška dodatočných nákladov kupujúcich zo zvýšenia ceny:

w(p) = ? p1q1 - ? p0q1 = 1470 - 1333,478 = 136,522 milióna rubľov.

V dôsledku rastúcich cien museli kupujúci minúť ďalších 136,522 milióna rubľov.

4. Všeobecný index fyzického objemu obchodného obratu:

Fyzický objem obchodného obratu vzrástol o 27,61 %.

5. Stanovme celkovú zmenu obchodného obratu v druhom období v porovnaní s prvým obdobím:

w = 1470-1045 = 425 miliónov rubľov.

z dôvodu zmeny cien:

W(p) = 1470 - 1333,478 = 136,522 milióna rubľov.

v dôsledku zmien fyzického objemu:

w(q) = 1333,478 - 1045 = 288,478 milióna rubľov.

Tržby za tovar vzrástli o 40,67 %. Ceny v priemere za 3 tovary vzrástli o 10,24 %. Fyzický objem obchodného obratu vzrástol o 27,61 %.

Vo všeobecnosti sa objem predaja zvýšil o 425 miliónov rubľov, a to aj v dôsledku rastúcich cien o 136,522 milióna rubľov a v dôsledku zvýšenia objemu predaja o 288,478 milióna rubľov.

ÚLOHA5

Nasledujúce údaje sú dostupné pre 10 tovární v jednom odvetví.

Číslo rastliny

Výstup produktu, tisíc kusov. (X)

Na základe uvedených údajov:

I) potvrdiť ustanovenia logickej analýzy o prítomnosti lineárnej korelácie medzi faktorovou charakteristikou (objem produktu) a výslednou charakteristikou (spotreba elektriny), vykresliť počiatočné údaje do grafu korelačného poľa a vyvodiť závery o tvare vzťahu, uveďte jeho vzorec;

2) určiť parametre rovnice spojenia a vyniesť výslednú teoretickú čiaru do grafu korelačného poľa;

3) vypočítajte koeficient lineárnej korelácie,

4) vysvetliť význam ukazovateľov získaných v odsekoch 2) a 3);

5) pomocou výsledného modelu urobte predpoveď o možnej spotrebe energie v závode s objemom výroby 4,5 tisíc kusov.

Riešenie

Údaj atribútu - objem výroby (faktor), bude označený xi; znak - spotreba elektriny (výsledok) cez yi; body so súradnicami (x, y) sú vynesené do korelačného poľa OXY.

Body korelačného poľa sú umiestnené pozdĺž určitej priamky. Vzťah je teda lineárny, budeme hľadať regresnú rovnicu v tvare priamky Уx=ax+b. Aby sme to našli, používame systém normálnych rovníc:

Vytvorme si výpočtovú tabuľku.

Pomocou zistených priemerov zostavíme systém a vyriešime ho s ohľadom na parametre a a b:

Takže dostaneme regresnú rovnicu pre y na x: = 3,57692 x + 3,19231

Na korelačnom poli postavíme regresnú priamku.

Dosadením hodnôt x zo stĺpca 2 do regresnej rovnice získame vypočítané hodnoty (stĺpec 7) a porovnáme ich s údajmi y, čo sa odráža v stĺpci 8. Mimochodom, správnosť výpočtov potvrdzuje zhoda priemerných hodnôt y a.

Koeficientlineárna korelácia vyhodnocuje tesnosť vzťahu medzi charakteristikami x a y a vypočíta sa pomocou vzorca

Uhlový koeficient priamej regresie a (v x) charakterizuje smer identifikovanéhozávislostiznaky: pre a>0 sú rovnaké, pre a<0- противоположны. Jeho absolútna hodnota - miera zmeny výslednej charakteristiky, keď sa charakteristika faktora zmení o jednotku merania.

Voľný člen priamej regresie odhaľuje smer a jeho absolútna hodnota je kvantitatívnou mierou vplyvu všetkých ostatných faktorov na výslednú charakteristiku.

Ak< 0, potom sa zdroj faktora charakteristické pre individuálny objekt používa s menším množstvom a kedy>0 svyššia účinnosť ako je priemer pre celý súbor objektov.

Urobme postregresnú analýzu.

Koeficient pri x priamej regresie je rovný 3,57692 >0, preto s nárastom (poklesom) výrobného výkonu rastie (klesá) spotreba elektriny. Zvýšenie produkcie o 1 tisíc kusov. udáva priemerný nárast spotreby elektriny o 3,57692 tisíc kWh.

2. Voľný člen priamej regresie je rovný 3,19231, teda vplyvom ostatných faktorov sa vplyv výkonu produktu na spotrebu elektriny v absolútnom vyjadrení zvýši o 3,19231 tis. kWh.

3. Korelačný koeficient 0,8235 odhaľuje veľmi úzku závislosť spotreby elektriny od výkonu produktu.

Je ľahké robiť predpovede pomocou rovnice regresného modelu. Na tento účel sa do regresnej rovnice dosadia hodnoty x - objem výroby a predpovedá sa spotreba elektriny. V tomto prípade môžu byť hodnoty x prijaté nielen v rámci daného rozsahu, ale aj mimo neho.

Urobme predpoveď o možnej spotrebe energie v závode s objemom výroby 4,5 tisíc kusov.

3,57692*4,5 + 3,19231= 19,288 45 tisíc kWh.

ZOZNAM POUŽITÝCH ZDROJOV

1. Zacharenkov S.N. Sociálno-ekonomická štatistika: Učebnica a praktická príručka. -Mn.: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumyantsev V.N. Všeobecná teória štatistiky. - M.: INFRA - M., 2000.

3. Eliseeva I.I. Štatistiky. - M.: Prospekt, 2002.

4. Všeobecná teória štatistiky / Pod všeobecný. vyd. O.E. Bashina, A.A. Spirina. - M.: Financie a štatistika, 2000.

5. Sociálno-ekonomická štatistika: Vzdelávacia a praktická. príspevok / Zacharenkov S.N. a ďalšie - Mn.: Jerevanská štátna univerzita, 2004.

6. Sociálno-ekonomická štatistika: Učebnica. príspevok. / Ed. Nesterovič S.R. - Mn.: BSEU, 2003.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Statistics. - Minsk, 2000.

8. Charčenko L.P. Štatistiky. - M.: INFRA - M, 2002.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. Štatistiky. - M.: INFRA - M, 1999.

10. Ekonomická štatistika / Ed. Yu.N. Ivanova - M., 2000.

Uverejnené na Allbest.ru

...

Podobné dokumenty

    Výpočet aritmetického priemeru pre intervalový distribučný rad. Stanovenie všeobecného indexu fyzického objemu obchodného obratu. Analýza absolútnej zmeny celkových výrobných nákladov v dôsledku zmien fyzického objemu. Výpočet variačného koeficientu.

    test, pridané 19.07.2010

    Podstata veľkoobchodu, maloobchodu a verejného obchodu. Vzorce na výpočet individuálnych a súhrnných indexov obratu. Výpočet charakteristík intervalového distribučného radu - aritmetický priemer, modus a medián, variačný koeficient.

    kurzová práca, pridané 05.10.2013

    Výpočet plánovaného a skutočného objemu predaja, percento plnenia plánu, absolútna zmena obratu. Stanovenie absolútneho rastu, priemerných temp rastu a nárastu peňažných príjmov. Výpočet štrukturálnych priemerov: mody, mediány, kvartily.

    test, pridané 24.02.2012

    Intervalové rady rozdelenia bánk podľa objemu zisku. Zistenie módu a mediánu výsledných intervalových distribučných radov pomocou grafickej metódy a výpočtov. Výpočet charakteristík intervalových distribučných radov. Výpočet aritmetického priemeru.

    test, pridaný 15.12.2010

    Vzorce na určenie priemerných hodnôt intervalového radu - režimy, mediány, disperzia. Výpočet analytických ukazovateľov dynamických radov pomocou reťazových a základných schém, rýchlostí rastu a prírastkov. Koncept konsolidovaného indexu nákladov, cien, nákladov a obratu.

    kurzová práca, pridané 27.02.2011

    Koncepcia a účel, poradie a pravidlá pre zostavenie série variácií. Analýza homogenity údajov v skupinách. Indikátory variácie (kolísania) vlastnosti. Stanovenie priemernej lineárnej a štvorcovej odchýlky, koeficientu oscilácie a variácie.

    test, pridané 26.04.2010

    Pojem modus a medián ako typické charakteristiky, poradie a kritériá na ich určenie. Nájdenie módu a mediánu v diskrétnych a intervalových variačných sériách. Kvartily a decily ako dodatočné charakteristiky variačných štatistických radov.

    test, pridané 9.11.2010

    Konštrukcia intervalového distribučného radu na základe zoskupovacích charakteristík. Charakteristika odchýlky frekvenčného rozloženia od symetrického tvaru, výpočet ukazovateľov špičatosti a asymetrie. Analýza ukazovateľov súvahy alebo výkazu ziskov a strát.

    test, pridaný 19.10.2014

    Prevod empirických radov na diskrétne a intervalové. Stanovenie priemernej hodnoty pre diskrétny rad pomocou jeho vlastností. Výpočet pomocou diskrétnej série režimov, mediánu, variačných indikátorov (rozptyl, odchýlka, oscilačný koeficient).

    test, pridané 17.04.2011

    Konštrukcia štatistického radu rozloženia organizácií. Grafické určenie hodnôt módu a mediánu. Tesnosť korelácie pomocou koeficientu determinácie. Stanovenie výberovej chyby priemerného počtu zamestnancov.

Ak je skúmaná náhodná premenná spojitá, potom klasifikácia a zoskupovanie pozorovaných hodnôt často neumožňuje identifikovať charakteristické črty variácie jej hodnôt. Vysvetľuje to skutočnosť, že jednotlivé hodnoty náhodnej premennej sa môžu od seba líšiť tak málo, ako je to žiaduce, a preto sa v súhrne pozorovaných údajov zriedkavo môžu vyskytnúť rovnaké hodnoty množstva a frekvencie varianty sa od seba málo líšia.

Je tiež nepraktické zostaviť diskrétnu sériu pre diskrétnu náhodnú premennú, ktorej počet možných hodnôt je veľký. V takýchto prípadoch by ste mali stavať intervalové variačné série distribúcie.

Na vytvorenie takejto série je celý interval variácií pozorovaných hodnôt náhodnej premennej rozdelený do série čiastkové intervaly a počítanie frekvencie výskytu hodnôt hodnôt v každom čiastočnom intervale.

Intervalové variačné série volajte usporiadanú množinu intervalov rôznych hodnôt náhodnej premennej so zodpovedajúcimi frekvenciami alebo relatívnymi frekvenciami hodnôt premennej, ktoré spadajú do každej z nich.

Na zostavenie intervalovej série potrebujete:

  1. definovať veľkosť čiastočné intervaly;
  2. definovať šírka intervaly;
  3. nastavte ho pre každý interval top A nižší limit ;
  4. zoskupte výsledky pozorovania.

1 . O otázke výberu počtu a šírky intervalov zoskupovania je potrebné rozhodnúť v každom konkrétnom prípade na základe Ciele výskum, objem vzorky a stupeň variácie charakteristika vo vzorke.

Približný počet intervalov k možno odhadnúť len na základe veľkosti vzorky n jedným z nasledujúcich spôsobov:

  • podľa vzorca Sturges : k = 1 + 3,32 log n ;
  • pomocou tabuľky 1.

stôl 1

2 . Vo všeobecnosti sú preferované priestory rovnakej šírky. Na určenie šírky intervalov h vypočítať:

  • rozsah variácií R - vzorové hodnoty: R = x max - x min ,

Kde xmax A xmin - možnosti maximálneho a minimálneho odberu vzoriek;

  • šírka každého intervalu h určuje sa podľa nasledujúceho vzorca: h = R/k .

3 . Spodná čiara prvý interval x h1 je zvolená tak, že možnosť minimálnej vzorky xmin klesol približne v strede tohto intervalu: x h1 = x min - 0,5 h .

Stredné intervaly získaná pripočítaním dĺžky čiastkového intervalu ku koncu predchádzajúceho intervalu h :

x hi = x hi-1 + h.

Konštrukcia intervalovej stupnice na základe výpočtu hraníc intervalov pokračuje až do hodnoty x ahoj vyhovuje vzťahu:

x ahoj< x max + 0,5·h .

4 . V súlade s intervalovou stupnicou sú charakteristické hodnoty zoskupené - pre každý čiastkový interval sa vypočíta súčet frekvencií n i možnosť zahrnutá v i interval. V tomto prípade interval zahŕňa hodnoty náhodnej premennej, ktoré sú väčšie alebo rovné dolnej hranici a menšie ako horná hranica intervalu.

Polygón a histogram

Pre prehľadnosť sú zostavené rôzne štatistické grafy rozdelenia.

Na základe údajov zo série diskrétnych variácií sa konštruujú mnohouholník frekvencie alebo relatívnej frekvencie.

Frekvenčný polygón x 1 ; n 1 ), (x 2 ; n 2 ), ..., (x k ; n k ). Na vytvorenie frekvenčného mnohouholníka sú možnosti vynesené na osi x. x i a na zvislej osi - zodpovedajúce frekvencie n i . Body ( x i ; n i ) sú spojené priamymi segmentmi a získa sa frekvenčný mnohouholník (obr. 1).

Mnohouholník relatívnych frekvencií nazývaná prerušovaná čiara, ktorej segmenty spájajú body ( x 1 ; W 1 ), (x 2 ; W 2 ), ..., (x k ; Wk ). Na vytvorenie mnohouholníka relatívnych frekvencií sú možnosti vynesené na osi x x i a na zvislej osi - zodpovedajúce relatívne frekvencie W i . Body ( x i ; W i ) sú spojené priamymi segmentmi a získa sa mnohouholník relatívnych frekvencií.

Kedy súvislý znak je vhodné postaviť histogram .

Histogram frekvencie nazývaný stupňovitý útvar pozostávajúci z obdĺžnikov, ktorých základňami sú čiastkové intervaly dĺžky h a výšky sa rovnajú pomeru NIH (hustota frekvencie).

Na zostavenie frekvenčného histogramu sa na os x rozložia čiastkové intervaly a nad nimi sa v určitej vzdialenosti nakreslia segmenty rovnobežné s osou x. NIH .

Pri konštrukcii intervalového distribučného radu sú vyriešené tri otázky:

  • 1. Koľko intervalov mám užívať?
  • 2. Aká je dĺžka intervalov?
  • 3. Aký je postup pri zaraďovaní jednotiek obyvateľstva do hraníc intervalov?
  • 1. Počet intervalov možno určiť podľa Sturgessov vzorec:

2. Dĺžka intervalu alebo krok intervalu, zvyčajne určený vzorcom

Kde R- rozsah variácií.

3. Poradie zaradenia jednotiek populácie v rámci hraníc intervalu

môžu byť rôzne, ale pri konštrukcii intervalového radu musí byť rozdelenie striktne definované.

Napríklad toto: [), v ktorom sú populačné jednotky zahrnuté v dolných hraniciach, ale nie sú zahrnuté v horných hraniciach, ale sú prenesené do ďalšieho intervalu. Výnimkou z tohto pravidla je posledný interval, ktorého horná hranica zahŕňa posledné číslo hodnotenej série.

Hranice intervalov sú:

  • uzavreté - s dvoma extrémnymi hodnotami atribútu;
  • open - s jednou extrémnou hodnotou atribútu (predtým taký a taký počet resp cez také a také číslo).

Za účelom asimilácie teoretického materiálu uvádzame informácie o pozadí pre riešenia end-to-end úloha.

Existujú podmienené údaje o priemernom počte manažérov predaja, množstve nimi predávaného podobného tovaru, individuálnej trhovej cene tohto produktu, ako aj objeme predaja 30 spoločností v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka (tabuľka 2.1).

Tabuľka 2.1

Počiatočné informácie pre prierezovú úlohu

číslo

manažéri,

Cena, tisíc rubľov

Objem predaja, milióny rubľov.

číslo

manažéri,

Množstvo predaného tovaru, ks.

Cena, tisíc rubľov

Objem predaja, milióny rubľov.

Na základe prvotných informácií, ale aj doplňujúcich informácií nastavíme jednotlivé úlohy. Následne predstavíme metodiku ich riešenia a samotné riešenia.

Prierezová úloha. Úloha 2.1

Použitie počiatočných údajov z tabuľky. 2.1 zostrojiť diskrétnu sériu rozdelenia firiem podľa množstva predaného tovaru (tabuľka 2.2).

Riešenie:

Tabuľka 2.2

Samostatné série distribúcie firiem podľa množstva predaného tovaru v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka

Prierezová úloha. Úloha 2.2

požadovaný zostaviť zoradený rad 30 firiem podľa priemerného počtu manažérov.

Riešenie:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

Prierezová úloha. Úloha 2.3

Použitie počiatočných údajov z tabuľky. 2.1, požadovaný:

  • 1. Zostrojte intervalový rad rozmiestnenia firiem podľa počtu manažérov.
  • 2. Vypočítajte frekvencie distribučných radov firiem.
  • 3. Vyvodiť závery.

Riešenie:

Vypočítajme pomocou Sturgessovho vzorca (2.5) počet intervalov:

Zoberieme teda 6 intervalov (skupín).

Dĺžka intervalu, alebo intervalový krok, vypočítajte pomocou vzorca

Poznámka. Poradie zaraďovania populačných jednotiek do hraníc intervalu je nasledovné: I), v ktorom populačné jednotky sú zahrnuté v dolných hraniciach, ale nie sú zahrnuté v horných hraniciach, ale sú prenesené do ďalšieho intervalu. Výnimkou z tohto pravidla je posledný interval I ], ktorého horná hranica zahŕňa posledné číslo zoradeného radu.

Zostavíme intervalový rad (tabuľka 2.3).

Intervalová séria distribúcie firiem a priemerný počet manažérov v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka

Záver. Najväčšiu skupinu firiem tvorí skupina s priemerným počtom manažérov 25 – 30 osôb, do ktorej patrí 8 firiem (27 %); Do najmenšej skupiny s priemerným počtom manažérov 40 – 45 osôb patrí len jedna firma (3 %).

Použitie počiatočných údajov z tabuľky. 2.1, ako aj intervalový rad rozdelenia firiem podľa počtu manažérov (tabuľka 2.3), požadovaný vybudovať analytické zoskupenie vzťahu medzi počtom manažérov a objemom predaja firiem a na základe toho vyvodiť záver o prítomnosti (alebo absencii) vzťahu medzi týmito charakteristikami.

Riešenie:

Analytické zoskupovanie je založené na faktorových charakteristikách. V našom probléme je faktorová charakteristika (x) počet manažérov a výsledná charakteristika (y) je objem predaja (tabuľka 2.4).

Poďme teraz stavať analytické zoskupenie(Tabuľka 2.5).

Záver. Na základe údajov vybudovaného analytického zoskupenia môžeme povedať, že s nárastom počtu obchodných manažérov sa zvyšuje aj priemerný objem predaja spoločnosti v skupine, čo naznačuje prítomnosť priameho spojenia medzi týmito charakteristikami.

Tabuľka 2.4

Pomocná tabuľka na zostavenie analytického zoskupenia

Počet manažérov, ľudí,

Číslo firmy

Objem predaja, milióny rubľov, y

" = 59 f = 9,97

I-™ 4 - Yu.22

74 '25 1PY1

U 4 = 7 = 10,61

pri = ’ =10,31 30

Tabuľka 2.5

Závislosť objemu predaja od počtu manažérov spoločnosti v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka

KONTROLNÉ OTÁZKY
  • 1. Čo je podstatou štatistického pozorovania?
  • 2. Vymenujte etapy štatistického pozorovania.
  • 3. Aké sú organizačné formy štatistického pozorovania?
  • 4. Vymenujte druhy štatistického pozorovania.
  • 5. Čo je to štatistický súhrn?
  • 6. Vymenujte typy štatistických výkazov.
  • 7. Čo je štatistické zoskupovanie?
  • 8. Vymenujte typy štatistických zoskupení.
  • 9. Čo je distribučná séria?
  • 10. Vymenujte konštrukčné prvky rozvodného radu.
  • 11. Aký je postup pri zostavovaní distribučnej série?

Sú prezentované vo forme distribučných sérií a sú prezentované vo forme.

Distribučný rad je jedným z typov zoskupení.

Rozsah distribúcie— predstavuje usporiadanú distribúciu jednotiek skúmanej populácie do skupín podľa určitej meniacej sa charakteristiky.

V závislosti od charakteristiky, ktorá je základom tvorby distribučného radu, sa rozlišujú atribútové a variačné distribučné riadky:

  • Prívlastkový- sa nazývajú distribučné rady konštruované podľa kvalitatívnych charakteristík.
  • Nazývajú sa distribučné série konštruované vo vzostupnom alebo zostupnom poradí hodnôt kvantitatívnej charakteristiky variačný.
Séria variácií distribúcie pozostáva z dvoch stĺpcov:

Prvý stĺpec poskytuje kvantitatívne hodnoty meniacej sa charakteristiky, ktoré sa nazývajú možnosti a sú určené. Diskrétna možnosť - vyjadrená ako celé číslo. Možnosť intervalu sa pohybuje od a do. V závislosti od typu možností môžete vytvoriť sériu diskrétnych alebo intervalových variácií.
Druhý stĺpec obsahuje počet konkrétnych možností vyjadrené ako frekvencie alebo frekvencie:

Frekvencie- sú to absolútne čísla, ktoré ukazujú, koľkokrát sa daná hodnota charakteristiky vyskytuje v súhrne, ktoré označujú . Súčet všetkých frekvencií sa musí rovnať počtu jednotiek v celej populácii.

Frekvencie() sú frekvencie vyjadrené ako percento z celku. Súčet všetkých frekvencií vyjadrený v percentách sa musí rovnať 100 % v zlomkoch jednej.

Grafické znázornenie distribučných sérií

Distribučné série sú vizuálne prezentované pomocou grafických obrázkov.

Distribučné série sú zobrazené ako:
  • Polygón
  • Histogramy
  • Kumuluje sa
  • Ogives

Polygón

Pri konštrukcii mnohouholníka sa hodnoty meniacej sa charakteristiky vynesú na vodorovnú os (os x) a frekvencie alebo frekvencie sa vynesú na zvislú os (os y).

Polygón na obr. 6.1 vychádza z údajov z mikrosčítania obyvateľov Ruska v roku 1994.

6.1. Distribúcia veľkosti domácností

Podmienka: Uvádzajú sa údaje o rozdelení 25 zamestnancov jedného z podnikov podľa tarifných kategórií:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Úloha: Zostrojte diskrétnu sériu variácií a graficky ju znázornite ako distribučný mnohouholník.
Riešenie:
V tomto príklade sú možnosťami platová trieda zamestnanca. Na určenie frekvencií je potrebné vypočítať počet zamestnancov s príslušnou tarifnou kategóriou.

Polygón sa používa pre série diskrétnych variácií.

Na vytvorenie distribučného polygónu (obrázok 1) vykreslíme kvantitatívne hodnoty rôznych charakteristík - variantov - pozdĺž osi x (X) a frekvencie alebo frekvencie pozdĺž osi y.

Ak sú hodnoty charakteristiky vyjadrené vo forme intervalov, potom sa takýto rad nazýva interval.
Intervalové série distribúcie sú znázornené graficky vo forme histogramu, kumulácie alebo ogive.

Štatistická tabuľka

Podmienka: Poskytujú sa údaje o veľkosti vkladov 20 jednotlivcov v jednej banke (tisíc rubľov) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Úloha: Zostrojte intervalový variačný rad s rovnakými intervalmi.
Riešenie:

  1. Počiatočná populácia pozostáva z 20 jednotiek (N = 20).
  2. Pomocou Sturgessovho vzorca určíme potrebný počet použitých skupín: n=1+3,322*lg20=5
  3. Vypočítajme hodnotu rovnakého intervalu: i=(152 - 2) /5 = 30 tisíc rubľov
  4. Rozdeľme počiatočnú populáciu do 5 skupín s intervalom 30 tisíc rubľov.
  5. Výsledky zoskupenia uvádzame v tabuľke:

Pri takomto zaznamenávaní spojitej charakteristiky, keď sa rovnaká hodnota vyskytuje dvakrát (ako horná hranica jedného intervalu a dolná hranica iného intervalu), potom táto hodnota patrí do skupiny, kde táto hodnota pôsobí ako horná hranica.

stĺpcový graf

Na zostavenie histogramu sú hodnoty hraníc intervalov vyznačené pozdĺž osi x a na základe nich sú zostavené obdĺžniky, ktorých výška je úmerná frekvenciám (alebo frekvenciám).

Na obr. 6.2. ukazuje histogram rozloženia ruskej populácie v roku 1997 podľa vekových skupín.

Ryža. 6.2. Rozdelenie ruskej populácie podľa vekových skupín

Podmienka: Dané je rozdelenie 30 zamestnancov spoločnosti podľa mesačného platu

Úloha: Grafické zobrazenie série variácií intervalu vo forme histogramu a sčítanie.
Riešenie:

  1. Neznáma hranica otvoreného (prvého) intervalu je určená hodnotou druhého intervalu: 7000 - 5000 = 2000 rubľov. S rovnakou hodnotou nájdeme spodnú hranicu prvého intervalu: 5000 - 2000 = 3000 rubľov.
  2. Na vytvorenie histogramu v pravouhlom súradnicovom systéme vykreslíme pozdĺž osi x segmenty, ktorých hodnoty zodpovedajú intervalom varikóznej série.
    Tieto segmenty slúžia ako spodná základňa a zodpovedajúca frekvencia (frekvencia) slúži ako výška vytvorených obdĺžnikov.
  3. Zostavme si histogram:

Na zostavenie kumulácií je potrebné vypočítať akumulované frekvencie (frekvencie). Určujú sa postupným sčítaním frekvencií (frekvencií) predchádzajúcich intervalov a sú označené S. Akumulované frekvencie ukazujú, koľko jednotiek populácie má charakteristickú hodnotu, ktorá nie je väčšia ako uvažovaná hodnota.

Kumuluje sa

Rozloženie charakteristiky v sérii variácií cez akumulované frekvencie (frekvencie) je znázornené pomocou kumulácie.

Kumuluje sa alebo kumulatívna krivka, na rozdiel od mnohouholníka, je skonštruovaná z akumulovaných frekvencií alebo frekvencií. V tomto prípade sú hodnoty charakteristiky umiestnené na vodorovnej osi a akumulované frekvencie alebo frekvencie sú umiestnené na osi y (obr. 6.3).

Ryža. 6.3. Kumuluje rozdelenie podľa veľkosti domácností

4. Vypočítajme akumulované frekvencie:
Kumulatívna frekvencia prvého intervalu sa vypočíta takto: 0 + 4 = 4, pre druhý: 4 + 12 = 16; pre tretinu: 4 + 12 + 8 = 24 atď.

Pri konštrukcii kumulácie sa akumulovaná frekvencia (frekvencia) príslušného intervalu priradí k jeho hornej hranici:

Ogiva

Ogiva je konštruovaný podobne ako kumulácia, len s tým rozdielom, že akumulované frekvencie sú umiestnené na osi x a charakteristické hodnoty sú umiestnené na osi y.

Typom kumulácie je krivka koncentrácie alebo Lorentzov graf. Na zostavenie koncentračnej krivky je na oboch osiach pravouhlého súradnicového systému vynesená mierka stupnice v percentách od 0 do 100. Súčasne sú na vodorovnej osi vyznačené akumulované frekvencie a akumulované hodnoty podielu (v percentách) objemových charakteristík sú uvedené na osi y.

Rovnomerné rozloženie charakteristiky zodpovedá uhlopriečke štvorca na grafe (obr. 6.4). Pri nerovnomernom rozdelení predstavuje graf konkávnu krivku v závislosti od úrovne koncentrácie znaku.

6.4. Krivka koncentrácie
KATEGÓRIE

POPULÁRNE ČLÁNKY

2023 „kingad.ru“ - ultrazvukové vyšetrenie ľudských orgánov