Construiți o serie de distribuție pe intervale. Construirea unei serii de variații de interval pentru date cantitative continue

gruparea- aceasta este împărțirea populației în grupuri omogene într-un fel.

Atribuirea serviciului. Cu calculatorul online puteți:

  • construiți o serie de variații, construiți o histogramă și un poligon;
  • găsiți indicatori de variație (medie, mod (inclusiv grafic), mediană, interval de variație, quartile, decile, coeficient de diferențiere cuartile, coeficient de variație și alți indicatori);

Instruire. Pentru a grupa o serie, trebuie să selectați tipul seriei de variații rezultate (discretă sau interval) și să specificați cantitatea de date (numărul de rânduri). Soluția rezultată este salvată într-un fișier Word (vezi exemplul de grupare a datelor statistice).

Numărul de date de intrare
",0);">

Dacă gruparea a fost deja făcută și serie de variații discrete sau serie de intervale, atunci trebuie să utilizați calculatorul online Indicatori de variație. Testarea ipotezei despre tipul de distribuție produs folosind serviciul Studiul formei de distributie.

Tipuri de grupări statistice

Seria de variații. În cazul observațiilor unei variabile aleatoare discrete, aceeași valoare poate fi întâlnită de mai multe ori. Astfel de valori ale unei variabile aleatoare x i sunt înregistrate indicând n i de câte ori apare în n observații, aceasta este frecvența acestei valori.
În cazul unei variabile aleatoare continue, gruparea este utilizată în practică.
  1. Gruparea tipologică- este împărțirea populației eterogene calitativ studiate în clase, tipuri socio-economice, grupuri omogene de unități. Pentru a construi această grupare, utilizați parametrul Serie variațională discretă.
  2. Se numește grupare structurală, în care o populație omogenă este împărțită în grupuri care îi caracterizează structura în funcție de anumite caracteristici diferite. Pentru a construi această grupare, utilizați parametrul Interval series.
  3. Se numește o grupare care relevă relația dintre fenomenele studiate și trăsăturile lor grup analitic(vezi gruparea analitică a serii).

Principii de construire a grupărilor statistice

O serie de observații ordonate în ordine crescătoare se numește serie de variații. semn de grupare este semnul prin care populația este împărțită în grupuri separate. Se numește baza grupului. Gruparea se poate baza atât pe caracteristici cantitative, cât și calitative.
După stabilirea bazei grupării, trebuie decisă problema numărului de grupuri în care ar trebui să fie împărțită populația studiată.

Atunci când se utilizează computere personale pentru prelucrarea datelor statistice, gruparea unităților unui obiect se realizează folosind proceduri standard.
O astfel de procedură se bazează pe utilizarea formulei Sturgess pentru a determina numărul optim de grupuri:

k = 1+3,322*lg(N)

Unde k este numărul de grupuri, N este numărul de unități de populație.

Lungimea intervalelor parțiale se calculează ca h=(x max -x min)/k

Apoi numărați numărul de accesări ale observațiilor din aceste intervale, care sunt luate ca frecvențe n i . Puține frecvențe, ale căror valori sunt mai mici de 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Punctele medii ale intervalelor x i =(c i-1 +c i)/2 sunt luate ca valori noi.

Trimiteți-vă munca bună în baza de cunoștințe este simplu. Utilizați formularul de mai jos

Studenții, studenții absolvenți, tinerii oameni de știință care folosesc baza de cunoștințe în studiile și munca lor vă vor fi foarte recunoscători.

postat pe http://www.allbest.ru/

SARCINĂ1

Avem următoarele date despre salariile angajaților din întreprindere:

Tabelul 1.1

Valoarea salariilor în conv. den. unitati

Este necesar să se construiască o serie de intervale a distribuției prin care să se găsească;

1) salariul mediu;

2) abaterea liniară medie;

4) abaterea standard;

5) interval de variație;

6) coeficient de oscilație;

7) coeficient liniar de variație;

8) coeficient de variație simplu;

10) mediană;

11) coeficient de asimetrie;

12) Indicele de asimetrie Pearson;

13) coeficientul de curtoză.

Soluţie

După cum știți, opțiunile (valorile recunoscute) sunt aranjate în ordine crescătoare pentru a se forma serie de variații discrete. Cu un număr mare varianta (mai mult de 10), chiar si in cazul variatiei discrete se construiesc serii de intervale.

Dacă o serie de intervale este compilată cu intervale pare, atunci intervalul de variație este împărțit la numărul specificat de intervale. În acest caz, dacă valoarea obținută este întreagă și lipsită de ambiguitate (ceea ce este rar), atunci lungimea intervalului este luată egală cu acest număr. In alte cazuri produs rotunjire Neapărat V latură mărire, Asa de la ultima cifră rămasă era pară. Evident, cu o creștere a lungimii intervalului, cel interval de variație cu o valoare egală cu produsul numărului de intervale: prin diferența dintre lungimea calculată și inițială a intervalului

A) Dacă valoarea extinderii intervalului de variație este nesemnificativă, atunci se adaugă fie la cea mai mare, fie se scade din cea mai mică valoare a caracteristicii;

b) Dacă amploarea extinderii intervalului de variație este palpabilă, atunci pentru a evita amestecarea centrului intervalului, acesta este împărțit aproximativ la jumătate, adăugând simultan la cea mai mare și scăzând din cele mai mici valori ale caracteristică.

Dacă o serie de intervale este compilată cu intervale inegale, atunci procesul este simplificat, dar ca și înainte, lungimea intervalelor trebuie exprimată ca un număr cu ultima cifră pară, ceea ce simplifică foarte mult calculele ulterioare ale caracteristicilor numerice.

30 - dimensiunea eșantionului.

Să compunem o serie de distribuție a intervalelor folosind formula Sturges:

K \u003d 1 + 3,32 * lg n,

K - numărul de grupuri;

K \u003d 1 + 3,32 * lg 30 \u003d 5,91 \u003d 6

Găsim intervalul semnului - salariile angajaților la întreprindere - (x) conform formulei

R \u003d xmax - xmin și împărțiți la 6; R=195-112=83

Atunci lungimea intervalului va fi l banda=83:6=13,83

Începutul primului interval va fi 112. Adăugând la 112 l ras=13,83, obținem valoarea sa finală 125,83, care este și începutul celui de-al doilea interval și așa mai departe. sfârșitul celui de-al cincilea interval este 195.

Atunci când găsiți frecvențe, trebuie să vă ghidați după regula: „dacă valoarea unei caracteristici coincide cu limita intervalului intern, atunci ar trebui să fie raportată la intervalul anterior”.

Obținem o serie de intervale de frecvențe și frecvențe cumulate.

Tabelul 1.2

Prin urmare, 3 angajați au salarii. plata de la 112 la 125,83 unitati conventionale. Cel mai mare salariu plata de la 181,15 la 195 unitati conventionale. doar 6 muncitori.

Pentru a calcula caracteristicile numerice, convertim seria de intervale într-una discretă, luând ca variantă mijlocul intervalelor:

Tabelul 1.3

14131,83

Conform formulei mediei aritmetice ponderate

cond.mon.un.

Abaterea liniară medie:

unde xi este valoarea caracteristicii studiate în a i-a unitate a populației,

Valoarea medie a trăsăturii studiate.

postat pe http://www.allbest.ru/

LPostat pe http://www.allbest.ru/

Unitate monetara

Deviație standard:

Dispersie:

Interval relativ de variație (coeficient de oscilație): c=R:,

Deviația liniară relativă: q = L:

Coeficientul de variație: V = y:

Coeficientul de oscilație arată fluctuația relativă a valorilor extreme ale trăsăturii în jurul mediei aritmetice, iar coeficientul de variație caracterizează gradul și omogenitatea populației.

c \u003d R: \u003d 83 / 159,485 * 100% \u003d 52,043%

Astfel, diferența dintre valorile extreme este cu 5,16% (=94,84%-100%) mai mică decât salariul mediu al angajaților din întreprindere.

q \u003d L: \u003d 17,765 / 159,485 * 100% \u003d 11,139%

V \u003d y: \u003d 21,704 / 159,485 * 100% \u003d 13,609%

Coeficientul de variație este mai mic de 33%, ceea ce indică o variație slabă a salariilor angajaților din întreprindere, i.e. că media este o caracteristică tipică a salariilor muncitorilor (agregat omogen).

În seria de distribuție a intervalelor Modă este determinat de formula -

Frecvența intervalului modal, adică intervalul care conține cel mai mare număr de opțiuni;

Frecvența intervalului premergător modalului;

Frecvența intervalului după modal;

Lungimea intervalului modal;

Limita inferioară a intervalului modal.

Pentru determinare medianeîn seria de intervale, folosim formula

unde este frecvența cumulativă (cumulată) a intervalului care precede mediana;

Limita inferioară a intervalului median;

Frecvența intervalului median;

Lungimea intervalului median.

Intervalul median- interval, a cărui frecvență acumulată (=3+3+5+7) depășește jumătate din suma frecvențelor - (153,49; 167,32).

Să calculăm asimetria și curtoza, pentru care vom compila o nouă foaie de lucru:

Tabelul 1.4

Date faptice

Date estimative

Calculați momentul de ordin al treilea

Prin urmare, asimetria este

De la 0,3553 0,25, asimetria este recunoscută ca fiind semnificativă.

Calculați momentul de ordinul al patrulea

Prin urmare, curtoza este

Deoarece< 0, то эксцесс является плосковершинным.

Gradul de asimetrie poate fi determinat utilizând coeficientul de asimetrie al lui Pearson (As): fluctuația costului eșantionului de rotație

unde este media aritmetică a seriei de distribuție; -- Modă; -- deviație standard.

Cu o distribuție simetrică (normală) = Mo, prin urmare, coeficientul de asimetrie este zero. Dacă Аs > 0, atunci există mai mult mod, prin urmare, există o asimetrie pe partea dreaptă.

Dacă As< 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.

Distribuția nu este simetrică, dar are o asimetrie pe partea stângă.

SARCINĂ 2

Care ar trebui să fie dimensiunea eșantionului astfel încât să existe o probabilitate de 0,954 ca eroarea de eșantionare să nu depășească 0,04 dacă se știe că varianța din sondajele anterioare este de 0,24?

Soluţie

Mărimea eșantionului pentru eșantionarea nerepetitivă este calculată prin formula:

t - coeficient de încredere (cu o probabilitate de 0,954 este egal cu 2,0; determinat din tabelele de integrale de probabilitate),

y2=0,24 - abaterea standard;

10000 de oameni - marime de mostra;

Dx =0,04 - eroarea marginală a mediei eșantionului.

Cu o probabilitate de 95,4%, se poate argumenta că dimensiunea eșantionului, oferind o eroare relativă de cel mult 0,04, ar trebui să fie de cel puțin 566 de familii.

SARCINĂ3

Următoarele date sunt disponibile cu privire la veniturile din activitatea principală a întreprinderii, milioane de ruble.

Pentru a analiza o serie de dinamici, determinați următorii indicatori:

1) lanț și bază:

Câștiguri absolute;

Rate de creștere;

Ratele de creștere;

2) mediu

Nivelul intervalului dinamic;

Creștere absolută;

Rata de crestere;

Rata de crestere;

3) valoarea absolută a creșterii de 1%.

Soluţie

1. Creștere absolută (Dy)- aceasta este diferența dintre următorul nivel al seriei și precedentul (sau de bază):

lanț: Du \u003d yi - yi-1,

de bază: Du \u003d yi - y0,

yi - nivelul rândului,

i - numărul la nivel de rând,

y0 - nivelul anului de bază.

2. Rata de creștere (Tu) este raportul dintre următorul nivel al seriei și cel anterior (sau anul de bază 2001):

lanț: Tu = ;

de bază: Tu =

3. Rata de creștere (TD) - acesta este raportul dintre creșterea absolută și nivelul anterior, exprimat în %.

lanț: Tu = ;

de bază: Tu =

4. Valoarea absolută a creșterii cu 1% (A)- este raportul dintre creșterea absolută a lanțului și rata de creștere, exprimată în%.

A =

Nivelul rândului din mijloc calculate folosind formula mediei aritmetice.

Nivelul mediu al veniturilor din activitățile de bază pe 4 ani:

Creștere medie absolută calculat prin formula:

unde n este numărul de niveluri din serie.

În medie, pentru anul, veniturile din activitățile de bază au crescut cu 3,333 milioane de ruble.

Rata medie anuală de creștere calculată prin formula mediei geometrice:

уn - nivelul final al seriei,

y0 - nivelul inițial al seriei.

Tu \u003d 100% \u003d 102,174%

Rata medie anuală de creștere calculat prin formula:

T? \u003d Tu - 100% \u003d 102,74% - 100% \u003d 2,74%.

Astfel, în medie, pe an, veniturile din activitatea principală a întreprinderii au crescut cu 2,74%.

SARCINIA4

Calculati:

1. Indici individuali de pret;

2. Indicele general al cifrei de afaceri;

3. Indicele agregat al prețurilor;

4. Indicele agregat al volumului fizic al vânzării mărfurilor;

5. Creșterea absolută a valorii cifrei de afaceri și descompunerea pe factori (datorită modificărilor prețurilor și numărului de mărfuri vândute);

6. Faceți concluzii succinte asupra tuturor indicatorilor obținuți.

Soluţie

1. După condiție, indicii individuali de preț pentru produsele A, B, C s-au ridicat la -

ipA=1,20; ipB=1,15; iрВ=1,00.

2. Indicele cifrei de afaceri totale se calculează prin formula:

Am \u003d \u003d 1470/1045 * 100% \u003d 140,67%

Cifra de afaceri comercială a crescut cu 40,67% (140,67% -100%).

În medie, prețurile mărfurilor au crescut cu 10,24%.

Valoarea costurilor suplimentare pentru cumpărători din creșterea prețului:

w(p) = ? p1q1-? p0q1 \u003d 1470 - 1333,478 \u003d 136,522 milioane de ruble.

Ca urmare a creșterii prețurilor, cumpărătorii au trebuit să cheltuiască în plus 136,522 milioane de ruble.

4. Indicele general al volumului fizic al comerțului:

Volumul fizic al comerțului a crescut cu 27,61%.

5. Să determinăm modificarea totală a cifrei de afaceri în a doua perioadă față de prima perioadă:

w \u003d 1470-1045 \u003d 425 milioane de ruble.

din cauza modificarilor de pret:

W(p) \u003d 1470 - 1333,478 \u003d 136,522 milioane de ruble.

prin modificarea volumului fizic:

w(q) \u003d 1333,478 - 1045 \u003d 288,478 milioane de ruble.

Cifra de afaceri a mărfurilor a crescut cu 40,67%. Prețurile în medie pentru 3 mărfuri au crescut cu 10,24%. Volumul fizic al comerțului a crescut cu 27,61%.

În general, volumul vânzărilor a crescut cu 425 milioane de ruble, inclusiv din cauza creșterii prețurilor, a crescut cu 136,522 milioane de ruble, iar din cauza creșterii volumelor de vânzări - cu 288,478 milioane de ruble.

SARCINĂ5

Pentru 10 fabrici dintr-o industrie, sunt disponibile următoarele date.

Fabrica Nr.

Ieșire, mii de bucăți (X)

Pe baza datelor date:

I) pentru a confirma prevederile analizei logice cu privire la prezența unei corelații liniare între semnul factorului (ieșirea producției) și semnul rezultat (consumul de energie electrică), se trasează datele inițiale pe graficul câmpului de corelare și se trag concluzii despre forma relației, indicați formula acesteia;

2) determinați parametrii ecuației de conectare și trasați linia teoretică rezultată pe graficul câmpului de corelație;

3) calculați coeficientul de corelație liniară,

4) explicați valorile indicatorilor obținuți la paragrafele 2) și 3);

5) folosind modelul obținut, faceți o prognoză despre consumul posibil de energie electrică la o centrală cu un volum de producție de 4,5 mii unități.

Soluţie

Date de caractere - volumul de ieșire (factor), notat cu хi; semn - consumul de energie electrică (rezultat) prin ui; punctele cu coordonatele (x, y) sunt trasate pe câmpul de corelație OXY.

Punctele câmpului de corelație sunt situate de-a lungul unei linii drepte. Prin urmare, legătura este liniară, vom căuta ecuația de regresie sub forma unei drepte Yx=ax+b. Pentru a-l găsi, folosim sistemul de ecuații normale:

Să creăm o foaie de calcul.

Pe baza mediilor găsite, compunem sistemul și îl rezolvăm în funcție de parametrii a și b:

Deci, obținem ecuația de regresie pentru y pe x: \u003d 3,57692 x + 3,19231

Construim o linie de regresie pe câmpul de corelație.

Înlocuind valorile x din coloana 2 în ecuația de regresie, le obținem pe cele calculate (coloana 7) și le comparăm cu datele y, care sunt reflectate în coloana 8. Apropo, corectitudinea calculelor este de asemenea confirmată prin coincidența valorilor medii ale lui y și.

Coeficientcorelație liniară evaluează strânsoarea relației dintre caracteristicile x și y și se calculează prin formula

Coeficientul unghiular de regresie directă a (la x) caracterizează direcția celui identificatdependențesemne: pentru a>0 sunt la fel, pentru a<0- противоположны. Absolutul lui valoare - o măsură a modificării semnului rezultat atunci când semnul factorial se modifică pe unitate de măsură.

Membrul liber al regresiei directe dezvăluie direcția și valoarea sa absolută - o măsură cantitativă a influenței asupra semnului efectiv al tuturor celorlalți factori.

Dacă< 0, atunci resursa atributului factor al unui obiect individual este utilizată cu mai puțin și când>0 Cuperformanță mai mare decât media pentru întregul set de obiecte.

Să facem o analiză post-regresie.

Coeficientul la x de regresie directă este 3,57692 > 0, prin urmare, cu o creștere (scădere) a producției, consumul de energie electrică crește (scade). Creșterea producției cu 1 mie de bucăți. dă o creștere medie a consumului de energie electrică cu 3,57692 mii kWh.

2. Termenul liber al regresiei directe este egal cu 3,19231, prin urmare, influența altor factori crește impactul producției asupra consumului de energie electrică în termeni absoluti cu 3,19231 mii kWh.

3. Coeficientul de corelație de 0,8235 relevă o dependență foarte strânsă a consumului de energie electrică de producție.

Este ușor să faci predicții folosind ecuația modelului de regresie. Pentru a face acest lucru, valorile x și volumul de ieșire sunt înlocuite în ecuația de regresie și se prevede consumul de energie electrică. În acest caz, valorile lui x pot fi luate nu numai într-un interval dat, ci și în afara acestuia.

Să facem o prognoză despre posibilul consum de energie electrică la o uzină cu un volum de producție de 4,5 mii de unități.

3,57692*4,5 + 3,19231= 19,288 45 mii kWh.

LISTA SURSELOR UTILIZATE

1. Zakharenkov S.N. Statistica socio-economică: Ghid de studiu. - Minsk: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumyantsev V.N. Teoria generală a statisticii. - M.: INFRA - M., 2000.

3. Eliseeva I.I. Statistici. - M.: Prospekt, 2002.

4. Teoria generală a statisticii / Ed. ed. O.E. Bashina, A.A. Spirin. - M.: Finanțe și statistică, 2000.

5. Statistica socio-economică: Manual.-practică. indemnizație / Zakharenkov S.N. etc. - Minsk: YSU, 2004.

6. Statistici socio-economice: Proc. indemnizatie. / Ed. Nesterovich S.R. - Minsk: BSEU, 2003.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Statistici - Minsk, 2000.

8. Harcenko L.P. Statistici. - M.: INFRA - M, 2002.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. Statistici. - M.: INFRA - M, 1999.

10. Statistica economică / Ed. Yu.N. Ivanova - M., 2000.

Găzduit pe Allbest.ru

...

Documente similare

    Calculul mediei aritmetice pentru seria de distribuție a intervalelor. Determinarea indicelui general al volumului fizic al comerțului. Analiza modificării absolute a costului total de producție datorită modificărilor volumului fizic. Calculul coeficientului de variație.

    test, adaugat 19.07.2010

    Esența comerțului cu ridicata, cu amănuntul și public. Formule pentru calcularea indicilor individuali, agregați ai cifrei de afaceri. Calculul caracteristicilor seriei de distribuție a intervalelor - medie aritmetică, mod și mediană, coeficient de variație.

    lucrare de termen, adăugată 05.10.2013

    Calculul volumului de vânzări planificat și real, procentul planului, modificarea absolută a cifrei de afaceri. Determinarea creșterii absolute, a ratelor medii de creștere și a creșterii veniturilor în numerar. Calculul mediilor structurale: moduri, mediane, quartile.

    test, adaugat 24.02.2012

    Serii de intervale de distribuție a băncilor după volumul profitului. Găsirea modului și medianei seriei de distribuție a intervalelor obținute printr-o metodă grafică și prin calcul. Calculul caracteristicilor seriei de distribuție a intervalelor. Calculul mediei aritmetice.

    test, adaugat 15.12.2010

    Formule pentru determinarea valorilor medii ale seriei de intervale - moduri, mediane, varianțe. Calculul indicatorilor analitici ai seriilor temporale în funcție de lanț și scheme de bază, rate de creștere și creștere. Conceptul de indice compus al costurilor, prețurilor, costurilor și cifrei de afaceri.

    lucrare de termen, adăugată 27.02.2011

    Conceptul și scopul, ordinea și regulile pentru construirea unei serii variaționale. Analiza omogenității datelor în grupuri. Indicatori de variație (fluctuație) a unei trăsături. Determinarea abaterii medii liniare și pătrate, a coeficientului de oscilație și a variației.

    test, adaugat 26.04.2010

    Conceptul de mod și mediană ca caracteristici tipice, ordinea și criteriile de determinare a acestora. Găsirea modului și a medianei într-o serie de variații discrete și pe intervale. Quartilele și decilele ca caracteristici suplimentare ale seriei statistice variaționale.

    test, adaugat 09.11.2010

    Construirea unei serii de intervale de distribuție pe bază de grupare. Caracterizarea abaterii distribuției de frecvență de la forma simetrică, calculul kurtozei și indicatorilor de asimetrie. Analiza indicatorilor bilanţului sau contului de profit şi pierdere.

    lucrare de control, adaugat 19.10.2014

    Transformarea seriei empirice în discret și interval. Determinarea valorii medii pe o serie discretă folosind proprietățile acesteia. Calculul unei serii discrete de moduri, mediane, indicatori de variație (dispersie, abatere, coeficient de oscilație).

    test, adaugat 17.04.2011

    Construirea unei serii statistice de distribuţie a organizaţiilor. Definirea grafică a valorii modului și a mediei. Strângerea corelației cu utilizarea coeficientului de determinare. Determinarea erorii de eșantionare a numărului mediu de salariați.

Dacă variabila aleatoare studiată este continuă, atunci clasarea și gruparea valorilor observate nu ne permit adesea să evidențiem trăsăturile caracteristice ale variației valorilor sale. Acest lucru se explică prin faptul că valorile individuale ale unei variabile aleatorii pot diferi cât de puțin se dorește unele de altele și, prin urmare, în totalitatea datelor observate, pot apărea rar aceleași valori ale unei cantități, iar frecvențele de variante diferă puțin între ele.

De asemenea, nu este practic să construiești o serie discretă pentru o variabilă aleatorie discretă, al cărei număr de valori posibile este mare. În astfel de cazuri, ar trebui să construiți serie de variații de interval distributie.

Pentru a construi o astfel de serie, întregul interval de variație a valorilor observate ale unei variabile aleatoare este împărțit într-o serie intervale parțiale și numărarea frecvenței de apariție a valorilor de magnitudine în fiecare interval parțial.

Seria de variație de interval numit un set ordonat de intervale de variație a valorilor unei variabile aleatoare cu frecvențele corespunzătoare sau frecvențele relative ale hit-urilor în fiecare dintre valorile valorii.

Pentru a construi o serie de intervale, aveți nevoie de:

  1. defini valoare intervale parțiale;
  2. defini lăţime intervale;
  3. stabilit pentru fiecare interval acesta top Și limita inferioară ;
  4. grupează rezultatele observației.

1 . Problema alegerii numărului și lățimii intervalelor de grupare trebuie să fie decisă în fiecare caz specific pe baza obiective cercetare, volum prelevarea de probe și gradul de variație caracteristică din eșantion.

Număr aproximativ de intervale k poate fi estimată doar din dimensiunea eșantionului n într-unul din următoarele moduri:

  • conform formulei Sturges : k = 1 + 3,32 log n ;
  • folosind tabelul 1.

tabelul 1

2 . Se preferă, în general, intervale de aceeași lățime. Pentru a determina lățimea intervalelor h calculati:

  • intervalul de variație R - valorile eșantionului: R = x max - x min ,

Unde xmax Și xmin - opțiuni de eșantionare maxime și minime;

  • lăţimea fiecărui interval h determinată de următoarea formulă: h = R/k .

3 . Concluzie primul interval x h1 se alege astfel încât varianta minimă de eşantion xmin a scăzut aproximativ la mijlocul acestui interval: x h1 = x min - 0,5 h .

Intervale obţinut prin adăugarea la sfârşitul intervalului anterior a lungimii intervalului parţial h :

xhi = xhi-1 +h.

Construcția scalei intervalelor pe baza calculului limitelor intervalelor continuă până la valoarea x salut satisface relatia:

x salut< x max + 0,5·h .

4 . În conformitate cu scara intervalelor, valorile atributului sunt grupate - pentru fiecare interval parțial, se calculează suma frecvențelor n i variantă prinsă i - al-lea interval. În acest caz, intervalul include valori ale unei variabile aleatorii mai mari sau egale cu limita inferioară și mai mici decât limita superioară a intervalului.

Poligon și histogramă

Pentru claritate, sunt construite diverse grafice ale distribuției statistice.

Pe baza datelor seriei variaționale discrete, construim poligon frecvențe sau frecvențe relative.

Poligon de frecvență x 1 ; n 1 ), (x2 ; n 2 ), ..., (x k ; nk ). Pentru a construi un poligon de frecvențe pe axa absciselor, opțiunile sunt lăsate deoparte x i , iar pe axa y - frecvențele corespunzătoare n i . Puncte ( x i ; n i ) sunt legate prin segmente de drepte și se obține un poligon de frecvență (fig. 1).

Poligon de frecvență relativă se numește polilinie ale cărei segmente leagă punctele ( x 1 ; W 1 ), (x2 ; W2 ), ..., (x k ; W k ). Pentru a construi un poligon de frecvențe relative pe abscisă, renunțați la opțiuni x i , iar pe axa y - frecvențele relative corespunzătoare acestora Wi . Puncte ( x i ; Wi ) sunt legate prin segmente de drepte și se obține un poligon de frecvențe relative.

Când caracteristică continuă este oportun de construit histogramă .

histogramă de frecvență numită figură în trepte formată din dreptunghiuri ale căror baze sunt intervale parțiale de lungime h , iar înălțimile sunt egale cu raportul NIH (densitatea de frecvență).

Pentru a construi o histogramă de frecvențe, intervalele parțiale sunt trasate pe axa absciselor, iar segmentele sunt trasate deasupra lor paralele cu axa absciselor la distanță. NIH .

La construirea unei serii de distribuție pe intervale, sunt rezolvate trei întrebări:

  • 1. Câte intervale ar trebui să iau?
  • 2. Care este lungimea intervalelor?
  • 3. Care este procedura de includere a unităților de populație în limitele intervalelor?
  • 1. Numărul de intervale poate fi determinat de Formula Sturgess:

2. Lungimea intervalului sau pas de interval, este de obicei determinată de formulă

Unde R- gama de variatie.

3. Ordinea de includere a unităților de populație în limitele intervalului

poate fi diferit, dar atunci când se construiește o serie de intervale, distribuția este în mod necesar strict definită.

De exemplu, acesta: [), în care unitățile populației sunt incluse în limitele inferioare și nu sunt incluse în limitele superioare, dar sunt transferate la intervalul următor. Excepția de la această regulă este ultimul interval, a cărui limită superioară include ultimul număr al seriei clasate.

Limitele intervalelor sunt:

  • închis - cu două valori extreme ale atributului;
  • deschis - cu o valoare extremă a caracteristicii (inainte de vreun număr sau peste un astfel de număr).

Pentru a asimila materialul teoretic, introducem informații generale pentru solutii prin sarcini.

Există date condiționate privind numărul mediu de manageri de vânzări, numărul de bunuri de calitate unică vândute de aceștia, prețul individual de piață pentru acest produs, precum și volumul vânzărilor a 30 de firme într-una dintre regiunile Federației Ruse în primul trimestru al anului de raportare (Tabelul 2.1).

Tabelul 2.1

Informații inițiale pentru o sarcină transversală

populatia

managerii

Preț, mii de ruble

Volumul vânzărilor, milioane de ruble

populatia

managerii

Cantitatea mărfurilor vândute, buc.

Preț, mii de ruble

Volumul vânzărilor, milioane de ruble

Pe baza informațiilor inițiale, precum și a informațiilor suplimentare, vom stabili sarcini individuale. Apoi vă prezentăm metodologia de rezolvare a acestora și soluțiile în sine.

Sarcină transversală. Sarcina 2.1

Folosind tabelul de date original. 2.1 necesar construiți o serie discretă de distribuție a firmelor după numărul de bunuri vândute (Tabelul 2.2).

Soluţie:

Tabelul 2.2

Serii discrete de distribuție a firmelor în funcție de numărul de bunuri vândute într-una dintre regiunile Federației Ruse în primul trimestru al anului de raportare

Sarcină transversală. Sarcina 2.2

necesar construiți o serie clasată de 30 de firme după numărul mediu de manageri.

Soluţie:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

Sarcină transversală. Sarcina 2.3

Folosind tabelul de date original. 2.1, necesar:

  • 1. Construiți o serie de intervale pentru distribuția firmelor după numărul de manageri.
  • 2. Calculați frecvențele seriei de distribuție a firmelor.
  • 3. Trageți concluzii.

Soluţie:

Calculați folosind formula Sturgess (2.5) numărul de intervale:

Astfel, luăm 6 intervale (grupe).

Lungimea intervalului, sau pas de interval, se calculează după formula

Notă. Ordinea de includere a unităților populației în limitele intervalului este următoarea: I), în care unitățile populației sunt incluse în limitele inferioare, și nu sunt incluse în limitele superioare, ci se transferă la următoarele. interval. Excepție de la această regulă este ultimul interval I ], a cărui limită superioară include ultimul număr al seriei clasate.

Construim o serie de intervale (Tabelul 2.3).

Seria de intervale de distribuție a firmelor, dar numărul mediu de manageri într-una dintre regiunile Federației Ruse în primul trimestru al anului de raportare

Concluzie. Cel mai numeros grup de firme este grupul cu un număr mediu de manageri de 25-30 de persoane, care cuprinde 8 firme (27%); cel mai mic grup cu un număr mediu de manageri de 40-45 de persoane include o singură firmă (3%).

Folosind tabelul de date original. 2.1, precum și seria intervalului de distribuție a firmelor după numărul de manageri (Tabelul 2.3), necesar construiți o grupare analitică a relației dintre numărul de manageri și volumul vânzărilor firmelor și, pe baza acesteia, trageți o concluzie despre prezența (sau absența) unei relații între semnele indicate.

Soluţie:

Gruparea analitică este construită pe o bază de factori. În problema noastră, semnul factor (x) este numărul de manageri, iar semnul rezultat (y) este volumul vânzărilor (Tabelul 2.4).

Să construim acum grupare analitică(Tabelul 2.5).

Concluzie. Pe baza datelor grupării analitice construite, se poate spune că odată cu creșterea numărului de directori de vânzări crește și volumul mediu de vânzări al companiei din grup, ceea ce indică prezența unei relații directe între aceste caracteristici.

Tabelul 2.4

Tabel auxiliar pentru construirea unei grupări analitice

Numărul de manageri, persoane,

Numarul companiei

Volumul vânzărilor, milioane de ruble, y

» = 59 f = 9,97

I-™ 4 - Yu.22

74 '25 1PY1

U4 = 7 = 10,61

la = ’ =10,31 30

Tabelul 2.5

Dependența volumelor vânzărilor de numărul de manageri de companie într-una dintre regiunile Federației Ruse în primul trimestru al anului de raportare

ÎNTREBĂRI DE CONTROL
  • 1. Care este esența observației statistice?
  • 2. Numiți etapele observației statistice.
  • 3. Care sunt formele organizatorice ale observaţiei statistice?
  • 4. Numiți tipurile de observație statistică.
  • 5. Ce este un rezumat statistic?
  • 6. Numiți tipurile de rapoarte statistice.
  • 7. Ce este o grupare statistică?
  • 8. Numiți tipurile de grupări statistice.
  • 9. Ce este o serie de distribuție?
  • 10. Numiți elementele structurale ale seriei de distribuție.
  • 11. Care este procedura de construire a unei serii de distribuție?

Acestea sunt prezentate sub formă de serii de distribuție și sunt formatate ca .

O serie de distribuție este un tip de grupare.

Domeniul de distribuție- reprezintă o distribuție ordonată a unităților populației studiate în grupuri în funcție de un anumit atribut variabil.

În funcție de trăsătura care stă la baza formării unei serii de distribuție, există atributiv și variațional grade de distributie:

  • atributiv- apelați seria de distribuție construită pe motive calitative.
  • Se numesc serii de distribuție construite în ordine crescătoare sau descrescătoare a valorilor unui atribut cantitativ variațională.
Seria de variații a distribuției constă din două coloane:

Prima coloană conține valorile cantitative ale caracteristicii variabilei, care sunt numite Opțiuniși sunt marcate. Varianta discretă - exprimată ca număr întreg. Opțiunea de interval este în intervalul de la și până la. În funcție de tipul de variante, este posibilă construirea unei serii variaționale discrete sau pe intervale.
A doua coloană conține numărul de opțiuni specifice, exprimat în termeni de frecvențe sau frecvențe:

Frecvențele- acestea sunt numere absolute care arată de câte ori în total apare valoarea dată a caracteristicii, care denotă . Suma tuturor frecvențelor ar trebui să fie egală cu numărul de unități ale întregii populații.

Frecvențele() sunt frecvențele exprimate ca procent din total. Suma tuturor frecvențelor exprimată ca procent trebuie să fie egală cu 100% în fracțiuni de unu.

Reprezentarea grafică a seriilor de distribuție

Serii de distribuție sunt vizualizate folosind imagini grafice.

Seriile de distribuție sunt afișate ca:
  • Poligon
  • Histograme
  • Se cumulează
  • ogive

Poligon

La construirea unui poligon, pe axa orizontală (abscisă) sunt trasate valorile atributului variabil, iar pe axa verticală (ordonată) - frecvențe sau frecvențe.

Poligonul din fig. 6.1 a fost construit conform micro-recensământului populației Rusiei în 1994.

6.1. Distribuția gospodăriilor după mărime

Condiție: Sunt date date privind repartizarea a 25 de salariați ai uneia dintre întreprinderi pe categorii tarifare:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Sarcină: Construiți o serie de variații discrete și afișați-o grafic ca poligon de distribuție.
Soluţie:
În acest exemplu, opțiunile sunt categoria salarială a lucrătorului. Pentru a determina frecvențele, este necesar să se calculeze numărul de angajați cu categoria salarială corespunzătoare.

Poligonul este utilizat pentru serii de variații discrete.

Pentru a construi un poligon de distribuție (Fig. 1), de-a lungul abscisei (X), trasăm valorile cantitative ale trăsăturii diferite - variante și de-a lungul ordonatei - frecvențe sau frecvențe.

Dacă valorile caracteristice sunt exprimate ca intervale, atunci o astfel de serie se numește serie de intervale.
serie de intervale distribuțiile sunt afișate grafic ca histogramă, cumulat sau ogivă.

Tabel statistic

Condiție: Date despre mărimea depozitelor a 20 de persoane într-o bancă (mii de ruble) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Sarcină: Construiți o serie de variații de intervale cu intervale egale.
Soluţie:

  1. Populația inițială este formată din 20 de unități (N = 20).
  2. Folosind formula Sturgess, determinăm numărul necesar de grupuri utilizate: n=1+3.322*lg20=5
  3. Să calculăm valoarea intervalului egal: i=(152 - 2) /5 = 30 mii de ruble
  4. Împărțim populația inițială în 5 grupuri cu un interval de 30 de mii de ruble.
  5. Rezultatele grupării sunt prezentate în tabel:

Cu o astfel de înregistrare a unei caracteristici continue, atunci când aceeași valoare apare de două ori (ca limită superioară a unui interval și limita inferioară a altui interval), atunci această valoare aparține grupului în care această valoare acționează ca limită superioară.

diagramă cu bare

Pentru a construi o histogramă de-a lungul abscisei, indicați valorile limitelor intervalelor și, pe baza acestora, construiți dreptunghiuri a căror înălțime este proporțională cu frecvențele (sau frecvențele).

Pe fig. 6.2. este prezentată histograma distribuției populației Rusiei în 1997 pe grupe de vârstă.

Orez. 6.2. Distribuția populației Rusiei pe grupe de vârstă

Condiție: Se da repartizarea a 30 de angajati ai firmei in functie de marimea salariului lunar

Sarcină: Afișează grafic seria variației intervalului ca histogramă și cumulează.
Soluţie:

  1. Limita necunoscută a intervalului deschis (primul) este determinată de valoarea celui de-al doilea interval: 7000 - 5000 = 2000 ruble. Cu aceeași valoare, găsim limita inferioară a primului interval: 5000 - 2000 = 3000 de ruble.
  2. Pentru a construi o histogramă într-un sistem de coordonate dreptunghiular, de-a lungul axei de abscisă, punem deoparte segmente ale căror valori corespund intervalelor rândului variantă.
    Aceste segmente servesc drept bază inferioară, iar frecvența corespunzătoare (frecvența) servește drept înălțime a dreptunghiurilor formate.
  3. Să construim o histogramă:

Pentru a construi cumulul, este necesar să se calculeze frecvențele (frecvențele) acumulate. Ele sunt determinate prin însumarea succesivă a frecvenţelor (frecvenţelor) intervalelor anterioare şi se notează cu S. Frecvenţele acumulate arată câte unităţi ale populaţiei au o valoare caracteristică nu mai mare decât cea luată în considerare.

Cumula

Distribuția unei trăsături într-o serie variațională în funcție de frecvențele (frecvențele) acumulate este descrisă folosind cumulat.

Cumula sau curba cumulativă, spre deosebire de poligon, este construită pe frecvențele sau frecvențele acumulate. În același timp, valorile caracteristicii sunt plasate pe axa absciselor, iar frecvențele sau frecvențele acumulate sunt plasate pe axa ordonatelor (Fig. 6.3).

Orez. 6.3. Distribuția cumulativă a gospodăriilor după mărime

4. Calculați frecvențele acumulate:
Frecvența genunchiului primului interval se calculează astfel: 0 + 4 = 4, pentru al doilea: 4 + 12 = 16; pentru al treilea: 4 + 12 + 8 = 24 etc.

Când se construiește cumulul, frecvența (frecvența) acumulată a intervalului corespunzător este atribuită limitei sale superioare:

Ogiva

Ogiva este construit în mod similar cu cumulul, cu singura diferență că frecvențele acumulate sunt plasate pe axa absciselor, iar valorile caracteristicilor sunt plasate pe axa ordonatelor.

O variație a cumulului este curba concentrației sau diagrama Lorenz. Pentru a trasa curba concentrației, ambele axe ale sistemului de coordonate dreptunghiulare sunt scalate ca procent de la 0 la 100. În acest caz, axele de abscisă indică frecvențele acumulate, iar axele ordonatelor arată valorile acumulate ale cotei (în procente) după volumul caracteristicii.

Distribuția uniformă a semnului corespunde diagonalei pătratului de pe grafic (Fig. 6.4). Cu distribuție neuniformă, graficul este o curbă concavă în funcție de nivelul de concentrație al trăsăturii.

6.4. curba de concentrare
CATEGORII

ARTICOLE POPULARE

2023 "kingad.ru" - examinarea cu ultrasunete a organelor umane