Caracteristici discrete pentru construirea serii de distribuție variațională. Construirea unei serii de variații de interval pentru date cantitative continue

Având datele de observație statistică care caracterizează cutare sau cutare fenomen, este necesară în primul rând eficientizarea acestora, adică. fă-l sistematic

statistician englez. UjReichman a spus la figurat despre agregatele neordonate că a fi confruntat cu o masă de date negeneralizate echivalează cu o situație în care o persoană este aruncată în desiș fără busolă. Ce este sistematizarea datelor statistice sub formă de serii de distribuție?

Seria de distribuție statistică este o populație statistică ordonată (Tabelul 17). Cel mai simplu tip de serie de distribuție statistică este o serie clasificată, adică. o serie de numere în ordine crescătoare sau descrescătoare semne variabile. O astfel de serie nu ne permite să judecăm tiparele inerente datelor distribuite: care valoare are majoritatea indicatorilor grupați, care sunt abaterile de la această valoare; ca model general de distribuţie. În acest scop, datele sunt grupate, arătând cât de des apar observații individuale în numărul lor total (Schema 1a 1).

. Tabelul 17

. Vedere generală a seriei de distribuție statistică

. Schema 1. Schema statistică rangurile de distribuție

Distribuția unităților populației după caracteristici care nu au o expresie cantitativă se numește serie de atribute(de exemplu, distribuția întreprinderilor în funcție de linia lor de producție)

Seriile de distribuție a unităților populației în funcție de caracteristici, au o expresie cantitativă, se numesc serie de variații. În astfel de serii, valoarea caracteristicii (opțiuni) este în ordine crescătoare sau descrescătoare

În seria de variație a distribuției se disting două elemente: variante și frecvență . Opțiune- aceasta este o valoare separată a caracteristicii de grupare frecvență- un număr care arată de câte ori apare fiecare opțiune

În statistica matematică, se calculează încă un element al seriei variaționale - parțial. Acesta din urmă este definit ca raportul dintre frecvența cazurilor dintr-un interval dat și cantitatea totală de frecvențe, partea este determinată în fracțiuni de unitate, procente (%) în ppm (% o)

Astfel, o serie de distribuție variațională este o serie în care opțiunile sunt dispuse în ordine crescătoare sau descrescătoare, sunt indicate frecvențele sau frecvențele acestora. Serii variaționale sunt discrete (pererivny) și alte intervale (continue).

. Serii de variații discrete- sunt serii de distribuţie în care varianta ca valoare a unei trăsături cantitative nu poate lua decât o anumită valoare. Variantele diferă între ele prin una sau mai multe unități

Deci, numărul de piese produse pe schimb de un anumit lucrător poate fi exprimat doar printr-un număr specific (6, 10, 12 etc.). Un exemplu de serie de variații discrete poate fi distribuția lucrătorilor în funcție de numărul de piese produse (Tabelul 18-18).

. Tabelul 18

. Domeniu de distribuție discret _

. Interval (continuu) serie de variații- astfel de serii de distribuție în care valoarea opțiunilor este dată ca intervale, i.e. valorile caracteristicilor pot diferi unele de altele printr-o cantitate arbitrar mică. Când se construiește o serie variațională de NEP, este imposibil să se indice fiecare valoare a variantelor, astfel încât mulțimea este distribuită pe intervale. Acestea din urmă pot fi egale sau nu. Pentru fiecare dintre ele sunt indicate frecvențele sau frecvențele (Tabelul 1 9 19).

În serii de distribuție de intervale cu intervale inegale, se calculează caracteristici matematice precum densitatea de distribuție și densitatea de distribuție relativă într-un interval dat. Prima caracteristică este determinată de raportul dintre frecvență și valoarea aceluiași interval, a doua - de raportul dintre frecvență și valoarea aceluiași interval. Pentru exemplul de mai sus, densitatea distribuției în primul interval va fi 3: 5 = 0,6, iar densitatea relativă în acest interval va fi 7,5: 5 = 1,55%.

. Tabelul 19

. Serii de distribuție pe intervale _

Descrierea modificărilor într-un atribut variabil se realizează folosind serii de distribuție.

Serii de distribuție statistică- aceasta este o distribuție ordonată a unităților populației statistice în grupuri separate în funcție de un anumit atribut variabil.

Se numesc serii statistice construite pe o bază calitativă atributiv. Dacă seria de distribuție se bazează pe un atribut cantitativ, atunci seria este variațională.

La rândul lor, seriile variaționale sunt împărțite în discrete și interval. In nucleu discret din seria de distribuție se află o caracteristică discretă (discontinuă) care ia valori numerice specifice (numărul de infracțiuni, numărul cererilor de asistență juridică ale cetățenilor). interval seria de distribuție este construită pe baza unei caracteristici continue care poate lua orice valori dintr-un interval dat (vârsta condamnatului, termenul de închisoare etc.)

Orice serie de distribuție statistică conține două elemente obligatorii - serie și variante de frecvență. Opțiuni (x i) sunt valorile individuale ale caracteristicii pe care le ia în seria de distribuție. Frecvențele (fi) sunt valori numerice care arată de câte ori apar anumite opțiuni în seria de distribuție. Suma tuturor frecvențelor se numește volumul populației.

Frecvențele exprimate în unități relative (fracții sau procente) se numesc frecvențe ( w i). Suma frecvențelor este egală cu unu dacă Frecvențele sunt exprimate în fracțiuni de unu, sau 100 dacă sunt exprimate ca procent. Utilizarea frecvențelor face posibilă compararea seriilor variaționale cu diferite dimensiuni ale populației. Frecvențele sunt determinate de următoarea formulă:

Pentru a construi o serie discretă, toate valorile individuale ale caracteristicii care apar în serie sunt clasate, iar apoi sunt calculate frecvențele de repetiție ale fiecărei valori. O serie de distribuție este întocmită în ideea unui tabel format din două rânduri și coloane, dintre care unul conține valorile variantelor seriei x i, în al doilea - valorile frecvențelor fi.

Luați în considerare un exemplu de construire a unei serii variaționale discrete.

Exemplul 3.1 . Potrivit Ministerului Afacerilor Interne, infracțiunile înregistrate săvârșite în orașul N minori în vârstă.

17 13 15 16 17 15 15 14 16 13 14 17 14 15 15 16 16 15 14 15 15 14 16 16 14 17 16 15 16 15 13 15 15 13 15 14 15 13 17 14.

Construiți o serie de distribuție discretă.

Soluţie .

În primul rând, este necesar să se ierarhească datele privind vârsta minorilor, adică. notează-le în ordine crescătoare.

13 13 13 13 13 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 15 15 15 15 15 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17



Tabelul 3.1

Astfel, frecvențele reflectă numărul de persoane de o anumită vârstă, de exemplu, 5 persoane au 13 ani, 8 persoane au 14 ani și așa mai departe.

Clădire interval rândurile de distribuție sunt efectuate în mod similar cu implementarea unei grupări cu intervale egale în funcție de un atribut cantitativ, adică mai întâi se determină numărul optim de grupuri în care va fi împărțit mulțimea, se stabilesc limitele intervalelor pe grupuri și se calculeaza frecventele.

Să ilustrăm construcția unei serii de distribuție a intervalelor folosind următorul exemplu.

Exemplul 3.2 .

Construiți o serie de intervale pentru următoarea populație statistică - salariul unui avocat în birou, mii de ruble:

16,0 22,2 25,1 24,3 30,5 32,0 17,0 23,0 19,8 27,5 22,0 18,9 31,0 21,5 26,0 27,4

Soluţie.

Să luăm numărul optim de grupuri cu intervale egale pentru o populație statistică dată, egal cu 4 (avem 16 opțiuni). Prin urmare, dimensiunea fiecărui grup este egală cu:

iar valoarea fiecărui interval va fi egală cu:

Limitele intervalelor sunt determinate de formulele:

,

unde sunt limitele inferioare și, respectiv, superioare ale intervalului i-lea.

Omitând calculele intermediare ale limitelor intervalelor, introducem valorile acestora (opțiuni) și numărul de avocați (frecvențe) care au salarii în cadrul fiecărui interval în Tabelul 3.2, care ilustrează seria de intervale rezultate.

Tabelul 3.2

Analiza seriilor de distribuție statistică poate fi efectuată folosind o metodă grafică. Reprezentarea grafică a seriei de distribuție face posibilă ilustrarea vizuală a modelelor de distribuție a populației studiate prin reprezentarea acesteia sub formă de poligon, histogramă și cumulări. Să aruncăm o privire la fiecare dintre aceste grafice.

Poligon este o polilinie ale cărei segmente conectează puncte cu coordonate ( x i;fi). De obicei, un poligon este utilizat pentru a afișa serii de distribuție discretă. Pentru a-l construi, valorile individuale clasate ale caracteristicii sunt reprezentate pe axa x x i, pe axa y sunt frecvențele corespunzătoare acestor valori. Ca urmare, prin conectarea segmentelor punctelor corespunzătoare datelor marcate de-a lungul axelor absciselor și ordonatelor, se obține o polilinie, numită poligon. Să dăm un exemplu de construcție a unui poligon de frecvență.

Pentru a ilustra construcția unui poligon, să luăm rezultatul rezolvării Exemplului 3.1 pentru construirea unei serii discrete - Figura 1. Abscisa arată vârsta condamnaților, ordonată arată numărul de condamnați minori cu o anumită vârstă. Analizând acest poligon, putem spune că cel mai mare număr de condamnați – 14 persoane, au 15 ani.

Figura 3.1 - Gama de frecvențe ale unei serii discrete.

Un poligon poate fi construit și pentru o serie de intervale, caz în care punctele medii ale intervalelor sunt reprezentate de-a lungul axei absciselor, iar frecvențele corespunzătoare sunt reprezentate de-a lungul axei ordonatelor.

diagramă cu bare– o figură în trepte formată din dreptunghiuri, ale căror baze sunt intervalele valorii caracteristicii, iar înălțimile sunt egale cu frecvențele corespunzătoare. Histograma este utilizată numai pentru afișarea serii de distribuție a intervalelor. Dacă intervalele sunt inegale, atunci pentru a construi o histogramă pe axa y, nu sunt reprezentate frecvențele, ci raportul dintre frecvență și lățimea intervalului corespunzător. O histogramă poate fi convertită într-un poligon de distribuție dacă mijlocul coloanelor sale este conectat prin segmente.

Pentru a ilustra construcția unei histograme, să luăm rezultatele construcției unei serii de intervale din Exemplul 3.2 - Figura 3.2.

Figura 3.2 - Histograma repartizării salariilor avocaților.

Pentru o reprezentare grafică a seriilor variaționale, se folosește și cumulate. Cumula este o curbă reprezentând o serie de frecvențe acumulate și puncte de legătură cu coordonate ( x i;f i nak). Frecvențele cumulate sunt calculate prin însumarea succesivă a tuturor frecvențelor din seria de distribuție și arată numărul de unități de populație care au o valoare caracteristică nu mai mare decât cea specificată. Să ilustrăm calculul frecvențelor acumulate pentru seria de intervale variaționale prezentată în exemplul 3.2 - tabelul 3.3.

Tabelul 3.3

Pentru a construi cumulul unei serii de distribuție discretă, valorile individuale clasate ale trăsăturii sunt reprezentate de-a lungul axei absciselor, iar frecvențele acumulate corespunzătoare acestora sunt reprezentate de-a lungul axei ordonatelor. Când se construiește o curbă cumulată a unei serii de intervale, primul punct va avea o abscisă egală cu limita inferioară a primului interval și o ordonată egală cu 0. Toate punctele ulterioare trebuie să corespundă limitei superioare a intervalelor. Să construim un cumul folosind datele din Tabelul 3.3 - Figura 3.3.

Figura 3.3 - Curba de distribuție cumulată a salariilor avocaților.

întrebări de testare

1. Conceptul de serie de distribuție statistică, elementele sale principale.

2. Tipuri de serii de distribuție statistică. Scurta lor descriere.

3. Serii de distribuție discretă și pe intervale.

4. Tehnica de construire a seriilor de distribuție discretă.

5. Tehnica de construire a seriei de distribuție a intervalelor.

6. Reprezentarea grafică a seriilor de distribuție discretă.

7. Reprezentarea grafică a serii de distribuție a intervalelor.

Sarcini

Sarcina 1. Există următoarele date despre progresul a 25 de elevi ai grupei în TGP pe sesiune: 5, 4, 4, 4, 3, 2, 5, 3, 4, 4, 4, 3, 2, 5, 2, 5 , 5, 2, 3 , 3, 5, 4, 2, 3, 3. Construiți o serie variațională discretă de distribuție a elevilor în funcție de scorurile evaluărilor primite în sesiune. Pentru seria rezultată, calculați Frecvențe, Frecvențe cumulate, Frecvențe cumulate. Trageți propriile concluzii.

Sarcina 2. Colonia conține 1000 de condamnați, distribuția pe vârstă a acestora este prezentată în tabel:

Afișați această serie în mod grafic. Trageți propriile concluzii.

Sarcina 3. Următoarele date sunt disponibile cu privire la termenele de închisoare ale deținuților:

5; 4; 2; 1; 6; 3; 4; 3; 2; 2; 3; 1; 17; 6; 2; 8; 5; 11; 9; 3; 5; 6; 4; 3; 10; 5; 25; 1; 12; 3; 3; 4; 9; 6; 5; 3; 4; 3; 5; 12; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 3; 12; 6.

Construiți o serie de intervale de distribuție a prizonierilor în funcție de termenii de închisoare. Trageți propriile concluzii.

Sarcina 4. Există următoarele date privind distribuția condamnaților în regiune pentru perioada de studiu pe grupe de vârstă:

Desenați această serie grafic, trageți concluzii.

Studii profesionale superioare

„ACADEMIA RUSĂ DE ECONOMIA POPORULUI ŞI

FUNCȚIA PUBLICĂ SUB PREȘEDINTE

FEDERAȚIA RUSĂ"

(filiala Kaluga)

Departamentul de Științe ale Naturii și Discipline Matematice

TEST

Subiectul „Statistici”

Student ___ Mayboroda Galina Yurievna ______

Departamentul de corespondență facultate Grupul de management de stat și municipal G-12-V

Lector ____________________ Hamer G.V.

dr., conferențiar

Kaluga-2013

Sarcina 1.

Sarcina 1.1. patru

Sarcina 1.2. 16

Sarcina 1.3. 24

Sarcina 1.4. 33

Sarcina 2.

Sarcina 2.1. 43

Sarcina 2.2. 48

Sarcina 2.3. 53

Sarcina 2.4. 58

Sarcina 3.

Sarcina 3.1. 63

Sarcina 3.2. 68

Sarcina 3.3. 73

Sarcina 3.4. 79

Sarcina 4.

Problema 4.1. 85

Sarcina 4.2. 88

Sarcina 4.3. 90

Sarcina 4.4. 93

Lista surselor folosite. 96

Sarcina 1.

Sarcina 1.1.

Există următoarele date privind producția și valoarea profitului întreprinderilor din regiune (tabelul 1).

tabelul 1

Date privind producția și valoarea profitului întreprinderilor

numarul companiei Ieșire, milioane de ruble Profit, milioane de ruble numarul companiei Ieșire, milioane de ruble Profit, milioane de ruble
63,0 6,7 56,0 7,2
48,0 6,2 81,0 9,6
39,0 6,5 55,0 6,3
28,0 3,0 76,0 9,1
72,0 8,2 54,0 6,0
61,0 7,6 53,0 6,4
47,0 5,9 68,0 8,5
37,0 4,2 52,0 6,5
25,0 2,8 44,0 5,0
60,0 7,9 51,0 6,4
46,0 5,5 50,0 5,8
34,0 3,8 65,0 6,7
21,0 2,1 49,0 6,1
58,0 8,0 42,0 4,8
45,0 5,7 32,0 4,6

Conform datelor originale:

1. Construiți o serie statistică de distribuție a întreprinderilor după producție, formând cinci grupuri la intervale egale.

Construiți grafice de serie de distribuție: poligon, histogramă, cumulat. Determinați grafic valoarea modului și a mediei.

2. Calculați caracteristicile unei serii de distribuție a întreprinderilor după producție: medie aritmetică, dispersie, abatere standard, coeficient de variație.

Faceți o concluzie.

3. Utilizând metoda grupării analitice, stabiliți prezența și natura corelației dintre costul produselor fabricate și valoarea profitului pe întreprindere.

4. Măsurați strânsoarea corelației dintre costul de producție și valoarea profitului prin corelația empirică.

Trageți concluzii generale.

Soluţie:

Să construim o serie statistică de distribuție

Pentru a construi o serie de variații de interval care caracterizează distribuția întreprinderilor în ceea ce privește producția, este necesar să se calculeze valoarea și limitele intervalelor seriei.

La construirea unei serii cu intervale egale, valoarea intervalului h este determinată de formula:

x maxși x min- cele mai mari și cele mai mici valori ale atributului din setul de întreprinderi studiat;

k- numărul de grupuri de serii de intervale.

Numărul de grupuri k specificate în sarcină. k= 5.

x max= 81 de milioane de ruble, x min= 21 de milioane de ruble

Calculul valorii intervalului:

milioane de ruble

Prin adăugarea succesivă a valorii intervalului h = 12 milioane de ruble. până la limita inferioară a intervalului, obținem următoarele grupuri:

1 grup: 21 - 33 milioane de ruble.

2 grup: 33 - 45 milioane de ruble;

Grupa 3: 45 - 57 milioane de ruble.

Grupa 4: 57 - 69 milioane de ruble.

Grupa 5: 69 - 81 milioane de ruble.

Pentru a construi o serie de intervale, este necesar să se calculeze numărul de întreprinderi incluse în fiecare grup ( frecvențe de grup).

Procesul de grupare a întreprinderilor după volumul de producție este prezentat în tabelul auxiliar 2. Coloana 4 a acestui tabel este necesară pentru a construi o grupare analitică (articolul 3 al misiunii).

masa 2

Tabel pentru construirea unei serii de distribuție a intervalelor și

grupare analitică

Grupuri de întreprinderi după producție, milioane de ruble numarul companiei Ieșire, milioane de ruble Profit, milioane de ruble
21-33 21,0 2,1
25,0 2,8
28,0 3,0
32,0 4,6
Total 106,0 12,5
33-45 34,0 3,8
37,0 4,2
39,0 6,5
42,0 4,8
44,0 5,0
Total 196,0 24,3
45-57 45,0 5,7
46,0 5,5
47,0 5,9
48,0 6,2
49,0 6,1
50,0 5,8
51,0 6,4
52,0 6,5
53,0 6,4
54,0 6,0
55,0 6,3
56,0 7,2
Total 606,0 74,0
57-69 58,0 8,0
60,0 7,9
61,0 7,6
63,0 6,7
65,0 6,7
68,0 8,5
Total 375,0 45,4
69-81 72,0 8,2
76,0 9,1
81,0 9,6
Total 229,0 26,9
Total 183,1

Pe baza rândurilor rezumative de grup ale tabelului „Total” 3, se formează tabelul final 3, reprezentând seria de intervale de distribuție a întreprinderilor pe producție.

Tabelul 3

O serie de distribuție a întreprinderilor după volumul producției

Concluzie. Gruparea construită arată că distribuția întreprinderilor în ceea ce privește producția nu este uniformă. Cele mai comune întreprinderi cu un volum de producție de 45 până la 57 de milioane de ruble. (12 întreprinderi). Cele mai puțin comune sunt întreprinderile cu producție de la 69 la 81 de milioane de ruble. (3 întreprinderi).

Să construim grafice ale seriei de distribuție.

Poligon adesea folosit pentru a reprezenta serii discrete. Pentru a construi un poligon într-un sistem de coordonate dreptunghiular, valorile argumentului sunt trasate pe axa absciselor, adică opțiuni (pentru seria de variații de interval, mijlocul intervalului este luat ca argument) și pe axa ordonatelor - frecvența valorile. Mai mult, în acest sistem de coordonate, sunt construite puncte, ale căror coordonate sunt perechi de numere corespunzătoare din seria de variații. Punctele rezultate sunt conectate în serie prin segmente drepte. Poligonul este prezentat în figura 1.

diagramă cu bare - diagramă cu bare. Vă permite să evaluați simetria distribuției. Histograma este prezentată în figura 2.

Figura 1 - Distribuția poligonală a întreprinderilor în funcție de volum

ieșire

Modă

Figura 2 - Histograma distribuţiei întreprinderilor pe volum

ieșire

Modă- valoarea trăsăturii care apare cel mai des în populaţia studiată.

Pentru o serie de intervale, modul poate fi determinat grafic din histogramă (Figura 2). Pentru aceasta, este selectat cel mai înalt dreptunghi, care în acest caz este modal (45-57 milioane de ruble). Apoi vârful din dreapta al dreptunghiului modal este conectat la colțul din dreapta sus al dreptunghiului anterior. Iar vârful din stânga dreptunghiului modal este cu colțul din stânga sus al dreptunghiului următor. În plus, din punctul de intersecție, o perpendiculară este coborâtă pe axa absciselor. Abscisa punctului de intersecție al acestor drepte va fi modul de distribuție.

Milion freca.

Concluzie.În setul considerat de întreprinderi, întreprinderile cu o producție de 52 de milioane de ruble sunt cele mai comune.

Cumula - curba rupta. Este construit pe frecvențele acumulate (calculate în Tabelul 4). Cumulul începe de la limita inferioară a primului interval (21 de milioane de ruble), frecvența acumulată este depusă la limita superioară a intervalului. Cumulul este prezentat în Figura 3.

Median

Figura 3 - Distribuția cumulativă a întreprinderilor după volum

ieșire

Median Eu este valoarea caracteristicii care se încadrează la mijlocul seriei clasate. Există același număr de unități de populație de ambele părți ale mediei.

Într-o serie de intervale, mediana poate fi determinată grafic dintr-o curbă cumulată. Pentru a determina mediana dintr-un punct de pe scara de frecvență cumulativă corespunzător la 50% (30:2 = 15), se trasează o linie dreaptă paralelă cu axa absciselor până când se intersectează cu cumulul. Apoi, din punctul de intersecție al dreptei specificate cu cumulul, o perpendiculară este coborâtă pe axa absciselor. Abscisa punctului de intersecție este mediana.

Milion freca.

Concluzie.În setul considerat de întreprinderi, jumătate dintre întreprinderi au un volum de producție de cel mult 52 de milioane de ruble, iar cealaltă jumătate - nu mai puțin de 52 de milioane de ruble.


Informații similare.


La construirea unei serii de distribuție pe intervale, sunt rezolvate trei întrebări:

  • 1. Câte intervale ar trebui să iau?
  • 2. Care este lungimea intervalelor?
  • 3. Care este procedura de includere a unităților de populație în limitele intervalelor?
  • 1. Numărul de intervale poate fi determinat de Formula Sturgess:

2. Lungimea intervalului sau pas de interval, este de obicei determinată de formulă

Unde R- gama de variatie.

3. Ordinea de includere a unităților de populație în limitele intervalului

poate fi diferit, dar atunci când se construiește o serie de intervale, distribuția este în mod necesar strict definită.

De exemplu, acesta: [), în care unitățile populației sunt incluse în limitele inferioare și nu sunt incluse în limitele superioare, dar sunt transferate la intervalul următor. Excepția de la această regulă este ultimul interval , a cărui limită superioară include ultimul număr al seriei clasate.

Limitele intervalelor sunt:

  • închis - cu două valori extreme ale atributului;
  • deschis - cu o valoare extremă a atributului (inainte de vreun număr sau peste un astfel de număr).

Pentru a asimila materialul teoretic, introducem informații generale pentru solutii prin sarcini.

Există date condiționate privind numărul mediu de manageri de vânzări, numărul de bunuri de calitate unică vândute de aceștia, prețul individual de piață pentru acest produs, precum și volumul vânzărilor a 30 de firme într-una dintre regiunile Federației Ruse în primul trimestru al anului de raportare (Tabelul 2.1).

Tabelul 2.1

Informații inițiale pentru o sarcină transversală

populatia

managerii

Preț, mii de ruble

Volumul vânzărilor, milioane de ruble

populatia

managerii

Cantitatea mărfurilor vândute, buc.

Preț, mii de ruble

Volumul vânzărilor, milioane de ruble

Pe baza informațiilor inițiale, precum și a informațiilor suplimentare, vom stabili sarcini individuale. Apoi vă prezentăm metodologia de rezolvare a acestora și soluțiile în sine.

Sarcină transversală. Sarcina 2.1

Folosind tabelul de date original. 2.1 necesar construiți o serie discretă de distribuție a firmelor după numărul de bunuri vândute (Tabelul 2.2).

Soluţie:

Tabelul 2.2

Serii discrete de distribuție a firmelor în funcție de numărul de bunuri vândute într-una dintre regiunile Federației Ruse în primul trimestru al anului de raportare

Sarcină transversală. Sarcina 2.2

necesar construiți o serie clasată de 30 de firme după numărul mediu de manageri.

Soluţie:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

Sarcină transversală. Sarcina 2.3

Folosind tabelul de date original. 2.1, necesar:

  • 1. Construiți o serie de intervale pentru distribuția firmelor după numărul de manageri.
  • 2. Calculați frecvențele seriei de distribuție a firmelor.
  • 3. Trageți concluzii.

Soluţie:

Calculați folosind formula Sturgess (2.5) numărul de intervale:

Astfel, luăm 6 intervale (grupe).

Lungimea intervalului, sau pas de interval, se calculează după formula

Notă. Ordinea de includere a unităților populației în limitele intervalului este următoarea: I), în care unitățile populației sunt incluse în limitele inferioare, și nu sunt incluse în limitele superioare, ci se transferă la următoarele. interval. Excepție de la această regulă este ultimul interval I ], a cărui limită superioară include ultimul număr al seriei clasate.

Construim o serie de intervale (Tabelul 2.3).

Seria de intervale de distribuție a firmelor, dar numărul mediu de manageri într-una dintre regiunile Federației Ruse în primul trimestru al anului de raportare

Concluzie. Cel mai numeros grup de firme este grupul cu un număr mediu de manageri de 25-30 de persoane, care cuprinde 8 firme (27%); cel mai mic grup cu un număr mediu de manageri de 40-45 de persoane include o singură firmă (3%).

Folosind tabelul de date original. 2.1, precum și seria intervalului de distribuție a firmelor după numărul de manageri (Tabelul 2.3), necesar construiți o grupare analitică a relației dintre numărul de manageri și volumul vânzărilor firmelor și, pe baza acesteia, trageți o concluzie despre prezența (sau absența) unei relații între semnele indicate.

Soluţie:

Gruparea analitică este construită pe o bază de factori. În problema noastră, semnul factor (x) este numărul de manageri, iar semnul rezultat (y) este volumul vânzărilor (Tabelul 2.4).

Să construim acum grupare analitică(Tabelul 2.5).

Concluzie. Pe baza datelor grupării analitice construite, se poate spune că odată cu creșterea numărului de directori de vânzări crește și volumul mediu de vânzări al companiei din grup, ceea ce indică prezența unei relații directe între aceste caracteristici.

Tabelul 2.4

Tabel auxiliar pentru construirea unei grupări analitice

Numărul de manageri, persoane,

Numarul companiei

Volumul vânzărilor, milioane de ruble, y

» = 59 f = 9,97

I-™ 4 - Yu.22

74 '25 1PY1

U4 = 7 = 10,61

la = ’ =10,31 30

Tabelul 2.5

Dependența volumelor vânzărilor de numărul de manageri de companie într-una dintre regiunile Federației Ruse în primul trimestru al anului de raportare

ÎNTREBĂRI DE TEST
  • 1. Care este esența observației statistice?
  • 2. Numiți etapele observației statistice.
  • 3. Care sunt formele organizatorice ale observaţiei statistice?
  • 4. Numiți tipurile de observație statistică.
  • 5. Ce este un rezumat statistic?
  • 6. Numiți tipurile de rapoarte statistice.
  • 7. Ce este o grupare statistică?
  • 8. Numiți tipurile de grupări statistice.
  • 9. Ce este o serie de distribuție?
  • 10. Numiți elementele structurale ale seriei de distribuție.
  • 11. Care este procedura de construire a unei serii de distribuție?

Cea mai importantă etapă în studiul fenomenelor și proceselor socio-economice este sistematizarea datelor primare și, pe această bază, obținerea unei caracteristici rezumative a întregului obiect folosind indicatori generalizatori, care se realizează prin sintetizarea și gruparea materialului statistic primar.

Rezumat statistic - acesta este un complex de operații secvențiale pentru a generaliza fapte unice specifice care formează un set, pentru a identifica trăsăturile și modelele tipice inerente fenomenului studiat în ansamblu. Efectuarea unui rezumat statistic include următorii pași :

  • alegerea caracteristicii de grupare;
  • determinarea ordinii de formare a grupurilor;
  • dezvoltarea unui sistem de indicatori statistici pentru a caracteriza grupurile și obiectul în ansamblu;
  • dezvoltarea de scheme de tabele statistice pentru prezentarea rezultatelor rezumative.

Gruparea statistică numită împărțirea unităților populației studiate în grupe omogene după anumite caracteristici care sunt esențiale pentru acestea. Grupările sunt cea mai importantă metodă statistică de rezumare a datelor statistice, baza pentru calculul corect al indicatorilor statistici.

Există următoarele tipuri de grupări: tipologice, structurale, analitice. Toate aceste grupări sunt unite de faptul că unitățile obiectului sunt împărțite în grupuri în funcție de un anumit atribut.

semn de grupare se numește semnul prin care unitățile populației sunt împărțite în grupuri separate. Concluziile unui studiu statistic depind de alegerea corectă a unui atribut de grupare. Ca bază pentru grupare, este necesar să se utilizeze caracteristici semnificative, fundamentate teoretic (cantitative sau calitative).

Semne cantitative de grupare au o expresie numerică (volumul tranzacționării, vârsta unei persoane, venitul familiei etc.) și caracteristicile calitative ale grupării reflectă starea unității de populație (sex, stare civilă, apartenența la industrie a întreprinderii, forma ei de proprietate etc.).

După ce se stabilește baza grupării, trebuie decisă problema numărului de grupuri în care ar trebui să fie împărțită populația de studiu. Numărul de grupuri depinde de obiectivele studiului și de tipul de indicator care stă la baza grupării, de volumul populației, de gradul de variație a trăsăturii.

De exemplu, gruparea întreprinderilor în funcție de formele de proprietate ia în considerare municipalitatea, federală și proprietatea subiecților federației. Dacă gruparea se realizează în funcție de un atribut cantitativ, atunci este necesar să se acorde o atenție deosebită numărului de unități ale obiectului studiat și gradului de fluctuație a atributului de grupare.

Când se determină numărul de grupuri, atunci trebuie determinate intervalele de grupare. Interval - acestea sunt valorile unei caracteristici variabile care se află în anumite limite. Fiecare interval are propria sa valoare, limite superioară și inferioară, sau cel puțin una dintre ele.

Limita inferioară a intervalului se numește cea mai mică valoare a atributului din interval și limită superioară - cea mai mare valoare a atributului din interval. Valoarea intervalului este diferența dintre limitele superioare și inferioare.

Intervalele de grupare, în funcție de mărimea lor, sunt: ​​egale și inegale. Dacă variația trăsăturii se manifestă în limite relativ înguste și distribuția este uniformă, atunci se construiește o grupare cu intervale egale. Valoarea unui interval egal este determinată de următoarea formulă :

unde Xmax, Xmin - valorile maxime și minime ale atributului în agregat; n este numărul de grupuri.

Cea mai simplă grupare, în care fiecare grup selectat este caracterizat de un indicator, este o serie de distribuție.

Serii de distribuție statistică - aceasta este o distribuție ordonată a unităților de populație în grupuri în funcție de un anumit atribut. În funcție de trăsătura care stă la baza formării unei serii de distribuție, se disting serii de distribuție atributive și variații.

atributiv ei numesc seria de distribuție construită în funcție de caracteristici calitative, adică semne care nu au o expresie numerică (distribuție pe tip de muncă, după sex, după profesie etc.). Serii de distribuție a atributelor caracterizează componența populației în funcție de una sau alta caracteristică esențială. Preluate pe mai multe perioade, aceste date ne permit să studiem schimbarea structurii.

Rânduri de variație numită serie de distribuţie construită pe o bază cantitativă. Orice serie variațională constă din două elemente: variante și frecvențe. Opțiuni se numesc valorile individuale ale atributului pe care îl ia în seria de variații, adică valoarea specifică a atributului variabil.

Frecvențele numite numărul de variante individuale sau fiecare grupă a seriei de variații, adică acestea sunt numere care arată cât de des apar anumite variante în seria de distribuție. Suma tuturor frecvențelor determină dimensiunea întregii populații, volumul acesteia. Frecvențele sunt numite frecvențe, exprimate în fracții de unitate sau ca procent din total. În consecință, suma frecvențelor este egală cu 1 sau 100%.

În funcție de natura variației trăsăturii, se disting trei forme ale seriei de variații: o serie clasificată, o serie discretă și o serie de intervale.

Serii de variații clasificate - aceasta este distribuția unităților individuale ale populației în ordine crescătoare sau descrescătoare a trăsăturii studiate. Clasificarea facilitează împărțirea datelor cantitative în grupuri, detectează imediat cele mai mici și mai mari valori ale unei caracteristici, evidențiază valorile care se repetă cel mai des.

Serii de variații discrete caracterizează distribuția unităților populației în funcție de un atribut discret care ia doar valori întregi. De exemplu, categoria tarifară, numărul de copii din familie, numărul de angajați din întreprindere etc.

Dacă un semn are o schimbare continuă, care în anumite limite poate lua orice valoare ("de la - la"), atunci pentru acest semn trebuie să construiți serie de variații de interval . De exemplu, valoarea veniturilor, experiența de muncă, costul activelor fixe ale întreprinderii etc.

Exemple de rezolvare a problemelor pe tema „Rezumat statistic și grupare”

Sarcina 1 . Există informații despre numărul de cărți primite de studenți prin abonament pentru anul universitar trecut.

Construiți o serie de distribuție variațională variată și discretă, indicând elementele seriei.

Soluţie

Acest set este un set de opțiuni pentru numărul de cărți pe care le primesc elevii. Să numărăm numărul de astfel de variante și să le aranjam sub forma unei serii de distribuție variațională clasificată și variațională.

Sarcina 2 . Există date despre valoarea activelor fixe pentru 50 de întreprinderi, mii de ruble.

Construiți o serie de distribuție, evidențiind 5 grupuri de întreprinderi (la intervale egale).

Soluţie

Pentru soluție, alegem cele mai mari și cele mai mici valori ale costului activelor fixe ale întreprinderilor. Acestea sunt 30,0 și 10,2 mii de ruble.

Găsiți dimensiunea intervalului: h \u003d (30,0-10,2): 5 \u003d 3,96 mii de ruble.

Apoi, primul grup va include întreprinderi, a căror valoare a activelor fixe este de la 10,2 mii de ruble. până la 10,2 + 3,96 = 14,16 mii de ruble. Vor fi astfel de întreprinderi 9. Al doilea grup va include întreprinderi, a căror valoare a activelor fixe va fi de la 14,16 mii de ruble. până la 14,16 + 3,96 = 18,12 mii de ruble. Astfel de întreprinderi vor fi 16. În mod similar, găsim numărul de întreprinderi incluse în grupa a treia, a patra și a cincea.

Seria de distribuție rezultată este plasată în tabel.

Sarcina 3 . Pentru o serie de întreprinderi din industria uşoară, au fost obţinute următoarele date:

Faceți o grupare a întreprinderilor în funcție de numărul de lucrători, formând 6 grupe la intervale egale. Numărați pentru fiecare grupă:

1. numărul de întreprinderi
2. numărul de muncitori
3. volumul de produse fabricate pe an
4. producția reală medie per lucrător
5. valoarea mijloacelor fixe
6. dimensiunea medie a mijloacelor fixe ale unei întreprinderi
7. valoarea medie a produselor fabricate de către o întreprindere

Înregistrați rezultatele calculului în tabele. Trageți propriile concluzii.

Soluţie

Pentru soluție, alegem cele mai mari și cele mai mici valori ale numărului mediu de lucrători din întreprindere. Acestea sunt 43 și 256.

Aflați dimensiunea intervalului: h = (256-43): 6 = 35,5

Apoi, primul grup va include întreprinderi cu un număr mediu de lucrători cuprins între 43 și 43 + 35,5 = 78,5 persoane. Vor fi astfel de întreprinderi 5. Al doilea grup va include întreprinderi, numărul mediu de muncitori în care va fi de la 78,5 la 78,5 + 35,5 = 114 persoane. Astfel de întreprinderi vor fi 12. În mod similar, găsim numărul de întreprinderi incluse în grupa a treia, a patra, a cincea și a șasea.

Punem seria de distribuție rezultată într-un tabel și calculăm indicatorii necesari pentru fiecare grup:

Concluzie : După cum se poate observa din tabel, al doilea grup de întreprinderi este cel mai numeros. Include 12 întreprinderi. Cele mai mici sunt grupele a cincea și a șasea (două întreprinderi fiecare). Acestea sunt cele mai mari întreprinderi (din punct de vedere al numărului de lucrători).

Deoarece a doua grupă este cea mai numeroasă, volumul producției anuale a întreprinderilor din acest grup și volumul mijloacelor fixe sunt mult mai mari decât altele. În același timp, producția medie reală a unui lucrător la întreprinderile din acest grup nu este cea mai mare. Întreprinderile din al patrulea grup sunt aici în frunte. Acest grup reprezintă, de asemenea, o cantitate destul de mare de active fixe.

În concluzie, observăm că mărimea medie a mijloacelor fixe și valoarea medie a producției unei întreprinderi sunt direct proporționale cu dimensiunea întreprinderii (din punct de vedere al numărului de lucrători).

CATEGORII

ARTICOLE POPULARE

2022 "kingad.ru" - examinarea cu ultrasunete a organelor umane