Dyskretne cechy do konstruowania wariacyjnych szeregów rozdzielczych. Budowa serii zmienności przedziałowej dla ciągłych danych ilościowych

Dysponując danymi z obserwacji statystycznych charakteryzujących to lub inne zjawisko, należy je przede wszystkim usprawnić, tj. zrób to systematycznie

Statystyk angielski. UjReichman powiedział w przenośni o nieuporządkowanych agregatach, że konfrontacja z masą nieuogólnionych danych jest równoznaczna z sytuacją, w której człowiek zostaje wrzucony w gąszcz bez kompasu. Na czym polega systematyzacja danych statystycznych w postaci szeregów dystrybucyjnych?

Szereg rozkładu statystycznego jest uporządkowaną populacją statystyczną (tabela 17). Najprostszym rodzajem szeregów statystycznych jest szereg szeregowy, tj. seria liczb w porządku rosnącym lub malejącym, różne znaki. Taki szereg nie pozwala nam ocenić prawidłowości tkwiących w dystrybuowanych danych: jaka wartość ma zgrupowaną większość wskaźników, jakie są odchylenia od tej wartości; jako ogólny wzorzec dystrybucji. W tym celu dane są pogrupowane, pokazując jak często poszczególne obserwacje występują w ich łącznej liczbie (Schemat 1a 1).

. Tabela 17

. Widok ogólny szeregów rozkładu statystycznego

. Schemat 1. Schemat statystyczny szeregi dystrybucyjne

Nazywa się rozkład jednostek populacji według cech, które nie mają wyrażenia ilościowego seria atrybutów(na przykład dystrybucja przedsiębiorstw według ich linii produkcyjnej)

Szeregi dystrybucyjne jednostek populacji według cech, mają wyrażenie ilościowe, nazywane są seria odmian. W takich szeregach wartość cechy (opcji) jest w porządku rosnącym lub malejącym

W szeregach zmienności rozkładu wyróżnia się dwa elementy: warianty i częstotliwość . Opcja- jest to osobna wartość funkcji grupowania częstotliwość- liczba, która pokazuje, ile razy występuje każda opcja

W statystyce matematycznej obliczany jest jeszcze jeden element szeregu wariacyjnego - częściowy. Ta ostatnia określana jest jako stosunek częstości przypadków danego przedziału do całkowitej ilości częstości, część określana jest w ułamkach jednostki, procent (%) w ppm (% o)

Tak więc wariacyjny szereg dystrybucyjny jest szeregiem, w którym opcje są ułożone w porządku rosnącym lub malejącym, wskazane są ich częstotliwości lub częstotliwości. Szeregi wariacyjne są dyskretne (pererivny) i inne przedziały (ciągłe).

. Dyskretna seria odmian- są to szeregi dystrybucyjne, w których wariant jako wartość cechy ilościowej może przyjąć tylko określoną wartość. Warianty różnią się od siebie o jedną lub więcej jednostek

Tak więc liczba części wyprodukowanych na zmianę przez konkretnego pracownika może być wyrażona tylko jedną konkretną liczbą (6, 10, 12 itd.). Przykładem dyskretnej serii zmian może być rozkład pracowników według liczby wyprodukowanych części (tabela 18-18).

. Tabela 18

. Dyskretny zakres dystrybucji _

. Przedziałowe (ciągłe) serie zmienności- takie szeregi rozkładowe, w których wartości opcji podane są w przedziałach, tj. wartości cech mogą różnić się od siebie o dowolnie małą wartość. Konstruując szereg wariacyjny NEP nie można wskazać każdej wartości wariantów, więc zbiór jest rozłożony na przedziały. Te ostatnie mogą, ale nie muszą być równe. Dla każdego z nich wskazano częstotliwości lub częstotliwości (tabela 1 9 19).

W szeregach rozkładów przedziałowych z nierównymi przedziałami obliczane są cechy matematyczne, takie jak gęstość rozkładu i względna gęstość rozkładu w danym przedziale. Pierwsza charakterystyka jest określona przez stosunek częstotliwości do wartości tego samego przedziału, druga - przez stosunek częstotliwości do wartości tego samego przedziału. Dla powyższego przykładu gęstość rozkładu w pierwszym przedziale wyniesie 3:5 = 0,6, a gęstość względna w tym przedziale wyniesie 7,5:5 = 1,55%.

. Tabela 19

. Serie dystrybucji interwałowej _

Opis zmian w atrybucie zmiennej odbywa się za pomocą szeregów dystrybucyjnych.

Szeregi rozkładu statystycznego- jest to uporządkowany rozkład jednostek populacji statystycznej na odrębne grupy według pewnego zmiennego atrybutu.

Szeregi statystyczne zbudowane na podstawie jakościowej nazywane są atrybutywny. Jeżeli szereg rozkładu oparty jest na atrybucie ilościowym, to szereg ten jest wariacja.

Z kolei szeregi wariacyjne dzielą się na dyskretne i interwałowe. U źródła oddzielny W serii dystrybucyjnej kryje się cecha dyskretna (nieciągła), która przyjmuje określone wartości liczbowe (liczba wykroczeń, liczba wniosków obywateli o pomoc prawną). Interwał szereg rozkładów budowany jest w oparciu o cechę ciągłą, która może przyjmować dowolne wartości z danego przedziału (wiek skazanego, kara pozbawienia wolności itp.)

Każdy szereg rozkładów statystycznych zawiera dwa obowiązkowe elementy - szeregi i warianty częstotliwości. Opcje (x ja) są indywidualnymi wartościami cechy, które przyjmuje w szeregu dystrybucyjnym. Częstotliwości (fi) to wartości liczbowe pokazujące, ile razy dane opcje występują w szeregu dystrybucyjnym. Suma wszystkich częstotliwości nazywana jest wielkością populacji.

Częstotliwości wyrażone w jednostkach względnych (ułamkach lub procentach) nazywane są częstotliwościami ( w ja). Suma częstotliwości jest równa jeden, jeśli Częstotliwości są wyrażone w ułamkach jeden lub 100, jeśli są wyrażone w procentach. Wykorzystanie liczności umożliwia porównanie szeregów wariacyjnych o różnej wielkości populacji. Częstotliwości określa następujący wzór:

Aby zbudować szereg dyskretny, wszystkie poszczególne wartości cechy występujące w szeregu są uszeregowane, a następnie obliczane są częstotliwości powtórzeń każdej wartości. Szereg rozkładów tworzony jest w idei tabeli składającej się z dwóch wierszy i kolumn, z których jedna zawiera wartości wariantów szeregu x ja, w drugim - wartości częstotliwości fi.

Rozważ przykład konstruowania dyskretnego szeregu wariacyjnego.

Przykład 3.1 . Według Ministerstwa Spraw Wewnętrznych zarejestrowane przestępstwa popełnione w mieście N małoletnich w wieku.

17 13 15 16 17 15 15 14 16 13 14 17 14 15 15 16 16 15 14 15 15 14 16 16 14 17 16 15 16 15 13 15 15 13 15 14 15 13 17 14.

Skonstruuj dyskretne szeregi dystrybucyjne.

Rozwiązanie .

W pierwszej kolejności należy uszeregować dane dotyczące wieku nieletnich, tj. zapisz je w porządku rosnącym.

13 13 13 13 13 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 15 15 15 15 15 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17



Tabela 3.1

Tak więc częstotliwości odzwierciedlają liczbę osób w danym wieku, na przykład 5 osób ma 13 lat, 8 osób ma 14 lat i tak dalej.

Budynek interwał rzędy rozkładów wykonuje się podobnie jak przy implementacji grupowania równoprzedziałowego według atrybutu ilościowego, czyli najpierw określa się optymalną liczbę grup, na które zbiór zostanie podzielony, ustala się granice przedziałów według grup oraz częstotliwości są obliczane.

Zilustrujmy konstrukcję szeregów rozkładów przedziałowych na poniższym przykładzie.

Przykład 3.2 .

Zbuduj serię przedziałową dla następującej populacji statystycznej - wynagrodzenie prawnika w biurze, tysiące rubli:

16,0 22,2 25,1 24,3 30,5 32,0 17,0 23,0 19,8 27,5 22,0 18,9 31,0 21,5 26,0 27,4

Rozwiązanie.

Przyjmijmy optymalną liczbę grup równoprzedziałowych dla danej populacji statystycznej, równą 4 (mamy 16 opcji). Dlatego liczebność każdej grupy jest równa:

a wartość każdego przedziału będzie równa:

Granice przedziałów wyznaczają wzory:

,

gdzie są odpowiednio dolna i górna granica i-tego przedziału.

Pomijając pośrednie obliczenia granic przedziałów, wprowadzamy ich wartości (opcje) oraz liczbę prawników (częstotliwości), którzy mają pensje w każdym przedziale w tabeli 3.2, która ilustruje powstałe szeregi przedziałowe.

Tabela 3.2

Analizę szeregów rozkładów statystycznych można przeprowadzić metodą graficzną. Graficzna reprezentacja szeregów dystrybucyjnych umożliwia wizualną ilustrację wzorców rozmieszczenia badanej populacji poprzez przedstawienie jej w postaci wielokąta, histogramu i kumulacji. Przyjrzyjmy się każdemu z tych wykresów.

Wielokąt to polilinia, której segmenty łączą punkty o współrzędnych ( x ja;fi). Zazwyczaj wielokąt służy do wyświetlania dyskretnych szeregów rozkładu. Aby go zbudować, uszeregowane poszczególne wartości cechy są wykreślane na osi x x ja, na osi y są częstotliwości odpowiadające tym wartościom. W rezultacie łącząc odcinki punktów odpowiadających danym zaznaczonym wzdłuż osi odciętych i rzędnych otrzymuje się polilinię, zwaną wielokątem. Podajmy przykład konstrukcji wielokąta częstości.

Aby zilustrować budowę wielokąta, weźmy wynik rozwiązania Przykładu 3.1 dla skonstruowania szeregu dyskretnego - Rysunek 1. Odcięta pokazuje wiek skazanych, rzędna pokazuje liczbę skazanych młodocianych w danym wieku. Analizując ten wielokąt możemy stwierdzić, że największa liczba skazanych – 14 osób, ma 15 lat.

Rysunek 3.1 - Zakres częstotliwości szeregu dyskretnego.

Wielokąt można również zbudować dla serii interwałów, w którym to przypadku punkty środkowe interwałów są wykreślane wzdłuż osi odciętej, a odpowiadające im częstotliwości są wykreślane wzdłuż osi rzędnych.

wykres słupkowy– figura schodkowa składająca się z prostokątów, których podstawą są przedziały wartości cechy, a wysokości są równe odpowiadającym im częstotliwościom. Histogram służy wyłącznie do wyświetlania szeregów rozkładu interwałowego. Jeśli przedziały są nierówne, to aby zbudować histogram na osi y, nie wykreśla się częstotliwości, ale stosunek częstotliwości do szerokości odpowiedniego przedziału. Histogram można przekształcić w wielokąt rozkładu, jeśli środki jego kolumn są połączone segmentami.

Aby zilustrować konstrukcję histogramu, weźmy wyniki konstruowania szeregu przedziałowego z Przykładu 3.2 - Rysunek 3.2.

Rysunek 3.2 – Histogram rozkładu wynagrodzeń prawników.

Do graficznego przedstawienia szeregu wariacyjnego stosuje się również kumulację. Kumulować jest krzywą reprezentującą serię skumulowanych częstotliwości i łączących punkty ze współrzędnymi ( x ja;jesli nak). Liczebności skumulowane są obliczane przez kolejne sumowanie wszystkich liczności szeregu rozkładów i pokazują liczbę jednostek populacji, które mają wartość cechy nie większą niż określona. Zilustrujmy obliczenie liczności akumulowanych dla szeregu przedziałów wariacyjnych przedstawionych w przykładzie 3.2 – tabela 3.3.

Tabela 3.3

Aby zbudować skumulowaną serię dyskretnych rozkładów, uszeregowane indywidualne wartości cechy są wykreślane wzdłuż osi odciętej, a skumulowane częstotliwości odpowiadające im są wykreślane wzdłuż osi rzędnych. Podczas konstruowania krzywej skumulowanej szeregu przedziałowego pierwszy punkt będzie miał odciętą równą dolnej granicy pierwszego przedziału i rzędną równą 0. Wszystkie kolejne punkty muszą odpowiadać górnej granicy przedziałów. Zbudujmy kumulację, korzystając z danych z tabeli 3.3 - rysunek 3.3.

Rysunek 3.3 – Krzywa skumulowanego rozkładu wynagrodzeń prawników.

pytania testowe

1. Pojęcie szeregu rozkładów statystycznych, jego główne elementy.

2. Rodzaje statystycznych szeregów dystrybucyjnych. Ich krótki opis.

3. Szeregi rozkładów dyskretnych i przedziałowych.

4. Technika konstruowania dyskretnych szeregów rozdzielczych.

5. Technika konstruowania szeregów rozkładów przedziałowych.

6. Graficzna reprezentacja dyskretnych szeregów dystrybucyjnych.

7. Graficzna reprezentacja szeregów rozkładów przedziałowych.

Zadania

Zadanie 1. Dostępne są następujące dane dotyczące postępów 25 uczniów grupy w TGP na sesję: 5, 4, 4, 4, 3, 2, 5, 3, 4, 4, 4, 3, 2, 5, 2, 5 , 5, 2, 3 , 3, 5, 4, 2, 3, 3. Skonstruuj dyskretny szereg wariacyjny rozkładu uczniów zgodnie z wynikami ocen otrzymanych w sesji. Dla wynikowych serii oblicz Częstotliwości, Częstotliwości skumulowane, Częstotliwości skumulowane. Wyciągnij własne wnioski.

Zadanie 2. Kolonia liczy 1000 skazanych, ich rozkład wiekowy przedstawia tabela:

Pokaż tę serię graficznie. Wyciągnij własne wnioski.

Zadanie 3. Dostępne są następujące dane dotyczące warunków odbywania kary pozbawienia wolności skazanych:

5; 4; 2; 1; 6; 3; 4; 3; 2; 2; 3; 1; 17; 6; 2; 8; 5; 11; 9; 3; 5; 6; 4; 3; 10; 5; 25; 1; 12; 3; 3; 4; 9; 6; 5; 3; 4; 3; 5; 12; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 3; 12; 6.

Zbuduj serię interwałową rozkładu więźniów według warunków pozbawienia wolności. Wyciągnij własne wnioski.

Zadanie 4. Dostępne są następujące dane dotyczące rozmieszczenia skazanych w województwie za okres badania według grup wiekowych:

Narysuj tę serię graficznie, wyciągnij wnioski.

Wyższe wykształcenie zawodowe

„ROSYJSKA AKADEMIA GOSPODARKI LUDOWEJ I

SŁUŻBA CYWILNA POD PREZYDENTEM

FEDERACJA ROSYJSKA"

(oddział w Kałudze)

Katedra Nauk Przyrodniczych i Dyscyplin Matematycznych

TEST

Temat "Statystyki"

Student ___ Mayboroda Galina Yurievna ______

Wydział Korespondencji Państwowa i komunalna grupa gospodarcza G-12-V

Wykładowca ____________________ Hamer G.V.

dr, profesor nadzwyczajny

Kaługa-2013

Zadanie 1.

Zadanie 1.1. cztery

Zadanie 1.2. 16

Zadanie 1.3. 24

Zadanie 1.4. 33

Zadanie 2.

Zadanie 2.1. 43

Zadanie 2.2. 48

Zadanie 2.3. 53

Zadanie 2.4. 58

Zadanie 3.

Zadanie 3.1. 63

Zadanie 3.2. 68

Zadanie 3.3. 73

Zadanie 3.4. 79

Zadanie 4.

Problem 4.1. 85

Zadanie 4.2. 88

Zadanie 4.3. 90

Zadanie 4.4. 93

Lista wykorzystanych źródeł. 96

Zadanie 1.

Zadanie 1.1.

Poniżej przedstawiono dane dotyczące produkcji i wysokości zysku przedsiębiorstw regionu (tabela 1).

Tabela 1

Dane o wielkości produkcji i wysokości zysku przedsiębiorstw

numer firmowy Produkcja, miliony rubli Zysk, miliony rubli numer firmowy Produkcja, miliony rubli Zysk, miliony rubli
63,0 6,7 56,0 7,2
48,0 6,2 81,0 9,6
39,0 6,5 55,0 6,3
28,0 3,0 76,0 9,1
72,0 8,2 54,0 6,0
61,0 7,6 53,0 6,4
47,0 5,9 68,0 8,5
37,0 4,2 52,0 6,5
25,0 2,8 44,0 5,0
60,0 7,9 51,0 6,4
46,0 5,5 50,0 5,8
34,0 3,8 65,0 6,7
21,0 2,1 49,0 6,1
58,0 8,0 42,0 4,8
45,0 5,7 32,0 4,6

Według oryginalnych danych:

1. Zbuduj szereg statystyczny rozkładu przedsiębiorstw według produkcji, tworząc pięć grup w równych odstępach czasu.

Buduj wykresy szeregów rozkładów: wielokąt, histogram, kumuluj. Graficznie określ wartość trybu i mediany.

2. Oblicz charakterystykę szeregów rozkładu przedsiębiorstw według produkcji: średnia arytmetyczna, rozrzut, odchylenie standardowe, współczynnik zmienności.

Wyciągnij wniosek.

3. Stosując metodę grupowania analitycznego ustal obecność i charakter korelacji między kosztem wytworzonych produktów a wysokością zysku przypadającego na przedsiębiorstwo.

4. Zmierz ścisłość korelacji między kosztem produkcji a wysokością zysku za pomocą korelacji empirycznej.

Wyciągnij ogólne wnioski.

Rozwiązanie:

Zbudujmy serię statystyczną rozkładu

Aby skonstruować przedziałowy szereg zmienności charakteryzujący rozkład przedsiębiorstw pod względem produkcji, konieczne jest obliczenie wartości i granic przedziałów szeregu.

Podczas konstruowania szeregu o równych przedziałach wartość przedziału h określa wzór:

x maks oraz x min- największe i najmniejsze wartości atrybutu w badanym zbiorze przedsiębiorstw;

k- liczba grup szeregów interwałowych.

Liczba grup k określone w cesji. k= 5.

x maks= 81 mln rubli, x min= 21 mln rubli

Obliczanie wartości interwału:

milionów rubli

Kolejno dodając wartość przedziału h = 12 milionów rubli. do dolnej granicy przedziału otrzymujemy następujące grupy:

1 grupa: 21 - 33 miliony rubli.

2 grupa: 33 - 45 milionów rubli;

Grupa 3: 45 - 57 milionów rubli.

Grupa 4: 57 - 69 milionów rubli.

Grupa 5: 69 - 81 milionów rubli.

Aby skonstruować szereg przedziałowy, należy obliczyć liczbę przedsiębiorstw wchodzących w skład każdej grupy ( częstotliwości grupowe).

Proces grupowania przedsiębiorstw według wielkości produkcji przedstawiono w tabeli pomocniczej 2. Kolumna 4 tej tabeli jest niezbędna do zbudowania grupowania analitycznego (pkt 3 zadania).

Tabela 2

Tabela do budowy szeregów rozkładu przedziałowego i

grupowanie analityczne

Grupy przedsiębiorstw według produkcji, mln rubli numer firmowy Produkcja, miliony rubli Zysk, miliony rubli
21-33 21,0 2,1
25,0 2,8
28,0 3,0
32,0 4,6
Całkowity 106,0 12,5
33-45 34,0 3,8
37,0 4,2
39,0 6,5
42,0 4,8
44,0 5,0
Całkowity 196,0 24,3
45-57 45,0 5,7
46,0 5,5
47,0 5,9
48,0 6,2
49,0 6,1
50,0 5,8
51,0 6,4
52,0 6,5
53,0 6,4
54,0 6,0
55,0 6,3
56,0 7,2
Całkowity 606,0 74,0
57-69 58,0 8,0
60,0 7,9
61,0 7,6
63,0 6,7
65,0 6,7
68,0 8,5
Całkowity 375,0 45,4
69-81 72,0 8,2
76,0 9,1
81,0 9,6
Całkowity 229,0 26,9
Całkowity 183,1

W oparciu o wiersze podsumowania grup tabeli „Ogółem” 3 tworzona jest końcowa tabela 3, reprezentująca szeregi przedziałów rozkładu przedsiębiorstw według produkcji.

Tabela 3

Liczba dystrybucji przedsiębiorstw według wielkości produkcji

Wniosek. Zbudowane grupowanie pokazuje, że rozkład przedsiębiorstw pod względem produkcji nie jest równomierny. Najczęstsze przedsiębiorstwa o wielkości produkcji od 45 do 57 milionów rubli. (12 przedsiębiorstw). Najmniej powszechne są przedsiębiorstwa o produkcji od 69 do 81 mln rubli. (3 przedsiębiorstwa).

Zbudujmy wykresy szeregów dystrybucyjnych.

Wielokąt często używane do reprezentowania serii dyskretnych. Aby skonstruować wielokąt w prostokątnym układzie współrzędnych, wartości argumentu są wykreślane na osi odciętej, czyli opcje (dla serii zmienności przedziałów jako argument przyjmuje się środek przedziału), a na osi rzędnych - częstotliwość wartości. Ponadto w tym układzie współrzędnych budowane są punkty, których współrzędne są parami odpowiednich liczb z serii wariacji. Wynikowe punkty są połączone szeregowo odcinkami linii prostych. Wielokąt pokazano na rysunku 1.

wykres słupkowy - wykres słupkowy. Pozwala ocenić symetrię rozkładu. Histogram pokazano na rysunku 2.

Rysunek 1 - Rozkład wielokątów przedsiębiorstw według objętości

wyjście

Moda

Rysunek 2 - Histogram rozkładu przedsiębiorstw według wolumenu

wyjście

Moda- wartość cechy, która występuje najczęściej w badanej populacji.

W przypadku serii interwałowej tryb można określić graficznie na podstawie histogramu (Rysunek 2). W tym celu wybierany jest najwyższy prostokąt, który w tym przypadku jest modalny (45–57 milionów rubli). Następnie prawy wierzchołek prostokąta modalnego jest połączony z prawym górnym rogiem poprzedniego prostokąta. Lewy wierzchołek prostokąta modalnego znajduje się w lewym górnym rogu kolejnego prostokąta. Dalej, od punktu ich przecięcia, prostopadła jest obniżona do osi odciętej. Odcięta punktu przecięcia tych linii będzie trybem rozkładu.

Milion pocierać.

Wniosek. W rozważanym zestawie przedsiębiorstw najczęściej występują przedsiębiorstwa o produkcji 52 mln rubli.

Kumulować - krzywa łamana. Opiera się on na zakumulowanych częstotliwościach (obliczonych w tabeli 4). Kumulacja zaczyna się od dolnej granicy pierwszego przedziału (21 milionów rubli), skumulowana częstotliwość jest zdeponowana na górnej granicy przedziału. Kumulację pokazano na rysunku 3.

Mediana

Rysunek 3 - Skumulowany rozkład przedsiębiorstw według wolumenu

wyjście

Mediana Me to wartość cechy, która znajduje się w środku serii rankingowej. Po obu stronach mediany znajduje się taka sama liczba jednostek populacji.

W szeregu interwałowym medianę można określić graficznie na podstawie krzywej skumulowanej. Aby wyznaczyć medianę z punktu na skali skumulowanej częstotliwości odpowiadającego 50% (30:2 = 15), należy narysować linię prostą równolegle do osi odciętej, aż przetnie się ona ze skumulowaną. Następnie od punktu przecięcia wyznaczonej linii prostej z kumulatem opuszczany jest prostopadły do ​​osi odciętej. Odcięta punktu przecięcia jest medianą.

Milion pocierać.

Wniosek. W rozważanym zestawie przedsiębiorstw połowa przedsiębiorstw ma wielkość produkcji nie większą niż 52 miliony rubli, a druga połowa - nie mniej niż 52 miliony rubli.


Podobne informacje.


Podczas konstruowania szeregu rozkładów przedziałowych rozwiązane są trzy pytania:

  • 1. Ile interwałów powinienem robić?
  • 2. Jaka jest długość interwałów?
  • 3. Jaka jest procedura uwzględniania jednostek populacji w granicach przedziałów?
  • 1. Liczba interwałów można określić przez Formuła Sturgesa:

2. Długość interwału lub krok interwału, zwykle określa wzór

gdzie R- zakres zmienności.

3. Kolejność uwzględniania jednostek populacji w granicach przedziału

może być inny, ale przy konstruowaniu szeregu przedziałowego rozkład jest z konieczności ściśle określony.

Na przykład to: [), w którym jednostki populacji są zawarte w dolnych granicach, a nie w górnych granicach, ale są przenoszone do następnego przedziału. Wyjątkiem od tej reguły jest ostatni przedział , którego górna granica zawiera ostatnią liczbę szeregu rankingowego.

Granice interwałów to:

  • zamknięty - z dwiema skrajnymi wartościami atrybutu;
  • open - z jedną skrajną wartością atrybutu (zanim jakaś liczba lub koniec taki numer).

W celu przyswojenia materiału teoretycznego wprowadzamy informacje ogólne dla rozwiązań poprzez zadania.

Istnieją dane warunkowe dotyczące średniej liczby kierowników sprzedaży, liczby sprzedawanych przez nich towarów jednogatunkowych, indywidualnej ceny rynkowej tego produktu, a także wielkości sprzedaży 30 firm w jednym z regionów Federacji Rosyjskiej w I kwartał roku sprawozdawczego (tabela 2.1).

Tabela 2.1

Wstępne informacje dotyczące zadania przekrojowego

populacja

menedżerowie

Cena, tysiąc rubli

Wielkość sprzedaży, mln rubli

populacja

menedżerowie

Ilość sprzedanego towaru, szt.

Cena, tysiąc rubli

Wielkość sprzedaży, mln rubli

Na podstawie wstępnych informacji, a także informacji dodatkowych ustalimy poszczególne zadania. Następnie przedstawiamy metodologię ich rozwiązywania oraz same rozwiązania.

Zadanie przekrojowe. Zadanie 2.1

Korzystanie z oryginalnej tabeli danych. 2.1 wymagane zbudować dyskretny szereg dystrybucji firm według liczby sprzedanych towarów (tabela 2.2).

Rozwiązanie:

Tabela 2.2

Dyskretna seria dystrybucji firm według liczby sprzedanych towarów w jednym z regionów Federacji Rosyjskiej w pierwszym kwartale roku sprawozdawczego

Zadanie przekrojowe. Zadanie 2.2

wymagany zbudować rankingową serię 30 firm według średniej liczby menedżerów.

Rozwiązanie:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

Zadanie przekrojowe. Zadanie 2.3

Korzystanie z oryginalnej tabeli danych. 2.1, wymagany:

  • 1. Skonstruuj szereg przedziałowy dla rozkładu firm według liczby menedżerów.
  • 2. Oblicz częstości szeregów dystrybucyjnych firm.
  • 3. Wyciągnij wnioski.

Rozwiązanie:

Oblicz za pomocą wzoru Sturgess (2.5) liczba interwałów:

Tak więc bierzemy 6 interwałów (grup).

Długość interwału, lub krok interwału, obliczyć według wzoru

Notatka. Kolejność włączania jednostek populacji do granic przedziału jest następująca: I), w której jednostki populacji są zawarte w dolnych granicach i nie są uwzględnione w górnych, ale są przenoszone do następnego interwał. Wyjątkiem od tej reguły jest ostatni przedział I ], którego górna granica zawiera ostatnią liczbę szeregu rankingowego.

Budujemy szereg interwałowy (tabela 2.3).

Szeregi przedziałowe rozkładu firm, ale średnia liczba menedżerów w jednym z regionów Federacji Rosyjskiej w pierwszym kwartale roku sprawozdawczego

Wniosek. Najliczniejszą grupą firm jest grupa ze średnią liczbą menedżerów 25-30 osób, która obejmuje 8 firm (27%); najmniejsza grupa ze średnią liczbą menedżerów 40-45 osób obejmuje tylko jedną firmę (3%).

Korzystanie z oryginalnej tabeli danych. 2.1, a także szeregi przedziałowe rozkładu firm według liczby menedżerów (tabela 2.3), wymagany zbuduj analityczne grupowanie relacji między liczbą menedżerów a wielkością sprzedaży firm i na tej podstawie wyciągnij wniosek o obecności (lub braku) związku między wskazanymi znakami.

Rozwiązanie:

Grupowanie analityczne budowane jest na zasadzie czynnikowej. W naszym problemie znakiem czynnika (x) jest liczba menedżerów, a znakiem wypadkowym (y) wielkość sprzedaży (tabela 2.4).

Zbudujmy teraz grupowanie analityczne(Tabela 2.5).

Wniosek. Na podstawie danych skonstruowanego grupowania analitycznego można stwierdzić, że wraz ze wzrostem liczby kierowników sprzedaży wzrasta również średni wolumen sprzedaży firmy w grupie, co wskazuje na istnienie bezpośredniego związku między tymi cechami.

Tabela 2.4

Tabela pomocnicza do budowania grupowania analitycznego

Liczba menedżerów, osób,

Numer firmowy

Wielkość sprzedaży, mln rubli, r

» = 59 f = 9,97

I-™ 4 - Yu.22

74 '25 1PLN1

U4 = 7 = 10,61

w = ’ =10,31 30

Tabela 2.5

Zależność wielkości sprzedaży od liczby kierowników firmy w jednym z regionów Federacji Rosyjskiej w pierwszym kwartale roku sprawozdawczego

PYTANIA TESTOWE
  • 1. Jaka jest istota obserwacji statystycznej?
  • 2. Wymień etapy obserwacji statystycznej.
  • 3. Jakie są formy organizacyjne obserwacji statystycznych?
  • 4. Wymień rodzaje obserwacji statystycznych.
  • 5. Co to jest podsumowanie statystyczne?
  • 6. Wymień rodzaje raportów statystycznych.
  • 7. Co to jest grupowanie statystyczne?
  • 8. Wymień rodzaje grupowań statystycznych.
  • 9. Co to jest seria dystrybucyjna?
  • 10. Wymień elementy strukturalne szeregu rozdzielczego.
  • 11. Jaka jest procedura konstruowania szeregu dystrybucyjnego?

Najważniejszym etapem w badaniu zjawisk i procesów społeczno-gospodarczych jest usystematyzowanie danych pierwotnych i na tej podstawie uzyskanie sumarycznej charakterystyki całego obiektu za pomocą wskaźników uogólniających, co osiąga się poprzez sumowanie i grupowanie pierwotnego materiału statystycznego.

Podsumowanie statystyczne - jest to zespół sekwencyjnych operacji uogólniających określone pojedyncze fakty, które tworzą zbiór, w celu zidentyfikowania typowych cech i wzorców tkwiących w badanym zjawisku jako całości. Przeprowadzenie zestawienia statystycznego obejmuje następujące kroki :

  • wybór funkcji grupowania;
  • ustalenie kolejności formowania się grup;
  • opracowanie systemu wskaźników statystycznych do scharakteryzowania grup i obiektu jako całości;
  • opracowanie układów tabel statystycznych do prezentacji wyników podsumowujących.

Grupowanie statystyczne nazwano podziałem jednostek badanej populacji na jednorodne grupy według pewnych cech, które są dla nich istotne. Grupowania są najważniejszą statystyczną metodą podsumowywania danych statystycznych, podstawą prawidłowego obliczania wskaźników statystycznych.

Wyróżnia się następujące rodzaje grupowań: typologiczne, strukturalne, analityczne. Wszystkie te grupy łączy fakt, że jednostki obiektu są podzielone na grupy według jakiegoś atrybutu.

znak grupujący nazywa się znakiem, za pomocą którego jednostki populacji są podzielone na oddzielne grupy. Wnioski z badania statystycznego zależą od prawidłowego wyboru atrybutu grupującego. Jako podstawę do grupowania konieczne jest wykorzystanie istotnych, teoretycznie uzasadnionych cech (ilościowych lub jakościowych).

Ilościowe oznaki grupowania mieć wyrażenie liczbowe (wolumen obrotu, wiek osoby, dochód rodziny itp.) oraz cechy jakościowe zgrupowania odzwierciedlają stan jednostki populacji (płeć, stan cywilny, przynależność branżowa przedsiębiorstwa, forma własności itp.).

Po ustaleniu podstawy grupowania należy rozstrzygnąć kwestię liczby grup, na które należy podzielić badaną populację. Liczba grup zależy od celów badania i rodzaju wskaźnika stanowiącego podstawę grupowania, wielkości populacji, stopnia zmienności cechy.

Na przykład grupowanie przedsiębiorstw według form własności uwzględnia własność komunalną, federalną i własność podmiotów federacji. Jeżeli grupowanie odbywa się zgodnie z atrybutem ilościowym, należy zwrócić szczególną uwagę na liczbę jednostek badanego obiektu i stopień fluktuacji atrybutu grupowania.

Po określeniu liczby grup należy określić przedziały grupowania. Interwał - są to wartości cechy zmiennej, które mieszczą się w pewnych granicach. Każdy przedział ma swoją wartość, górną i dolną granicę lub przynajmniej jedną z nich.

Dolna granica przedziału nazywana jest najmniejszą wartością atrybutu w przedziale, a Górna granica - największa wartość atrybutu w przedziale. Wartość interwału to różnica między górną i dolną granicą.

Przedziały grupowania, w zależności od ich wielkości, są równe i nierówne. Jeżeli zmienność cechy przejawia się w stosunkowo wąskich granicach, a rozkład jest równomierny, to zgrupowanie budowane jest w równych odstępach. Wartość równego przedziału określa następujący wzór :

gdzie Xmax, Xmin - maksymalna i minimalna wartość atrybutu w agregacie; n to liczba grup.

Najprostsze grupowanie, w którym każda wybrana grupa charakteryzuje się jednym wskaźnikiem, to szeregi dystrybucyjne.

Szeregi rozkładu statystycznego - jest to uporządkowany rozkład jednostek ludności na grupy według określonego atrybutu. W zależności od cechy leżącej u podstaw tworzenia szeregów dystrybucyjnych rozróżnia się szeregi rozkładów atrybutowych i zmienności.

atrybutywny nazywają szeregi dystrybucyjne zbudowane według cech jakościowych, czyli znaków, które nie mają wyrażenia liczbowego (podział według rodzaju pracy, według płci, według zawodu itp.). Szeregi dystrybucji atrybutów charakteryzują skład populacji według jednej lub drugiej istotnej cechy. Dane te, ujmowane w kilku okresach, pozwalają nam zbadać zmianę struktury.

Wiersze odmiany zwane szeregami dystrybucyjnymi zbudowanymi na podstawie ilościowej. Każda seria wariacyjna składa się z dwóch elementów: wariantów i częstotliwości. Opcje nazywamy poszczególne wartości atrybutu, który przyjmuje w serii odmian, czyli konkretną wartość atrybutu zmiennej.

Częstotliwości zwane numerem pojedynczego wariantu lub każdej grupy szeregu wariantów, to znaczy są to liczby, które pokazują, jak często określone warianty występują w szeregu rozdzielczym. Suma wszystkich częstotliwości określa wielkość całej populacji, jej wielkość. Częstotliwości wywoływane są częstotliwości wyrażone w ułamkach jednostki lub jako procent całości. W związku z tym suma częstotliwości jest równa 1 lub 100%.

W zależności od charakteru zmienności cechy wyróżnia się trzy formy szeregu wariacyjnego: szereg szeregowy, szereg dyskretny i szereg interwałowy.

Seria wariacji rankingowych - jest to rozkład poszczególnych jednostek populacji w porządku rosnącym lub malejącym badanej cechy. Ranking ułatwia dzielenie danych ilościowych na grupy, natychmiastowe wykrywanie najmniejszych i największych wartości cechy, wyróżnianie wartości, które najczęściej się powtarzają.

Dyskretna seria odmian charakteryzuje rozkład jednostek populacji zgodnie z atrybutem dyskretnym, który przyjmuje tylko wartości całkowite. Na przykład kategoria taryfowa, liczba dzieci w rodzinie, liczba pracowników w przedsiębiorstwie itp.

Jeśli znak ma ciągłą zmianę, która w pewnych granicach może przybierać dowolne wartości („od - do”), to dla tego znaku musisz zbudować seria zmienności interwału . Na przykład kwota dochodu, doświadczenie zawodowe, koszt środków trwałych przedsiębiorstwa itp.

Przykłady rozwiązywania problemów na temat „Podsumowanie statystyczne i grupowanie”

Zadanie 1 . Znajduje się tam informacja o liczbie książek otrzymanych przez studentów w ramach prenumeraty za miniony rok akademicki.

Zbuduj szeregowy i dyskretny rozkład wariacyjny, oznaczający elementy serii.

Rozwiązanie

Ten zestaw to zestaw opcji dotyczących liczby książek, które otrzymują studenci. Policzmy liczbę takich wariantów i uporządkujmy je w postaci szeregów wariacyjnych uszeregowanych i dyskretnych wariacyjnych.

Zadanie 2 . Istnieją dane o wartości środków trwałych dla 50 przedsiębiorstw, tysiące rubli.

Zbuduj serię dystrybucji, wyróżniając 5 grup przedsiębiorstw (w równych odstępach).

Rozwiązanie

Do rozwiązania dobieramy największe i najmniejsze wartości kosztów środków trwałych przedsiębiorstw. Są to 30,0 i 10,2 tys. Rubli.

Znajdź wielkość przedziału: h \u003d (30,0-10,2): 5 \u003d 3,96 tys. Rubli.

Następnie pierwsza grupa obejmie przedsiębiorstwa, których kwota środków trwałych wynosi od 10,2 tys. Rubli. do 10,2 + 3,96 = 14,16 tysięcy rubli. Takich przedsiębiorstw będzie 9. Druga grupa będzie obejmowała przedsiębiorstwa, których wartość środków trwałych wyniesie od 14,16 tys. Rubli. do 14,16 + 3,96 = 18,12 tys. Rubli. Takich przedsiębiorstw będzie 16. Podobnie znajdujemy liczbę przedsiębiorstw zaliczanych do grupy trzeciej, czwartej i piątej.

Otrzymany szereg rozkładów jest umieszczany w tabeli.

Zadanie 3 . Dla szeregu przedsiębiorstw przemysłu lekkiego uzyskano następujące dane:

Pogrupuj przedsiębiorstwa według liczby pracowników, tworząc 6 grup w równych odstępach. Policz dla każdej grupy:

1. liczba przedsiębiorstw
2. liczba pracowników
3. ilość wytwarzanych produktów rocznie
4. średnia rzeczywista produkcja na pracownika
5. ilość środków trwałych
6. średnia wielkość majątku trwałego jednego przedsiębiorstwa
7. średnia wartość wytwarzanych wyrobów przez jedno przedsiębiorstwo

Zapisz wyniki obliczeń w tabelach. Wyciągnij własne wnioski.

Rozwiązanie

Do rozwiązania wybieramy największe i najmniejsze wartości średniej liczby pracowników w przedsiębiorstwie. Są to 43 i 256.

Znajdź rozmiar przedziału: h = (256-43): 6 = 35,5

Następnie do pierwszej grupy będą należeć przedsiębiorstwa o przeciętnej liczbie pracowników od 43 do 43 + 35,5 = 78,5 osób. Takich przedsiębiorstw będzie 5. Druga grupa będzie obejmowała przedsiębiorstwa, w których średnia liczba pracowników będzie wynosić od 78,5 do 78,5 + 35,5 = 114 osób. Takich przedsiębiorstw będzie 12. Podobnie znajdujemy liczbę przedsiębiorstw zaliczanych do grupy trzeciej, czwartej, piątej i szóstej.

Otrzymane serie dystrybucji umieszczamy w tabeli i obliczamy niezbędne wskaźniki dla każdej grupy:

Wniosek : Jak widać z tabeli, druga grupa przedsiębiorstw jest najliczniejsza. Obejmuje 12 przedsiębiorstw. Najmniejsze są grupy piąta i szósta (po dwa przedsiębiorstwa). Są to przedsiębiorstwa największe (pod względem liczby zatrudnionych).

Ponieważ druga grupa jest najliczniejsza, wielkość produkcji rocznie przedsiębiorstw tej grupy oraz wielkość majątku trwałego są znacznie wyższe niż pozostałe. Jednocześnie średnia rzeczywista produkcja jednego pracownika w przedsiębiorstwach tej grupy nie jest najwyższa. Prym wiodą tu przedsiębiorstwa czwartej grupy. Ta grupa to również dość duża ilość środków trwałych.

Podsumowując, zauważamy, że przeciętna wielkość majątku trwałego i przeciętna wartość produkcji jednego przedsiębiorstwa są wprost proporcjonalne do wielkości przedsiębiorstwa (pod względem liczby pracujących).

KATEGORIE

POPULARNE ARTYKUŁY

2022 „kingad.ru” - badanie ultrasonograficzne narządów ludzkich