Distribucijski rangovi. Serije distribucije atributa i varijacija

Prvi korak u statističkom proučavanju varijacije je konstrukcija varijacijske serije - uređena distribucija jedinica populacije prema rastućim (češće) ili opadajućim (rjeđe) vrijednostima atributa i brojanjem broja jedinica s jednom ili drugom vrijednošću atributa.

Postoje tri oblika varijacijskog niza: rasponski niz, diskretni niz, intervalni niz. Često se naziva varijacijski niz blizu distribucije. Ovaj se izraz koristi u proučavanju varijacija kvantitativnih i nekvantitativnih svojstava. Distribucijska serija je strukturno grupiranje(vidi poglavlje 6).

Rangirani redak - ovo je popis pojedinačnih jedinica populacije u uzlaznom (silaznom) redoslijedu osobine koja se proučava.

Tablica 1 može poslužiti kao primjer rangirane serije. 5.5.

Tablica 5.5

Velike banke Sankt Peterburga, poredane po veličinivlastiti kapital od 01.07.96

Ako je broj populacijskih jedinica dovoljno velik, rangirani niz postaje glomazan, a njegova konstrukcija, čak i uz pomoć računala, dugo traje. U takvim slučajevima, niz varijacija se konstruira grupiranjem jedinica populacije prema vrijednostima svojstva koje se proučava.

Ako atribut ima mali broj vrijednosti, gradi se diskretni varijacijski niz. Primjer takvog niza je distribucija nogometnih utakmica prema broju postignutih golova (tablica 5.1). Serije diskretnih varijacija - ovo je tablica koja se sastoji od dva retka ili grafikona: specifične vrijednosti varijabilnog atributa xja i broj jedinica populacije sa zadanom vrijednošću obilježja fi frekvencije (f je početno slovo engleske riječi frekvencija).

Određivanje broja grupa

Broj grupa u diskretnoj seriji varijacija određen je brojem stvarno postojećih vrijednosti atributa varijable. Ako svojstvo može poprimiti diskretne vrijednosti, ali je njihov broj vrlo velik (na primjer, broj stoke 1. siječnja u godini u različitim poljoprivrednim poduzećima može se kretati od nule do nekoliko desetaka tisuća grla), tada je niz intervalnih varijacija. izgrađena je. Intervalni varijacijski niz također je konstruiran za proučavanje značajki koje mogu poprimiti bilo koje, i cijele i frakcijske vrijednosti u području svog postojanja. Takvi su, primjerice, profitabilnost prodanih proizvoda, trošak jedinice proizvodnje, dohodak po 1 stanovniku grada, udio visokoobrazovanih u stanovništvu različitih teritorija i općenito sve sekundarne karakteristike, čije se vrijednosti izračunavaju dijeljenjem vrijednosti jedne primarne karakteristike s vrijednošću druge (vidi Poglavlje 3).

Intervalni varijacijski nizovi je tablica (koja se sastoji od dva stupca (ili reda) - intervala svojstva čija se varijacija proučava i broja jedinica populacije koje spadaju u taj interval (frekvencije) ili udjela tog broja od ukupna populacija (učestalosti).

Prilikom konstruiranja niza intervalnih varijacija potrebno je odabrati optimalan broj grupa (intervala znakova) i postaviti duljinu intervala. Budući da se pri analizi varijacijskog niza frekvencije uspoređuju u različitim intervalima, potrebno je da vrijednost intervala bude konstantna. Optimalan broj skupina odabire se na takav način da se raznolikost vrijednosti svojstava u agregatu dovoljno odražava i, u isto vrijeme, pravilnost distribucije, njezin oblik nije iskrivljen slučajnim fluktuacijama frekvencije. Ako postoji premalo grupa, neće biti uzorka varijacija; ako postoji previše grupa, nasumični skokovi frekvencije će iskriviti oblik distribucije.

Najčešće se broj skupina u varijacijskom nizu određuje prema formuli koju preporučuje američki statističar Sturgess. (Sturgess):

Gdje k- broj grupa; n- veličina populacije.

Ova formula pokazuje da je broj grupa funkcija količine podataka.

Pretpostavimo da je potrebno izgraditi varijacijski niz raspodjele poduzeća u regiji prema prinosu žitarica za određenu godinu. Broj poljoprivrednih poduzeća s usjevima žitarica bio je 143; najmanja vrijednost prinosa je 10,7 c/ha, najveća 53,1 c/ha. Imamo:

Budući da je broj grupa cjelobrojan, preporučuje se sastavljanje 8 ili 9 grupa.

Određivanje veličine intervala

Znajući broj grupa, izračunajte vrijednost intervala:

U našem primjeru vrijednost intervala je:

a) sa 8 grupa

b) sa 9 grupa

Za izradu niza i analizu varijacija, puno je bolje imati zaokružene vrijednosti veličine intervala i njegovih granica, ako je moguće. Stoga bi najbolje rješenje bilo izgraditi varijacijsku seriju s 9 skupina s intervalom jednakim 5 q/ha. Ova serija varijacija dana je u tablici. 5.6, a njen grafički prikaz dat je na sl. 5.1.

Granice intervala mogu se odrediti na različite načine: gornja granica prethodnog intervala ponavlja donju granicu sljedećeg, kao što je prikazano u tablici. 5.6, ili se ne ponavlja.

U potonjem slučaju, drugi interval bit će označen kao 15.1-20, treći kao 20.1-25, itd., tj. pretpostavlja se da su sve vrijednosti prinosa nužno zaokružene na jednu desetinu. Osim toga, javlja se neželjena komplikacija sa sredinom intervala 15,1-20, koja će, strogo govoreći, već biti jednaka ne 17,5, već 17,55; prema tome, kada zaokruženi interval 40-60 zamijenimo 40,1-6,0, umjesto zaokružene vrijednosti njegove sredine 50, dobivamo 50,5. Stoga je poželjno ostaviti intervale s ponavljajućim zaobljenim rubom i dogovoriti se da jedinice populacije koje imaju vrijednost značajke jednaku granici intervala, uključeni su u interval u kojem je ta točna vrijednost prvi put prijavljena. Tako je farma s prinosom od 15 centnera po hektaru uključena u prvu skupinu, vrijednost od 20 centnera po hektaru uključena je u drugu, i tako dalje.

Riža. 5.1. Raspodjela gospodarstava prema prinosu

Tablica 5.6

Raspodjela gospodarstava u regiji prema prinosu žitarica

Grupe farmi prema prinosu,

c/ha xj

Broj farmi

Sredina intervala

c/ha xj"

Akumulirana frekvencija f'j

Grafički prikaz varijacijskog niza

Značajnu pomoć u analizi varijacijskog niza i njegovih svojstava pruža grafički prikaz. Niz intervala predstavljen je stupčastim grafikonom, u kojem su baze stupaca, smještene na apscisnoj osi, intervali vrijednosti promjenjivog atributa, a visine stupaca su frekvencije koje odgovaraju ljestvici duž y-osi. Grafički prikaz distribucije poljoprivrednih gospodarstava u regiji po prinosima žitarica prikazan je na sl. 5.1. Ova vrsta dijagrama često se naziva histogram(od grčke riječi "histos" - tkivo, struktura).

Tablični podaci. 5.5 i sl. 5.1 prikazuje oblik distribucije karakterističan za mnoge znakove: vrijednosti prosječnih intervala znaka su češće, rjeđe - ekstremne; male i velike vrijednosti obilježja. Oblik ove distribucije blizak je zakonu normalne distribucije koji se razmatra u matematičkoj statistici. Veliki ruski matematičar A. M. Ljapunov (1857. - 1918.) dokazao je da normalna raspodjela nastaje ako na varijablu varijable utječe veliki broj čimbenika od kojih niti jedan nema prevladavajući utjecaj. Slučajna kombinacija mnogih približno jednakih čimbenika koji utječu na varijacije prinosa žitarica, kako prirodnih tako i agrotehničkih, ekonomskih, stvara raspodjelu poljoprivrednih gospodarstava u regiji po prinosu blisku normalnom zakonu raspodjele.

Ako postoji diskretni varijacijski niz ili se koriste središnje točke intervala, tada se grafički prikaz takvog varijacijskog niza naziva poligon(od grčkih riječi - poligon). Svatko od vas može jednostavno sastaviti ovaj grafikon povezujući točke s koordinatama ravnim crtama X, I /.

Omjer visine poligona ili grafikona prema njegovoj bazi preporučuje se u omjeru od približno 5:8.

Pojam frekvencije

Ako u tablici 5.6 Izrazite broj farmi s jednom ili drugom razinom produktivnosti kao postotak ukupnog broja, uzimajući cijeli broj farmi (143) kao 100%, tada se prosječni prinos može izračunati na sljedeći način:

Gdje w- učestalost 7. kategorije varijacijskog niza;

Kumulativna distribucija

Transformirani oblik varijacijskog niza je broj akumuliranih frekvencija, dati u tablici. 5.6, stupac 5. Ovo je niz vrijednosti za broj jedinica u populaciji s manjim i jednakim donjoj granici odgovarajućih intervalnih vrijednosti atributa. Takav niz se zove kumulativno. Možete izgraditi kumulativnu distribuciju "ne manje od", ili možete "veće od". U prvom slučaju naziva se kumulativni raspored raspodjele kumulovanje, u drugom - ogive(Slika 5.2).

Gustoća, raspodjela

Ako imate posla s varijacijskim nizom s nejednakim intervalima, tada za usporedivost morate frekvenciju ili frekvenciju dovesti do jedinice intervala. Dobiveni omjer naziva se gustoća distribucije:

Gustoća distribucije koristi se kako za izračun generalizirajućih pokazatelja, tako i za grafički prikaz nizova varijacija s nejednakim intervalima.

Riža. 5.2. Ogiva i kumulativna raspodjela prinosa

5.7. Strukturne karakteristike varijacije red

Medijan distribucije

Pri proučavanju varijacije koriste se takve karakteristike varijacijskog niza koje kvantitativno opisuju njegovu strukturu, strukturu. Takav je npr. srednji- vrijednost značajke varijable koja dijeli populaciju na dva jednaka dijela ~ s vrijednostima značajki manjim od medijana I s vrijednostima obilježja većim od medijana (treća skupina od pet u tablici 5.5, tj. 196 milijardi rubalja).

Na primjeru tablice. 5.5 prikazuje temeljnu razliku između medijana i prosjeka. Medijan ne ovisi o vrijednostima značajki na rubovima rangirane serije. Čak i da je kapital najveće banke u Sankt Peterburgu deset puta veći, srednja vrijednost se ne bi promijenila. Stoga se medijan često koristi kao pouzdaniji pokazatelj tipične vrijednosti značajke od aritmetičke sredine, ako je niz vrijednosti heterogen, uključuje oštra odstupanja od srednje vrijednosti. U ovoj seriji, prosječna vrijednost kapitala, jednaka 269 milijardi rubalja, formirana je pod snažnim utjecajem najveće opcije. 80% banaka ima kapital manji od prosjeka, a samo 20% veći. Malo je vjerojatno da se takav prosjek može smatrati tipičnom vrijednošću. S parnim brojem jedinica populacije, medijan se uzima kao aritmetički prosjek dviju središnjih opcija, na primjer, s deset vrijednosti atributa, prosjek pete i šeste vrijednosti u rangiranoj seriji.

U intervalnom varijacijskom nizu, formula (5.14) se koristi za pronalaženje medijana.

gdje je Me medijan;

x 0 - donja granica intervala u kojem se nalazi medijan;

f M e-1 - akumulirana frekvencija u intervalu koji prethodi medijanu;

f ja- učestalost u srednjem intervalu;

ja- vrijednost intervala;

k - broj grupa.

U tablici. 5.6 medijan je prosjek 143 vrijednosti, tj. sedamdeset druga od početka niza vrijednost produktivnosti. Kao što je vidljivo iz broja akumuliranih frekvencija, nalazi se u četvrtom intervalu. Zatim

S neparnim brojem jedinica populacije, srednji broj, kao što vidimo, jednak je ne , kao u formuli (5.14), a , ali ta razlika nije značajna i obično se zanemaruje u praksi.

U diskretnoj varijacijskoj seriji, medijan treba smatrati vrijednošću obilježja u skupini u kojoj je akumulirana frekvencija;

više od polovice stanovništva. Na primjer, za podatke u tablici. 5.1 Srednji broj postignutih golova po utakmici bit će 2.

Kvartili distribucije

Slično medijanu, izračunavaju se vrijednosti atributa, dijeleći populaciju na četiri dijela jednaka po broju jedinica. Te se količine nazivaju kvartili i označavaju se velikim latiničnim "slovom" Q sa značkom potpisanog kvartilnog broja. Jasno je da Q 2 odgovara Meni. Za prvi i treći kvartil prikazujemo formule i izračun prema tablici. 5.6.

Jer Q 2 = Me = 29,5 c/ha, vidi se da je razlika između prvog kvartila i medijana manja nego između medijana i trećeg kvartila. Ova činjenica ukazuje na prisutnost određene asimetrije u srednjem području distribucije, što je također vidljivo na Sl. 5.1.

Nazivaju se karakteristične vrijednosti koje dijele niz na pet jednakih dijelova kvintile na deset dijelova decili, sto dijelova percentili. Budući da se ove karakteristike koriste samo kada je potrebno detaljno proučiti strukturu varijacijskog niza, nećemo navoditi njihove formule i izračun.

Način distribucije

Nedvojbeno je da je takva vrijednost svojstva koja se javlja u proučavanom nizu, najčešće u agregatu, od velikog značaja. Ova količina se zove moda i označavaju Mo. U diskretnom nizu mod se određuje bez izračuna kao vrijednost značajke s najvećom frekvencijom. Na primjer, prema tablici. 5.1 najčešće su postignuta 2 gola u nogometnoj utakmici - 71 puta. Način je broj 2. Obično postoje redovi s jednom modalnom vrijednošću atributa. Ako su u nizu varijacija prisutne dvije ili više jednakih (pa čak i nekoliko različitih, ali većih od susjednih) vrijednosti obilježja, ono se smatra bimodalnim („poput deve”) odnosno multimodalnim. Ovo ukazuje na heterogenost skupa, koji može predstavljati agregat nekoliko skupova s ​​različitim načinima rada.

Dakle, u gomili turista koji su došli iz različitih zemalja, umjesto jedne moderne odjeće koja prevladava među lokalnim stanovništvom, možete pronaći mješavinu različitih "moda" koje su prihvatili različiti narodi svijeta.

U seriji intervalnih varijacija, posebno s kontinuiranom varijacijom značajke, strogo govoreći, svaka se vrijednost značajke pojavljuje samo jednom. Modalni interval je interval s najvećom frekvencijom.Unutar tog intervala nalazi se uvjetna vrijednost atributa u čijoj blizini je gustoća distribucije, tj. broj jedinica populacije po mjernoj jedinici varijabilnog atributa doseže maksimum. Ovo je uvjetna vrijednost i uzima se u obzir točkasta moda. Logično je pretpostaviti da se takva točka moda nalazi bliže onoj granici intervala, iza koje je frekvencija u susjednom intervalu veća od frekvencije u intervalu iza druge granice modalnog intervala. Stoga imamo često korištenu formulu (5.15):

Gdje x 0 - donja granica modalnog intervala;

fMo - učestalost u modalnom intervalu;

fMo -1 - učestalost u prethodnom intervalu;

fMo +1 - frekvencija u sljedećem intervalu nakon modala;

ja - vrijednost intervala.

Prema tablici. 5.6 izračunajte modu:

Izračun moda u intervalnom nizu prilično je uvjetovan. Približno, Mo se može odrediti grafički (vidi sl. 5.1).

Vrijednost aritmetičke sredine također je relevantna za proučavanje strukture varijacijskog niza, iako je glavna vrijednost ovog generalizirajućeg pokazatelja drugačija. U nizu distribucije farmi prema prinosu (tablica 5.6), prosječni prinos se izračunava kao frekvencijski ponderirana sredina intervala x(po formuli (5.2)):

Odnos između srednje vrijednosti, medijana i modusa

Razlika između aritmetičke sredine, medijana i moda u ovoj distribuciji je mala. Ako je raspodjela po obliku bliska normalnom zakonu, tada je medijan između modusa i srednje vrijednosti, a bliži je prosjeku nego modusu.

S asimetrijom desne strane x̅ > Ja > Mo;

s lijevom asimetrijom x̅ < Mi< Mo.

Za umjereno iskrivljene distribucije vrijedi jednakost:

5.8. Mjere veličine i intenziteta varijacije

Apsolutne srednje veličine varijacije

Sljedeća faza u proučavanju varijacije svojstva u agregatu je mjerenje karakteristika sile, veličine varijacije. Najjednostavniji od njih može biti djelokrug ili amplituda varijacije - apsolutna razlika između maksimalne i minimalne vrijednosti svojstva od vrijednosti dostupnih u proučavanom skupu vrijednosti. Stoga se raspon varijacije izračunava formulom

Budući da veličina raspona karakterizira samo maksimalnu razliku u vrijednostima atributa, ne može mjeriti redovitu snagu njegove varijacije u cijeloj populaciji. Pokazatelj namijenjen za ovu svrhu treba uzeti u obzir i generalizirati sve razlike u vrijednostima atributa u agregatu, bez iznimke. Broj takvih razlika jednak je broju kombinacija dviju iz svih jedinica populacije; prema tablici. 5.6 to će biti: C^= 10 153. Međutim, nema potrebe razmatrati, izračunavati i uprosječavati sva odstupanja. Lakše je koristiti prosjek odstupanja pojedinih vrijednosti atributa od aritmetičke sredine vrijednosti atributa, a njih je samo 143. No prosječno odstupanje vrijednosti atributa od aritmetičke sredine vrijednosti, prema prema dobro poznatom svojstvu potonjeg, je nula. Stoga pokazatelj jačine varijacije nije algebarski prosjek odstupanja, već prosječni modul odstupanja:

Prema tablici. 5.6 srednji modul, odn prosječno linearno odstupanje, u apsolutnoj vrijednosti izračunava se kao frekvencijski ponderirano odstupanje modulo srednjih točaka intervala od aritmetičke sredine, tj. prema formuli

To znači da je u prosjeku prinos na ispitivanom skupu gospodarstava odstupao od prosječnog prinosa u regiji za 6,85 c/ha. Jednostavnost izračuna i interpretacije pozitivni su aspekti ovog pokazatelja, međutim, matematička svojstva modula su "loša": njihov ne može se uskladiti ni s jednim vjerojatnosnim zakonom, uključujući normalnu distribuciju, čiji parametar nije prosječni modul odstupanja, već standardna devijacija(u engleskim računalnim programima naziva se "standardna devijacija", skraćeno "s.d." ili jednostavno « s», na ruskom govornom području - NKO). U statističkoj literaturi standardna devijacija od prosječne vrijednosti obično se označava malim (malim) grčkim slovom sigma (st) ili s(vidi poglavlje 7):

za rangirane serije

za intervalne serije

Prema tablici. 5.6 standardna devijacija prinosa zrna bila je:

Treba istaknuti da neko zaokruživanje srednje vrijednosti i središta intervala, npr. na cjelobrojne, slabo utječe na vrijednost σ, koja bi tada iznosila 8,55 c/ha.

Standardna devijacija veličine u stvarnim populacijama uvijek je veća od prosječnog modula devijacije. Omjer (na: A ovisi o prisutnosti oštrih, istaknutih odstupanja u agregatima i može poslužiti kao pokazatelj "kontaminacije" agregata heterogenim elementima s glavnom masom: što je taj omjer veći, to je takva "kontaminacija" jača. Za normalni zakon distribucije σ: a = 1,2.

Pojam disperzije

Kvadrat standardne devijacije daje vrijednost disperzija σ 2 . Formula disperzije:

jednostavno (za negrupirane podatke):

ponderirano (za grupirane podatke):

Gotovo sve metode matematičke statistike temelje se na disperziji. Od velike praktične važnosti je pravilo za dodavanje varijanci (vidi Poglavlje 6).

Ostale mjere varijacije

Još jedan pokazatelj snage varijacije, koji je karakterizira ne u cijeloj populaciji, već samo u njezinom središnjem dijelu, jest prosječna četvrtina udaljenosti, oni. prosječna vrijednost razlike između kvartila, dolje označena kao q:

Za raspodjelu poljoprivrednih poduzeća po prinosu u tablici. 5.2

q\u003d (36.25 - 25.09): 2 \u003d 5,58 kg / ha. Jačina varijacije u središnjem dijelu populacije u pravilu je manja nego u cijeloj populaciji. Omjer između prosječnog modula odstupanja i prosječnog tromjesečnog odstupanja također služi za proučavanje strukture varijacije: velika vrijednost ovog omjera ukazuje na prisutnost slabo varirajuće "jezgre" i jako raspršenog okruženja oko te jezgre, ili "halo". " u proučavanoj populaciji. Za podatke u tablici. omjer 5,6 a: q= 1,23, što ukazuje na malu razliku u snazi ​​varijacije u središnjem dijelu populacije i na njenoj periferiji.

Za procjenu intenziteta varijacije i njezinu usporedbu u različitim populacijama, a još više za različita svojstva, potrebno je relativni pokazatelji varijacije. Izračunavaju se kao omjer apsolutnih pokazatelja jačine varijacije, o kojima smo ranije govorili, i aritmetičke srednje vrijednosti svojstva. Dobijamo sljedeće pokazatelje:

1) relativni raspon varijacije p:

2) relativno odstupanje po modulu T:

3) koeficijent varijacije kao relativno kvadratno odstupanje v:

4) relativna četvrtina udaljenosti d:

Gdje q - srednja kvartilna udaljenost.

Za promjenu prinosa prema tablici. 5.6 ovi pokazatelji su:

ρ = 42,4: 30,3 = 1,4, ili 140%;

T= 6,85 : 30,3 = 0,226, ili 22,6%;

v = 8,44: 30,3 = 0,279, ili 27,9%;

d= 5,58: 30,3 = 0,184, ili 18,4%.

Procjena stupnja intenziteta varijacije moguća je samo za svako pojedino obilježje populacije određenog sastava. Dakle, za skup poljoprivrednih poduzeća, varijacije u prinosu u istoj prirodnoj regiji mogu se ocijeniti kao slabe ako v < 10%, умеренная при 10% < v < 25% и сильная при v > 25%.

Naprotiv, varijaciju u visini u populaciji odraslih muškaraca ili žena već s koeficijentom jednakim 7% ljudi bi trebali procijeniti i percipirati kao jaku. Stoga se procjena intenziteta varijacije sastoji u usporedbi promatrane varijacije s nekim njezinim uobičajenim intenzitetom, uzetim kao standard. Navikli smo da se produktivnost, zarada ili prihod po stanovniku, broj stambenih soba u zgradi mogu razlikovati nekoliko ili čak desetke puta, ali razlika u visini ljudi barem jedan i pol puta već se doživljava kao vrlo jak.

Različita snaga, varijacije intenziteta su zbog objektivnih razloga. Na primjer, prodajna cijena američkog dolara u komercijalnim bankama u Sankt Peterburgu 24. siječnja 1997. varirala je od 5675 do 5640 rubalja. po prosječnoj cijeni od 5664 rubalja. Relativni raspon varijacije ρ = 35:5664 = 0,6%. Ovako mala varijacija posljedica je činjenice da bi uz značajnu razliku u tečaju dolara odmah došlo do odljeva kupaca iz “skuplje” banke u “jeftinije”. Naprotiv, cijena kilograma krumpira ili govedine u različitim regijama Rusije jako varira - za desetke postotaka ili više. To je zbog različitih troškova isporuke robe od regije proizvođača do regije potrošača, tj. poslovica "junica u inozemstvu je pola, ali rublja se transportira."

5.9. Momenti distribucije i indikatori njegove forme

Središnji momenti distribucije

Za daljnje proučavanje prirode varijacije koriste se prosječne vrijednosti različitih stupnjeva odstupanja pojedinih vrijednosti svojstva od njegove aritmetičke srednje vrijednosti. Ti se pokazatelji nazivaju središnjim trenucima distribucije reda koji odgovara snazi ​​na koju se podižu odstupanja (tablica 5.7), ili jednostavno momenti (necentralni momenti se rijetko koriste i neće se ovdje razmatrati). Vrijednost trećeg momenta ts- ovisi, kao i njegov predznak, o prevlasti pozitivnih kubova odstupanja nad negativnim kubovima, ili obrnuto. Pod normalnom i bilo kojom drugom strogo simetričnom distribucijom, zbroj pozitivnih kubova je strogo jednak zbroju negativnih kubova.

Pokazatelji asimetrije

Na temelju trenutka trećeg reda moguće je konstruirati pokazatelj koji karakterizira stupanj asimetrije distribucije:

Kao nazvao koeficijent asimetrije. Može se izračunati iz grupiranih i negrupiranih podataka. Prema tablici. 5.6 indeks asimetrije bio je:

oni. asimetrija je mala. Engleski statističar K. Pearson, na temelju razlike između prosječne vrijednosti i modusa, predložio je još jedan pokazatelj asimetrije

Tablica 5.7

Središnji trenuci

Prema tablici. 5.6 Pearsonov indeks bio je:

Pearsonov indeks ovisi o stupnju asimetrije u srednjem dijelu niza distribucije, a indeks asimetrije, temeljen na momentu trećeg reda, ovisi o ekstremnim vrijednostima svojstva. Tako je u našem primjeru, u srednjem dijelu distribucije, asimetrija izraženija, što se može vidjeti i iz grafikona (sl. 5.1). Distribucije s jakom desnom i lijevom (pozitivnom i negativnom) asimetrijom prikazane su na sl. 5.3.

Karakterizacija kurtoze distribucije

Uz pomoć momenta četvrtog reda, još složenije svojstvo serija distribucije od asimetrije, tzv. kurtosis.


Riža. 5.3. Asimetrija, raspodjele

Indikator kurtoze izračunava se formulom

(5.30)

Često se kurtosis tumači kao "strmost" distribucije, ali to je neprecizno i ​​nepotpuno. Grafikon distribucije može izgledati proizvoljno strmo, ovisno o snazi ​​varijacije svojstva: što je varijacija slabija, to je krivulja distribucije strmija na određenoj skali. Da ne govorimo o tome da se promjenom mjerila po apscisi i po ordinati svaka raspodjela može umjetno učiniti "strmom" i "kosom". Da biste pokazali što je kurtosis distribucije i da biste ga ispravno protumačili, potrebno je usporediti nizove s istom snagom varijacije (ista vrijednost σ) i različitim pokazateljima kurtosisa. Kako ne bi zbunili kurtosis s nagnutošću, svi uspoređeni redovi moraju biti simetrični. Takva usporedba prikazana je na sl. 5.4.

sl.5.4. Kurtoza distribucije

Za varijacijski niz s normalnom distribucijom, vrijednosti ja indikator kurtoze, izračunat formulom (5.30), j je jednak tri.

Međutim, takav pokazatelj ne bi se trebao nazivati ​​pojmom "kurtosis", što u prijevodu znači "višak". Pojam "kurtosis" ne treba primijeniti na sam omjer prema formuli (5.30), već na usporedbu takvog omjera za proučavanu distribuciju s vrijednošću zadanog omjera normalne distribucije, tj. s vrijednošću 3. Odatle konačne formule za pokazatelj kurtosisa, t.j. ekscesi u usporedbi s normalnom distribucijom s istom snagom varijacije imaju oblik:

za rangirane serije

za intervalne i diskretne varijacijske serije

Prisutnost pozitivnog kurtosisa, kao i prethodno primijećena značajna razlika između male kvartalne udaljenosti i velike standardne devijacije, znači da u proučavanoj masi fenomena postoji "jezgra" koja malo varira u ovoj značajci, okružena raspršena “aureola”. Uz značajnu negativnu kurtozu, takva "jezgra" uopće ne postoji.

Po vrijednostima pokazatelja asimetrije i kurtoze distribucije može se suditi o bliskosti distribucije normalnoj, što je bitno za ocjenu rezultata korelacijske i regresijske analize, mogućnosti probabilističke procjene prognoza ( vidi poglavlja 7,8,9). Distribucija se može smatrati normalnom, točnije, hipoteza o sličnosti stvarne distribucije s normalnom distribucijom ne može se odbaciti ako pokazatelji asimetrije i kurtosis ne prelaze svoje dvostruke standardne devijacije Cm. Ove standardne devijacije izračunavaju se formulama:

5.10. Najveće moguće vrijednosti indikatori varijacije i njihova primjena

Prilikom primjene bilo koje vrste statističkih pokazatelja, korisno je znati koje su najveće moguće vrijednosti danog pokazatelja za sustav koji se proučava i koji je omjer stvarno promatranih vrijednosti prema maksimalno mogućim. Ovaj problem je posebno relevantan kada se proučava varijacija pokazatelja obujma, kao što su obujam proizvodnje određene vrste proizvoda, raspoloživost određenih resursa, raspodjela kapitalnih ulaganja, prihoda i dobiti. Razmotrimo teorijski i praktično ovo pitanje na primjeru raspodjele proizvodnje povrća između poljoprivrednih poduzeća u regiji.

Očito je da se minimalna moguća vrijednost pokazatelja varijacije postiže uz strogo ujednačenu raspodjelu svojstava volumena između svih jedinica populacije, tj. uz isti obujam proizvodnje u svakom od poljoprivrednih poduzeća. U takvoj ograničavajućoj (naravno, u praksi vrlo malo vjerojatnoj) distribuciji nema varijacije i svi pokazatelji, varijacije su jednaki nuli.

Najveća moguća vrijednost pokazatelja varijacije postiže se takvom raspodjelom svojstva volumena u populaciji, u kojoj je cijeli njegov volumen koncentriran u jednoj jedinici populacije; na primjer, cjelokupni obujam proizvodnje povrća - u jednom poljoprivrednom poduzeću okruga u nedostatku njihove proizvodnje u drugim farmama. Vjerojatnost takve iznimno moguće koncentracije volumena obilježja u jednoj jedinici populacije nije tako mala; u svakom slučaju, mnogo je veća od vjerojatnosti striktno uniformne distribucije.

Razmotrimo eksponente varijacije za naznačeni granični slučaj njegovog maksimuma. Označimo broj populacijskih jedinica P, prosječna vrijednost obilježja x̅ , tada će ukupni volumen značajke u agregatu biti izražen kao x̅ P. Sav taj volumen koncentriran je u jednoj jedinici populacije, tako da xmax= x̅ p. xmin = 0, odakle slijedi da je najveća vrijednost amplitude (raspon varijacije) jednaka:

Da bismo izračunali maksimalne vrijednosti srednjih modulnih i kvadratnih odstupanja, napravit ćemo tablicu odstupanja (tablica 5.8).

Tablica 5.8

Moduli i kvadrati odstupanja od maksimalne srednje vrijednostimoguća varijacija

Broj jedinica stanovništva

Vrijednosti obilježja

Odstupanja od srednje vrijednosti

x i - x̅

Moduli odstupanja

|x i - x̅|

Kvadrati odstupanja

(Xja- x̅ ) 2

x̅ P

x̅ (P - 1)

-x̅

-x̅

-x̅

x̅ (P - 1)

x̅

x̅

x̅

x̅ 2 (P - 1) 2

x̅ 2

x̅ 2

x̅ 2

x̅ P

2x̅ (P - 1)

x̅ 2 [(P - 1) 2 +(n-1)]

Na temelju izraza u posljednjem retku tablice. 5.8, dobivamo sljedeće najveće moguće vrijednosti pokazatelja varijacije.

Prosječni modul odstupanja ili prosječno linearno odstupanje:

Standardna devijacija:

Relativno modularno (linearno) odstupanje:

Koeficijent varijacije:

Što se tiče tromjesečne udaljenosti, sustav s maksimalnom mogućom varijacijom ima degeneriranu strukturu distribucije značajki, u kojoj nema (“ne rade”) karakteristika strukture: medijana, kvartila i slično.

Na temelju dobivenih formula za maksimalno moguće vrijednosti glavnih pokazatelja varijacije, prije svega, slijedi zaključak o ovisnosti ovih vrijednosti o obujmu populacije. P. Ta je ovisnost sažeta u tablici. 5.9.

Najuže granice promjene i slaba ovisnost o veličini populacije otkrivaju prosječni modul i relativno linearno odstupanje. Naprotiv, standardna devijacija i koeficijent varijacije jako ovise o broju jedinica populacije. Ovu ovisnost treba uzeti u obzir pri usporedbi intenziteta varijacije u populacijama različitih veličina. Ako je u agregatu šest poduzeća koeficijent varijacije obujma proizvodnje iznosio 0,58, a u agregatu 20 poduzeća 0,72, onda je opravdano zaključiti da je obujam proizvodnje u drugoj populaciji neujednačeniji? Dapače, u prvom, manjem, iznosio je 0,58 : 2,24 = 25,9% maksimalno mogućeg, tj. granica, razina koncentracije proizvodnje u jednom poduzeću od šest, au drugom, većem skupu, promatrani koeficijent varijacije bio je samo 0,72: 4,36 = 16,5% od maksimalno mogućeg.

Tablica 5.9

Granične vrijednosti pokazatelja varijacije volumetrijske značajke za različite veličine populacije

Veličina populacije

Maksimalne vrijednosti indikatora

x̅

x̅

1,5x̅

1,73x̅

1,67x̅

2,24x̅

1,80x̅

3x̅

1,90x̅

4,36x̅

1,96x̅

7x̅

1,98x̅

9,95x̅

2x̅

Od praktične je važnosti takav pokazatelj kao što je omjer stvarnog prosječnog modula odstupanja prema maksimalnom mogućem. Tako je za agregat od šest poduzeća taj omjer bio: 0,47 : 1,67 = 0,281, odnosno 28,1%. Interpretacija dobivenog pokazatelja je sljedeća: da bi se prešlo s promatrane raspodjele outputa između poduzeća na jednoliku raspodjelu, bilo bi potrebno preraspodijeliti

, odnosno 23,4% ukupne proizvodnje u agregatu. Ako je stupanj stvarne koncentracije proizvodnje (stvarna vrijednost σ odn v) je određeni udio granične vrijednosti u slučaju monopolizacije proizvodnje u jednom poduzeću, tada omjer stvarnog pokazatelja prema graničnom može karakterizirati stupanj koncentracije (ili monopolizacije) proizvodnje.

Omjeri stvarnih vrijednosti pokazatelja varijacije ili promjene strukture prema maksimalno mogućim također se koriste u analizi strukturnih pomaka (vidi Poglavlje 11).

1. Jeanie K. Prosječne vrijednosti. - M.: Statistika, 1970.

2. Krivenkova L. N., Yuzbashev M. M. Područje postojanja varijacijskih pokazatelja i njegova primjena // Statistički bilten. - 1991. - br. 6. - S. 66-70.

3. Paskhaver I. S. Prosječne vrijednosti u statistici. - M.: Statistika. 1979. godine.

4. Shurakov V. V., Dayitbegov D. M. i drugi. Automatizirano radno mjesto za statističku obradu podataka (Poglavlje 4. Prethodna statistička obrada podataka). - M.: Financije i statistika, 1990.

Rangiranje- postupak sređivanja bilo kojih objekata u rastućem ili silaznom redoslijedu nekih njihovih svojstava, pod uvjetom da imaju to svojstvo.

Možete rangirati:

Stanje prema životnom standardu, natalitetu, nezaposlenosti;

Zanimanja po ugledu;

Roba prema željama potrošača;

Ispitanici prema političkom djelovanju, imovinskom stanju;

Objekti rangiranja su oni objekti koji su izravno poredani. Osnovno rangiranje(ranking attribute) - svojstvo po kojem su objekti poredani. Kao rezultat rangiranja dobivamo rangiranu seriju u kojoj je svakom objektu dodijeljen vlastiti pojedinac rang- mjesto objekta u rangiranom redu. Broj mjesta i shodno tome broj rangova u rangiranoj seriji jednak je broju objekata.

Vrste rangiranih serija:

1) svaki objekt ima vrijednost značajke koja se razlikuje od vrijednosti značajke drugih objekata, tada se svakom objektu rangirane serije dodjeljuje vlastiti rang, različit od drugog objekta;

2) nekoliko objekata ima istu vrijednost atributa, tada se tim objektima u rangiranoj seriji dodjeljuju isti rangovi, izračunati prema određenoj formuli. U ovom slučaju, rangirani niz se naziva rangirani niz s pripadajućim rangovima. Prilikom rješavanja zadataka prvi rang ćemo dodijeliti najvećoj vrijednosti obilježja. Pridruženi rang izračunava se kao prosjek mjesta koja zauzimaju objekti koji imaju istu vrijednost obilježja. Uspostavljanje statističkog odnosa za 2 ili više rangiranih nizova provodi se pomoću koeficijenti ranga povezanosti- takve koeficijente koji vam omogućuju izračunavanje stupnja dosljednosti u rangiranju istih objekata na dvije različite osnove (značajke). Najčešći koeficijent povezanosti ranga (korelacija ranga) je ρ-Spearmanov koeficijent.

Recimo da je n objekata poredano prema atributu x i prema atributu y. Neka

Mjera nepoklapanja rangova i-tog objekta: d i = R x i - R y i

Svojstva:

Promjene u rasponu od -1 do 1;

Po = 1 ako postoji potpuna dosljednost rangirane serije; rangovi jednog te istog objekta su isti po dva osnova.

Po = -1 ako postoji potpuna nekonzistentnost rangirane serije; ova situacija nastaje ako nizovi poretka imaju suprotan smjer: R x i – 1 2 3 4 5; R y i – 5 4 3 2 1.

Napomena: može se izračunati za dvije vrste jednakosti (ako svaki objekt ima svoj rang i ako postoje povezani rangovi).

Testiranje hipoteze o statističkoj značajnosti ρ-Spearmanova koeficijenta.

H 0: ρ gs = 0

H 1: ρ gs ≠ 0

Nulta hipoteza uvijek tvrdi da je ρ jednako 0. Alternativna hipoteza je da je vrijednost ρ različita od 0.

Razina značajnosti kao u tablicama nepredviđenosti.

država A B U G D E I W I
Kvaliteta života 6,8 7,0 6,5 5,9 4,6 5,7 4,5 5,8 4,0
Nezaposlenost 20,3 18,0 19,8 23,4 21,6 20,8
rang x
rang y
|d i |
d 2 i
Σ d 2 i

τ - Kendall je razlika između vjerojatnosti točnog i netočnog redoslijeda za dva promatranja nasumično izvučena iz populacije, pod uvjetom da nema povezanih rangova. Svojstva:

Promjene od -1 do 1;

Ako su značajke x i y statistički neovisne, tada koeficijent τ postaje 0; ako je τ jednako 0, to ne znači da su značajke statistički neovisne;

Ako je τ jednako 1, to znači da postoji potpuni izravan statistički odnos između značajki ili su rangirane serije potpuno dosljedne; ako je τ -1, to znači da postoji potpuni statistički inverzni odnos ili su rangirani nizovi nekonzistentni.

S je ukupan broj parova objekata s dosljednim točnim redoslijedom za oba objekta. D je ukupan broj parova objekata s nekonzistentnim pogrešnim redoslijedom za oba objekta.

Testiranje hipoteze o statističkoj značajnosti koeficijenta τ:

H 0: τ gs = 0

H 1: τ gs ≠ 0

Koeficijent τ je statistički značajan ako je njegova vrijednost za HS različita od 0.

|Z H | > Z cr => H 1

Ako gradimo rangirani niz za mali broj objekata, tada nam potvrda nulte hipoteze govori da trebamo proučavati veći broj objekata.

Ako je proučavan dovoljan broj objekata, tada potvrda nulte hipoteze ukazuje na to da ne postoji odnos između značajki.

Koeficijent veze više rangova

Koristi se u slučajevima kada je potrebno izmjeriti odnos između više od 2 rangirane serije (npr. kada želimo ocijeniti konzistentnost stručnih mišljenja (više od 2) kod ocjene 1 istih objekata).

S je zbroj kvadratnih odstupanja vrijednosti ranga za red od prosječnog ranga za cijelu populaciju. k 2 – broj varijabli (broj stručnjaka). n je broj rangiranih objekata.

Pojam sažetka, grupiranja, klasifikacije

Sažetak- sistematizacija i sumiranje: vremenska prognoza, sažetak s terena. Sažetak ne dopušta detaljnu analizu informacija. Svaki sažetak trebao bi se temeljiti na grupiranju podataka, tj. prvo grupiranje, a zatim sažimanje podataka.

grupiranje- podjela populacija na više skupina prema najznačajnijim obilježjima.

Razlikovati kvalitativno i kvantitativno grupiranje. kvaliteta- atributivni kvantitativni- varijacija. S druge strane, varijacija se dijeli na strukturnu i analitičku . Strukturalni grupiranje uključuje izračunavanje udjela svake grupe. Primjer: u poduzeću 80% su radnici, 20% zaposlenici, od čega 5% menadžeri, 3% zaposlenici, 12% stručnjaci. Cilj analitički grupiranje - identificirati odnos između znakova: radno iskustvo i prosječna primanja, iskustvo i učinak i drugi.

Prilikom grupiranja morate:

Provođenje sveobuhvatne analize prirode fenomena koji se proučava;

Identifikacija značajke grupiranja (jedna ili više);

Postavite granice grupa na način da se grupe značajno razlikuju jedna od druge, a da se homogeni elementi kombiniraju u svakoj grupi.

Prema stupnju složenosti grupiranja mogu biti jednostavna i kombinativna (prema obilježjima).

Prema početnim informacijama razlikuju se primarne i sekundarne grupacije, primarni provedeno na temelju podataka početnog opažanja, sekundarni koristi primarne podatke grupiranja.

Određuje se broj grupa prema Sturgessovoj formuli:

Gdje n- broj grupa, N- opća populacija.

Ako se koriste jednaki intervali, onda vrijednost intervala jednako je .

Intervali mogu i ne moraju biti jednaki. Potonji su pak podijeljeni na one koji se mijenjaju prema zakonu aritmetičke ili geometrijske progresije. Prvi i zadnji interval mogu biti otvoreni ili zatvoreni. Zatvoreni intervali uključuju ili ne uključuju granice intervala.

Ako su intervali zatvoreni, a ništa nije rečeno o uključivanju gornjih granica, tada pretpostavljamo da su gornje granice uključene.

Ako su intervali otvoreni, tada se vodimo zadnjim intervalom.

Predznak u tim intervalima može se mjeriti diskretno i kontinuirano (tj. podijeljeno). S kontinuiranim znakom, granice su zatvorene 1-10, 10-20, 20-30; ako se atribut diskretno mijenja, tada se može koristiti sljedeći unos: 1 - 10, 11 - 20, 21 - 30.

Ako su intervali otvoreni, tada je vrijednost posljednjeg intervala jednaka prethodnom, a vrijednost prvog - drugom.

Klasifikacija grupiranje po kvaliteti. Relativno je stabilan, standardiziran i odobren od strane državnih tijela za statistiku.


3.2. Rangovi raspodjele: vrste i glavne karakteristike

Pod, ispod blizu distribucije odnosi se na niz podataka koji na jednoj osnovi karakteriziraju bilo koju društveno-ekonomsku pojavu. Ovo je najjednostavniji tip grupiranja po dvije osnove.

Nizovi distribucije dijele se na kvalitativne i kvantitativne, rangirane i nerangirane, grupirane i negrupirane, s diskretnom i kontinuiranom distribucijom obilježja.

Primjer negrupirane, nerangirane serije plaća je platni spisak. Pritom se popis zaposlenika može poredati po abecednom redu ili po kadrovskim brojevima. Primjer rangirane serije je popis timova, poredak tenisača.

rangirani redak distribucije - niz podataka poredanih silaznim ili rastućim redoslijedom značajke.

Za grupirane rangirane serije razlikuju se sljedeće karakteristike: varijanta, učestalost ili učestalost, kumulacija i gustoća distribucije.

Varijanta() je prosječna vrijednost intervala značajke. Jer pri stvaranju grupiranja mora se poštovati načelo jednolike raspodjele obilježja u svakom intervalu, tada se varijanta može izračunati kao poluzbroj granica intervala.

Frekvencija() pokazuje koliko se puta pojavljuje zadana vrijednost značajke. Izraz relativne frekvencije je frekvencija(.) , tj. udio, specifična težina iz zbroja frekvencija.

Kumulovanje() – kumulativna učestalost ili učestalost, kumulativni izračun. Obim, troškovi, prihodi izračunavaju se kumulativno, tj. rezultate aktivnosti.

stol 1

Grupiranje poslovnih kreditnih institucija
iznosom upisanog temeljnog kapitala

2008. godine u Rusiji

Prvi korak u statističkom proučavanju varijacije je konstrukcija varijacijskog niza - uređene distribucije jedinica populacije prema rastućim (češće) ili opadajućim (rjeđe) vrijednostima obilježja i brojanje broja jedinica s jednim ili drugu vrijednost obilježja.

Postoje tri oblika varijacijskih nizova: rasponski, diskretni, intervalni. Varijacijski niz se često naziva niz distribucije. Ovaj izraz se koristi kada se proučava varijacija kvantitativnih i nekvantitativnih svojstava. Niz distribucije je strukturna grupacija (poglavlje 6).

Rangirani niz je popis pojedinačnih jedinica populacije u uzlaznom (silaznom) redoslijedu osobine koja se proučava.

U nastavku su informacije o velikim bankama Sankt Peterburga, poredane prema temeljnom kapitalu od 01.10.1999.

Naziv banke Temeljni kapital, milijun rubalja

Baltonexim banka 169

Banka Sankt Peterburg 237

Petrovski 268

Baltik 290

Promstroybank 1007

Ako je broj populacijskih jedinica dovoljno velik, rangirani niz postaje glomazan, a njegova konstrukcija, čak i uz pomoć računala, dugo traje. U takvim slučajevima, niz varijacija se konstruira grupiranjem jedinica populacije prema vrijednostima svojstva koje se proučava.

Određivanje broja grupa

Broj grupa u diskretnoj seriji varijacija određen je brojem stvarno postojećih vrijednosti atributa varijable. Ako svojstvo ima diskretne vrijednosti, ali njihov je broj vrlo velik (na primjer, broj stoke 1. siječnja u godini u različitim poljoprivrednim poduzećima može se kretati od nule do nekoliko desetaka tisuća grla), tada se gradi niz intervalnih varijacija. . Intervalni varijacijski niz također je konstruiran za proučavanje značajki koje mogu poprimiti bilo koje, i cijele i frakcijske vrijednosti u području svog postojanja. Takvi su, na primjer, profitabilnost prodanih proizvoda, trošak jedinice proizvodnje, prihod po stanovniku grada, udio ljudi s visokim obrazovanjem među stanovništvom različitih teritorija i općenito sve sekundarne karakteristike, vrijednosti od kojih se izračunavaju dijeljenjem vrijednosti jedne primarne karakteristike s vrijednošću druge (vidi Poglavlje 3).

Niz intervalnih varijacija je tablica koja se sastoji od dva stupca (ili retka) - intervala svojstva čija se varijacija proučava, i broja jedinica populacije koje spadaju u taj interval (frekvencije), ili udjela tog broja od ukupna populacija (frekvencije).

Najčešće se koriste dvije vrste nizova intervalnih varijacija: jednakih intervala i jednakih frekvencija. Serija jednakih intervala koristi se ako varijacija svojstva nije jako jaka, tj. za homogenu populaciju, čija je raspodjela prema danom atributu bliska normalnom zakonu. (Takva serija je prikazana u tablici 5.6.) Serija jednake frekvencije koristi se ako je varijacija značajke vrlo jaka, ali distribucija nije normalna, već, na primjer, hiperbolična (tablica 5.5).

Prilikom konstruiranja niza s jednakim intervalima, broj skupina je odabran tako da se raznolikost vrijednosti svojstava u agregatu dovoljno odražava i, u isto vrijeme, pravilnost distribucije, njen oblik nije iskrivljen slučajnim fluktuacije frekvencije. Ako postoji premalo grupa, neće biti uzorka varijacija; ako postoji previše grupa, nasumični skokovi frekvencije će iskriviti oblik distribucije.


Granice intervala mogu se odrediti na različite načine: gornja granica prethodnog intervala ponavlja donju granicu sljedećeg, kao što je prikazano u tablici. 5.5, ili se ne ponavlja.

U potonjem slučaju, drugi interval bit će označen kao 15,1-20, treći - kao 20,1-25, itd., tj. pretpostavlja se da su sve vrijednosti prinosa nužno zaokružene na jednu desetinu. Osim toga, javlja se neželjena komplikacija sa sredinom intervala 15,1-20, koja će, strogo govoreći, već biti jednaka ne 17,5, već 17,55; prema tome, zamjenom zaokruženog intervala 40-60 s 40,1-60, umjesto zaokružene vrijednosti njegove sredine 50, dobivamo 50,5. Stoga je poželjno ostaviti intervale s ponavljajućom zaobljenom granicom i složiti se da jedinice populacije koje imaju karakterističnu vrijednost jednaku granici intervala budu uključene u interval u kojem se ta točna vrijednost prvi put javlja. Tako je farma s prinosom od 15 centnera po hektaru uključena u prvu skupinu, vrijednost od 20 centnera po hektaru uključena je u drugu, i tako dalje.

Varijacijski niz jednake učestalosti je neophodan s vrlo jakom varijacijom svojstva jer je, s distribucijom jednakih intervala, većina populacijskih jedinica

Tablica 5.5

Raspodjela 100 ruskih banaka prema bilančnoj procjeni imovine od 01.01.2000.

Granice intervala za ravnomjernu raspodjelu su stvarne vrijednosti imovine prve, desete, jedanaeste, dvadesete i tako dalje banke.

Grafički prikaz varijacijskog niza

Značajnu pomoć u analizi varijacijskog niza i njegovih svojstava pruža grafički prikaz. Niz intervala predstavljen je stupčastim grafikonom, u kojem su baze stupaca smještenih na apscisnoj osi intervali vrijednosti promjenjivog atributa, a visina stupaca su frekvencije koje odgovaraju ljestvici duž y-os. Grafički prikaz distribucije poljoprivrednih gospodarstava u regiji po prinosima žitarica prikazan je na sl. 5.1. Dijagram ove vrste često se naziva histogram (gr. histos - tkivo).

Tablični podaci. 5.6 i sl. 5.1 prikazuje oblik raspodjele karakterističan za mnoga svojstva: češće su vrijednosti prosječnih intervala svojstva, rjeđe ekstremne, male i velike vrijednosti svojstva. Oblik ove distribucije blizak je zakonu normalne distribucije koji se razmatra u matematičkoj statistici. Veliki ruski matematičar A. M. Ljapunov (1857.-1918.) dokazao je da normalna

Tablica 5.6 Raspodjela gospodarstava u regiji prema prinosu žitarica

Mala distribucija nastaje kada na varijablu utječe velik broj čimbenika od kojih niti jedan nema dominantan utjecaj. Slučajna kombinacija mnogih približno jednakih čimbenika koji utječu na varijacije prinosa žitarica, kako prirodnih tako i agrotehničkih, ekonomskih, stvara raspodjelu poljoprivrednih gospodarstava u regiji u smislu prinosa blisku normalnom zakonu raspodjele.

Riža. 5.2. Kumulativna i ogiva raspodjela farmi po prinosu

Takav niz se naziva kumulativnim. Možete izgraditi kumulativnu distribuciju "ne manje od", ili možete "veće od". U prvom slučaju, graf kumulativne distribucije naziva se kumulativni, u drugom - ogive (slika 5.2).

Gustoća distribucije

Ako imate posla s varijacijskim nizom s nejednakim intervalima, tada za usporedivost morate dovesti frekvenciju, ili frekvenciju, na jedinicu intervala. Rezultirajući omjer naziva se gustoća distribucije:

Gustoća distribucije koristi se kako za izračun generalizirajućih pokazatelja, tako i za grafički prikaz nizova varijacija s nejednakim intervalima.

proizvodnja krumpira rangirana statistički

Na temelju pokazatelja u tablici 2. sastavljamo rangirane redove za proizvodnju krumpira na 100 ha obradivih površina; na prinos krumpira; po trošku. Odnos između ovih pokazatelja je grafički prikazan.

Prvi korak u statističkom proučavanju varijacije je konstrukcija serije varijacija - uređene distribucije populacijskih jedinica prema rastućim (češće) ili opadajućim (rjeđe) vrijednostima svojstva.

Postoje tri oblika varijacijskog niza: rasponski niz, diskretni niz, intervalni niz. Varijacijski niz se često naziva niz distribucije.

Rangirana serija je popis pojedinačnih jedinica populacije u uzlaznom (silaznom) redoslijedu osobine koja se proučava

Rangiranje je postupak redoslijeda predmeta proučavanja koji se provodi na temelju preferencija. Raspon varijacije pokazuje kolika je razlika između jedinica populacije.

Rang je redni broj vrijednosti atributa poredanih uzlaznim ili silaznim redoslijedom njihovih vrijednosti. Ako vrijednost atributa ima istu kvantitativnu procjenu, tada se rang svih ovih vrijednosti uzima jednak aritmetičkoj sredini odgovarajućeg broja mjesta koja su određena. Ti redovi se nazivaju povezani.

Grafikoni u statistici način su vizualizacije statističkih pokazatelja u obliku geometrijskih oblika i znakova, crteža ili shematskih karata. Vizualna slika olakšava percepciju informacija, omogućuje pokrivanje skupa pokazatelja u međusobnom povezivanju, prepoznavanje trendova razvoja i tipičnih omjera pokazatelja.

Za prikaz pokazatelja dinamike preporučljivo je koristiti linijske ili stupčaste grafikone. Grafikon treba biti vizualan, razumljiv, lako čitljiv i, po mogućnosti, likovno oblikovan, koji će privući pozornost na njega.

Prilikom konstruiranja dijagrama raspršenosti skup točaka koristi se kao grafički uzorci; pri konstruiranju linearnih - linija. Izrada grafikona uvijek je kreativan proces. Ovdje je potrebno malo pretraživanja. Tek nakon sastavljanja i uspoređivanja nekoliko nacrta, moguće je odrediti ispravan sastav grafikona, postaviti mjerilo i položaj znakova na polju grafikona.

Iz rangiranog reda za proizvodnju krumpira na 100 ha obradivog zemljišta može se izvući sljedeći zaključak da je najmanja proizvodnja uočena u okrugu Balagansky, a okrug Angarsk ima najveću produktivnost krumpira sa 100 ha obradivog zemljišta.

Najmanji prinos bio je u okrugu Kachugsky - 10 centnera / ha, a najveći u Usolskom - 195,5 centnersa / ha.

U okrugu Chunsky, s visokom proizvodnjom krumpira na 100 hektara obradive zemlje, najniži trošak od 1 c. Maksimalni trošak promatra se u regiji Nizhne-Ilimsk. Raspon varijacija u cijeni centnera krumpira je vrlo velik i iznosi 1161,01 rublja.

Ostale publikacije

Analiza gospodarske aktivnosti poduzeća
Prijelaz na tržišno gospodarstvo zahtijeva od poduzeća povećanje učinkovitosti proizvodnje, konkurentnosti proizvoda i usluga kroz uvođenje učinkovitih oblika ekonomskog upravljanja i upravljanja proizvodnjom, dostignuća znanstvenog i tehnološkog napretka, te aktiviranje ...

Analiza financijskih i gospodarskih aktivnosti JSC TransContainer
Financijska analiza je proces koji se temelji na proučavanju podataka o financijskom stanju poduzeća i rezultatima njegovih aktivnosti u prošlosti kako bi se procijenili budući uvjeti i učinak. Stoga je glavni zadatak financijske analize ...

KATEGORIJE

POPULARNI ČLANCI

2023 "kingad.ru" - ultrazvučni pregled ljudskih organa