Statističko odstupanje. Procjena varijance, standardna devijacija

U statističkom testiranju hipoteza, kada se mjeri linearni odnos između slučajnih varijabli.

Standardna devijacija:

Standardna devijacija(procjena standardne devijacije slučajne varijable Pod, zidovi oko nas i strop, x u odnosu na svoje matematičko očekivanje temeljeno na nepristranoj procjeni njegove varijance):

gdje je disperzija; - Pod, zidovi oko nas i strop, ja element selekcije; - veličina uzorka; - aritmetička sredina uzorka:

Treba napomenuti da su obje procjene pristrane. U općem slučaju nemoguće je konstruirati nepristranu procjenu. Međutim, procjena temeljena na nepristranoj procjeni varijance je dosljedna.

Pravilo tri sigme

Pravilo tri sigme() - gotovo sve vrijednosti normalno distribuirane slučajne varijable leže u intervalu. Strože rečeno – s pouzdanošću ne manjom od 99,7%, vrijednost normalno distribuirane slučajne varijable leži u navedenom intervalu (pod uvjetom da je vrijednost istinita i da nije dobivena kao rezultat obrade uzorka).

Ako je prava vrijednost nepoznata, onda ne bismo trebali koristiti, nego pod, zidove oko nas i strop, s. Tako se pravilo tri sigme pretvara u pravilo tri poda, zidova oko nas i stropa, s .

Tumačenje vrijednosti standardne devijacije

Velika vrijednost standardne devijacije pokazuje veliki raspon vrijednosti u prikazanom skupu s prosječnom vrijednošću skupa; mala vrijednost, prema tome, pokazuje da su vrijednosti u skupu grupirane oko srednje vrijednosti.

Na primjer, imamo tri skupa brojeva: (0, 0, 14, 14), (0, 6, 8, 14) i (6, 6, 8, 8). Sva tri skupa imaju srednje vrijednosti jednake 7, odnosno standardne devijacije jednake 7, 5 i 1. Posljednji skup ima malu standardnu ​​devijaciju, budući da su vrijednosti u skupu grupirane oko srednje vrijednosti; prvi skup ima najveću vrijednost standardne devijacije - vrijednosti unutar skupa jako odstupaju od prosječne vrijednosti.

U općem smislu, standardna devijacija se može smatrati mjerom nesigurnosti. Na primjer, u fizici se standardna devijacija koristi za određivanje pogreške niza uzastopnih mjerenja neke veličine. Ova je vrijednost vrlo važna za određivanje vjerodostojnosti fenomena koji se proučava u usporedbi s vrijednošću koju predviđa teorija: ako se prosječna vrijednost mjerenja jako razlikuje od vrijednosti predviđenih teorijom (velika standardna devijacija), tada treba ponovno provjeriti dobivene vrijednosti ili način njihova dobivanja.

Praktična upotreba

U praksi, standardna devijacija vam omogućuje da odredite koliko se vrijednosti u skupu mogu razlikovati od prosječne vrijednosti.

Klima

Pretpostavimo da postoje dva grada s istom prosječnom maksimalnom dnevnom temperaturom, ali se jedan nalazi na obali, a drugi u unutrašnjosti. Poznato je da gradovi koji se nalaze na obali imaju mnogo različitih maksimalnih dnevnih temperatura koje su niže od gradova u unutrašnjosti. Dakle, standardna devijacija maksimalnih dnevnih temperatura za obalni grad bit će manja nego za drugi grad, unatoč činjenici da je prosječna vrijednost te vrijednosti ista, što u praksi znači da je vjerojatnost da će maksimalna temperatura zraka na bilo koji dan u godini bit će veća razlika od prosječne vrijednosti, veća za grad koji se nalazi u unutrašnjosti.

Sport

Pretpostavimo da postoji nekoliko nogometnih momčadi koje su ocijenjene prema nekom skupu parametara, na primjer, broj postignutih i primljenih golova, šanse za postizanje pogotka itd. Najvjerojatnije je da će najbolja momčad u ovoj skupini imati bolje vrijednosti na više parametara. Što je manja standardna devijacija tima za svaki od prikazanih parametara, to je rezultat tima predvidljiviji; takvi timovi su uravnoteženi. S druge strane, momčad s velikom standardnom devijacijom teško je predvidjeti rezultat, što se pak objašnjava neravnotežom, primjerice, jaka obrana, ali slab napad.

Korištenje standardne devijacije parametara tima omogućuje, u jednom ili drugom stupnju, predviđanje rezultata utakmice između dva tima, procjenjujući snage i slabosti timova, a time i odabrane metode borbe.

Tehnička analiza

vidi također

Književnost

* Borovikov, V. STATISTIKA. Umjetnost analize podataka na računalu: Za profesionalce / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 str. - ISBN 5-272-00078-1.

Približna metoda za procjenu varijabilnosti serije varijacija je određivanje granice i amplitude, ali se vrijednosti varijante unutar serije ne uzimaju u obzir. Glavna općeprihvaćena mjera varijabilnosti kvantitativnog obilježja unutar niza varijacija je standardna devijacija (σ - sigma). Što je standardna devijacija veća, to je veći stupanj fluktuacije ove serije.

Metoda izračuna standardne devijacije uključuje sljedeće korake:

1. Pronađite aritmetičku sredinu (M).

2. Utvrditi odstupanja pojedinih opcija od aritmetičke sredine (d=V-M). U medicinskoj statistici odstupanja od prosjeka označavaju se s d (deviate). Zbroj svih odstupanja je nula.

3. Kvadratirajte svako odstupanje d 2.

4. Pomnožite kvadrate odstupanja s odgovarajućim frekvencijama d 2 *p.

5. Nađi zbroj umnožaka å(d 2 *p)

6. Izračunajte standardnu ​​devijaciju pomoću formule:

Kada je n veći od 30 ili kada je n manji ili jednak 30, gdje je n broj svih opcija.

Vrijednost standardne devijacije:

1. Standardna devijacija karakterizira širenje varijante u odnosu na prosječnu vrijednost (tj. varijabilnost niza varijacija). Što je sigma veća, to je veći stupanj raznolikosti ove serije.

2. Standardna devijacija koristi se za komparativnu procjenu stupnja podudarnosti aritmetičke sredine s nizom varijacija za koji je izračunata.

Varijacije masovnih pojava pokoravaju se zakonu normalne raspodjele. Krivulja koja predstavlja ovu distribuciju izgleda kao glatka simetrična krivulja u obliku zvona (Gaussova krivulja). Prema teoriji vjerojatnosti, u pojavama koje se pokoravaju zakonu normalne distribucije, postoji strogi matematički odnos između vrijednosti aritmetičke sredine i standardne devijacije. Teorijska distribucija varijante u homogenom nizu varijacija pridržava se pravila tri sigme.

Ako su u sustavu pravokutnih koordinata na apscisnu os nanesene vrijednosti kvantitativnog obilježja (varijante), a na ordinatnu os učestalost pojavljivanja varijante u nizu varijacija, tada su varijante s većim i manjim vrijednosti su ravnomjerno smještene na stranama aritmetičke sredine.



Utvrđeno je da uz normalnu raspodjelu svojstva:

68,3% varijantnih vrijednosti je unutar M±1s

95,5% varijantnih vrijednosti je unutar M±2s

99,7% varijantnih vrijednosti je unutar M±3s

3. Standardna devijacija omogućuje vam određivanje normalnih vrijednosti za kliničke i biološke parametre. U medicini se interval M±1s obično uzima kao normalni raspon za fenomen koji se proučava. Odstupanje procijenjene vrijednosti od aritmetičke sredine za više od 1 s ukazuje na odstupanje proučavanog parametra od norme.

4. U medicini se pravilo tri sigme koristi u pedijatriji za individualnu procjenu stupnja tjelesnog razvoja djece (metoda sigma odstupanja), za izradu standarda za dječju odjeću.

5. Standardna devijacija je neophodna za karakterizaciju stupnja različitosti svojstva koje se proučava i za izračunavanje pogreške aritmetičke sredine.

Vrijednost standardne devijacije obično se koristi za usporedbu varijabilnosti serija iste vrste. Ako se usporede dvije serije s različitim karakteristikama (visina i težina, prosječno trajanje bolničkog liječenja i bolničke smrtnosti itd.), tada je izravna usporedba sigma veličina nemoguća. , jer standardna devijacija je imenovana vrijednost izražena apsolutnim brojevima. U tim slučajevima koristite koeficijent varijacije (Cv), što je relativna vrijednost: postotni omjer standardne devijacije i aritmetičke sredine.

Koeficijent varijacije izračunava se pomoću formule:

Što je koeficijent varijacije veći , veća je varijabilnost ove serije. Smatra se da koeficijent varijacije veći od 30% ukazuje na kvalitativnu heterogenost populacije.

U statističkom testiranju hipoteza, kada se mjeri linearni odnos između slučajnih varijabli.

Standardna devijacija:

Standardna devijacija(procjena standardne devijacije slučajne varijable Pod, zidovi oko nas i strop, x u odnosu na svoje matematičko očekivanje temeljeno na nepristranoj procjeni njegove varijance):

gdje je disperzija; - Pod, zidovi oko nas i strop, ja element selekcije; - veličina uzorka; - aritmetička sredina uzorka:

Treba napomenuti da su obje procjene pristrane. U općem slučaju nemoguće je konstruirati nepristranu procjenu. Međutim, procjena temeljena na nepristranoj procjeni varijance je dosljedna.

Pravilo tri sigme

Pravilo tri sigme() - gotovo sve vrijednosti normalno distribuirane slučajne varijable leže u intervalu. Strože rečeno – s pouzdanošću ne manjom od 99,7%, vrijednost normalno distribuirane slučajne varijable leži u navedenom intervalu (pod uvjetom da je vrijednost istinita i da nije dobivena kao rezultat obrade uzorka).

Ako je prava vrijednost nepoznata, onda ne bismo trebali koristiti, nego pod, zidove oko nas i strop, s. Tako se pravilo tri sigme pretvara u pravilo tri poda, zidova oko nas i stropa, s .

Tumačenje vrijednosti standardne devijacije

Velika vrijednost standardne devijacije pokazuje veliki raspon vrijednosti u prikazanom skupu s prosječnom vrijednošću skupa; mala vrijednost, prema tome, pokazuje da su vrijednosti u skupu grupirane oko srednje vrijednosti.

Na primjer, imamo tri skupa brojeva: (0, 0, 14, 14), (0, 6, 8, 14) i (6, 6, 8, 8). Sva tri skupa imaju srednje vrijednosti jednake 7, odnosno standardne devijacije jednake 7, 5 i 1. Posljednji skup ima malu standardnu ​​devijaciju, budući da su vrijednosti u skupu grupirane oko srednje vrijednosti; prvi skup ima najveću vrijednost standardne devijacije - vrijednosti unutar skupa jako odstupaju od prosječne vrijednosti.

U općem smislu, standardna devijacija se može smatrati mjerom nesigurnosti. Na primjer, u fizici se standardna devijacija koristi za određivanje pogreške niza uzastopnih mjerenja neke veličine. Ova je vrijednost vrlo važna za određivanje vjerodostojnosti fenomena koji se proučava u usporedbi s vrijednošću koju predviđa teorija: ako se prosječna vrijednost mjerenja jako razlikuje od vrijednosti predviđenih teorijom (velika standardna devijacija), tada treba ponovno provjeriti dobivene vrijednosti ili način njihova dobivanja.

Praktična upotreba

U praksi, standardna devijacija vam omogućuje da odredite koliko se vrijednosti u skupu mogu razlikovati od prosječne vrijednosti.

Klima

Pretpostavimo da postoje dva grada s istom prosječnom maksimalnom dnevnom temperaturom, ali se jedan nalazi na obali, a drugi u unutrašnjosti. Poznato je da gradovi koji se nalaze na obali imaju mnogo različitih maksimalnih dnevnih temperatura koje su niže od gradova u unutrašnjosti. Dakle, standardna devijacija maksimalnih dnevnih temperatura za obalni grad bit će manja nego za drugi grad, unatoč činjenici da je prosječna vrijednost te vrijednosti ista, što u praksi znači da je vjerojatnost da će maksimalna temperatura zraka na bilo koji dan u godini bit će veća razlika od prosječne vrijednosti, veća za grad koji se nalazi u unutrašnjosti.

Sport

Pretpostavimo da postoji nekoliko nogometnih momčadi koje su ocijenjene prema nekom skupu parametara, na primjer, broj postignutih i primljenih golova, šanse za postizanje pogotka itd. Najvjerojatnije je da će najbolja momčad u ovoj skupini imati bolje vrijednosti na više parametara. Što je manja standardna devijacija tima za svaki od prikazanih parametara, to je rezultat tima predvidljiviji; takvi timovi su uravnoteženi. S druge strane, momčad s velikom standardnom devijacijom teško je predvidjeti rezultat, što se pak objašnjava neravnotežom, primjerice, jaka obrana, ali slab napad.

Korištenje standardne devijacije parametara tima omogućuje, u jednom ili drugom stupnju, predviđanje rezultata utakmice između dva tima, procjenjujući snage i slabosti timova, a time i odabrane metode borbe.

Tehnička analiza

vidi također

Književnost

* Borovikov, V. STATISTIKA. Umjetnost analize podataka na računalu: Za profesionalce / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 str. - ISBN 5-272-00078-1.

Prema istraživanju uzorka, štediše su grupirane prema veličini depozita u gradskoj Sberbanci:

Definirati:

1) opseg varijacije;

2) prosječna veličina depozita;

3) prosječno linearno odstupanje;

4) disperzija;

5) standardna devijacija;

6) koeficijent varijacije doprinosa.

Riješenje:

Ovaj niz distribucije sadrži otvorene intervale. U takvim nizovima vrijednost intervala prve skupine konvencionalno se pretpostavlja jednakom vrijednosti intervala sljedeće, a vrijednost intervala posljednje skupine jednaka je vrijednosti intervala skupine prethodni.

Vrijednost intervala druge grupe je jednaka 200, dakle, vrijednost prve grupe je također jednaka 200. Vrijednost intervala pretposljednje grupe je jednaka 200, što znači da će i zadnji interval također biti jednak 200. imaju vrijednost 200.

1) Definirajmo raspon varijacije kao razliku između najveće i najmanje vrijednosti atributa:

Raspon varijacija u veličini depozita je 1000 rubalja.

2) Prosječna veličina doprinosa bit će određena pomoću formule ponderirane aritmetičke sredine.

Najprije odredimo diskretnu vrijednost atributa u svakom intervalu. Da bismo to učinili, koristeći jednostavnu formulu aritmetičke sredine, nalazimo sredine intervala.

Prosječna vrijednost prvog intervala bit će:

drugi - 500, itd.

Upišimo rezultate izračuna u tablicu:

Iznos depozita, rub.Broj deponenata, fSredina intervala, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Ukupno 400 - 312000

Prosječni depozit u gradskoj Sberbanci bit će 780 rubalja:

3) Prosječno linearno odstupanje je aritmetička sredina apsolutnih odstupanja pojedinih vrijednosti obilježja od ukupnog prosjeka:

Postupak za izračunavanje prosječnog linearnog odstupanja u seriji intervalne distribucije je sljedeći:

1. Izračunava se ponderirana aritmetička sredina, kao što je prikazano u stavku 2).

2. Apsolutna odstupanja od prosjeka utvrđuju se:

3. Rezultirajuća odstupanja se množe s frekvencijama:

4. Pronađite zbroj ponderiranih odstupanja bez uzimanja u obzir predznaka:

5. Zbroj ponderiranih odstupanja dijeli se sa zbrojem frekvencija:

Prikladno je koristiti tablicu podataka za izračun:

Iznos depozita, rub.Broj deponenata, fSredina intervala, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Ukupno 400 - - - 81280

Prosječno linearno odstupanje veličine depozita klijenata Sberbanke iznosi 203,2 rublja.

4) Disperzija je aritmetička sredina kvadrata odstupanja svake vrijednosti atributa od aritmetičke sredine.

Izračun varijance u serijama intervalne distribucije provodi se pomoću formule:

Postupak za izračunavanje varijance u ovom slučaju je sljedeći:

1. Odredite ponderiranu aritmetičku sredinu, kao što je prikazano u paragrafu 2).

2. Pronađite odstupanja od prosjeka:

3. Kvadrat odstupanja svake opcije od prosjeka:

4. Pomnožite kvadrate odstupanja s težinama (frekvencijama):

5. Zbrojite dobivene produkte:

6. Dobiveni iznos se dijeli sa zbrojem težina (učestalosti):

Stavimo izračune u tablicu:

Iznos depozita, rub.Broj deponenata, fSredina intervala, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Ukupno 400 - - - 23040000

upute

Neka postoji nekoliko brojeva koji karakteriziraju homogene veličine. Na primjer, rezultati mjerenja, vaganja, statistička opažanja itd. Sve predstavljene količine moraju se mjeriti istom mjerom. Da biste pronašli standardnu ​​devijaciju, učinite sljedeće:

Odredite aritmetičku sredinu svih brojeva: zbrojite sve brojeve i zbroj podijelite s ukupnim brojem brojeva.

Odredite disperziju (raspršenost) brojeva: zbrojite kvadrate prethodno pronađenih odstupanja i dobiveni zbroj podijelite s brojem brojeva.

Na odjelu je sedam pacijenata s temperaturama od 34, 35, 36, 37, 38, 39 i 40 Celzijevih stupnjeva.

Potrebno je odrediti prosječno odstupanje od srednje vrijednosti.
Riješenje:
“u odjelu”: (34+35+36+37+38+39+40)/7=37 ºS;

Odstupanja temperature od prosjeka (u ovom slučaju normalne vrijednosti): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, što rezultira: -3, - 2, -1 , 0, 1, 2, 3 (ºS);

Zbroj prethodno dobivenih brojeva podijelite njihovim brojem. Za točne izračune bolje je koristiti kalkulator. Rezultat dijeljenja je aritmetička sredina zbrojenih brojeva.

Obratite pozornost na sve faze izračuna, budući da će pogreška čak iu jednom od izračuna dovesti do netočnog konačnog pokazatelja. Provjerite svoje izračune u svakoj fazi. Aritmetički prosjek ima isti metar kao i zbrojeni brojevi, odnosno ako odredite prosječnu posjećenost, tada će svi vaši pokazatelji biti "osoba".

Ova metoda izračuna se koristi samo u matematičkim i statističkim izračunima. Na primjer, aritmetička sredina u informatici ima drugačiji algoritam izračuna. Aritmetička sredina je vrlo relativan pokazatelj. Pokazuje vjerojatnost nekog događaja, pod uvjetom da ima samo jedan faktor ili pokazatelj. Za najdublju analizu potrebno je uzeti u obzir mnoge čimbenike. U tu svrhu koristi se izračun općenitijih veličina.

Aritmetička sredina jedna je od mjera središnje tendencije, široko korištena u matematici i statističkim proračunima. Pronalaženje aritmetičkog prosjeka za nekoliko vrijednosti vrlo je jednostavno, ali svaki zadatak ima svoje nijanse, koje je jednostavno potrebno znati kako bi se izvršili ispravni izračuni.

Kvantitativni rezultati sličnih pokusa.

Kako pronaći aritmetičku sredinu

Pronalaženje aritmetičke sredine za niz brojeva treba započeti određivanjem algebarskog zbroja tih vrijednosti. Na primjer, ako niz sadrži brojeve 23, 43, 10, 74 i 34, tada će njihov algebarski zbroj biti jednak 184. Pri pisanju se aritmetička sredina označava slovom μ (mu) ili x (x s a bar). Zatim, algebarski zbroj treba podijeliti s brojem brojeva u nizu. U primjeru koji razmatramo bilo je pet brojeva, pa će aritmetička sredina biti jednaka 184/5 i bit će 36,8.

Značajke rada s negativnim brojevima

Ako niz sadrži negativne brojeve, tada se aritmetička sredina pronalazi pomoću sličnog algoritma. Razlika postoji samo kod računanja u programskom okruženju ili ako problem ima dodatne uvjete. U tim slučajevima pronalaženje aritmetičke sredine brojeva s različitim predznacima svodi se na tri koraka:

1. Određivanje općeg aritmetičkog prosjeka standardnom metodom;
2. Određivanje aritmetičke sredine negativnih brojeva.
3. Izračunavanje aritmetičke sredine pozitivnih brojeva.

Odgovori za svaku akciju pišu se odvojeni zarezima.

Prirodni i decimalni razlomci

Ako je niz brojeva predstavljen decimalnim razlomcima, rješavanje se provodi metodom izračuna aritmetičke sredine cijelih brojeva, ali se rezultat reducira prema zahtjevima zadatka za točnost odgovora.

Kada radite s prirodnim razlomcima, potrebno ih je svesti na zajednički nazivnik, koji se množi s brojem brojeva u nizu. Brojnik odgovora bit će zbroj zadanih brojnika izvornih razlomaka.

KATEGORIJE

POPULARNI ČLANCI

2023 “kingad.ru” - ultrazvučni pregled ljudskih organa