Pearsonova distribucija s k jednakim 19. Pearsonov test prilagodbe

Zadatak 1.

Koristeći Pearsonov test, na razini značajnosti a= 0,05 provjeriti je li hipoteza o normalnoj raspodjeli stanovništva konzistentna x s empirijskim rasporedom veličine uzorka n = 200.

Riješenje.

1. Izračunajmo i standardna devijacija uzorka .
2. Izračunajmo teorijske frekvencije uzimajući u obzir da n = 200, h= 2, = 4,695, prema formuli
.

Kreirajmo tablicu izračuna (vrijednosti funkcije j(x) dani su u Dodatku 1).


ja

3. Usporedimo empirijske i teorijske frekvencije. Sastavimo računsku tablicu iz koje ćemo pronaći opaženu vrijednost kriterija :


ja
Iznos

Prema tablici kritičnih točaka distribucije (prilog 6.), po razini značajnosti a= 0,05 i broj stupnjeva slobode k = s– 3 = 9 – 3 = 6 nalazimo kritičnu točku desnog kritičnog područja (0,05; 6) = 12,6.
Budući da je =22,2 > = 12,6, odbacujemo hipotezu o normalnoj distribuciji stanovništva. Drugim riječima, empirijske i teorijske učestalosti značajno se razlikuju.

Problem 2

Prikazani su statistički podaci.

Rezultati mjerenja promjera n= 200 valjaka nakon mljevenja sažeti su u tablici. (mm):
Stol Niz varijacija frekvencije promjera valjka

ja

xi, mm

xi, mm

Potreban:

1) sastaviti diskretnu seriju varijacija, poredajući je ako je potrebno;

2) odrediti glavne numeričke karakteristike niza;

3) dati grafički prikaz niza u obliku poligona raspodjele (histogram);

4) konstruirati krivulju teorijske normalne distribucije i provjeriti podudarnost empirijske i teorijske distribucije koristeći Pearsonov kriterij. Prilikom testiranja statističke hipoteze o vrsti distribucije prihvatiti razinu značajnosti a = 0,05

Riješenje: Pronaći ćemo glavne numeričke karakteristike zadanog niza varijacija prema definiciji. Prosječni promjer rola je (mm):
x prosječno = = 6,753;
ispravljena disperzija (mm2):
D = = 0,0009166;
ispravljena srednja kvadratna (standardna) devijacija (mm):
s = = 0,03028.


Riža. Raspodjela učestalosti promjera valjaka

Izvorna ("sirova") distribucija frekvencije niza varijacija, tj. Dopisivanje ni(xi), odlikuje se prilično velikim rasponom vrijednosti ni u odnosu na neku hipotetsku krivulju "usrednjavanja" (sl.). U ovom slučaju, poželjno je konstruirati i analizirati niz intervalnih varijacija, kombinirajući frekvencije za promjere koji spadaju u odgovarajuće intervale.
Broj grupa intervala K Definirajmo ga pomoću Sturgessove formule:
K= 1 + log2 n= 1 + 3,322lg n,
Gdje n= 200 – veličina uzorka. U našem slučaju
K= 1 + 3,322×lg200 = 1 + 3,322×2,301 = 8,644 » 8.
Širina intervala je (6,83 – 6,68)/8 = 0,01875 » 0,02 mm.
Niz intervalnih varijacija prikazan je u tablici.

Tablica Niz varijacija intervala frekvencije promjera valjka.

k

xk, mm

Intervalni niz može se vizualno prikazati u obliku histograma distribucije frekvencija.


Riža. Raspodjela učestalosti promjera valjaka. Puna linija je izglađujuća normalna krivulja.

Pojava histograma omogućuje nam da pretpostavimo da se raspodjela promjera valjaka pokorava normalnom zakonu, prema kojem se teorijske frekvencije mogu pronaći kao
nk, teorija = n× N(a; s; xk)×D xk,
gdje je, pak, izglađujuća Gaussova krivulja normalne distribucije određena izrazom:
N(a; s; xk) = .
U ovim izrazima xk– središta intervala u nizu varijacija intervala frekvencije.

Na primjer, x 1 = (6,68 + 6,70)/2 = 6,69. Kao središnje procjene a a parametar s Gaussove krivulje može se uzeti:
a = x oženiti se
Od sl. vidi se da Gaussova krivulja normalne distribucije općenito odgovara empirijskoj intervalnoj distribuciji. Međutim, treba provjeriti statističku značajnost ove korespondencije. Kako bismo provjerili podudarnost empirijske distribucije s empirijskom distribucijom, koristimo Pearsonov kriterij dobrog uklapanja c2. Da biste to učinili, izračunajte empirijsku vrijednost kriterija kao zbroj
= ,
Gdje nk I nk,theor – empirijske odnosno teorijske (normalne) frekvencije. Pogodno je prikazati rezultate izračuna u tabelarnom obliku:
Stol Izračuni Pearsonovog testa


[xk, xk+ 1), mm

xk, mm

nk,teor

Kritičnu vrijednost kriterija ćemo pronaći pomoću Pearsonove tablice za razinu značajnosti a = 0,05 i broj stupnjeva slobode d.f. = K – 1 – r, Gdje K= 8 – broj intervala intervalne varijacijske serije; r= 2 – broj parametara teorijske distribucije procijenjen na temelju podataka uzorka (u ovom slučaju, parametri a i s). Tako, d.f. = 5. Kritična vrijednost Pearsonovog kriterija je crit(a; d.f.) = 11.1. Od c2emp< c2крит, заключаем, что согласие между эмпирическим и теоретическим нормальным распределением является статистическим значимым. Иными словами, теоретическое нормальное распределение удовлетворительно описывает эмпирические данные.

Problem 3

Kutije čokolade pakiraju se automatski. Prema shemi nasumičnog uzorkovanja bez ponavljanja, uzeto je 130 od 2000 paketa sadržanih u seriji te su dobiveni sljedeći podaci o njihovoj težini:

Potrebno je koristiti Pearsonov kriterij na razini značajnosti a=0,05 za testiranje hipoteze da je slučajna varijabla X - težina paketa - raspodijeljena prema normalnom zakonu. Konstruirajte histogram empirijske distribucije i pripadajuće normalne krivulje na jednom grafikonu.

Riješenje

1012,5
= 615,3846

Bilješka:

U načelu, ispravljenu varijancu uzorka treba uzeti kao varijancu normalnog zakona distribucije. Ali zbog broj promatranja - 130 je dovoljno velik, onda će poslužiti i "obični".
Dakle, teorijska normalna distribucija je:

Interval

[xi ; xi+1]

Empirijske frekvencije

ni

Vjerojatnosti
pi

Teorijske frekvencije
npi

(ni-npi)2

Statistički test

Pravilo kojim se hipoteza I 0 odbacuje ili prihvaća naziva se statistički kriterij. Naziv kriterija u pravilu sadrži slovo koje označava posebno sastavljenu karakteristiku iz klauzule 2 algoritma za testiranje statističke hipoteze (vidi klauzulu 4.1), izračunatu u kriteriju. Pod uvjetima ovog algoritma, kriterij bi se pozvao "V-kriterij".

Prilikom testiranja statističkih hipoteza moguće su dvije vrste pogrešaka:

  • - Pogreška tipa I(možete odbaciti hipotezu I 0 kada je zapravo istinita);
  • - Greška tipa II(možete prihvatiti hipotezu I 0 kada ona zapravo nije istinita).

Vjerojatnost A pravljenje pogreške prvog tipa naziva se razina značajnosti kriterija.

Ako za R označavaju vjerojatnost pravljenja pogreške drugog tipa, tada (l - R) - vjerojatnost da se ne napravi greška drugog tipa, koja se zove snaga kriterija.

Pearsonov x 2 test dobrog pristajanja

Postoji nekoliko vrsta statističkih hipoteza:

  • - o zakonu raspodjele;
  • - homogenost uzoraka;
  • - numeričke vrijednosti parametara distribucije itd.

Razmotrit ćemo hipotezu o zakonu distribucije na primjeru Pearsonovog x 2 testa prilagodbe.

Kriterij dogovora naziva se statistički kriterij za testiranje nulte hipoteze o pretpostavljenom zakonu nepoznate distribucije.

Pearsonov test prilagodbe temelji se na usporedbi empirijskih (promatranih) i teorijskih učestalosti opažanja izračunatih pod pretpostavkom određenog zakona distribucije. Hipoteza br. 0 ovdje je formulirana na sljedeći način: prema osobini koja se proučava, populacija je normalno raspoređena.

Algoritam za testiranje statističke hipoteze #0 za kriterij x 1 Pearson:

  • 1) postavili smo hipotezu I 0 - prema osobini koja se proučava, opća populacija je normalno raspoređena;
  • 2) izračunati srednju vrijednost uzorka i standardnu ​​devijaciju uzorka O V;

3) prema raspoloživoj veličini uzorka P izračunavamo posebno sastavljenu karakteristiku,

gdje su: i empirijske frekvencije, - teorijske frekvencije,

P - veličina uzorka,

h- veličina intervala (razlika između dvije susjedne opcije),

Normalizirane vrijednosti promatrane karakteristike,

- funkcija stola. Također i teorijske frekvencije

može se izračunati standardnom MS Excel funkcijom NORMIDIST pomoću formule;

4) korištenjem distribucije uzorka određujemo kritičnu vrijednost posebno sastavljene karakteristike xl P

5) kada je hipoteza #0 odbačena, kada je hipoteza #0 prihvaćena.

Primjer. Razmotrimo znak x- vrijednost pokazatelja testiranja osuđenika u jednoj od popravnih kolonija za neku psihološku karakteristiku, prikazanu u obliku varijacijskog niza:

Na razini značajnosti 0,05 testirajte hipotezu o normalnoj distribuciji populacije.

1. Na temelju empirijske distribucije može se postaviti hipoteza H 0: prema proučavanom kriteriju “vrijednost pokazatelja testiranja za danu psihološku karakteristiku”, opća populacija

očekivano se normalno distribuira. Alternativna hipoteza 1: prema proučavanom kriteriju “vrijednost testnog pokazatelja za danu psihološku karakteristiku” opća populacija osuđenika nije normalno raspoređena.

2. Izračunajmo numeričke karakteristike uzorka:

Intervali

x g y

X) sch

3. Izračunajmo posebno sastavljenu karakteristiku j 2 . Da bismo to učinili, u pretposljednjem stupcu prethodne tablice nalazimo teorijske frekvencije pomoću formule, au zadnjem stupcu

Izračunajmo karakteristike % 2. Dobivamo x 2 = 0,185.

Radi jasnoće, konstruirat ćemo poligon empirijske distribucije i normalnu krivulju na temelju teoretskih frekvencija (slika 6).

Riža. 6.

4. Odrediti broj stupnjeva slobode s: k = 5, t = 2, s = 5-2-1 = 2.

Prema tablici ili koristeći standardnu ​​MS Excel funkciju “HI20BR” za broj stupnjeva slobode 5 = 2 i razinu značajnosti a = 0,05 naći ćemo kritičnu vrijednost kriterija xl P .=5,99. Za razinu značaja A= 0,01 vrijednost kritičnog kriterija X%. = 9,2.

5. Promatrana vrijednost kriterija x=0,185 manje od svih pronađenih vrijednosti Hk R.-> stoga se hipoteza I 0 prihvaća na obje razine značajnosti. Razlika između empirijskih i teoretskih učestalosti je beznačajna. Stoga su podaci promatranja u skladu s hipotezom o normalnoj distribuciji stanovništva. Dakle, prema proučavanom kriteriju “vrijednost pokazatelja testiranja za datu psihološku karakteristiku” opća populacija osuđenika raspoređena je normalno.

  • 1. Koryachko A.V., Kulichenko A.G. Viša matematika i matematičke metode u psihologiji: vodič kroz praktičnu nastavu za studente Psihološkog fakulteta. Ryazan, 1994.
  • 2. Nasledov A.D. Matematičke metode psiholoških istraživanja. Analiza i interpretacija podataka: Udžbenik, priručnik. Sankt Peterburg, 2008.
  • 3. Sidorenko E.V. Metode matematičke obrade u psihologiji. Sankt Peterburg, 2010.
  • 4. Soshnikova L.A. i dr. Multivarijatna statistička analiza u ekonomiji: Udžbenik, priručnik za sveučilišta. M., 1999. (monografija).
  • 5. Sukhodolsky E.V. Matematičke metode u psihologiji. Kharkov, 2004.
  • 6. Shmoilova R.A., Minashkin V.E., Sadovnikova N.A. Radionica iz teorije statistike: Udžbenik, priručnik. M., 2009. (monografija).
  • Gmurman V.E. Teorija vjerojatnosti i matematička statistika. Str. 465.
Svrha χ 2 kriterija - Pearsonov kriterij χ 2 kriterij se koristi u dvije svrhe: 1) za usporedbu empirijske distribucije karakteristike s teoretskom - jednoličnom, normalnom ili nekom drugom; 2) usporediti dvije, tri ili više empirijskih distribucija iste karakteristike. Opis kriterija Kriterij χ 2 odgovara na pitanje pojavljuju li se različite vrijednosti karakteristike s jednakom učestalošću u empirijskim i teorijskim distribucijama ili u dvije ili više empirijskih distribucija. Prednost metode je što omogućuje usporedbu distribucija obilježja prikazanih na bilo kojoj ljestvici, počevši od ljestvice naziva. U najjednostavnijem slučaju alternativne distribucije "da - ne", "dopustio nedostatak - nije dopustio nedostatak", "riješio problem - nije riješio problem" itd., već možemo primijeniti χ 2 kriterij. Što je veća razlika između dvije uspoređene distribucije, to je veća empirijska vrijednost χ 2 . Automatski izračun χ 2 - Pearsonovog kriterija Da biste izvršili automatski izračun χ 2 - Pearsonovog kriterija, morate izvesti dva koraka: Korak 1. Navedite broj empirijskih distribucija (od 1 do 10); Korak 2. Unesite empirijske frekvencije u tablicu; 3. korak. Dobiti odgovor.

Prednost Pearsonovog kriterija je njegova univerzalnost: može se koristiti za testiranje hipoteza o različitim zakonima distribucije.

1. Testiranje hipoteze o normalnoj distribuciji.

Neka se dobije dovoljno veliki uzorak P s mnogo opcija različitih značenja. Radi lakše obrade, interval od najmanje do najveće vrijednosti opcije dijelimo na s jednake dijelove i pretpostavit ćemo da su vrijednosti opcija koje ulaze u svaki interval približno jednake broju koji određuje sredinu intervala. Prebrojavanjem broja opcija koje ulaze u svaki interval, stvorit ćemo takozvani grupirani uzorak:

opcije……….. x 1 x 2 … x s

frekvencije…………. P 1 P 2 … n s ,

Gdje x i su vrijednosti srednjih točaka intervala, i n i– broj opcija uključenih u ja-interval (empirijske frekvencije).



Iz dobivenih podataka možete izračunati srednju vrijednost uzorka i standardnu ​​devijaciju uzorka σ B. Provjerimo pretpostavku da je populacija raspoređena prema normalnom zakonu s parametrima M(x) = , D(x) = . Zatim možete pronaći broj brojeva iz veličine uzorka P, koji bi se trebao pojaviti u svakom intervalu pod ovom pretpostavkom (to jest, teorijske frekvencije). Da bismo to učinili, pomoću tablice vrijednosti Laplaceove funkcije pronalazimo vjerojatnost ulaska ja ti interval:

,

Gdje i ja I b i- granice ja-ti interval. Množenjem dobivenih vjerojatnosti s veličinom uzorka n, nalazimo teorijske frekvencije: p i =n·p i Cilj nam je usporediti empirijske i teorijske frekvencije, koje se, naravno, međusobno razlikuju, te utvrditi jesu li te razlike beznačajne i ne pobijaju hipotezu o normalnoj distribuciji slučajne varijable koja se proučava ili jesu toliko velike da proturječe ovoj hipotezi. U tu svrhu koristi se kriterij u obliku slučajne varijable

. (20.1)

Njegovo značenje je očito: zbrajaju se dijelovi koje kvadrati odstupanja empirijskih frekvencija od teoretskih čine od odgovarajućih teorijskih frekvencija. Može se dokazati da, bez obzira na pravi zakon raspodjele populacije, zakon raspodjele slučajne varijable (20.1) teži zakonu raspodjele (vidi predavanje 12) s brojem stupnjeva slobode k = s – 1 – r, Gdje r– broj parametara očekivane distribucije procijenjen iz podataka uzorka. Normalnu distribuciju karakteriziraju, dakle, dva parametra k = s – 3. Za odabrani kriterij konstruira se desno kritično područje određeno uvjetom

(20.2)

Gdje α - razina značajnosti. Prema tome, kritično područje je zadano nejednakošću a područje prihvaćanja hipoteze je .

Dakle, za testiranje nulte hipoteze N 0: populacija je normalno raspoređena - potrebno je izračunati opaženu vrijednost kriterija iz uzorka:

, (20.1`)

i koristeći tablicu kritičnih točaka distribucije χ 2, pronađite kritičnu točku koristeći poznate vrijednosti α i k = s – 3. Ako - nulta hipoteza je prihvaćena, ako je odbačena.

2. Provjera hipoteze jednolike raspodjele.

Kada koristite Pearsonov test za testiranje hipoteze da je populacija ravnomjerno raspoređena s procijenjenom gustoćom vjerojatnosti

Potrebno je, izračunavši vrijednost iz raspoloživog uzorka, procijeniti parametre A I b prema formulama:

Gdje A* I b*- procjene A I b. Dapače, za ravnomjernu raspodjelu M(x) = , , gdje možete nabaviti sustav za određivanje A* I b*: čije su rješenje izrazi (20.3).

Zatim, pod pretpostavkom da , možete pronaći teorijske frekvencije pomoću formula

Ovdje s– broj intervala na koje je uzorak podijeljen.

Opažena vrijednost Pearsonovog kriterija izračunava se pomoću formule (20.1`), a kritična vrijednost izračunava se pomoću tablice, uzimajući u obzir činjenicu da je broj stupnjeva slobode k = s – 3. Nakon toga se određuju granice kritičnog područja na isti način kao i za provjeru hipoteze o normalnoj distribuciji.

3. Testiranje hipoteze o eksponencijalnoj distribuciji.

U ovom slučaju, podijelivši postojeći uzorak u intervale jednake duljine, razmatramo slijed opcija, jednako udaljenih jedna od druge (pretpostavljamo da su sve opcije koje spadaju u ja- th interval, uzmite vrijednost koja se podudara s njegovom sredinom), i njihove odgovarajuće frekvencije n i(broj opcija uzorka uključenih u ja– th interval). Izračunajmo iz ovih podataka i uzmimo kao procjenu parametra λ veličina. Zatim se pomoću formule izračunaju teorijske frekvencije

Zatim se uspoređuju promatrana i kritična vrijednost Pearsonovog kriterija, uzimajući u obzir činjenicu da je broj stupnjeva slobode k = s – 2.

Kriterij prilagodbe za testiranje hipoteze o zakonu distribucije slučajne varijable koja se proučava. U mnogim praktičnim problemima, točan zakon distribucije je nepoznat. Stoga se postavlja hipoteza o korespondenciji postojećeg empirijskog zakona, konstruirana iz opažanja, do neke teorijske. Ova hipoteza zahtijeva statističko testiranje, čiji će rezultati ili potvrditi, ili opovrgnuti.

Neka je X slučajna varijabla koja se proučava. Potrebno je testirati hipotezu H 0 da ova slučajna varijabla poštuje zakon distribucije F(x). Da bi se to postiglo, potrebno je napraviti uzorak od n neovisnih promatranja i koristiti ga za konstruiranje empirijskog zakona distribucije F"(x). Za usporedbu empirijskog i hipotetskog zakona koristi se pravilo koje se naziva kriterij prilagodbe Jedan od popularnih je K. Pearsonov hi-kvadrat test prilagodbe.

Izračunava hi-kvadrat statistiku:

,

gdje je N broj intervala prema kojima je konstruiran empirijski zakon distribucije (broj stupaca odgovarajućeg histograma), i je broj intervala, p t i je vjerojatnost da vrijednost slučajne varijable padne u i -ti interval za teorijski zakon distribucije, p e i je vjerojatnost da vrijednost slučajne varijable padne u i -interval za empirijski zakon distribucije. Trebao bi se pridržavati distribucije hi-kvadrat.

Ako izračunata vrijednost statistike premašuje kvantil hi-kvadrat distribucije s k-p-1 stupnjeva slobode za danu razinu značajnosti, tada se hipoteza H 0 odbacuje. U protivnom se prihvaća na danoj razini značajnosti. Ovdje k je broj opažanja, p je broj procijenjenih parametara zakona raspodjele .

Pearson vam omogućuje da provjerite empirijske i teorijske (ili druge empirijske) distribucije jedne karakteristike. Ovaj kriterij se primjenjuje uglavnom u dva slučaja:

Usporediti empirijsku raspodjelu obilježja s teoretskom raspodjelom (normalna, eksponencijalna, uniformna ili neka druga zakonitost);

Usporediti dvije empirijske distribucije iste karakteristike.

Ideja metode je odrediti stupanj odstupanja između odgovarajućih frekvencija n i i ; što je veća razlika, to je veća vrijednost

Veličina uzorka mora biti najmanje 50, a zbrojevi učestalosti moraju biti jednaki

Nulta hipoteza H 0 = (dvije distribucije praktički se ne razlikuju jedna od druge); alternativna hipoteza – H 1 = (diskrepancija između distribucija je značajna).

Ovdje je dijagram za primjenu kriterija za usporedbu dviju empirijskih distribucija:

Kriterij - statistički kriterij za testiranje hipoteze da promatrana slučajna varijabla poštuje neki teorijski zakon distribucije.


Ovisno o vrijednosti kriterija, hipoteza se može prihvatiti ili odbaciti:

§ , hipoteza je ispunjena.

§ (spada u lijevi “rep” distribucije). Stoga su teorijske i praktične vrijednosti vrlo bliske. Ako se, na primjer, testira generator slučajnih brojeva koji je generirao n brojeva iz segmenta, a hipoteza je: uzorak je jednoliko raspoređen na , tada se generator ne može nazvati slučajnim (hipoteza slučajnosti nije zadovoljena), jer uzorak je raspoređen previše ravnomjerno, ali hipoteza je točna.

§ (pada u desni “rep” distribucije) hipoteza je odbačena.

Definicija: Neka je dana slučajna varijabla X.

Hipoteza: Sa. V. X poštuje zakon distribucije.

Za testiranje hipoteze, razmotrite uzorak koji se sastoji od n neovisnih opažanja r.v. X: . Na temelju uzorka konstruirat ćemo empirijsku distribuciju r.v.-a u X. Usporedba empirijske i teorijske distribucije (pretpostavljene u hipotezi) napravljena je pomoću posebno odabrane funkcije - kriterija dobrog uklapanja. Razmotrite Pearsonov kriterij prilagodbe (kriterij):

Hipoteza: X n generira funkcija .

Podijeliti na k disjunktnih intervala ;

Neka je broj opažanja u j-tom intervalu: ;

Vjerojatnost da promatranje padne u j-ti interval kada je hipoteza ispunjena;

- očekivani broj pogodaka u j-tom intervalu;

Statistika: - Hi-kvadrat distribucija s k-1 stupnjeva slobode.

Kriterij čini pogreške u uzorcima s niskofrekventnim (rijetkim) događajima. Ovaj se problem može riješiti odbacivanjem niskofrekventnih događaja ili njihovim kombiniranjem s drugim događajima. Ova metoda se naziva Yatesova korekcija.

Pearsonov test prilagođenosti (χ 2) koristi se za testiranje hipoteze da empirijska distribucija odgovara očekivanoj teorijskoj distribuciji F(x) s velikom veličinom uzorka (n ≥ 100). Kriterij je primjenjiv za bilo koju vrstu funkcije F(x), čak i s nepoznatim vrijednostima njihovih parametara, što se obično događa pri analizi rezultata mehaničkih ispitivanja. To je njegova svestranost.

Korištenje kriterija χ 2 uključuje podjelu raspona varijacije uzorka u intervale i određivanje broja opažanja (učestalosti) n j za svaki od e intervali. Radi lakšeg ocjenjivanja parametara distribucije, intervali su odabrani iste duljine.

Broj intervala ovisi o veličini uzorka. Obično prihvaćeno: na n = 100 e= 10 ÷ 15, s n = 200 e= 15 ÷ 20, s n = 400 e= 25 ÷ 30, s n = 1000 e= 35 ÷ 40.

Intervali koji sadrže manje od pet opažanja kombiniraju se sa susjednim. Međutim, ako je broj takvih intervala manji od 20% njihovog ukupnog broja, dopušteni su intervali s frekvencijom n j ≥ 2.

Statistika Pearsonovog kriterija je vrijednost
, (3.91)
gdje je p j vjerojatnost da slučajna varijabla koja se proučava padne u j-interval, izračunata u skladu s hipotetskim zakonom distribucije F(x). Kada izračunavate vjerojatnost p j, morate imati na umu da se lijeva granica prvog intervala i desna granica posljednjeg moraju podudarati s granicama područja mogućih vrijednosti slučajne varijable. Na primjer, s a normalne raspodjele, prvi interval se proteže do -∞, a posljednji do +∞.

Nulta hipoteza o podudarnosti distribucije uzorkovanja s teorijskim zakonom F(x) provjerava se usporedbom vrijednosti izračunate pomoću formule (3.91) s kritičnom vrijednošću χ 2 α dobivenom iz tablice. VI primjene za razinu značajnosti α i broj stupnjeva slobode k = e 1 - m - 1. Ovdje e 1 - broj intervala nakon spajanja; m je broj parametara procijenjen iz uzorka koji se razmatra. Ako je nejednakost zadovoljena
χ 2 ≤ χ 2 α (3.92)
tada se nulta hipoteza ne odbacuje. Ako navedena nejednakost nije ispunjena, prihvaća se alternativna hipoteza da uzorak pripada nepoznatoj distribuciji.

Nedostatak Pearsonovog testa usklađenosti je gubitak dijela početnih informacija povezan s potrebom grupiranja rezultata promatranja u intervale i kombiniranja pojedinačnih intervala s malim brojem promatranja. U tom smislu preporučuje se dopuna provjera usklađenosti distribucija pomoću kriterija χ 2 s drugim kriterijima.Ovo je posebno potrebno kod uzoraka relativno malog volumena (n ≈ 100).

U tablici su prikazane kritične vrijednosti hi-kvadrat distribucije sa zadanim brojem stupnjeva slobode. Željena vrijednost nalazi se na sjecištu stupca s pripadajućom vrijednošću vjerojatnosti i retka s brojem stupnjeva slobode. Na primjer, kritična vrijednost hi-kvadrat distribucije s 4 stupnja slobode za vjerojatnost od 0,25 je 5,38527. To znači da je površina ispod hi-kvadrat krivulje gustoće s 4 stupnja slobode desno od vrijednosti 5,38527 0,25.

ODA Kriterij za provjeru hipoteze o pretpostavljenom zakonu nepoznate distribucije naziva se kriterij prilagodbe.

Postoji nekoliko testova dobrog uklapanja: $\chi ^2$ (chi-kvadrat) K. Pearsona, Kolmogorova, Smirnova itd.

Obično se teorijske i empirijske učestalosti razlikuju. Slučaj odstupanja ne mora biti slučajan, što znači da se objašnjava činjenicom da hipoteza nije ispravno odabrana. Pearsonov kriterij odgovara na postavljeno pitanje, ali kao i svaki drugi kriterij ne dokazuje ništa, već samo utvrđuje njegovo slaganje ili neslaganje s podacima promatranja na prihvaćenoj razini značajnosti.

ODA Dovoljno mala vjerojatnost pri kojoj se neki događaj može smatrati praktički nemogućim naziva se razina značajnosti.

U praksi se obično uzima da su razine značajnosti između 0,01 i 0,05, $\alpha =0,05$ je razina značajnosti od $5 ( \% ) $.

Kao kriterij za testiranje hipoteze uzet ćemo vrijednost \begin(equation) \label ( eq1 ) \chi ^2=\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) \qquad (1) \ kraj(jednadžba)

ovdje $n_i -$ empirijske frekvencije dobivene iz uzorka, $n_i" -$ teoretske frekvencije nađene teorijski.

Dokazano je da za $n\to \infty $ zakon distribucije slučajne varijable (1), bez obzira na zakon po kojem je populacija raspoređena, teži $\chi ^2$ zakonu (hi-kvadratu) sa $k$ stupnjeva slobode.

ODA Broj stupnjeva slobode nalazi se jednakošću $k=S-1-r$ gdje je $S-$ broj intervalnih grupa, $r-$ broj parametara.

1) ravnomjerna raspodjela: $r=2, k=S-3 $

2) normalna raspodjela: $r=2, k=S-3 $

3) eksponencijalna distribucija: $r=1, k=S-2$.

Pravilo . Testiranje hipoteze Pearsonovim testom.

  1. Da biste testirali hipotezu, izračunajte teorijske frekvencije i pronađite $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $
  2. Koristeći tablicu kritičnih točaka distribucije $\chi ^2$ za danu razinu značajnosti $\alpha $ i broj stupnjeva slobode $k$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$ nalaze se.
  3. Ako je $\chi _ (obs) ^2<\chi _ { кр } ^2 $ то нет оснований отвергать гипотезу, если не выполняется данное условие - то отвергают.

Komentar Za kontrolu izračuna upotrijebite formulu za $\chi ^2$ u obliku $\chi _ (promatrano) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) $

Provjera hipoteze jednolike raspodjele

Funkcija gustoće jednolike raspodjele veličine $X$ ima oblik $f(x)=\frac ( 1 ) ( b-a ) x\in \left[ ( a,b )\right]$.

Kako bi se testirala hipoteza da je kontinuirana slučajna varijabla raspodijeljena prema jedinstvenom zakonu na razini značajnosti $\alpha $, potrebno je:

1) Pronađite srednju vrijednost uzorka $\overline ( x_b ) $ i $\sigma _b =\sqrt ( D_b ) $ iz zadane empirijske distribucije. Uzmite kao procjenu parametara $a$ i $b$ količine

$a = \overline x _b -\sqrt 3 \sigma _b $, $b = \overline x _b +\sqrt 3 \sigma _b $

2) Pronađite vjerojatnost da slučajna varijabla $X$ padne u parcijalne intervale $(( x_i ,x_ ( i+1 ) ))$ pomoću formule $ P_i =P(( x_i

3) Pronađite teorijske (nivelirajuće) frekvencije pomoću formule $n_i" =np_i $.

4) Uzimajući broj stupnjeva slobode $k=S-3$ i razinu značajnosti $\alpha =0,05$ iz tablica $\chi ^2$ nalazimo $\chi _ ( cr ) ^2 $ za dano $\alpha $ i $k$, $\chi _ ( kr ) ^2 (( \alpha ,k ))$.

5) Koristeći formulu $\chi _ (promatrano) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ gdje su $n_i -$ empirijske frekvencije, nalazimo promatrana vrijednost $\ chi _ ( obs ) ^2 $.

6) Ako je $\chi _ ( obs ) ^2<\chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу.

Testirajmo hipotezu na našem primjeru.

1) $\overline x _b =13,00\,\,\sigma _b =\sqrt ( D_b ) = 6,51$

2) $a=13,00-\sqrt 3 \cdot 6,51=13,00-1,732\cdot 6,51=1,72468$

$b=13,00+1,732\cdot 6,51=24,27532$

$b-a=24,27532-1,72468=22,55064$

3) $P_i =P(( x_i

$P_2 =(( 3

$P_3 =(( 7

$P_4 =(( 11

$P_5 =(( 15

$P_6 =(( 19

U uniformnoj distribuciji, ako je duljina intervala ista, tada su $P_i -$ isti.

4) Pronađite $n_i" =np_i $.

5) Pronađite $\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" )) $ i pronađite $\chi _ ( obs ) ^2 $.

Upišimo sve dobivene vrijednosti u tablicu

\begin(niz) ( |l|l|l|l|l|l|l| ) \hline i& n_i & n_i" =np_i & n_i -n_i" & (( n_i -n_i" ))^2& \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) & Kontrola~ \frac ( n_i^2 ) ( n_i" ) \\ \hline 1& 1& 4,43438& -3,43438& 11,7950& 2,659898& 0,22551 \\ \hline 2& 6& 4,43438& 1,56562& 2,45117& 0,552765& 8,11838 \\ \hline 3& 3& 4,43438& -1,43438& 2,05744& 0,471463& 2,0296 \\ \hline 4 &3&4 ,43438& -1 .43438& 2.05744& 0.471463& 2.0296 \\ \hline 5& 6& 4.43438& 1,56562& 2,45117& 0,552765& 8,11838 \\ \hline 6& 6& 4,43438& 1,56562& 2, 45117& 0,552765& 8,11838 \\ \hline & & & & & \sum = \chi _ ( obs ) ^2 =3,261 119& \chi _ ( obs ) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) =3,63985 \\ \hline \end(array)

$\chi _ ( cr ) ^2 (( 0,05,3 ))=7,8 $

$\chi _ (obs) ^2<\chi _ { кр } ^2 =3,26<7,8$

Zaključak nema razloga za odbacivanje hipoteze.

KATEGORIJE

POPULARNI ČLANCI

2023 “kingad.ru” - ultrazvučni pregled ljudskih organa