Pearsonova distribucija za k jednako 19. Pearsonov test prilagodbe

Zadatak 1.

Koristeći Pearsonov test, na razini značajnosti a= 0,05 provjerite je li hipoteza o normalnoj raspodjeli stanovništva konzistentna x s empirijskim rasporedom veličine uzorka n = 200.

Riješenje.

1. Izračunaj i standardna devijacija uzorka .
2. Izračunajte teorijske frekvencije, uzimajući u obzir da n = 200, h= 2, = 4,695, prema formuli
.

Napravimo tablicu izračuna (vrijednosti funkcije j(x) dani su u Dodatku 1).


ja

3. Usporedimo empirijske i teorijske frekvencije. Napravimo računsku tablicu, iz koje ćemo pronaći promatranu vrijednost kriterija :


ja
Iznos

Prema tablici kritičnih točaka distribucije (prilog 6.), po razini značajnosti a= 0,05 i broj stupnjeva slobode k = s- 3 \u003d 9 - 3 \u003d 6 nalazimo kritičnu točku desnog kritičnog područja (0,05; 6) \u003d 12,6.
Budući da je =22,2 >= 12,6, odbacujemo hipotezu o normalnoj distribuciji opće populacije. Drugim riječima, empirijske i teorijske učestalosti značajno se razlikuju.

Zadatak2

Prikazani su statistički podaci.

Rezultati mjerenja promjera n= 200 valjaka nakon mljevenja sažeti su u tablici. (mm):
Stol Niz varijacija frekvencije promjera valjka

ja

xi, mm

xi, mm

Potreban:

1) sastaviti diskretni varijacijski niz, poredajući ga ako je potrebno;

2) odrediti glavne numeričke karakteristike niza;

3) dati grafički prikaz niza u obliku poligona (histograma) distribucije;

4) konstruirati krivulju teorijske normalne distribucije i provjeriti podudarnost između empirijske i teorijske distribucije koristeći Pearsonov kriterij. Prilikom testiranja statističke hipoteze o vrsti distribucije uzmite razinu značajnosti a = 0,05

Riješenje: Glavne numeričke karakteristike ovog varijacijskog niza pronaći ćemo po definiciji. Prosječni promjer rola je (mm):
x cp = = 6,753;
ispravljena disperzija (mm2):
D = = 0,0009166;
ispravljena standardna devijacija (mm):
s = = 0,03028.


Riža. Raspodjela učestalosti promjera valjaka

Početna ("sirova") distribucija frekvencije niza varijacija, tj. Dopisivanje ni(xi), karakterizira prilično velik raspon vrijednosti ni u odnosu na neku hipotetsku krivulju "usrednjavanja" (sl.). U ovom slučaju, poželjno je konstruirati i analizirati niz varijacija intervala kombiniranjem frekvencija za promjere koji se nalaze unutar odgovarajućih intervala.
Broj grupa intervala K definiramo Sturgessovom formulom:
K= 1 + log2 n= 1 + 3,322lg n,
Gdje n= 200 – veličina uzorka. U našem slučaju
K= 1 + 3,322×lg200 = 1 + 3,322×2,301 = 8,644 » 8.
Širina intervala je (6,83 - 6,68)/8 = 0,01875 » 0,02 mm.
Niz intervalnih varijacija prikazan je u tablici.

Tablica Niz varijacija intervala frekvencije promjera valjka.

k

xk, mm

Intervalni niz može se vizualno prikazati kao histogram distribucije frekvencija.


Riža. Raspodjela učestalosti promjera valjaka. Puna linija je izglađujuća normalna krivulja.

Oblik histograma omogućuje nam da pretpostavimo da se raspodjela promjera valjka pokorava normalnom zakonu, prema kojem se teorijske frekvencije mogu pronaći kao
nk, teor = n× N(a; s; xk)×D xk,
gdje je zauzvrat izglađena Gaussova krivulja normalne distribucije dana sa:
N(a; s; xk) = .
U ovim izrazima xk su središta intervala u nizu varijacija intervala frekvencije.

Na primjer, x 1 = (6,68 + 6,70)/2 = 6,69. Prema procjenama centra a a parametar s Gaussove krivulje može se uzeti:
a = x usp.
Od fig. vidi se da Gaussova krivulja normalne distribucije u cjelini odgovara empirijskoj intervalnoj distribuciji. Međutim, statističku značajnost ove korespondencije treba provjeriti. Upotrijebimo Pearsonov kriterij dobrote prilagodbe c2 da provjerimo odgovara li empirijska distribucija empirijskoj. Da biste to učinili, izračunajte empirijsku vrijednost kriterija kao zbroj
= ,
Gdje nk I nk,theor su empirijske i teorijske (normalne) frekvencije. Pogodno je prikazati rezultate izračuna u tabelarnom obliku:
Stol Proračuni Pearsonovog kriterija


[xk, xk+ 1), mm

xk, mm

nk,teor

Kritičnu vrijednost kriterija nalazimo pomoću Pearsonove tablice za razinu značajnosti a = 0,05 i broj stupnjeva slobode d.f. = K – 1 – r, Gdje K= 8 je broj intervala serije varijacija intervala; r= 2 je broj parametara teorijske distribucije procijenjen na temelju podataka uzorka (u ovom slučaju, parametri a i s). Tako, d.f. = 5. Kritična vrijednost Pearsonovog kriterija je crit(a; d.f.) = 11.1. Od c2emp< c2крит, заключаем, что согласие между эмпирическим и теоретическим нормальным распределением является статистическим значимым. Иными словами, теоретическое нормальное распределение удовлетворительно описывает эмпирические данные.

Zadatak3

Čokoladne kutije se pakiraju automatski. 130 od 2000 paketa sadržanih u lotu uzeto je prema shemi samonasumičnog uzorkovanja bez ponavljanja, te su dobiveni sljedeći podaci o njihovoj težini:

Potrebno je Pearsonovim testom na razini značajnosti a=0,05 testirati hipotezu da je slučajna varijabla X - težina paketa - raspoređena prema normalnom zakonu. Konstruirajte histogram empirijske distribucije i pripadajuće normalne krivulje na jednom grafikonu.

Riješenje

1012,5
= 615,3846

Bilješka:

U načelu, ispravljenu varijancu uzorka treba uzeti kao varijancu normalne distribucije. Ali budući da broj opažanja - 130 je dovoljno velik, tada će poslužiti i "uobičajeno".
Dakle, teorijska normalna distribucija je:

Interval

[xi; xi+1]

Empirijske frekvencije

ni

Vjerojatnosti
pi

Teorijske frekvencije
npi

(ni-npi)2

Statistički test

Pravilo kojim se hipoteza R 0 odbacuje ili prihvaća naziva se statistički kriterij. Naziv kriterija u pravilu sadrži slovo koje označava posebno sastavljenu karakteristiku iz stavka 2. algoritma za testiranje statističke hipoteze (vidi stavak 4.1.), izračunatu u kriteriju. Pod uvjetima ovog algoritma, kriterij bi se pozvao "V-kriterij".

Prilikom testiranja statističkih hipoteza moguće su dvije vrste pogrešaka:

  • - greška prve vrste(možete odbaciti hipotezu I 0 kada je zapravo istinita);
  • - greška tipa II(možete prihvatiti hipotezu I 0 kada ona zapravo nije istinita).

Vjerojatnost A make a type one error se zove razina značajnosti kriterija.

Ako za R označavaju vjerojatnost pravljenja pogreške tipa II, tada (l - R) - vjerojatnost da se ne napravi greška tipa II, koja se zove snaga kriterija.

Dobro odgovara x 2 Pearson

Postoji nekoliko vrsta statističkih hipoteza:

  • - o zakonu raspodjele;
  • - homogenost uzoraka;
  • - numeričke vrijednosti parametara distribucije itd.

Hipotezu o zakonu distribucije razmotrit ćemo na primjeru Pearsonovog x 2 testa prilagodbe.

Kriterij podudarnosti nazvan statistički test za testiranje nulte hipoteze o navodnom zakonu nepoznate distribucije.

Pearsonov test prilagodbe temelji se na usporedbi empirijskih (promatranih) i teorijskih učestalosti opažanja izračunatih pod pretpostavkom određenog zakona distribucije. Hipoteza # 0 ovdje je formulirana na sljedeći način: opća populacija normalno je raspoređena prema kriteriju koji se proučava.

Algoritam za testiranje statističke hipoteze #0 za kriterije x 1 Pearson:

  • 1) postavili smo hipotezu R 0 - prema kriteriju koji se proučava, opća populacija je normalno raspoređena;
  • 2) izračunati srednju vrijednost uzorka i standardnu ​​devijaciju uzorka O V;

3) prema raspoloživom volumenu uzorka P izračunavamo posebno sastavljenu karakteristiku,

gdje je: i, - empirijske frekvencije, - teorijske frekvencije,

P - veličina uzorka,

h- vrijednost intervala (razlika između dvije susjedne opcije),

Normalizirane vrijednosti promatrane značajke,

- funkcija stola. Također i teorijske frekvencije

može se izračunati standardnom MS Excel funkcijom NORMDIST prema formuli ;

4) prema raspodjeli uzorkovanja određujemo kritičnu vrijednost posebno sastavljene karakteristike XL P

5) kada je hipoteza #0 odbačena, kada je hipoteza #0 prihvaćena.

Primjer. Razmotrite znak x- vrijednost pokazatelja testiranja osuđenika u jednoj od popravnih kolonija prema nekoj psihološkoj karakteristici, prikazana kao niz varijacija:

Na razini značajnosti od 0,05 testirajte hipotezu o normalnoj distribuciji opće populacije.

1. Na temelju empirijske distribucije možete postaviti hipotezu H 0: prema kriteriju koji se proučava "vrijednost pokazatelja testa za danu psihološku karakteristiku", opća populacija

broj djece je normalno raspoređen. Alternativna hipoteza 1: prema proučavanom obilježju “vrijednost testnog pokazatelja za ovu psihološku karakteristiku” generalna populacija osuđenika nije normalno raspoređena.

2. Izračunajte numeričke karakteristike uzorka:

Intervali

x y y

X) sch

3. Izračunajte posebno sastavljenu karakteristiku j 2 . Da bismo to učinili, u pretposljednjem stupcu prethodne tablice nalazimo teorijske frekvencije pomoću formule, au zadnjem stupcu

izračunajmo karakteristiku % 2 . Dobivamo x 2 = 0,185.

Radi jasnoće, konstruirat ćemo poligon empirijske distribucije i normalnu krivulju prema teorijskim frekvencijama (slika 6).

Riža. 6.

4. Odrediti broj stupnjeva slobode s: k = 5, t = 2, s = 5-2-1 = 2.

Prema tablici ili korištenjem standardne MS Excel funkcije "XI20BR" za broj stupnjeva slobode 5 = 2 i razinu značajnosti a = 0,05 pronađite kritičnu vrijednost kriterija xl P .=5,99. Za razinu značaja A= 0,01 kritična vrijednost kriterija X%. = 9,2.

5. Promatrana vrijednost kriterija x=0,185 manje od svih pronađenih vrijednosti Hc R.-> stoga je hipoteza R 0 prihvaćena na obje razine značajnosti. Razlika između empirijskih i teoretskih učestalosti je beznačajna. Stoga su podaci promatranja u skladu s hipotezom o normalnoj distribuciji stanovništva. Dakle, prema proučavanom obilježju “vrijednost testnog pokazatelja za ovo psihološko obilježje” opća populacija osuđenika raspoređena je normalno.

  • 1. Koryachko A.V., Kulichenko A.G. Viša matematika i matematičke metode u psihologiji: Vodič kroz praktične studije za studente Psihološkog fakulteta. Ryazan, 1994.
  • 2. Nasledov A.D. Matematičke metode psiholoških istraživanja. Analiza i interpretacija podataka: Udžbenik, priručnik. SPb., 2008.
  • 3. Sidorenko E.V. Metode matematičke obrade u psihologiji. SPb., 2010.
  • 4. Soshnikova L.A. i dr. Multivarijatna statistička analiza u gospodarstvu: Udžbenik, priručnik za sveučilišta. M., 1999. (monografija).
  • 5. Sukhodolsky E.V. Matematičke metode u psihologiji. Kharkov, 2004.
  • 6. Shmoylova R.A., Minashkin V.E., Sadovnikova N.A. Radionica iz teorije statistike: Udžbenik, priručnik. M., 2009. (monografija).
  • Gmurman V.E. Teorija vjerojatnosti i matematička statistika. S. 465.
Svrha kriterija χ 2 - Pearsonov kriterij Kriterij χ 2 koristi se u dvije svrhe: 1) za usporedbu empirijske distribucije obilježja s teoretskom - jednoličnom, normalnom ili nekom drugom; 2) usporediti dvije, tri ili više empirijskih distribucija istog obilježja. Opis kriterija Kriterij χ 2 odgovara na pitanje pojavljuju li se različite vrijednosti obilježja s istom učestalošću u empirijskoj i teorijskoj distribuciji ili u dvije ili više empirijskih distribucija. Prednost metode je što omogućuje usporedbu distribucija obilježja prikazanih u bilo kojoj ljestvici, počevši od ljestvice naziva. U najjednostavnijem slučaju alternativne distribucije "da - ne", "dozvoljeno vjenčanje - nedopušteno vjenčanje", "riješio problem - nije riješio problem" itd. već možemo primijeniti kriterij χ 2 . Što je veća razlika između dvije usporedive distribucije, to je veća empirijska vrijednost χ 2 . Automatsko izračunavanje χ 2 - Pearsonovog kriterija Za automatsko izračunavanje χ 2 - Pearsonovog kriterija potrebno je izvršiti dva koraka: Korak 1. Navedite broj empirijskih distribucija (od 1 do 10); Korak 2. Upiši empirijske frekvencije u tablicu; 3. korak. Dobiti odgovor.

Prednost Pearsonovog kriterija je njegova univerzalnost: može se koristiti za testiranje hipoteza o različitim zakonima distribucije.

1. Testiranje hipoteze o normalnoj distribuciji.

Neka se dobije uzorak dovoljno velike veličine P s puno različitih varijantnih vrijednosti. Radi lakše obrade, interval od najmanje do najveće vrijednosti varijante dijelimo s s jednake dijelove i pretpostavit ćemo da su vrijednosti opcija koje ulaze u svaki interval približno jednake broju koji određuje sredinu intervala. Nakon što smo prebrojali opcije koje su pale u svaki interval, napravit ćemo takozvani grupirani uzorak:

opcije……….. x 1 x 2 … x s

frekvencije…………. P 1 P 2 … n s ,

Gdje x i su vrijednosti srednjih točaka intervala, i n i je broj opcija uključenih u ja th interval (empirijske frekvencije).



Na temelju dobivenih podataka moguće je izračunati srednju vrijednost uzorka i standardnu ​​devijaciju uzorka σ B. Provjerimo pretpostavku da je opća populacija raspoređena prema normalnom zakonu s parametrima M(x) = , D(x) = . Zatim možete pronaći broj brojeva iz uzorka volumena P, koji bi trebao biti u svakom intervalu pod ovom pretpostavkom (to jest, teorijske frekvencije). Da bismo to učinili, koristeći tablicu vrijednosti Laplaceove funkcije, nalazimo vjerojatnost pogotka ja-ti interval:

,

Gdje a ja I b i- granice ja-ti interval. Množenjem dobivenih vjerojatnosti s veličinom uzorka n, nalazimo teorijske frekvencije: p i =n p i.Naš cilj je usporediti empirijske i teorijske frekvencije, koje se, naravno, međusobno razlikuju, i otkriti jesu li te razlike beznačajne, ne opovrgavaju hipotezu o normalnoj distribuciji slučajne varijable koja se proučava ili jesu li takve velike da su u suprotnosti s ovom hipotezom. Za to se koristi kriterij u obliku slučajne varijable

. (20.1)

Njegovo značenje je očito: zbrajaju se dijelovi koji su kvadrati odstupanja empirijskih frekvencija od teoretskih od odgovarajućih teorijskih frekvencija. Može se dokazati da, bez obzira na pravi zakon distribucije opće populacije, zakon distribucije slučajne varijable (20.1) pri teži zakonu distribucije (vidi predavanje 12) s brojem stupnjeva slobode k = s - 1 – r, Gdje r je broj parametara procijenjene distribucije procijenjen iz podataka uzorka. Normalnu distribuciju karakteriziraju dva parametra, tj k = s - 3. Za odabrani kriterij konstruira se desno kritično područje određeno uvjetom

(20.2)

Gdje α - razina značajnosti. Stoga je kritično područje zadano nejednakošću a područje prihvaćanja hipoteze je .

Dakle, za testiranje nulte hipoteze H 0: populacija je normalno raspoređena - potrebno je izračunati opaženu vrijednost kriterija iz uzorka:

, (20.1`)

i prema tablici kritičnih točaka distribucije χ 2 pronaći kritičnu točku koristeći poznate vrijednosti α i k = s - 3. Ako - nulta hipoteza je prihvaćena, ako je odbačena.

2. Provjera hipoteze jednolike raspodjele.

Kada se koristi Pearsonov test za testiranje hipoteze jednolike distribucije opće populacije s pretpostavljenom gustoćom vjerojatnosti

potrebno je, izračunavši vrijednost iz raspoloživog uzorka, procijeniti parametre A I b prema formulama:

Gdje A* I b*- procjene A I b. Dapače, za jednoliku raspodjelu M(x) = , , odakle možete dobiti sustav za određivanje A* I b*: čije su rješenje izrazi (20.3).

Zatim, pod pretpostavkom da , možete pronaći teorijske frekvencije pomoću formula

Ovdje s je broj intervala na koje je uzorak podijeljen.

Opažena vrijednost Pearsonovog kriterija izračunava se po formuli (20.1`), a kritična vrijednost se izračunava iz tablice, uzimajući u obzir činjenicu da je broj stupnjeva slobode k = s - 3. Nakon toga se određuju granice kritične regije na isti način kao i za provjeru hipoteze o normalnoj distribuciji.

3. Testiranje hipoteze o eksponencijalnoj distribuciji.

U ovom slučaju, dijeleći postojeći uzorak na intervale jednake duljine, razmatramo niz opcija jednako udaljenih jedna od druge (pretpostavljamo da sve opcije koje spadaju u ja-th interval, uzmite vrijednost koja se podudara s njegovom sredinom), i njihove odgovarajuće frekvencije n i(broj opcija uzorka uključenih u ja– th interval). Računamo iz ovih podataka i uzimamo kao procjenu parametra λ vrijednost . Zatim se teorijske frekvencije izračunavaju prema formuli

Zatim se uspoređuju opažene i kritične vrijednosti Pearsonovog kriterija, uzimajući u obzir da je broj stupnjeva slobode k = s - 2.

Kriterij slaganja za testiranje hipoteze o zakonu distribucije slučajne varijable koja se proučava. U mnogim praktičnim problemima, točan zakon distribucije je nepoznat. Stoga se postavlja hipoteza o korespondenciji postojećeg empirijskog zakona, izgrađenog na opažanjima, na neku teoretsku.Ova hipoteza zahtijeva statistički test čiji će rezultati potvrditi ili opovrgnuti.

Neka je X slučajna varijabla koja se proučava. Potrebno je testirati hipotezu H 0 da ova slučajna varijabla poštuje zakon distribucije F(x). Da bi se to postiglo, potrebno je napraviti uzorak od n neovisnih opažanja i koristiti ga za izgradnju empirijskog zakona distribucije F "(x). Za usporedbu empirijskih i hipotetskih zakona koristi se pravilo koje se naziva dobrota pristajanja. Jedan od najpopularniji je K. Pearsonov hi-kvadrat dobrog pristajanja.

Izračunava hi-kvadrat statistiku:

,

gdje je N broj intervala prema kojima je izgrađen empirijski zakon distribucije (broj stupaca odgovarajućeg histograma), i je broj intervala, p t i je vjerojatnost da će vrijednost slučajne varijable pasti u i-ti interval za teorijski zakon distribucije, p e i je vjerojatnost da će vrijednost slučajne varijable pasti u i-ti interval za empirijski zakon distribucije. Mora poštovati hi-kvadrat distribuciju.

Ako izračunata vrijednost statistike premašuje kvantil distribucije hi-kvadrat s k-p-1 stupnjeva slobode za danu razinu značajnosti, tada se hipoteza H 0 odbacuje. U suprotnom se prihvaća na danoj razini značajnosti. Ovdje je k broj opažanja, p je broj procijenjenih parametara zakona raspodjele .

Pearson vam omogućuje da testirate empirijske i teorijske (ili druge empirijske) distribucije jedne značajke. Ovaj kriterij se uglavnom primjenjuje u dva slučaja:

Usporediti empirijsku raspodjelu svojstva s teoretskom raspodjelom (normalna, eksponencijalna, uniformna ili neka druga zakonitost);

Usporediti dvije empirijske distribucije istog svojstva.

Ideja metode je odrediti stupanj divergencije odgovarajućih frekvencija n i i ; što je ta razlika veća, to je vrijednost veća

Veličina uzorka mora biti najmanje 50, a zbrojevi učestalosti moraju biti jednaki

Nulta hipoteza H 0 = (dvije distribucije praktički se ne razlikuju jedna od druge); alternativna hipoteza - H 1 = (diskrepancija između distribucija je značajna).

Evo sheme za primjenu kriterija za usporedbu dviju empirijskih distribucija:

Kriterij - statistički kriterij za testiranje hipoteze da promatrana slučajna varijabla poštuje neki teorijski zakon distribucije.


Ovisno o vrijednosti kriterija, hipoteza se može prihvatiti ili odbaciti:

§ , hipoteza je ispunjena.

§ (spada u lijevi "rep" distribucije). Stoga su teorijske i praktične vrijednosti vrlo bliske. Ako se, na primjer, provjeri generator slučajnih brojeva koji je generirao n brojeva iz segmenta, a hipoteza je: uzorak je jednoliko raspoređen na , tada se generator ne može nazvati slučajnim (hipoteza slučajnosti nije zadovoljena), jer uzorak je previše ravnomjerno raspoređen, ali je hipoteza zadovoljena.

§ (spada u desni "rep" distribucije) hipoteza je odbačena.

Definicija: Neka je dana slučajna varijabla X.

Hipoteza: Sa. V. X se pokorava zakonu distribucije.

Za testiranje hipoteze, razmotrite uzorak koji se sastoji od n neovisnih opažanja r.v. X: . Na temelju uzorka konstruiramo empirijsku distribuciju r.v. X. Usporedba empirijske i teorijske distribucije (pretpostavljene u hipotezi) provodi se pomoću posebno odabrane funkcije - kriterija dobrog uklapanja. Razmotrite Pearsonov test podesnosti (kriterij):

Hipoteza: X n generira funkcija .

Podijelite na k intervala koji se ne preklapaju ;

Neka je broj opažanja u j-tom intervalu: ;

Vjerojatnost da promatranje padne u j-ti interval kada je hipoteza ispunjena;

- očekivani broj pogodaka u j-tom intervalu;

Statistika: - Hi-kvadrat distribucija s k-1 stupnjeva slobode.

Kriterij je pogrešan na uzorcima s niskofrekventnim (rijetkim) događajima. Ovaj se problem može riješiti odbacivanjem niskofrekventnih događaja ili njihovim kombiniranjem s drugim događajima. Ova metoda se naziva Yatesova korekcija.

Pearsonov test usklađenosti (χ 2) koristi se za testiranje hipoteze da empirijska distribucija odgovara očekivanoj teorijskoj distribuciji F(x) s velikom veličinom uzorka (n ≥ 100). Kriterij je primjenjiv za bilo koju vrstu funkcije F(x), čak i s nepoznatim vrijednostima njihovih parametara, što se obično događa pri analizi rezultata mehaničkih ispitivanja. Upravo u tome leži njegova svestranost.

Korištenje kriterija χ 2 uključuje podjelu raspona varijacije uzorka u intervale i određivanje broja opažanja (učestalosti) n j za svaki od e intervali. Radi lakšeg procjenjivanja parametara distribucije, intervali su odabrani iste duljine.

Broj intervala ovisi o veličini uzorka. Obično prihvaćeno: na n = 100 e= 10 ÷ 15, pri n = 200 e= 15 ÷ 20, pri n = 400 e= 25 ÷ 30, pri n = 1000 e= 35 ÷ 40.

Intervali koji sadrže manje od pet opažanja kombiniraju se sa susjednim. Međutim, ako je broj takvih intervala manji od 20% njihovog ukupnog broja, dopušteni su intervali s frekvencijom n j ≥ 2.

Vrijednost je statistika Pearsonovog testa
, (3.91)
gdje je p j vjerojatnost da slučajna varijabla koja se proučava padne u j-ti interval, izračunata u skladu s hipotetskim zakonom distribucije F(x). Pri izračunavanju vjerojatnosti p j treba imati na umu da se lijeva granica prvog intervala i desna granica posljednjeg moraju podudarati s granicama područja mogućih vrijednosti slučajne varijable. Na primjer, s normalnim distribucije, prvi interval se proteže do -∞, a posljednji - do +∞.

Nulta hipoteza o usklađenosti distribucije uzorka s teorijskim zakonom F(x) provjerava se usporedbom vrijednosti izračunate formulom (3.91) s kritičnom vrijednošću χ 2 α dobivenom iz tablice. Primjena VI za razinu značajnosti α i broj stupnjeva slobode k = e 1 - m - 1. Ovdje e 1 - broj intervala nakon spajanja; m je broj parametara procijenjen iz razmatranog uzorka.Ako je nejednakost
χ 2 ≤ χ 2 α (3.92)
tada se nulta hipoteza ne odbacuje. Ako se navedena nejednakost ne poštuje, prihvaća se alternativna hipoteza da uzorak pripada nepoznatoj distribuciji.

Nedostatak Pearsonovog testa podudarnosti je gubitak nekih početnih informacija povezanih s potrebom grupiranja rezultata promatranja u intervale i kombiniranja pojedinačnih intervala s malim brojem promatranja. U tom smislu preporučuje se dopuna provjera korespondencije distribucija prema kriteriju χ 2 s drugim kriterijima.Ovo je posebno potrebno kod relativno malih volumena uzoraka (n ≈ 100).

U tablici su prikazane kritične vrijednosti hi-kvadrat distribucije sa zadanim brojem stupnjeva slobode. Željena vrijednost je na sjecištu stupca s pripadajućom vrijednošću vjerojatnosti i retka s brojem stupnjeva slobode. Na primjer, kritična vrijednost chi-kvadrat distribucije s 4 stupnja slobode za vjerojatnost od 0,25 je 5,38527. To znači da je površina ispod krivulje gustoće hi-kvadrat distribucije s 4 stupnja slobode desno od vrijednosti 5,38527 0,25.

ODA Kriterij za testiranje hipoteze o predloženom zakonu nepoznate distribucije naziva se kriterij prilagodbe.

Postoji nekoliko kriterija dobrote prilagodbe: $\chi ^2$ (chi-kvadrat) K. Pearsona, Kolmogorova, Smirnova i drugih.

Obično se teorijske i empirijske učestalosti razlikuju. Slučaj odstupanja ne mora biti slučajan, što znači da se objašnjava činjenicom da hipoteza nije ispravno odabrana. Pearsonov kriterij daje odgovor na postavljeno pitanje, ali kao i svaki drugi kriterij ne dokazuje ništa, već samo utvrđuje njegovo slaganje ili neslaganje s podacima promatranja na prihvaćenoj razini značajnosti.

ODA Dovoljno mala vjerojatnost pri kojoj se neki događaj može smatrati gotovo nemogućim naziva se razina značajnosti.

U praksi je uobičajeno uzeti razine značajnosti između 0,01 i 0,05, pri čemu je $\alpha =0,05$ razina značajnosti od $5 (\% ) $.

Kao kriterij za testiranje hipoteze uzimamo vrijednost \begin(equation) \label ( eq1 ) \chi ^2=\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) \ qquad (1) \ kraj (jednadžba)

ovdje $n_i -$ empirijske frekvencije dobivene iz uzorka, $n_i" -$ teoretske frekvencije nađene teorijski.

Dokazano je da za $n\to \infty $ zakon raspodjele slučajne varijable ( 1 ), bez obzira na zakon raspodjele opće populacije, teži zakonu $\chi ^2$ ( hi-kvadrat ) s $k$ stupnjeva slobode.

ODA Broj stupnjeva slobode nalazi se jednadžbom $k=S-1-r$ gdje je $S-$ broj intervalnih grupa, $r-$ broj parametara.

1) ravnomjerna raspodjela: $r=2, k=S-3 $

2) normalna raspodjela: $r=2, k=S-3 $

3) eksponencijalna distribucija: $r=1, k=S-2$.

Pravilo . Testiranje hipoteze Pearsonovim kriterijem.

  1. Da biste testirali hipotezu, izračunajte teorijske frekvencije i pronađite $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $
  2. Prema tablici kritičnih točaka distribucije $\chi ^2$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$ nalazi se prema danoj razini značajnosti $\alpha $ i broju stupnjeva sloboda $k$.
  3. Ako je $\chi _ (obs) ^2<\chi _ { кр } ^2 $ то нет оснований отвергать гипотезу, если не выполняется данное условие - то отвергают.

Komentar Za kontrolu izračuna upotrijebite formulu za $\chi ^2$ u obliku $\chi _ ( obs ) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) $

Testiranje hipoteze o uniformnoj distribuciji

Funkcija gustoće jednolike raspodjele $X$ ima oblik $f(x)=\frac ( 1 ) ( b-a ) x\in \left[ ( a,b )\right]$.

Kako bi se testirala hipoteza da je kontinuirana slučajna varijabla ravnomjerno raspoređena na razini značajnosti $\alpha $, potrebno je:

1) Pronađite srednju vrijednost uzorka $\overline ( x_b ) $ i $\sigma _b =\sqrt ( D_b ) $ iz dane empirijske distribucije. Uzmite kao procjenu parametara $a$ i $b$ količine

$a = \overline x _b -\sqrt 3 \sigma _b $, $b = \overline x _b +\sqrt 3 \sigma _b $

2) Nađite vjerojatnost da slučajna varijabla $X$ padne u parcijalne intervale $(( x_i ,x_ ( i+1 ) ))$ pomoću formule $ P_i =P(( x_i

3) Pronađite teorijske (izjednačujuće) frekvencije pomoću formule $n_i" =np_i $.

4) Pretpostavljajući broj stupnjeva slobode $k=S-3$ i razinu značajnosti $\alpha =0,05$ iz tablica $\chi ^2$, nalazimo $\chi _ ( cr ) ^2 $ iz dati $\alpha $ i $k$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$.

5) Koristeći formulu $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ gdje su $n_i $ empirijske frekvencije, nalazimo promatrane vrijednost $\ chi _ ( obs ) ^2 $.

6) Ako je $\chi _ ( obs ) ^2<\chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу.

Provjerimo hipotezu na našem primjeru.

1) $\overline x _b =13,00\,\,\sigma _b =\sqrt ( D_b ) = 6,51$

2) $a=13,00-\sqrt 3 \cdot 6,51=13,00-1,732\cdot 6,51=1,72468$

$b=13,00+1,732\cdot 6,51=24,27532$

$b-a=24,27532-1,72468=22,55064$

3) $P_i =P(( x_i

$P_2 =((3

$P_3 =((7

$P_4 =((11

$P_5 =((15

$P_6 =((19

U uniformnoj distribuciji, ako je duljina intervala ista, tada su $P_i -$ isti.

4) Pronađite $n_i" =np_i $.

5) Pronađite $\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" )) $ i pronađite $\chi _ ( obs ) ^2 $.

Stavimo sve dobivene vrijednosti u tablicu

\begin(niz) ( |l|l|l|l|l|l|l| ) \hline i& n_i & n_i" =np_i & n_i -n_i" & (( n_i -n_i"))^2& \frac ( (( n_i -n_i")^2 ) ( n_i" ) & Kontrola~ \frac ( n_i^2 ) ( n_i" ) \\ \hline 1& 1& 4,43438& -3,43438& 11,7950& 2,659898& 0,22551 \\ \hline 2& 6& 4.43438 & 1.56562 & 2.45117 & 0.552765 & 8.11838 \\ \ \ hline 3 & 3 & 4.43438 & -1.43438 i 2.05744 & 0.471463 i 2.02 & 2. & 3 & 3 & 3 & 3 & 3 & 3 & 3 & 3 & 3 & 3 & 3 & 3. 1,56562& 2,45117& 0,552765& 8,11838 \\ \hline 6& 6& 4,43438& 1,562 45117& 0,552765& 8,11838 \\ \hline & & & & & \sum = \chi _ ( obs ) ^2 =3,261119& \chi _ ( 2 =\zbroj ( \frac ( n_i^2 ) ( n_i" ) -n ) =3,63985 \\ \hline \end(niz)

$\chi _ ( cr ) ^2 (( 0,05,3 ))=7,8 $

$\chi _ (obs) ^2<\chi _ { кр } ^2 =3,26<7,8$

Zaključak nema razloga za odbacivanje hipoteze.

KATEGORIJE

POPULARNI ČLANCI

2023 "kingad.ru" - ultrazvučni pregled ljudskih organa