Distribuția Pearson cu k egal cu 19. Testul Pearson de bunăstare a potrivirii

Sarcina 1.

Folosind testul Pearson, la un nivel de semnificație A= 0,05 verificați dacă ipoteza despre distribuția normală a populației este consecventă X cu distribuția empirică a mărimii eșantionului n = 200.

Soluţie.

1. Să calculăm și abaterea standard a eșantionului .
2. Să calculăm frecvențele teoretice, ținând cont de faptul că n = 200, h= 2, = 4,695, conform formulei
.

Să creăm un tabel de calcul (valorile funcției j(X) sunt date în Anexa 1).


i

3. Să comparăm frecvențele empirice și teoretice. Să creăm un tabel de calcul din care vom găsi valoarea observată a criteriului :


i
Sumă

Conform tabelului punctelor critice de distribuție (Anexa 6), pe nivel de semnificație A= 0,05 și numărul de grade de libertate k = s– 3 = 9 – 3 = 6 găsim punctul critic al regiunii critice din dreapta (0,05; 6) = 12,6.
Deoarece =22,2 > = 12,6, respingem ipoteza despre distribuția normală a populației. Cu alte cuvinte, frecvențele empirice și teoretice diferă semnificativ.

Problema 2

Sunt prezentate date statistice.

Rezultate măsurarea diametrului n= 200 role după măcinare sunt rezumate în tabel. (mm):
Masa Seria de variație de frecvență a diametrelor rolei

i

xi, mm

xi, mm

Necesar:

1) alcătuiește o serie de variații discrete, ordonând-o dacă este necesar;

2) determinarea principalelor caracteristici numerice ale seriei;

3) dați o reprezentare grafică a seriei sub forma unui poligon de distribuție (histogramă);

4) construiți o curbă de distribuție normală teoretică și verificați corespondența distribuțiilor empirice și teoretice folosind criteriul Pearson. Când testați ipoteza statistică despre tipul de distribuție, acceptați nivelul de semnificație a = 0,05

Soluţie: Vom găsi prin definiție principalele caracteristici numerice ale unei serii de variații date. Diametrul mediu al rolelor este (mm):
X medie = = 6,753;
dispersie corectată (mm2):
D = = 0,0009166;
abatere pătrată medie corectată (standard) (mm):
s = = 0,03028.


Orez. Distribuția de frecvență a diametrelor rolelor

Distribuția de frecvență inițială („brută”) a seriei de variații, adică corespondenţă ni(xi), se remarcă printr-o răspândire destul de mare a valorilor ni relativ la o curbă ipotetică de „mediere” (Fig.). În acest caz, este de preferat să se construiască și să se analizeze o serie de variații de interval, combinând frecvențele pentru diametrele care se încadrează în intervalele corespunzătoare.
Numărul de grupuri de intervale K Să o definim folosind formula Sturgess:
K= 1 + log2 n= 1 + 3,322 lg n,
Unde n= 200 – dimensiunea eșantionului. În cazul nostru
K= 1 + 3,322×lg200 = 1 + 3,322×2,301 = 8,644 » 8.
Lățimea intervalului este (6,83 – 6,68)/8 = 0,01875 » 0,02 mm.
Seria de variații de interval este prezentată în tabel.

Tabel Seria de variație a intervalului de frecvență a diametrelor rolei.

k

xk, mm

O serie de intervale poate fi prezentată vizual sub forma unei histograme a distribuției frecvenței.


Orez. Distribuția de frecvență a diametrelor rolelor. Linia continuă este o curbă normală de netezire.

Apariția histogramei ne permite să facem ipoteza că distribuția diametrelor rolelor respectă legea normală, conform căreia frecvențele teoretice pot fi găsite ca
nk, teorie = n× N(A; s; xk)×D xk,
unde, la rândul său, curba Gaussiană de netezire a distribuției normale este determinată de expresia:
N(A; s; xk) = .
În aceste expresii xk– centrele intervalelor din seria de variație a intervalului de frecvență.

De exemplu, X 1 = (6,68 + 6,70)/2 = 6,69. Ca evaluări de centru A iar parametrul s al curbei gaussiene poate fi luat:
A = X mier
Din fig. se poate observa că curba de distribuție normală Gaussiană corespunde în general distribuției intervalului empiric. Cu toate acestea, trebuie să vă asigurați că această corespondență este semnificativă din punct de vedere statistic. Pentru a verifica corespondența distribuției empirice cu distribuția empirică, folosim criteriul Pearson de bunătate de potrivire c2. Pentru a face acest lucru, calculați valoarea empirică a criteriului ca sumă
= ,
Unde nkȘi nk,teor – frecvențe empirice și, respectiv, teoretice (normale). Este convenabil să prezentați rezultatele calculului în formă tabelară:
Masa Calculele testului Pearson


[xk, xk+ 1), mm

xk, mm

nk,teor

Vom găsi valoarea critică a criteriului folosind tabelul Pearson pentru nivelul de semnificație a = 0,05 și numărul de grade de libertate d.f. = K – 1 – r, Unde K= 8 – numărul de intervale ale seriei de variații de interval; r= 2 – numărul de parametri ai distribuției teoretice estimați pe baza datelor eșantionului (în acest caz, parametrii Ași s). Prin urmare, d.f. = 5. Valoarea critică a criteriului Pearson este crit(a; d.f.) = 11,1. Din moment ce c2emp< c2крит, заключаем, что согласие между эмпирическим и теоретическим нормальным распределением является статистическим значимым. Иными словами, теоретическое нормальное распределение удовлетворительно описывает эмпирические данные.

Problema 3

Cutiile de ciocolată sunt ambalate automat. Conform schemei de eșantionare aleatorie nerepetitivă, au fost prelevate 130 din cele 2000 de pachete conținute în lot și s-au obținut următoarele date privind greutatea acestora:

Este necesar să se utilizeze criteriul Pearson la un nivel de semnificație de a=0,05 pentru a testa ipoteza că variabila aleatoare X - greutatea pachetelor - este distribuită conform unei legi normale. Construiți o histogramă a distribuției empirice și a curbei normale corespunzătoare pe un grafic.

Soluţie

1012,5
= 615,3846

Notă:

În principiu, varianța eșantionului corectată ar trebui luată ca varianță a legii distribuției normale. Dar pentru că numărul de observații - 130 este suficient de mare, atunci cel „obișnuit” va face.
Astfel, distribuția normală teoretică este:

Interval

[xi ; xi+1]

Frecvențele empirice

ni

Probabilități
pi

Frecvențe teoretice
npi

(ni-npi)2

Test statistic

Se numește regula prin care ipoteza I 0 este respinsă sau acceptată criteriu statistic. Numele criteriului, de regulă, conține o literă care denotă o caracteristică special compilată din clauza 2 a algoritmului de testare a ipotezelor statistice (a se vedea clauza 4.1), calculată în criteriu. În condițiile acestui algoritm, criteriul ar fi numit „V-criteriu".

La testarea ipotezelor statistice, sunt posibile două tipuri de erori:

  • - Eroare de tip I(puteți respinge ipoteza I 0 când este de fapt adevărată);
  • - Eroare de tip II(puteți accepta ipoteza I 0 când de fapt nu este adevărată).

Probabilitate A se numește efectuarea unei erori de tip I nivelul de semnificație al criteriului.

Dacă pentru R indicați probabilitatea de a face o eroare de al doilea tip, apoi (l - R) - probabilitatea de a nu face o eroare de al doilea tip, care se numește puterea criteriului.

Testul de bunăstare a potrivirii lui Pearson x 2

Există mai multe tipuri de ipoteze statistice:

  • - despre legea distributiei;
  • - omogenitatea probelor;
  • - valorile numerice ale parametrilor de distribuție etc.

Vom lua în considerare ipoteza despre legea distribuției folosind exemplul testului Pearson x 2 de bunătate a potrivirii.

Criteriul acordului se numește criteriu statistic pentru testarea ipotezei nule despre legea presupusă a unei distribuții necunoscute.

Testul Pearson de bunătate a potrivirii se bazează pe o comparație a frecvențelor empirice (observate) și teoretice ale observațiilor calculate în baza ipotezei unei anumite legi de distribuție. Ipoteza #0 aici este formulată astfel: în funcție de caracteristica studiată, populația este distribuită normal.

Algoritmul de testare a ipotezelor statistice #0 pentru criteriu x 1 Pearson:

  • 1) propunem ipoteza I 0 - în funcţie de caracteristica studiată, populaţia generală este distribuită normal;
  • 2) calculați media eșantionului și abaterea standard a eșantionului O V;

3) în funcție de volumul eșantionului disponibil P calculăm o caracteristică special compilată,

unde: i, sunt frecvențe empirice, - frecvente teoretice,

P - marime de mostra,

h- dimensiunea intervalului (diferența dintre două opțiuni adiacente),

Valori normalizate ale caracteristicii observate,

- funcția de masă. De asemenea, frecvențele teoretice

poate fi calculat folosind funcția standard MS Excel NORMIDIST folosind formula;

4) folosind distribuția eșantionului, determinăm valoarea critică a unei caracteristici special compilate xl P

5) când ipoteza # 0 este respinsă, când ipoteza # 0 este acceptată.

Exemplu. Să luăm în considerare semnul X- valoarea indicatorilor de testare pentru condamnații dintr-una din coloniile de corecție pentru o anumită caracteristică psihologică, prezentați sub forma unei serii de variații:

La un nivel de semnificație de 0,05, testați ipoteza despre distribuția normală a populației.

1. Pe baza distribuției empirice se poate formula o ipoteză H 0: conform criteriului studiat „valoarea indicatorului de testare pentru o anumită caracteristică psihologică”, populația generală

aşteptat este distribuit normal. Ipoteza alternativă 1: conform criteriului studiat „valoarea indicatorului de test pentru o anumită caracteristică psihologică”, populația generală de condamnați nu este distribuită în mod normal.

2. Să calculăm caracteristicile numerice ale eșantionului:

Intervale

x g y

X) sch

3. Să calculăm caracteristica special compilată j 2 . Pentru a face acest lucru, în penultima coloană a tabelului precedent găsim frecvențele teoretice folosind formula, iar în ultima coloană

Să calculăm caracteristicile % 2. Primim x 2 = 0,185.

Pentru claritate, vom construi un poligon al distribuției empirice și o curbă normală bazată pe frecvențe teoretice (Fig. 6).

Orez. 6.

4. Determinați numărul de grade de libertate s: k = 5, t = 2, s = 5-2-1 = 2.

Conform tabelului sau folosind funcția standard MS Excel „HI20BR” pentru numărul de grade de libertate 5 = 2 și nivelul de semnificație a = 0,05 să găsim valoarea critică a criteriului xl P .=5,99. Pentru nivelul de semnificație A= 0,01 valoarea criteriului critic X%. = 9,2.

5. Valoarea criteriului observat X=0,185 mai puțin decât toate valorile găsite Hk R.-> prin urmare, ipoteza I 0 este acceptată la ambele niveluri de semnificație. Discrepanța dintre frecvențele empirice și cele teoretice este nesemnificativă. Prin urmare, datele observaționale sunt în concordanță cu ipoteza unei distribuții normale a populației. Astfel, conform criteriului studiat, „valoarea indicatorului de test pentru o anumită caracteristică psihologică”, populația generală de condamnați este distribuită normal.

  • 1. Koryachko A.V., Kulichenko A.G. Matematică superioară și metode matematice în psihologie: un ghid pentru orele practice pentru studenții Facultății de Psihologie. Ryazan, 1994.
  • 2. Nasledov A.D. Metode matematice de cercetare psihologică. Analiza și interpretarea datelor: manual, manual. Sankt Petersburg, 2008.
  • 3. Sidorenko E.V. Metode de prelucrare matematică în psihologie. Sankt Petersburg, 2010.
  • 4. Soshnikova L.A. și altele. Analiza statistică multivariată în economie: manual, manual pentru universități. M., 1999.
  • 5. Suhodolsky E.V. Metode matematice în psihologie. Harkov, 2004.
  • 6. Shmoilova R.A., Minashkin V.E., Sadovnikova N.A. Workshop de teoria statisticii: manual, manual. M., 2009.
  • Gmurman V.E. Teoria Probabilității și Statistica Matematică. p. 465.
Scopul criteriului χ 2 - criteriul Pearson Criteriul χ 2 este utilizat în două scopuri: 1) pentru a compara distribuția empirică a unei caracteristici cu cea teoretică - uniformă, normală sau alta; 2) să compare două, trei sau mai multe distribuții empirice ale aceleiași caracteristici. Descrierea criteriului Criteriul χ 2 răspunde la întrebarea dacă valori diferite ale unei caracteristici apar cu o frecvență egală în distribuțiile empirice și teoretice sau în două sau mai multe distribuții empirice. Avantajul metodei este că permite compararea distribuțiilor caracteristicilor prezentate pe orice scară, pornind de la scara numelor. În cel mai simplu caz al unei distribuții alternative „da - nu”, „a permis un defect - nu a permis un defect”, „a rezolvat o problemă - nu a rezolvat o problemă”, etc., putem aplica deja criteriul χ 2. Cu cât discrepanța dintre cele două distribuții comparate este mai mare, cu atât valoarea empirică a lui χ 2 este mai mare. Calculul automat al χ 2 - criteriul Pearson Pentru a efectua calculul automat al χ 2 - criteriul Pearson, trebuie să efectuați doi pași: Pasul 1. Precizați numărul de distribuții empirice (de la 1 la 10); Pasul 2. Introduceți frecvențele empirice în tabel; Pasul 3. Obțineți un răspuns.

Avantajul criteriului Pearson este universalitatea acestuia: poate fi folosit pentru a testa ipoteze despre diverse legi de distribuție.

1. Testarea ipotezei distribuţiei normale.

Să se obțină o probă suficient de mare P cu o mulțime de opțiuni de semnificații diferite. Pentru confortul procesării acestuia, împărțim intervalul de la cea mai mică la cea mai mare valoare a opțiunii în s părți egale și vom presupune că valorile opțiunilor care se încadrează în fiecare interval sunt aproximativ egale cu numărul care specifică mijlocul intervalului. Numărând numărul de opțiuni care se încadrează în fiecare interval, vom crea un așa-numit eșantion grupat:

Opțiuni……….. X 1 X 2 … x s

frecvențe…………. P 1 P 2 … n s ,

Unde x i sunt valorile punctelor medii ale intervalelor și n i– numărul de opțiuni incluse în i-interval (frecvenţe empirice).



Din datele obținute, puteți calcula media eșantionului și abaterea standard a eșantionului σ B. Să verificăm ipoteza că populația este distribuită conform unei legi normale cu parametri M(X) = , D(X) = . Apoi puteți găsi numărul de numere din dimensiunea eșantionului P, care ar trebui să apară în fiecare interval sub această ipoteză (adică frecvențe teoretice). Pentru a face acest lucru, folosind tabelul de valori al funcției Laplace, găsim probabilitatea de a intra i intervalul:

,

Unde și euȘi b i- limite i- al-lea interval. Înmulțind probabilitățile obținute cu dimensiunea eșantionului n, găsim frecvențele teoretice: p i =n·p i Scopul nostru este să comparăm frecvențele empirice și teoretice, care, desigur, diferă între ele, și să aflăm dacă aceste diferențe sunt nesemnificative și nu infirmă ipoteza unei distribuții normale a variabilei aleatoare studiate, sau dacă sunt atât de mari încât contrazic această ipoteză. În acest scop, se utilizează un criteriu sub forma unei variabile aleatorii

. (20.1)

Sensul ei este evident: se însumează părțile pe care pătratele abaterilor frecvențelor empirice față de cele teoretice le alcătuiesc din frecvențele teoretice corespunzătoare. Se poate dovedi că, indiferent de legea distribuției reale a populației, legea distribuției variabilei aleatoare (20.1) tinde către legea distribuției (vezi prelegerea 12) cu numărul de grade de libertate. k = s – 1 – r, Unde r– numărul de parametri ai distribuției așteptate estimați din datele eșantionului. Prin urmare, distribuția normală este caracterizată de doi parametri k = s – 3. Pentru criteriul selectat, se construiește o regiune critică pe partea dreaptă, determinată de condiție

(20.2)

Unde α - nivelul de semnificație. În consecință, regiunea critică este dată de inegalitate iar zona de acceptare a ipotezei este .

Deci, pentru a testa ipoteza nulă N 0: populația este distribuită în mod normal - trebuie să calculați valoarea observată a criteriului din eșantion:

, (20.1`)

și folosind tabelul punctelor critice ale distribuției χ 2, găsiți punctul critic folosind valorile cunoscute ale lui α și k = s – 3. Dacă - se acceptă ipoteza nulă, dacă se respinge.

2. Testarea ipotezei distribuţiei uniforme.

Când se utilizează testul Pearson pentru a testa ipoteza că populația este distribuită uniform cu densitatea de probabilitate estimată

Este necesar, după calcularea valorii din eșantionul disponibil, estimarea parametrilor AȘi b dupa formulele:

Unde A*Și b*- evaluări AȘi b. Într-adevăr, pentru o distribuție uniformă M(X) = , , de unde puteți obține un sistem de determinare A*Și b*: , a cărui soluție este expresiile (20.3).

Apoi, presupunând că , puteți găsi frecvențele teoretice folosind formulele

Aici s– numărul de intervale în care se împarte proba.

Valoarea observată a criteriului Pearson se calculează cu formula (20.1`), iar valoarea critică se calculează cu ajutorul tabelului, ținând cont de faptul că numărul de grade de libertate k = s – 3. După aceasta, limitele regiunii critice se determină în același mod ca și pentru testarea ipotezei unei distribuții normale.

3. Testarea ipotezei despre distribuția exponențială.

În acest caz, după împărțirea eșantionului existent în intervale de lungime egală, luăm în considerare succesiunea de opțiuni, distanțate egal între ele (presupunem că toate opțiunile care se încadrează în i- al-lea interval, ia o valoare care coincide cu mijlocul său) și frecvențele corespunzătoare n i(numărul de opțiuni de eșantion incluse în i– al-lea interval). Să calculăm din aceste date și să luăm ca estimare a parametrului λ mărimea. Apoi frecvențele teoretice sunt calculate folosind formula

Apoi se compară valoarea observată și cea critică a criteriului Pearson, ținând cont de faptul că numărul de grade de libertate k = s – 2.

Un criteriu de bunătate pentru testarea unei ipoteze despre legea de distribuție a variabilei aleatoare studiate În multe probleme practice, legea distribuției exacte este necunoscută. construită din observații, până la unele teoretice. Această ipoteză necesită testare statistică, ale căror rezultate fie vor confirma, fie vor infirma.

Fie X variabila aleatoare studiată. Este necesar să se testeze ipoteza H 0 că această variabilă aleatoare respectă legea distribuției F(x). Pentru a face acest lucru, este necesar să faceți un eșantion de n observații independente și să îl folosiți pentru a construi o lege de distribuție empirică F"(x). Pentru a compara legile empirice și ipotetice, se folosește o regulă numită criteriul de bunăstare a potrivirii. Unul dintre cele populare este testul de bunătate a potrivirii chi-pătrat al lui K. Pearson.

Acesta calculează statistica chi-pătrat:

,

unde N este numărul de intervale după care a fost construită legea distribuției empirice (numărul de coloane ale histogramei corespunzătoare), i este numărul intervalului, p t i este probabilitatea ca valoarea unei variabile aleatoare să cadă în i -al-lea interval pentru legea distribuției teoretice, p e i este probabilitatea ca valoarea unei variabile aleatoare să cadă în intervalul i pentru legea distribuției empirică. Ar trebui să respecte distribuția chi-pătrat.

Dacă valoarea calculată a statisticii depășește cuantila distribuției chi-pătrat cu k-p-1 grade de libertate pentru un nivel de semnificație dat, atunci ipoteza H 0 este respinsă. În caz contrar, este acceptată la nivelul de semnificație dat este numărul de observații, p este numărul de parametri estimați ai legii distribuției.

Pearson vă permite să verificați distribuțiile empirice și teoretice (sau alte empirice) ale unei caracteristici. Acest criteriu se aplică în principal în două cazuri:

Pentru a compara distribuția empirică a unei caracteristici cu o distribuție teoretică (normală, exponențială, uniformă sau altă lege);

Pentru a compara două distribuții empirice cu aceeași caracteristică.

Ideea metodei este de a determina gradul de discrepanță între frecvențele corespunzătoare n i și; cu cât discrepanța este mai mare, cu atât valoarea este mai mare

Dimensiunile eșantionului trebuie să fie de cel puțin 50 și sunt necesare sume egale de frecvențe

Ipoteza nulă H 0 = (două distribuții practic nu diferă una de cealaltă); ipoteză alternativă – H 1 = (discrepanța dintre distribuții este semnificativă).

Iată o diagramă pentru aplicarea criteriului pentru a compara două distribuții empirice:

Criteriu - un criteriu statistic pentru testarea ipotezei că variabila aleatoare observată se supune unei legi teoretice de distribuție.


În funcție de valoarea criteriului, ipoteza poate fi acceptată sau respinsă:

§ , ipoteza este îndeplinită.

§ (cade în „coada” stângă a distribuției). Prin urmare, valorile teoretice și practice sunt foarte apropiate. Dacă, de exemplu, este testat un generator de numere aleatorii care a generat n numere dintr-un segment și ipoteza este: eșantionul este distribuit uniform pe , atunci generatorul nu poate fi numit aleatoriu (ipoteza aleatoriei nu este satisfăcută), deoarece eșantionul este distribuit prea uniform, dar ipoteza este adevărată.

§ (cade în „coada” dreaptă a distribuţiei) ipoteza este respinsă.

Definiție: Fie dată o variabilă aleatoare X.

Ipoteză: Cu. V. X respectă legea distribuției.

Pentru a testa ipoteza, luați în considerare un eșantion format din n observații independente ale r.v. X: . Pe baza eșantionului, vom construi o distribuție empirică a r.v în X. O comparație a distribuției empirice și teoretice (presupusă în ipoteză) se face folosind o funcție special selectată - criteriul de bunătate. Luați în considerare criteriul Pearson de bunătate (criteriul):

Ipoteză: X n este generat de funcţia .

Împărțiți în k intervale disjunse ;

Fie numărul de observații din intervalul j-lea: ;

Probabilitatea ca o observație să cadă în intervalul j-lea când ipoteza este îndeplinită;

- numărul așteptat de accesări în intervalul j-lea;

Statistici: - Distribuție chi-pătrat cu k-1 grade de libertate.

Criteriul face erori în eșantioane cu evenimente de joasă frecvență (rare) Această problemă poate fi rezolvată prin eliminarea evenimentelor de joasă frecvență sau combinând-le cu alte evenimente.

Testul de bunătate Pearson (χ 2) este utilizat pentru a testa ipoteza conform căreia distribuția empirică corespunde distribuției teoretice așteptate F(x) cu o dimensiune mare a eșantionului (n ≥ 100). Criteriul este aplicabil pentru orice tip de funcție F(x), chiar și cu valori necunoscute ale parametrilor acestora, ceea ce apare de obicei la analiza rezultatelor testelor mecanice. Aceasta este versatilitatea sa.

Utilizarea criteriului χ 2 presupune împărțirea intervalului de variație a eșantionului în intervale și determinarea numărului de observații (frecvență) n j pentru fiecare dintre e intervale. Pentru comoditatea estimării parametrilor de distribuție, se aleg intervale de aceeași lungime.

Numărul de intervale depinde de dimensiunea eșantionului. De obicei acceptat: la n = 100 e= 10 ÷ 15, cu n = 200 e= 15 ÷ 20, cu n = 400 e= 25 ÷ 30, cu n = 1000 e= 35 ÷ 40.

Intervalele care conțin mai puțin de cinci observații sunt combinate cu cele învecinate. Cu toate acestea, dacă numărul acestor intervale este mai mic de 20% din numărul lor total, sunt permise intervale cu o frecvență n j ≥ 2.

Statistica criteriului Pearson este valoarea
, (3.91)
unde p j este probabilitatea ca variabila aleatoare studiată să cadă în intervalul j, calculată în conformitate cu legea distribuției ipotetice F(x). Când calculați probabilitatea p j, trebuie să aveți în vedere că limita din stânga a primului interval și limita din dreapta a ultimului trebuie să coincidă cu limitele regiunii de valori posibile ale variabilei aleatoare distribuție normală, primul interval se extinde la -∞, iar ultimul la +∞.

Ipoteza nulă despre corespondența distribuției de eșantionare cu legea teoretică F(x) se verifică prin compararea valorii calculate cu formula (3.91) cu valoarea critică χ 2 α găsită din tabel. VI aplicații pentru nivelul de semnificație α și numărul de grade de libertate k = e 1 - m - 1. Aici e 1 - numărul de intervale după îmbinare; m este numărul de parametri estimați din eșantionul luat în considerare Dacă inegalitatea este satisfăcută
χ 2 ≤ χ 2 α (3,92)
atunci ipoteza nulă nu este respinsă Dacă inegalitatea specificată nu este îndeplinită, se acceptă o ipoteză alternativă că eșantionul aparține unei distribuții necunoscute.

Dezavantajul testului de bunătate Pearson este pierderea unei părți din informațiile inițiale asociate cu necesitatea de a grupa rezultatele observației în intervale și de a combina intervale individuale cu un număr mic de observații. În acest sens, se recomandă completarea verificarea conformității distribuțiilor folosind criteriul χ 2 cu alte criterii Acest lucru este necesar în special în cazul probelor de volum relativ mic (n ≈ 100).

Tabelul prezintă valorile critice ale distribuției chi-pătrat cu un număr dat de grade de libertate. Valoarea dorită este situată la intersecția coloanei cu valoarea probabilității corespunzătoare și a rândului cu numărul de grade de libertate. De exemplu, valoarea critică chi-pătrat a unei distribuții cu 4 grade de libertate pentru o probabilitate de 0,25 este 5,38527. Aceasta înseamnă că aria de sub curba de densitate chi-pătrat cu 4 grade de libertate la dreapta valorii 5,38527 este 0,25.

AOD Criteriul de testare a ipotezei despre legea presupusă a unei distribuții necunoscute se numește criteriul de bunătate a potrivirii.

Există mai multe teste de bunătate de potrivire: $\chi ^2$ (chi-pătrat) de K. Pearson, Kolmogorov, Smirnov etc.

De obicei, frecvențele teoretice și cele empirice diferă. Cazul de discrepanță poate să nu fie întâmplător, ceea ce înseamnă că se explică prin faptul că ipoteza nu a fost aleasă corect. Criteriul Pearson răspunde la întrebarea pusă, dar ca orice criteriu nu dovedește nimic, ci doar își stabilește acordul sau dezacordul cu datele observaționale la nivelul de semnificație acceptat.

AOD O probabilitate suficient de mică la care un eveniment poate fi considerat practic imposibil se numește nivel de semnificație.

În practică, nivelurile de semnificație sunt de obicei considerate a fi între 0,01 și 0,05, $\alpha =0,05$ este nivelul de semnificație de $5 ( \% ) $.

Ca criteriu de testare a ipotezei, vom lua valoarea \begin(equation) \label ( eq1 ) \chi ^2=\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) \qquad (1) \ end(ecuație)

aici $n_i -$ frecvente empirice obtinute din proba, $n_i" -$ frecvente teoretice gasite teoretic.

S-a dovedit că pentru $n\to \infty $ legea de distribuție a variabilei aleatoare (1), indiferent de legea după care este distribuită populația, tinde către legea $\chi ^2$ (chi-pătrat) cu $k$ grade de libertate.

AOD Numărul de grade de libertate se găsește prin egalitatea $k=S-1-r$ unde $S-$ este numărul de grupuri de intervale, $r-$ este numărul de parametri.

1) distribuție uniformă: $r=2, k=S-3 $

2) distribuție normală: $r=2, k=S-3 $

3) distribuție exponențială: $r=1, k=S-2$.

Regulă . Testarea ipotezei folosind testul Pearson.

  1. Pentru a testa ipoteza, calculați frecvențele teoretice și găsiți $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $
  2. Folosind tabelul punctelor critice ale distribuției $\chi ^2$ pentru un nivel de semnificație dat $\alpha $ și numărul de grade de libertate $k$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$ sunt găsite.
  3. Dacă $\chi _ ( obs ) ^2<\chi _ { кр } ^2 $ то нет оснований отвергать гипотезу, если не выполняется данное условие - то отвергают.

cometariu Pentru a controla calculele, utilizați formula pentru $\chi ^2$ sub forma $\chi _ (observat) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) $

Testarea ipotezei distribuţiei uniforme

Funcția de densitate a distribuției uniforme a mărimii $X$ are forma $f(x)=\frac ( 1 ) ( b-a ) x\in \left[ ( a,b )\right]$.

Pentru a testa ipoteza că o variabilă aleatoare continuă este distribuită conform unei legi uniforme la nivelul de semnificație $\alpha $, este necesar:

1) Găsiți media eșantionului $\overline ( x_b ) $ și $\sigma _b =\sqrt ( D_b ) $ dintr-o distribuție empirică dată. Luați ca estimare a parametrilor $a$ și $b$ cantitățile

$a = \overline x _b -\sqrt 3 \sigma _b $, $b = \overline x _b +\sqrt 3 \sigma _b $

2) Găsiți probabilitatea ca o variabilă aleatoare $X$ să cadă în intervale parțiale $(( x_i ,x_ ( i+1 ) ))$ folosind formula $ P_i =P(( x_i

3) Găsiți frecvențele teoretice (de nivelare) folosind formula $n_i" =np_i $.

4) Luând numărul de grade de libertate $k=S-3$ și nivelul de semnificație $\alpha =0.05$ din tabelele $\chi ^2$ găsim $\chi _ ( cr ) ^2 $ pentru data dată $\alpha $ și $k$, $\chi _ ( kr ) ^2 (( \alpha ,k ))$.

5) Folosind formula $\chi _ (observată) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ unde $n_i -$ sunt frecvențe empirice, găsim valoarea observată $\ chi _ ( obs ) ^2 $.

6) Dacă $\chi _ ( obs ) ^2<\chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу.

Să testăm ipoteza folosind exemplul nostru.

1) $\overline x _b =13,00\,\,\sigma _b =\sqrt ( D_b ) = 6,51$

2) $a=13,00-\sqrt 3 \cdot 6,51=13,00-1,732\cdot 6,51=1,72468$

$b=13,00+1,732\cdot 6,51=24,27532$

$b-a=24,27532-1,72468=22,55064$

3) $P_i =P(( x_i

$P_2 =(( 3

$P_3 =(( 7

$P_4 =(( 11

$P_5 =(( 15

$P_6 =(( 19

Într-o distribuție uniformă, dacă lungimea intervalului este aceeași, atunci $P_i -$ sunt aceleași.

4) Găsiți $n_i" =np_i $.

5) Găsiți $\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ și găsiți $\chi _ ( obs ) ^2 $.

Să introducem toate valorile obținute în tabel

\begin(array) ( |l|l|l|l|l|l|l| ) \hline i& n_i & n_i" =np_i & n_i -n_i" & (( n_i -n_i" ))^2& \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) & Control~ \frac ( n_i^2 ) ( n_i" ) \\ \hline 1& 1& 4.43438& -3.43438& 11.7950& 2.659898& 0.225 1 \& \hline 6& 4.43438& 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 3& 3& 4.43438& -1.43438& 2.05744& 0.471463& 8.471463& 2& 2& 2& 2 & -1.43438& 2.05744& 0.471463& 2.0296 \\ \hline 5& 6& 4.43438 & 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 6& 6& 4.43438& 1.56562& 2, 45117& 0.552765& 8.11838 & obs 1119& \chi _ ( obs ) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) =3.63985 \\ \hline \end(array)

$\chi _ ( cr ) ^2 (( 0,05,3 ))=7,8$

$\chi _ ( obs ) ^2<\chi _ { кр } ^2 =3,26<7,8$

Concluzie nu există niciun motiv pentru a respinge ipoteza.

CATEGORII

ARTICOLE POPULARE

2024 „kingad.ru” - examinarea cu ultrasunete a organelor umane