Distribuția lui Pearson pentru k egală cu 19. Testul de bunăstare a potrivirii lui Pearson

Sarcina 1.

Folosind testul Pearson, la nivel de semnificație A= 0,05 verificați dacă ipoteza despre distribuția normală a populației este consecventă X cu distribuția empirică a mărimii eșantionului n = 200.

Soluţie.

1. Calculați și abaterea standard a eșantionului .
2. Calculați frecvențele teoretice, ținând cont de faptul că n = 200, h= 2, = 4,695, conform formulei
.

Să facem un tabel de calcul (valorile funcției j(X) sunt date în Anexa 1).


i

3. Să comparăm frecvențele empirice și teoretice. Să facem un tabel de calcul, din care vom găsi valoarea observată a criteriului :


i
Sumă

Conform tabelului punctelor critice de distribuție (Anexa 6), pe nivel de semnificație A= 0,05 și numărul de grade de libertate k = s- 3 \u003d 9 - 3 \u003d 6 găsim punctul critic al regiunii critice din dreapta (0,05; 6) \u003d 12,6.
Deoarece =22,2 >= 12,6, respingem ipoteza distribuției normale a populației generale. Cu alte cuvinte, frecvențele empirice și teoretice diferă semnificativ.

Sarcina 2

Sunt prezentate date statistice.

Rezultate măsurarea diametrului n= 200 role după măcinare sunt rezumate în tabel. (mm):
Masa Seria de variație de frecvență a diametrelor rolei

i

xi, mm

xi, mm

Necesar:

1) alcătuiți o serie variațională discretă, ordonând-o dacă este necesar;

2) determinarea principalelor caracteristici numerice ale seriei;

3) dați o reprezentare grafică a seriei sub forma unui poligon (histogramă) al distribuției;

4) construiți o curbă de distribuție normală teoretică și verificați corespondența dintre distribuțiile empirice și teoretice folosind criteriul Pearson. Când testați ipoteza statistică despre tipul de distribuție, luați nivelul de semnificație a = 0,05

Soluţie: Vom găsi principalele caracteristici numerice ale acestei serii variaționale prin definiție. Diametrul mediu al rolelor este (mm):
X cp = = 6,753;
dispersie corectată (mm2):
D = = 0,0009166;
abaterea standard corectată (mm):
s = = 0,03028.


Orez. Distribuția de frecvență a diametrelor rolelor

Distribuția de frecvență inițială („brută”) a seriei de variații, adică conformitate ni(xi), se caracterizează printr-o răspândire destul de mare a valorilor ni relativ la o curbă ipotetică de „mediere” (Fig.). În acest caz, este de preferat să se construiască și să se analizeze o serie de variații de interval prin combinarea frecvențelor pentru diametrele care se încadrează în intervalele corespunzătoare.
Numărul de grupuri de intervale K definim prin formula Sturgess:
K= 1 + log2 n= 1 + 3,322 lg n,
Unde n= 200 – dimensiunea eșantionului. În cazul nostru
K= 1 + 3,322×lg200 = 1 + 3,322×2,301 = 8,644 » 8.
Lățimea intervalului este (6,83 - 6,68)/8 = 0,01875 » 0,02 mm.
Seria de variații de interval este prezentată în tabel.

Tabel Seria de variație a intervalului de frecvență a diametrelor rolei.

k

xk, mm

Seria de intervale poate fi reprezentată vizual ca o histogramă a distribuției de frecvență.


Orez. Distribuția de frecvență a diametrelor rolelor. Linia continuă este o curbă normală de netezire.

Forma histogramei ne permite să presupunem că distribuția diametrelor rolelor respectă legea normală, conform căreia frecvențele teoretice pot fi găsite ca
nk, theor = n× N(A; s; xk)×D xk,
unde, la rândul său, curba de distribuție normală Gaussiană de netezire este dată de:
N(A; s; xk) = .
În aceste expresii xk sunt centrele intervalelor din seria de variație a intervalului de frecvență.

De exemplu, X 1 = (6,68 + 6,70)/2 = 6,69. Ca deviz de centru A iar parametrul s al curbei gaussiene poate fi luat:
A = X cf.
Din fig. se poate observa că curba gaussiană a distribuției normale în ansamblu corespunde distribuției intervalului empiric. Cu toate acestea, semnificația statistică a acestei corespondențe ar trebui verificată. Să folosim criteriul Pearson de bunătate a potrivirii c2 pentru a verifica dacă distribuția empirică corespunde cu cea empirică. Pentru a face acest lucru, calculați valoarea empirică a criteriului ca sumă
= ,
Unde nkși nk,theor sunt frecvențele empirice și, respectiv, teoretice (normale). Este convenabil să prezentați rezultatele calculului în formă tabelară:
Masa Calcule ale criteriului Pearson


[xk, xk+ 1), mm

xk, mm

nk,teor

Găsim valoarea critică a criteriului folosind tabelul Pearson pentru nivelul de semnificație a = 0,05 și numărul de grade de libertate. d.f. = K – 1 – r, Unde K= 8 este numărul de intervale ale seriei de variații de interval; r= 2 este numărul de parametri ai distribuției teoretice estimați pe baza datelor eșantionului (în acest caz, parametrii Ași s). În acest fel, d.f. = 5. Valoarea critică a criteriului Pearson este crit(a; d.f.) = 11,1. Din moment ce c2emp< c2крит, заключаем, что согласие между эмпирическим и теоретическим нормальным распределением является статистическим значимым. Иными словами, теоретическое нормальное распределение удовлетворительно описывает эмпирические данные.

Sarcina 3

Cutiile de ciocolată sunt ambalate automat. 130 din cele 2000 de pachete cuprinse în lot au fost prelevate în cadrul schemei de prelevare auto-aleatorie nerepetată și s-au obținut următoarele date privind greutatea acestora:

Este necesară utilizarea testului Pearson la un nivel de semnificație a=0,05 pentru a testa ipoteza că variabila aleatoare X - greutatea pachetelor - este distribuită conform legii normale. Construiți o histogramă a distribuției empirice și a curbei normale corespunzătoare pe un grafic.

Soluţie

1012,5
= 615,3846

Notă:

În principiu, varianța eșantionului corectată ar trebui luată ca varianță a distribuției normale. Dar de atunci numărul de observații - 130 este suficient de mare, atunci cel „obișnuit” va face.
Astfel, distribuția normală teoretică este:

Interval

[xi; xi+1]

Frecvențe empirice

ni

Probabilități
pi

Frecvențe teoretice
npi

(ni-npi)2

Test statistic

Se numește regula prin care ipoteza R 0 este respinsă sau acceptată criteriu statistic. Numele criteriului, de regulă, conține o literă, care denotă o caracteristică special compilată din paragraful 2 al algoritmului de testare a ipotezelor statistice (a se vedea paragraful 4.1), calculată în criteriu. În condițiile acestui algoritm, criteriul ar fi numit "în-criteriu".

La testarea ipotezelor statistice, sunt posibile două tipuri de erori:

  • - eroare de primul fel(puteți respinge ipoteza I 0 când este de fapt adevărată);
  • - eroare de tip II(puteți accepta ipoteza I 0 când de fapt nu este adevărată).

Probabilitate A face o eroare de tip unu este numită nivelul de semnificație al criteriului.

Dacă pentru R indicați probabilitatea de a face o eroare de tip II, atunci (l - R) - probabilitatea de a nu face o eroare de tip II, care se numește puterea criteriului.

Bunătatea potrivirii x 2 Pearson

Există mai multe tipuri de ipoteze statistice:

  • - despre legea distributiei;
  • - omogenitatea probelor;
  • - valorile numerice ale parametrilor de distribuție etc.

Vom lua în considerare ipoteza despre legea distribuției pe exemplul testului Pearson x 2 de bunătate a potrivirii.

Criteriul de concordanță numit test statistic pentru testarea ipotezei nule despre presupusa lege a distributiei necunoscute.

Testul de bunătate a potrivirii lui Pearson se bazează pe o comparație a frecvențelor empirice (observate) și teoretice ale observațiilor calculate sub ipoteza unei anumite legi de distribuție. Ipoteza #0 aici se formulează astfel: populația generală este distribuită în mod normal conform criteriului studiat.

Algoritmul de testare a ipotezelor statistice #0 pentru criterii x 1 Pearson:

  • 1) propunem ipoteza R 0 - conform criteriului studiat populaţia generală este distribuită normal;
  • 2) calculați media eșantionului și abaterea standard a eșantionului despreîn;

3) în funcție de volumul de probă disponibil P calculăm o caracteristică special compilată,

unde: i, - frecvențe empirice, - frecvente teoretice,

P - marime de mostra,

h- valoarea intervalului (diferența dintre două opțiuni adiacente),

Valori normalizate ale caracteristicii observate,

- funcția de masă. De asemenea, frecvențele teoretice

poate fi calculat folosind funcția standard MS Excel NORMDIST conform formulei ;

4) în funcție de distribuția de eșantionare, determinăm valoarea critică a unei caracteristici special compilate XL P

5) când ipoteza # 0 este respinsă, când ipoteza # 0 este acceptată.

Exemplu. Luați în considerare semnul X- valoarea indicatorilor de testare pentru condamnații dintr-una din coloniile de corecție în funcție de unele caracteristici psihologice, prezentate ca o serie de variații:

La un nivel de semnificație de 0,05, testați ipoteza unei distribuții normale a populației generale.

1. Pe baza distribuției empirice, puteți formula o ipoteză H 0: conform criteriului studiat „valoarea indicatorului de test pentru o caracteristică psihologică dată”, populația generală

numărul de copii este distribuit în mod normal. Ipoteza alternativă 1: conform trăsăturii studiate „valoarea indicatorului de test pentru această caracteristică psihologică”, populația generală de condamnați nu este distribuită în mod normal.

2. Calculați caracteristicile numerice ale eșantionului:

Intervale

x y y

X) sch

3. Calculaţi o caracteristică special compusă j 2 . Pentru a face acest lucru, în penultima coloană a tabelului precedent, găsim frecvențele teoretice folosind formula, iar în ultima coloană

să calculăm caracteristica % 2 . Primim x 2 = 0,185.

Pentru claritate, vom construi un poligon cu distribuția empirică și o curbă normală în funcție de frecvențele teoretice (Fig. 6).

Orez. 6.

4. Determinați numărul de grade de libertate s: k = 5, t = 2, s = 5-2-1 = 2.

Conform tabelului sau folosind funcția standard MS Excel „XI20BR” pentru numărul de grade de libertate 5 = 2 și nivelul de semnificație a = 0,05 găsiți valoarea critică a criteriului xl P .=5,99. Pentru nivelul de semnificație A= 0,01 valoarea critică a criteriului X%. = 9,2.

5. Valoarea observată a criteriului X=0,185 mai puțin decât toate valorile găsite Hc R.-> prin urmare, ipoteza R 0 este acceptată la ambele niveluri de semnificație. Discrepanța dintre frecvențele empirice și teoretice este nesemnificativă. Prin urmare, datele observaționale sunt în concordanță cu ipoteza unei distribuții normale a populației. Astfel, conform trăsăturii studiate „valoarea indicatorului de test pentru această caracteristică psihologică”, populația generală de condamnați este distribuită normal.

  • 1. Koryachko A.V., Kulichenko A.G. Matematică superioară și metode matematice în psihologie: un ghid de studii practice pentru studenții Facultății de Psihologie. Ryazan, 1994.
  • 2. Nasledov A.D. Metode matematice de cercetare psihologică. Analiza și interpretarea datelor: manual, manual. SPb., 2008.
  • 3. Sidorenko E.V. Metode de prelucrare matematică în psihologie. SPb., 2010.
  • 4. Soshnikova L.A. şi altele.Analiza statistică multivariată în economie: manual, manual pentru universităţi. M., 1999.
  • 5. Suhodolsky E.V. Metode matematice în psihologie. Harkov, 2004.
  • 6. Shmoylova R.A., Minashkin V.E., Sadovnikova N.A. Workshop de teoria statisticii: manual, manual. M., 2009.
  • Gmurman V.E. Teoria Probabilității și Statistica Matematică. S. 465.
Scopul criteriului χ 2 - Criteriul lui Pearson Criteriul χ 2 este utilizat în două scopuri: 1) pentru a compara distribuția empirică a unei trăsături cu cea teoretică - uniformă, normală sau alta; 2) pentru a compara două, trei sau mai multe distribuții empirice ale aceleiași caracteristici. Descrierea criteriului Criteriul χ 2 răspunde la întrebarea dacă valori diferite ale unei caracteristici apar cu aceeași frecvență în distribuțiile empirice și teoretice sau în două sau mai multe distribuții empirice. Avantajul metodei este că permite compararea distribuțiilor de caracteristici prezentate la orice scară, pornind de la scara numelor. În cel mai simplu caz al distribuției alternative „da – nu”, „a permis căsătoria – nu a permis căsătoria”, „a rezolvat problema – nu a rezolvat problema”, etc., putem aplica deja criteriul χ 2 . Cu cât discrepanța dintre două distribuții comparabile este mai mare, cu atât valoarea empirică a lui χ 2 este mai mare. Calculul automat al χ 2 - criteriul lui Pearson Pentru a calcula automat χ 2 - criteriul lui Pearson, este necesar să se efectueze doi pași: Pasul 1. Precizați numărul de distribuții empirice (de la 1 la 10); Pasul 2. Introduceți frecvențele empirice în tabel; Pasul 3. Obțineți un răspuns.

Avantajul criteriului Pearson este universalitatea acestuia: poate fi folosit pentru a testa ipoteze despre diverse legi de distribuție.

1. Testarea ipotezei unei distribuții normale.

Să se obțină o probă de o dimensiune suficient de mare P cu o mulțime de valori de variante diferite. Pentru comoditatea procesării sale, împărțim intervalul de la cea mai mică la cea mai mare dintre valorile variantei prin s părți egale și vom presupune că valorile opțiunilor care se încadrează în fiecare interval sunt aproximativ egale cu numărul care specifică mijlocul intervalului. După ce am numărat numărul de opțiuni care au intrat în fiecare interval, vom face așa-numitul eșantion grupat:

Opțiuni……….. X 1 X 2 … x s

frecvențe…………. P 1 P 2 … n s ,

Unde x i sunt valorile punctelor medii ale intervalelor și n i este numărul de opțiuni incluse în i al-lea interval (frecvențe empirice).



Pe baza datelor obținute, este posibil să se calculeze media eșantionului și abaterea standard a eșantionului σ B. Să verificăm ipoteza că populația generală este distribuită conform legii normale cu parametri M(X) = , D(X) = . Apoi puteți găsi numărul de numere din eșantionul de volum P, care ar trebui să fie în fiecare interval sub această ipoteză (adică frecvențe teoretice). Pentru a face acest lucru, folosind tabelul de valori al funcției Laplace, găsim probabilitatea de a lovi i- al-lea interval:

,

Unde un iși b i- granițe i- al-lea interval. Înmulțind probabilitățile rezultate cu dimensiunea eșantionului n, găsim frecvențele teoretice: p i = n p i.Scopul nostru este să comparăm frecvențele empirice și teoretice, care, desigur, diferă între ele, și să aflăm dacă aceste diferențe sunt nesemnificative, nu infirmă ipoteza distribuției normale a variabilei aleatoare studiate, sau sunt așa. mare că contrazic această ipoteză. Pentru aceasta, se folosește un criteriu sub forma unei variabile aleatoare

. (20.1)

Sensul ei este evident: se însumează părțile, care sunt pătratele abaterilor frecvențelor empirice de la cele teoretice de la frecvențele teoretice corespunzătoare. Se poate dovedi că, indiferent de legea distribuției reale a populației generale, legea distribuției variabilei aleatoare (20.1) la tinde spre legea distribuției (vezi prelegerea 12) cu numărul de grade de libertate. k = s - 1 – r, Unde r este numărul de parametri ai distribuției estimate estimați din datele eșantionului. Distribuția normală este caracterizată de doi parametri, deci k = s - 3. Pentru criteriul selectat se construiește o regiune critică de dreapta, determinată de condiție

(20.2)

Unde α - nivelul de semnificație. Prin urmare, regiunea critică este dată de inegalitate iar zona de acceptare a ipotezei este .

Deci, pentru a testa ipoteza nulă H 0: populația este distribuită în mod normal - trebuie să calculați valoarea observată a criteriului din eșantion:

, (20.1`)

și conform tabelului punctelor critice ale distribuției χ 2 găsiți punctul critic folosind valorile cunoscute ale lui α și k = s - 3. Dacă - se acceptă ipoteza nulă, dacă se respinge.

2. Testarea ipotezei distribuţiei uniforme.

Când se utilizează testul Pearson pentru a testa ipoteza unei distribuții uniforme a populației generale cu o densitate de probabilitate presupusă

este necesar, după calcularea valorii din eșantionul disponibil, estimarea parametrilor Ași b dupa formulele:

Unde A*și b*- estimări Ași b. Într-adevăr, pentru o distribuție uniformă M(X) = , , de unde puteți obține un sistem de determinare A*și b*: , a cărui soluție sunt expresiile (20.3).

Apoi, presupunând că , puteți găsi frecvențele teoretice folosind formulele

Aici s este numărul de intervale în care este împărțit eșantionul.

Valoarea observată a criteriului Pearson se calculează prin formula (20.1`), iar valoarea critică se calculează din tabel, ținând cont de faptul că numărul de grade de libertate k = s - 3. După aceea, limitele regiunii critice se determină în același mod ca și pentru testarea ipotezei unei distribuții normale.

3. Testarea ipotezei despre distribuția exponențială.

În acest caz, împărțind eșantionul existent în intervale de lungime egală, considerăm o secvență de opțiuni echidistantă între ele (presupunem că toate opțiunile care se încadrează în i--lea interval, ia o valoare care coincide cu mijlocul său) și frecvențele corespunzătoare n i(numărul de opțiuni de eșantion incluse în i– al-lea interval). Calculăm din aceste date și luăm ca estimare a parametrului λ valoare . Apoi frecvențele teoretice sunt calculate prin formula

Apoi, se compară valorile observate și critice ale criteriului Pearson, ținând cont de faptul că numărul de grade de libertate k = s - 2.

Criteriul acordului de testare a ipotezei despre legea de distribuție a variabilei aleatoare studiate.În multe probleme practice, legea distribuției exacte este necunoscută.De aceea, se propune o ipoteză despre corespondența legii empirice existente, construită pe observații, la unele teoretice Această ipoteză necesită un test statistic, ale cărui rezultate fie vor confirma, fie vor infirma.

Fie X variabila aleatoare studiată. Este necesar să se testeze ipoteza H 0 că această variabilă aleatoare respectă legea distribuției F(x). Pentru a face acest lucru, este necesar să faceți un eșantion de n observații independente și să îl folosiți pentru a construi o lege de distribuție empirică F "(x). Pentru a compara legile empirice și ipotetice, se utilizează o regulă numită bunătatea potrivirii. Una dintre cea mai populară este bunătatea potrivirii chi-pătrat a lui K. Pearson.

Acesta calculează statistica chi-pătrat:

,

unde N este numărul de intervale conform cărora a fost construită legea distribuției empirice (numărul de coloane ale histogramei corespunzătoare), i este numărul intervalului, p t i este probabilitatea ca valoarea unei variabile aleatoare să cadă în Intervalul i-lea pentru legea distribuției teoretice, p e i este probabilitatea ca valoarea unei variabile aleatoare să se încadreze în al i-lea interval pentru legea distribuției empirică. Trebuie să respecte distribuția chi-pătrat.

Dacă valoarea calculată a statisticii depășește cuantila distribuției chi-pătrat cu k-p-1 grade de libertate pentru un nivel de semnificație dat, atunci ipoteza H 0 este respinsă. În caz contrar, este acceptată la un nivel de semnificație dat. Aici k este valoarea numărul de observații, p este numărul de parametri estimați ai legii distribuției.

Pearson vă permite să testați distribuțiile empirice și teoretice (sau alte empirice) ale unei caracteristici. Acest criteriu se aplică în principal în două cazuri:

Pentru a compara distribuția empirică a unei trăsături cu o distribuție teoretică (normală, exponențială, uniformă sau altă lege);

Pentru a compara două distribuții empirice ale aceleiași trăsături.

Ideea metodei este de a determina gradul de divergență al frecvențelor corespunzătoare n i și; cu cât această discrepanță este mai mare, cu atât valoarea este mai mare

Dimensiunile eșantionului trebuie să fie de cel puțin 50, iar sumele frecvențelor trebuie să fie egale

Ipoteza nulă H 0 = (două distribuții practic nu diferă una de cealaltă); ipoteza alternativă - H 1 = (discrepanța dintre distribuții este semnificativă).

Iată o schemă de aplicare a criteriului de comparare a două distribuții empirice:

Criteriu - un criteriu statistic pentru testarea ipotezei că variabila aleatoare observată se supune unei legi teoretice de distribuție.


În funcție de valoarea criteriului , ipoteza poate fi acceptată sau respinsă:

§ , ipoteza este îndeplinită.

§ (cade în „coada” stângă a distribuţiei). Prin urmare, valorile teoretice și practice sunt foarte apropiate. Dacă, de exemplu, se verifică un generator de numere aleatorii care a generat n numere dintr-un segment și ipoteza este: eșantionul este distribuit uniform pe , atunci generatorul nu poate fi numit aleatoriu (ipoteza aleatoriei nu este satisfăcută), deoarece eșantionul este distribuit prea uniform, dar ipoteza este satisfăcută.

§ (cade in „coada” dreapta a distributiei) ipoteza este respinsa.

Definiție: Fie dată o variabilă aleatoare X.

Ipoteză: Cu. în. X respectă legea distribuției.

Pentru a testa ipoteza, luați în considerare un eșantion format din n observații independente ale r.v. X: . Pe baza eșantionului, construim o distribuție empirică a r.v.X. Comparația distribuțiilor empirice și teoretice (presupusă în ipoteză) se realizează folosind o funcție special selectată - criteriul de bunătate a potrivirii. Luați în considerare testul de bunăstare a potrivirii lui Pearson (criteriul):

Ipoteză: X n este generat de funcţia .

Împărțiți în k intervale care nu se suprapun ;

Fie numărul de observații în al-lea interval: ;

Probabilitatea ca o observație să cadă în intervalul j-lea când ipoteza este îndeplinită;

- numărul aşteptat de accesări în intervalul j-lea;

Statistici: - Distribuție chi-pătrat cu k-1 grade de libertate.

Criteriul este greșit la probele cu evenimente de joasă frecvență (rare). Această problemă poate fi rezolvată prin eliminarea evenimentelor de joasă frecvență sau prin combinarea lor cu alte evenimente. Această metodă se numește corecția lui Yates.

Testul de bunătate a potrivirii lui Pearson (χ 2) este utilizat pentru a testa ipoteza conform căreia distribuția empirică corespunde distribuției teoretice așteptate F(x) cu o dimensiune mare a eșantionului (n ≥ 100). Criteriul este aplicabil pentru orice fel de funcție F(x), chiar și cu valori necunoscute ale parametrilor acestora, care de obicei are loc la analiza rezultatelor testelor mecanice. Aici se află versatilitatea sa.

Utilizarea criteriului χ 2 presupune împărțirea intervalului de variație a eșantionului în intervale și determinarea numărului de observații (frecvență) n j pentru fiecare dintre e intervale. Pentru comoditatea estimării parametrilor de distribuție, intervalele sunt alese să fie de aceeași lungime.

Numărul de intervale depinde de dimensiunea eșantionului. De obicei acceptat: la n = 100 e= 10 ÷ 15, la n = 200 e= 15 ÷ 20, la n = 400 e= 25 ÷ 30, la n = 1000 e= 35 ÷ 40.

Intervalele care conțin mai puțin de cinci observații sunt combinate cu cele învecinate. Cu toate acestea, dacă numărul acestor intervale este mai mic de 20% din numărul lor total, sunt permise intervale cu o frecvență de n j ≥ 2.

Statistica testului Pearson este valoarea
, (3.91)
unde p j este probabilitatea ca variabila aleatoare studiată să se încadreze în intervalul j-lea, calculată în conformitate cu legea distribuției ipotetice F(x). Când se calculează probabilitatea p j, trebuie să se țină cont de faptul că marginea din stânga a primului interval și marginea dreaptă a ultimului trebuie să coincidă cu marginile regiunii de valori posibile ale variabilei aleatoare. De exemplu, cu o normală distribuția, primul interval se extinde la -∞, iar ultimul - la +∞.

Ipoteza nulă despre conformitatea distribuției eșantionului cu legea teoretică F(x) se verifică prin compararea valorii calculate prin formula (3.91) cu valoarea critică χ 2 α găsită din Tabel. Aplicația VI pentru nivelul de semnificație α și numărul de grade de libertate k = e 1 - m - 1. Aici e 1 - numărul de intervale după îmbinare; m este numărul de parametri estimaţi din eşantionul considerat.Dacă inegalitatea
χ 2 ≤ χ 2 α (3,92)
atunci ipoteza nulă nu este respinsă.Dacă nu se respectă inegalitatea specificată, se acceptă o ipoteză alternativă că eșantionul aparține unei distribuții necunoscute.

Dezavantajul testului de bunătate a potrivirii lui Pearson este pierderea unora dintre informațiile inițiale asociate cu necesitatea de a grupa rezultatele observației în intervale și de a combina intervale individuale cu un număr mic de observații.În acest sens, se recomandă completarea verificarea corespondenței distribuțiilor prin criteriul χ 2 cu alte criterii.Acest lucru este necesar în special în cazul probelor de volum relativ mic (n ≈ 100).

Tabelul prezintă valorile critice ale distribuției chi-pătrat cu un număr dat de grade de libertate.Valoarea dorită se află la intersecția coloanei cu valoarea probabilității corespunzătoare și a rândului cu numărul de grade de libertate. De exemplu, valoarea critică a distribuției chi-pătrat cu 4 grade de libertate pentru o probabilitate de 0,25 este 5,38527. Aceasta înseamnă că aria de sub curba de densitate a distribuției chi-pătrat cu 4 grade de libertate la dreapta valorii de 5,38527 este 0,25.

AOD Criteriul de testare a ipotezei despre legea propusă a distribuției necunoscute se numește criteriul de bunătate a potrivirii.

Există mai multe criterii de bunătate a potrivirii: $\chi ^2$ (chi-pătrat) de K. Pearson, Kolmogorov, Smirnov și alții.

De obicei, frecvențele teoretice și cele empirice diferă. Cazul de discrepanță poate să nu fie aleatoriu, ceea ce înseamnă că se explică prin faptul că ipoteza nu este aleasă corect. Criteriul Pearson răspunde la întrebare, dar, ca orice criteriu, nu dovedește nimic, ci doar își stabilește acordul sau dezacordul cu datele observaționale la nivelul de semnificație acceptat.

AOD O probabilitate suficient de mică la care un eveniment poate fi considerat aproape imposibil se numește nivel de semnificație.

În practică este obișnuit să se ia niveluri de semnificație între 0,01 și 0,05, $\alpha =0,05$ fiind nivelul de semnificație $5 ( \% ) $.

Ca criteriu de testare a ipotezei, luăm valoarea \begin(equation) \label ( eq1 ) \chi ^2=\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) \ qquad (1) \ end(ecuație)

aici $n_i -$ frecvente empirice obtinute din proba, $n_i" -$ frecvente teoretice gasite teoretic.

Se dovedește că pentru $n\to \infty $ legea de distribuție a variabilei aleatoare ( 1 ), indiferent de legea de distribuție a populației generale, tinde către legea $\chi ^2$ ( chi-pătrat ) cu $k$ grade de libertate.

AOD Numărul de grade de libertate se găsește prin ecuația $k=S-1-r$ unde $S-$ este numărul de grupuri de intervale, $r-$ este numărul de parametri.

1) distribuție uniformă: $r=2, k=S-3 $

2) distribuție normală: $r=2, k=S-3 $

3) distribuție exponențială: $r=1, k=S-2$.

regulă . Testarea ipotezei prin criteriul lui Pearson.

  1. Pentru a testa ipoteza, calculați frecvențele teoretice și găsiți $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $
  2. Conform tabelului punctelor critice de distribuție $\chi ^2$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$ se găsește după nivelul de semnificație dat $\alpha $ și numărul de grade de libertate $k$.
  3. Dacă $\chi _ ( obs ) ^2<\chi _ { кр } ^2 $ то нет оснований отвергать гипотезу, если не выполняется данное условие - то отвергают.

cometariu Pentru a controla calculele, utilizați formula pentru $\chi ^2$ sub forma $\chi _ ( obs ) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) $

Testarea ipotezei distribuției uniforme

Funcția de densitate a distribuției uniforme a lui $X$ are forma $f(x)=\frac ( 1 ) ( b-a ) x\in \left[ ( a,b )\right]$.

Pentru a testa ipoteza că o variabilă aleatoare continuă este distribuită uniform la un nivel de semnificație de $\alpha $, este necesar:

1) Găsiți media eșantionului $\overline ( x_b ) $ și $\sigma _b =\sqrt ( D_b ) $ din distribuția empirică dată. Luați ca estimare a parametrilor $a$ și $b$ cantitățile

$a = \overline x _b -\sqrt 3 \sigma _b $, $b = \overline x _b +\sqrt 3 \sigma _b $

2) Găsiți probabilitatea ca o variabilă aleatoare $X$ să cadă în intervale parțiale $(( x_i ,x_ ( i+1 ) ))$ folosind formula $ P_i =P(( x_i

3) Găsiți frecvențele teoretice (de egalizare) folosind formula $n_i" =np_i $.

4) Presupunând numărul de grade de libertate $k=S-3$ și nivelul de semnificație $\alpha =0.05$ din tabelele $\chi ^2$, găsim $\chi _ ( cr ) ^2 $ din dat $\alpha $ și $k$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$.

5) Folosind formula $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ unde $n_i sunt $ frecvențe empirice, găsim frecvențele observate valoarea $\ chi _ ( obs ) ^2 $.

6) Dacă $\chi _ ( obs ) ^2<\chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу.

Să testăm ipoteza pe exemplul nostru.

1) $\overline x _b =13,00\,\,\sigma _b =\sqrt ( D_b ) = 6,51$

2) $a=13,00-\sqrt 3 \cdot 6,51=13,00-1,732\cdot 6,51=1,72468$

$b=13,00+1,732\cdot 6,51=24,27532$

$b-a=24,27532-1,72468=22,55064$

3) $P_i =P((x_i

$P_2 =((3

$P_3 =((7

$P_4 =((11

$P_5 =((15

$P_6 =((19

Într-o distribuție uniformă, dacă lungimea intervalului este aceeași, atunci $P_i -$ sunt aceleași.

4) Găsiți $n_i" =np_i $.

5) Găsiți $\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ și găsiți $\chi _ ( obs ) ^2 $.

Să punem toate valorile obținute în tabel

\begin(array) ( |l|l|l|l|l|l|l| ) \hline i& n_i & n_i" =np_i & n_i -n_i" & (( n_i -n_i"))^2& \frac ( (( n_i -n_i")^2 ) ( n_i" ) & Control~ \frac ( n_i^2 ) ( n_i" ) \\ \hline 1& 1& 4.43438& -3.43438& 11.7950& 2.659898& 0.226& 2& \\ \hline 2& 4.43438 & 1.56562 & 2.45117 & 0.552765 & 8.11838 \\ \ hline 3 & 3 & 4.43438 & -1.43438 & 2.05744 & 0.471463 & 2.0296 \\ \ \ hline 4 & 3 & 4. 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 6& 6& 4.43438& 1.562 45117& 0.552765& 8.11838 \\ \hline 6& 6& 4.43438& 1.562 45117& 0.552765& 8.11838 \\ \hline 6& 6& 4.43438& 1.562 45117& 0.552765& 8.11838 \\ \hline 6& 6& 4.43438& _ 2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) =3,63985 \\ \hline \end(array)

$\chi _ ( cr ) ^2 (( 0,05,3 ))=7,8$

$\chi _ ( obs ) ^2<\chi _ { кр } ^2 =3,26<7,8$

Concluzie nu există niciun motiv pentru a respinge ipoteza.

CATEGORII

ARTICOLE POPULARE

2022 "kingad.ru" - examinarea cu ultrasunete a organelor umane