Pearsonovo rozdelenie pre k rovné 19. Pearsonov test dobrej zhody

Úloha 1.

Pomocou Pearsonovho testu na hladine významnosti a= 0,05 skontrolujte, či je hypotéza o normálnom rozdelení populácie konzistentná X s empirickou distribúciou veľkosti vzorky n = 200.

Riešenie.

1. Vypočítajte a štandardná odchýlka vzorky .
2. Vypočítajte teoretické frekvencie, berúc do úvahy to n = 200, h= 2, = 4,695, podľa vzorca
.

Urobme výpočtovú tabuľku (hodnoty funkcie j(X) sú uvedené v prílohe 1).


i

3. Porovnajme empirické a teoretické frekvencie. Urobme si výpočtovú tabuľku, z ktorej zistíme pozorovanú hodnotu kritéria :


i
Sum

Podľa tabuľky kritických distribučných bodov (príloha 6) podľa hladiny významnosti a= 0,05 a počet stupňov voľnosti k = s- 3 \u003d 9 - 3 \u003d 6 nájdeme kritický bod pravej kritickej oblasti (0,05; 6) \u003d 12,6.
Keďže =22,2 >= 12,6, zamietame hypotézu o normálnom rozdelení všeobecnej populácie. Inými slovami, empirické a teoretické frekvencie sa výrazne líšia.

Úloha2

Uvádzajú sa štatistické údaje.

Výsledky merania priemeru n= 200 kotúčov po mletí je zhrnutých v tabuľke. (mm):
Tabuľka Séria frekvenčných variácií priemerov valcov

i

xi, mm

xi, mm

Požadovaný:

1) zostaviť diskrétnu variačnú sériu a v prípade potreby ju zoradiť;

2) určiť hlavné číselné charakteristiky série;

3) poskytnúť grafické znázornenie série vo forme mnohouholníka (histogramu) rozdelenia;

4) zostrojte teoretickú krivku normálneho rozdelenia a skontrolujte zhodu medzi empirickým a teoretickým rozdelením pomocou Pearsonovho kritéria. Pri testovaní štatistickej hypotézy o type distribúcie vezmite hladinu významnosti a = 0,05

Riešenie: Hlavné číselné charakteristiky tohto variačného radu nájdeme podľa definície. Priemerný priemer valcov je (mm):
X cp = = 6,753;
korigovaná disperzia (mm2):
D = = 0,0009166;
opravená štandardná odchýlka (mm):
s = = 0,03028.


Ryža. Frekvenčné rozdelenie priemerov valcov

Počiatočné („surové“) rozdelenie frekvencií variačných sérií, t.j. korešpondencia ni(xi), sa vyznačuje pomerne veľkým rozptylom hodnôt ni relatívne k nejakej hypotetickej "priemerovacej" krivke (obr.). V tomto prípade je výhodné skonštruovať a analyzovať rad intervalových variácií kombinovaním frekvencií pre priemery spadajúce do zodpovedajúcich intervalov.
Počet intervalových skupín K definujeme podľa Sturgessovho vzorca:
K= 1 + log2 n= 1 + 3,322 lg n,
Kde n= 200 – veľkosť vzorky. V našom prípade
K= 1 + 3,322 × lg200 = 1 + 3,322 × 2,301 = 8,644 » 8.
Šírka intervalu je (6,83 - 6,68)/8 = 0,01875 » 0,02 mm.
Séria intervalových variácií je uvedená v tabuľke.

Tabuľka Frekvenčný interval variácie série priemerov valcov.

k

xk, mm

Intervalový rad možno vizuálne znázorniť ako histogram distribúcie frekvencií.


Ryža. Frekvenčné rozdelenie priemerov valcov. Plná čiara je vyhladzujúca normálna krivka.

Forma histogramu nám umožňuje predpokladať, že rozdelenie priemerov valcov sa riadi normálnym zákonom, podľa ktorého teoretické frekvencie možno nájsť ako
nk, teória = n× N(a; s; xk)×D xk,
kde je vyhladzovacia Gaussova normálna distribučná krivka daná vzťahom:
N(a; s; xk) = .
V týchto výrazoch xk sú stredy intervalov v sérii variácií frekvenčných intervalov.

Napríklad, X 1 = (6,68 + 6,70)/2 = 6,69. Podľa odhadov centra a a parameter s Gaussovej krivky možno vziať:
a = X porov.
Z obr. možno vidieť, že Gaussova krivka normálneho rozdelenia ako celku zodpovedá empirickému intervalovému rozdeleniu. Treba však overiť štatistickú významnosť tejto korešpondencie. Použime Pearsonovo kritérium dobrej zhody c2 na kontrolu, či empirické rozdelenie zodpovedá empirickému. Na tento účel vypočítajte empirickú hodnotu kritéria ako súčet
= ,
Kde nk A nk,teória sú empirické a teoretické (normálne) frekvencie, resp. Je vhodné prezentovať výsledky výpočtu v tabuľkovej forme:
Tabuľka Výpočty Pearsonovho kritéria


[xk, xk+ 1), mm

xk, mm

nk,teor

Kritickú hodnotu kritéria zistíme pomocou Pearsonovej tabuľky pre hladinu významnosti a = 0,05 a počet stupňov voľnosti d.f. = K – 1 – r, Kde K= 8 je počet intervalov série variácií intervalov; r= 2 je počet parametrov teoretického rozdelenia odhadnutý na základe údajov vzorky (v tomto prípade parametrov a a s). teda d.f. = 5. Kritická hodnota Pearsonovho kritéria je crit(a; d.f.) = 11,1. Od c2emp< c2крит, заключаем, что согласие между эмпирическим и теоретическим нормальным распределением является статистическим значимым. Иными словами, теоретическое нормальное распределение удовлетворительно описывает эмпирические данные.

Úloha 3

Krabičky od čokolády sa balia automaticky. 130 z 2 000 balení obsiahnutých v dávke bolo odobraných v rámci schémy samonáhodného neopakujúceho sa odberu vzoriek a o ich hmotnosti sa získali tieto údaje:

Je potrebné použiť Pearsonov test na hladine významnosti a=0,05 na testovanie hypotézy, že náhodná premenná X - hmotnosť balíkov - je rozdelená podľa normálneho zákona. Zostrojte histogram empirického rozdelenia a zodpovedajúcu normálovú krivku na jednom grafe.

Riešenie

1012,5
= 615,3846

Poznámka:

V zásade by sa mal korigovaný rozptyl vzorky brať ako rozptyl normálneho rozdelenia. Ale odvtedy počet pozorovaní - 130 je dostatočne veľký, potom bude stačiť „obvyklé“.
Teoretické normálne rozdelenie je teda:

Interval

[xi; xi+1]

Empirické frekvencie

ni

Pravdepodobnosti
pi

Teoretické frekvencie
npi

(ni-npi)2

Štatistický test

Pravidlo, podľa ktorého je hypotéza R 0 zamietnutá alebo akceptovaná, sa nazýva štatistické kritérium. Názov kritéria spravidla obsahuje písmeno, ktoré označuje špeciálne zostavenú charakteristiku z odseku 2 algoritmu testovania štatistických hypotéz (pozri odsek 4.1), vypočítanú v kritériu. V podmienkach tohto algoritmu by sa kritérium nazývalo "V-kritérium“.

Pri testovaní štatistických hypotéz sú možné dva typy chýb:

  • - chyba prvého druhu(môžete zamietnuť hypotézu I 0, keď je skutočne pravdivá);
  • - chyba typu II(môžete prijať hypotézu I 0, keď v skutočnosti nie je pravdivá).

Pravdepodobnosť A make a type one error sa nazýva úroveň významnosti kritéria.

Ak pre R označujú pravdepodobnosť vykonania chyby typu II, potom (l - R) - pravdepodobnosť, že neurobíte chybu typu II, ktorá je tzv sila kritéria.

Dobrá vhodnosť x 2 Pearson

Existuje niekoľko typov štatistických hypotéz:

  • - o zákone rozdeľovania;
  • - homogenita vzoriek;
  • - číselné hodnoty distribučných parametrov atď.

Hypotézu o zákone rozdelenia budeme uvažovať na príklade Pearsonovho testu dobrej zhody x 2.

Kritérium zhody nazval štatistický test na testovanie nulovej hypotézy o údajnom zákone neznámeho rozdelenia.

Pearsonov test dobrej zhody je založený na porovnaní empirických (pozorovaných) a teoretických frekvencií pozorovaní vypočítaných za predpokladu určitého distribučného zákona. Hypotéza č. 0 je tu formulovaná nasledovne: všeobecná populácia je normálne rozdelená podľa skúmaného kritéria.

Algoritmus testovania štatistických hypotéz č. 0 pre kritériá x 1 Pearson:

  • 1) predkladáme hypotézu R 0 - podľa skúmaného kritéria je všeobecná populácia rozložená normálne;
  • 2) vypočítajte priemer vzorky a štandardnú odchýlku vzorky O V;

3) podľa dostupného objemu vzorky P vypočítame špeciálne zostavenú charakteristiku,

kde: i, - empirické frekvencie, - teoretické frekvencie,

P - veľkosť vzorky,

h- hodnota intervalu (rozdiel medzi dvoma susednými možnosťami),

normalizované hodnoty pozorovaného znaku,

- funkcia stola. Aj teoretické frekvencie

možno vypočítať pomocou štandardnej funkcie MS Excel NORMDIST podľa vzorca ;

4) podľa vzorkovacieho rozdelenia určíme kritickú hodnotu špeciálne zostavenej charakteristiky XL P

5) keď je hypotéza # 0 zamietnutá, keď je hypotéza # 0 prijatá.

Príklad. Zvážte znamenie X- hodnota testovacích ukazovateľov pre odsúdených v jednej z nápravných kolónií podľa nejakej psychologickej charakteristiky, prezentovaná ako variačná séria:

Na hladine významnosti 0,05 otestujte hypotézu normálneho rozloženia bežnej populácie.

1. Na základe empirického rozdelenia môžete predložiť hypotézu H 0: podľa skúmaného kritéria „hodnota testovacieho ukazovateľa pre danú psychologickú charakteristiku“ všeobecná populácia

počet detí je normálne rozdelený. Alternatívna hypotéza 1: podľa skúmaného znaku „hodnota testovacieho indikátora pre túto psychologickú charakteristiku“ nie je všeobecná populácia odsúdených normálne rozložená.

2. Vypočítajte numerické charakteristiky vzorky:

Intervaly

x y y

X) sch

3. Vypočítajte špeciálne zostavenú charakteristiku j 2 . Aby sme to dosiahli, v predposlednom stĺpci predchádzajúcej tabuľky nájdeme teoretické frekvencie pomocou vzorca a v poslednom stĺpci

vypočítajme charakteristiku % 2 . Dostaneme x 2 = 0,185.

Pre názornosť zostrojíme polygón empirického rozdelenia a normálovú krivku podľa teoretických početností (obr. 6).

Ryža. 6.

4. Určte počet stupňov voľnosti s: k = 5, t = 2, s = 5-2-1 = 2.

Podľa tabuľky alebo pomocou štandardnej funkcie MS Excel "XI20BR" pre počet stupňov voľnosti 5 = 2 a hladinu významnosti a = 0,05 nájdite kritickú hodnotu kritéria xl P.=5,99. Pre hladinu významnosti A= 0,01 kritická hodnota kritéria X%. = 9,2.

5. Zistená hodnota kritéria X=0,185 menej ako všetky zistené hodnoty Hc R.-> preto je hypotéza R 0 prijatá na oboch hladinách významnosti. Rozdiel medzi empirickými a teoretickými frekvenciami je zanedbateľný. Údaje z pozorovania sú preto v súlade s hypotézou normálneho rozloženia populácie. Podľa študovaného znaku „hodnota testovacieho indikátora pre túto psychologickú charakteristiku“ je teda všeobecná populácia odsúdených rozdelená normálne.

  • 1. Koryachko A.V., Kulichenko A.G. Vyššia matematika a matematické metódy v psychológii: Sprievodca praktickým štúdiom pre študentov PF. Ryazan, 1994.
  • 2. Nasledov A.D. Matematické metódy psychologického výskumu. Analýza a interpretácia údajov: Učebnica, príručka. SPb., 2008.
  • 3. Sidorenko E.V. Metódy matematického spracovania v psychológii. SPb., 2010.
  • 4. Soshnikova L.A. a iné Viacrozmerná štatistická analýza v ekonomike: učebnica, príručka pre univerzity. M., 1999.
  • 5. Suchodolskij E.V. Matematické metódy v psychológii. Charkov, 2004.
  • 6. Shmoylova R.A., Minashkin V.E., Sadovnikova N.A. Workshop z teórie štatistiky: Učebnica, príručka. M., 2009.
  • Gmurman V.E. Teória pravdepodobnosti a matematická štatistika. S. 465.
Účel kritéria χ 2 - Pearsonovo kritérium Kritérium χ 2 sa používa na dva účely: 1) na porovnanie empirického rozdelenia znaku s teoretickým - rovnomerné, normálne alebo iné; 2) na porovnanie dvoch, troch alebo viacerých empirických rozdelení rovnakého znaku. Opis kritéria Kritérium χ 2 odpovedá na otázku, či sa rôzne hodnoty znaku vyskytujú s rovnakou frekvenciou v empirických a teoretických rozdeleniach alebo v dvoch alebo viacerých empirických rozdeleniach. Výhodou metódy je, že umožňuje porovnávať distribúcie prezentovaných vlastností v ľubovoľnej mierke, počnúc stupnicou mien. V najjednoduchšom prípade alternatívneho rozdelenia "áno - nie", "povolené manželstvo - neumožnil manželstvo", "vyriešil problém - nevyriešil problém" atď., už môžeme použiť kritérium χ 2 . Čím väčší je rozdiel medzi dvoma porovnateľnými rozdeleniami, tým väčšia je empirická hodnota χ 2 . Automatický výpočet χ 2 - Pearsonovo kritérium Na automatický výpočet χ 2 - Pearsonovo kritérium je potrebné vykonať dva kroky: Krok 1. Uveďte počet empirických rozdelení (od 1 do 10); Krok 2. Empirické frekvencie zadajte do tabuľky; Krok 3. Získajte odpoveď.

Výhodou Pearsonovho kritéria je jeho univerzálnosť: možno ho použiť na testovanie hypotéz o rôznych distribučných zákonoch.

1. Testovanie hypotézy normálneho rozdelenia.

Nechajte získať vzorku dostatočne veľkej veľkosti P s množstvom rôznych variantných hodnôt. Pre pohodlie jeho spracovania delíme interval od najmenšej po najväčšiu z hodnôt variantu s rovnaké časti a budeme predpokladať, že hodnoty možností, ktoré spadajú do každého intervalu, sa približne rovnajú číslu, ktoré určuje stred intervalu. Po spočítaní počtu možností, ktoré spadali do každého intervalu, vytvoríme takzvanú zoskupenú vzorku:

možnosti……….. X 1 X 2 … x s

frekvencie …………. P 1 P 2 … n s ,

Kde x i sú hodnoty stredných bodov intervalov a n i je počet zahrnutých možností i interval (empirické frekvencie).



Na základe získaných údajov je možné vypočítať výberový priemer a výberovú smerodajnú odchýlku σ B. Overme si predpoklad, že všeobecná populácia je rozdelená podľa normálneho zákona s parametrami M(X) = , D(X) = . Potom môžete nájsť počet čísel z objemovej vzorky P, ktoré by sa za tohto predpokladu mali nachádzať v každom intervale (čiže teoretické početnosti). Aby sme to dosiahli, pomocou tabuľky hodnôt Laplaceovej funkcie nájdeme pravdepodobnosť zásahu i-tý interval:

,

Kde a i A b i- hranice i-tý interval. Vynásobením výsledných pravdepodobností veľkosťou vzorky n nájdeme teoretické frekvencie: p i = n p i.Naším cieľom je porovnať empirické a teoretické frekvencie, ktoré sa, samozrejme, navzájom líšia a zistiť, či sú tieto rozdiely nevýznamné, nevyvracajú hypotézu o normálnom rozdelení skúmanej náhodnej premennej, resp. že sú v rozpore s touto hypotézou. Na tento účel sa používa kritérium vo forme náhodnej premennej

. (20.1)

Jeho význam je zrejmý: časti sú sčítané, čo sú druhé mocniny odchýlok empirických frekvencií od teoretických od zodpovedajúcich teoretických frekvencií. Dá sa dokázať, že bez ohľadu na skutočný distribučný zákon všeobecnej populácie, distribučný zákon náhodnej premennej (20.1) at smeruje k distribučnému zákonu (pozri prednášku 12) s počtom stupňov voľnosti. k = s - 1 – r, Kde r je počet parametrov odhadovaného rozdelenia odhadnutých z údajov vzorky. Normálne rozdelenie je charakterizované dvoma parametrami, tzv k = s - 3. Pre zvolené kritérium sa zostrojí pravotočivá kritická oblasť určená podmienkou

(20.2)

Kde α - hladina významnosti. Preto je kritická oblasť daná nerovnosťou a akceptačná oblasť hypotézy je .

Takže, aby som otestoval nulovú hypotézu H 0: populácia je normálne rozložená - musíte vypočítať pozorovanú hodnotu kritéria zo vzorky:

, (20.1`)

a podľa tabuľky kritických bodov rozloženia χ 2 nájdite kritický bod pomocou známych hodnôt α a k = s - 3. Ak - je akceptovaná nulová hypotéza, ak je zamietnutá.

2. Testovanie hypotézy rovnomerného rozdelenia.

Pri použití Pearsonovho testu na testovanie hypotézy o rovnomernom rozložení všeobecnej populácie s predpokladanou hustotou pravdepodobnosti

po vypočítaní hodnoty z dostupnej vzorky je potrebné odhadnúť parametre A A b podľa vzorcov:

Kde A* A b*- odhady A A b. Skutočne pre rovnomernú distribúciu M(X) = , , odkiaľ môžete získať systém na určovanie A* A b*: , ktorého riešením sú výrazy (20.3).

Potom, za predpokladu, že , môžete nájsť teoretické frekvencie pomocou vzorcov

Tu s je počet intervalov, do ktorých je vzorka rozdelená.

Pozorovaná hodnota Pearsonovho kritéria sa vypočíta podľa vzorca (20,1`) a kritická hodnota sa vypočíta z tabuľky, berúc do úvahy skutočnosť, že počet stupňov voľnosti k = s - 3. Potom sa určia hranice kritickej oblasti rovnakým spôsobom ako pri testovaní hypotézy normálneho rozdelenia.

3. Testovanie hypotézy o exponenciálnom rozdelení.

V tomto prípade, rozdelením existujúcej vzorky na intervaly rovnakej dĺžky, uvažujeme o postupnosti možností, ktoré sú od seba rovnako vzdialené (predpokladáme, že všetky možnosti, ktoré spadajú do i-tý interval, nadobúdajú hodnotu zhodnú s jeho stredom) a ich zodpovedajúce frekvencie n i(počet vzorových možností zahrnutých v i– tý interval). Z týchto údajov počítame a berieme ako odhad parametra λ hodnotu . Potom sa teoretické frekvencie vypočítajú podľa vzorca

Potom sa porovnajú pozorované a kritické hodnoty Pearsonovho kritéria, berúc do úvahy, že počet stupňov voľnosti k = s - 2.

Kritérium zhody na testovanie hypotézy o zákone rozdelenia skúmanej náhodnej premennej. V mnohých praktických problémoch nie je presný zákon rozdelenia známy. Preto sa predkladá hypotéza o zhode existujúceho empirického zákona, postavená na pozorovaniach, na nejakú teoretickú.Táto hypotéza si vyžaduje štatistický test, ktorého výsledky buď potvrdia, alebo vyvrátia.

Nech X je skúmaná náhodná premenná. Je potrebné otestovať hypotézu H 0, že táto náhodná premenná sa riadi distribučným zákonom F(x). Na to je potrebné urobiť vzorku n nezávislých pozorovaní a použiť ju na zostavenie empirického distribučného zákona F "(x). Na porovnanie empirických a hypotetických zákonov sa používa pravidlo nazývané dobrá zhoda. Jedno z najpopulárnejšia je chi-square dobrota od K. Pearsona.

Vypočítava štatistiku chí-kvadrát:

,

kde N je počet intervalov, podľa ktorých bol zostavený empirický distribučný zákon (počet stĺpcov príslušného histogramu), i je číslo intervalu, p t i je pravdepodobnosť, že hodnota náhodnej premennej bude spadať do i-tý interval pre teoretický distribučný zákon, p e i je pravdepodobnosť, že hodnota náhodnej premennej bude spadať do i-tého intervalu pre empirický distribučný zákon. Musí sa riadiť rozdelením chí-kvadrát.

Ak vypočítaná hodnota štatistiky presiahne chí-kvadrát distribučný kvantil s k-p-1 stupňami voľnosti pre danú hladinu významnosti, potom sa hypotéza H 0 zamietne. V opačnom prípade je akceptovaná na danej hladine významnosti. Tu je k počet pozorovaní, p je počet odhadovaných parametrov distribučného zákona .

Pearson vám umožňuje testovať empirické a teoretické (alebo iné empirické) rozdelenia jednej funkcie. Toto kritérium sa uplatňuje najmä v dvoch prípadoch:

Porovnať empirické rozdelenie vlastnosti s teoretickým rozdelením (normálnym, exponenciálnym, rovnomerným alebo iným zákonom);

Porovnať dve empirické distribúcie tej istej vlastnosti.

Myšlienkou metódy je určiť stupeň divergencie zodpovedajúcich frekvencií n i a; čím väčšia je táto odchýlka, tým väčšia je hodnota

Veľkosť vzoriek musí byť aspoň 50 a súčty frekvencií musia byť rovnaké

Nulová hypotéza H 0 = (dve rozdelenia sa od seba prakticky nelíšia); alternatívna hypotéza - H 1 = (rozpor medzi rozdeleniami je významný).

Tu je schéma na uplatnenie kritéria na porovnanie dvoch empirických rozdelení:

Kritérium - štatistické kritérium na testovanie hypotézy, že pozorovaná náhodná premenná sa riadi nejakým teoretickým zákonom rozdelenia.


V závislosti od hodnoty kritéria môže byť hypotéza prijatá alebo zamietnutá:

§ , hypotéza je splnená.

§ (spadá do ľavého „chvosta“ distribúcie). Preto sú teoretické a praktické hodnoty veľmi blízke. Ak sa napríklad kontroluje generátor náhodných čísel, ktorý vygeneroval n čísel zo segmentu a hypotéza je: vzorka je rozdelená rovnomerne na , potom generátor nemožno nazvať náhodným (hypotéza náhodnosti nie je splnená), pretože vzorka je rozložená príliš rovnomerne, ale hypotéza je splnená.

§ (spadá do pravého „chvosta“ rozdelenia) hypotéza sa zamieta.

Definícia: Nech je daná náhodná premenná X.

Hypotéza: S. V. X dodržiava zákon rozdelenia.

Na testovanie hypotézy uvažujme vzorku pozostávajúcu z n nezávislých pozorovaní r.v. X: . Na základe vzorky zostrojíme empirické rozdelenie r.v. X. Porovnanie empirického a teoretického rozdelenia (predpokladané v hypotéze) sa vykonáva pomocou špeciálne vybranej funkcie – kritéria dobrej zhody. Zvážte Pearsonov test dobrej zhody (kritérium):

Hypotéza: X n je generované funkciou .

Rozdeľte na k neprekrývajúcich sa intervalov ;

Nech je počet pozorovaní v j-tom intervale: ;

Pravdepodobnosť pozorovania spadajúceho do j-tého intervalu, keď je hypotéza splnená;

- očakávaný počet zásahov v j-tom intervale;

štatistiky: - Chi-kvadrát rozdelenie s k-1 stupňami voľnosti.

Kritérium je nesprávne na vzorkách s nízkofrekvenčnými (zriedkavými) udalosťami.Tento problém je možné vyriešiť vyradením nízkofrekvenčných udalostí alebo ich kombináciou s inými udalosťami.Táto metóda sa nazýva Yatesova korekcia.

Pearsonov test dobrej zhody (χ 2) sa používa na testovanie hypotézy, že empirické rozdelenie zodpovedá očakávanému teoretickému rozdeleniu F(x) s veľkou veľkosťou vzorky (n ≥ 100). Kritérium je použiteľné pre akýkoľvek druh funkcie F(x), dokonca aj s neznámymi hodnotami ich parametrov, čo sa zvyčajne deje pri analýze výsledkov mechanických skúšok. V tom spočíva jeho všestrannosť.

Použitie kritéria χ 2 zahŕňa rozdelenie rozsahu variácií vzorky na intervaly a určenie počtu pozorovaní (frekvencie) n j pre každé z e intervaloch. Pre pohodlie odhadu distribučných parametrov sú intervaly zvolené tak, aby mali rovnakú dĺžku.

Počet intervalov závisí od veľkosti vzorky. Zvyčajne akceptované: pri n = 100 e= 10 ÷ 15, pri n = 200 e= 15 ÷ 20, pri n = 400 e= 25 ÷ 30, pri n = 1000 e= 35 ÷ 40.

Intervaly obsahujúce menej ako päť pozorovaní sa kombinujú so susednými. Ak je však počet takýchto intervalov menší ako 20 % z ich celkového počtu, sú povolené intervaly s frekvenciou n j ≥ 2.

Hodnotou je štatistika Pearsonovho testu
, (3.91)
kde p j je pravdepodobnosť, že skúmaná náhodná premenná spadá do j-tého intervalu, vypočítaná v súlade s hypotetickým distribučným zákonom F(x). Pri výpočte pravdepodobnosti p j treba mať na pamäti, že ľavá hranica prvého intervalu a pravá hranica posledného sa musia zhodovať s hranicami oblasti možných hodnôt náhodnej premennej. Napríklad s normálnou rozdelenia, prvý interval siaha do -∞ a posledný - do +∞.

Nulová hypotéza o súlade rozloženia vzorky s teoretickým zákonom F(x) sa overí porovnaním hodnoty vypočítanej podľa vzorca (3.91) s kritickou hodnotou χ 2 α zistenou z tabuľky. Aplikácia VI pre hladinu významnosti α a počet stupňov voľnosti k = e 1 - m - 1. Tu e 1 - počet intervalov po zlúčení; m je počet parametrov odhadnutých z uvažovanej vzorky.Ak nerovnosť
χ 2 ≤ χ 2 α (3,92)
potom sa nulová hypotéza nezamietne Ak nie je dodržaná špecifikovaná nerovnosť, prijme sa alternatívna hypotéza, že vzorka patrí do neznámeho rozdelenia.

Nevýhodou Pearsonovho testu dobrej zhody je strata niektorých prvotných informácií spojených s potrebou zoskupovať výsledky pozorovaní do intervalov a jednotlivé intervaly spájať s malým počtom pozorovaní.V tomto smere sa odporúča doplniť overenie zhody rozdelení podľa kritéria χ 2 s inými kritériami, čo je potrebné najmä pri relatívne malom objeme vzoriek (n ≈ 100).

Tabuľka zobrazuje kritické hodnoty rozdelenia chí-kvadrát s daným počtom stupňov voľnosti. Požadovaná hodnota je v priesečníku stĺpca s príslušnou hodnotou pravdepodobnosti a riadku s počtom stupňov voľnosti. Napríklad kritická hodnota rozdelenia chí-kvadrát so 4 stupňami voľnosti pre pravdepodobnosť 0,25 je 5,38527. To znamená, že plocha pod krivkou hustoty rozdelenia chí-kvadrát so 4 stupňami voľnosti napravo od hodnoty 5,38527 je 0,25.

ODA Kritérium na testovanie hypotézy o navrhovanom zákone neznámeho rozdelenia sa nazýva kritérium dobrej zhody.

Existuje niekoľko kritérií vhodnosti: $\chi ^2$ (chí-kvadrát) od K. Pearsona, Kolmogorova, Smirnova a iných.

Teoretické a empirické frekvencie sa zvyčajne líšia. Prípad nesúladu nemusí byť náhodný, čo znamená, že sa vysvetľuje tým, že hypotéza nie je správne zvolená. Pearsonovo kritérium odpovedá na otázku, ale ako každé kritérium nič nedokazuje, ale iba potvrdzuje svoj súhlas alebo nesúhlas s pozorovanými údajmi na akceptovanej úrovni významnosti.

ODA Dostatočne malá pravdepodobnosť, pri ktorej možno udalosť považovať za takmer nemožnú, sa nazýva hladina významnosti.

V praxi je bežné brať hladiny významnosti medzi 0,01 a 0,05, pričom $\alpha =0,05$ je $5 ( \% ) $ hladina významnosti.

Ako kritérium na testovanie hypotézy berieme hodnotu \begin(rovnica) \label ( eq1 ) \chi ^2=\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) \ qquad (1) \ end (rovnica)

tu $n_i -$ empirické frekvencie získané zo vzorky, $n_i" -$ teoretické frekvencie zistené teoreticky.

Je dokázané, že pre $n\to \infty $ zákon rozdelenia náhodnej premennej ( 1 ), bez ohľadu na distribučný zákon všeobecnej populácie, smeruje k zákonu $\chi ^2$ ( chí-kvadrát ) s $k$ stupňov voľnosti.

ODA Počet stupňov voľnosti sa zistí rovnicou $k=S-1-r$, kde $S-$ je počet skupín intervalov, $r-$ je počet parametrov.

1) rovnomerné rozdelenie: $r=2, k=S-3 $

2) normálne rozdelenie: $r=2, k=S-3 $

3) exponenciálne rozdelenie: $r=1, k=S-2$.

pravidlo . Testovanie hypotézy podľa Pearsonovho kritéria.

  1. Na testovanie hypotézy vypočítajte teoretické frekvencie a nájdite $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $
  2. Podľa tabuľky kritických distribučných bodov $\chi ^2$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$ sa zistí podľa danej hladiny významnosti $\alpha $ a počtu stupňov sloboda $k$.
  3. Ak $\chi _ ( obs ) ^2<\chi _ { кр } ^2 $ то нет оснований отвергать гипотезу, если не выполняется данное условие - то отвергают.

Komentujte Na ovládanie výpočtov použite vzorec pre $\chi ^2$ v tvare $\chi _ ( obs ) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) $

Testovanie hypotézy rovnomernej distribúcie

Funkcia hustoty rovnomerného rozdelenia $X$ má tvar $f(x)=\frac ( 1 ) ( b-a ) x\in \left[ ( a,b )\right]$.

Na testovanie hypotézy, že spojitá náhodná premenná je rovnomerne rozložená na hladine významnosti $\alpha $, je potrebné:

1) Nájdite vzorový priemer $\overline ( x_b ) $ a $\sigma _b =\sqrt ( D_b ) $ z daného empirického rozdelenia. Berte ako odhad parametrov $a$ a $b$ množstvá

$a = \overline x _b -\sqrt 3 \sigma _b $, $b = \overline x _b +\sqrt 3 \sigma _b $

2) Nájdite pravdepodobnosť, že náhodná premenná $X$ spadá do čiastkových intervalov $(( x_i ,x_ ( i+1 ) ))$ pomocou vzorca $ P_i =P(( x_i)

3) Nájdite teoretické (vyrovnávacie) frekvencie pomocou vzorca $n_i" =np_i $.

4) Za predpokladu počtu stupňov voľnosti $k=S-3$ a hladiny významnosti $\alpha =0,05$ z tabuliek $\chi ^2$ nájdeme $\chi _ ( cr ) ^2 $ z dané $\alpha $ a $k$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$.

5) Pomocou vzorca $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ kde $n_i sú $ empirické frekvencie zistíme pozorované hodnota $\ chi _ ( obs ) ^2 $.

6) Ak $\chi _ ( obs ) ^2<\chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу.

Otestujme hypotézu na našom príklade.

1) $\overline x _b =13,00\,\,\sigma _b =\sqrt ( D_b ) = 6,51 $

2) $a=13,00-\sqrt 3 \cdot 6,51=13,00-1,732\cdot 6,51=1,72468$

$b=13,00+1,732\cdot 6,51=24,27532$

$b-a=24,27532-1,72468=22,55064$

3) $P_i =P((x_i

$P_2 =((3

$P_3 =((7

$P_4 =((11

$P_5 =((15

$P_6 =((19

Pri rovnomernom rozdelení, ak je dĺžka intervalu rovnaká, potom $P_i -$ sú rovnaké.

4) Nájdite $n_i" =np_i $.

5) Nájdite $\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" )) $ a nájdite $\chi _ ( obs ) ^2 $.

Všetky získané hodnoty dajme do tabuľky

\begin(pole) ( |l|l|l|l|l|l|l| ) \hline i& n_i & n_i" =np_i & n_i -n_i" & (( n_i -n_i"))^2& \frac ( (( n_i -n_i")^2 ) ( n_i" ) & Control~ \frac ( n_i^2 ) ( n_i" ) \\ \hline 1& 1& 4.43438& -3.43438& 11.7950& 2.659&2695& 1. \\ 4.43438& 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 3& 3& 4.43438& -1.43438& 2.05744& 0.47&1463& 38 4.-4.04. 1,43438& 2,05744& 0,471463& 2,0296 \\ \hline 5& 6& 4,43438& 1,56562& 2,45117& 0,552765& 8,11838 \\ \hline 6& 6& 4,43438& 1, 56562&2, 45117& 0,552765& 8,^ riadok &s &\h = \^ riadok &s &\h = \11838 &\h = \11838 &\h 261119& \chi _ ( obs ) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) =3,63985 \\ \hline \end(pole)

$\chi _ ( cr ) ^2 (( 0,05,3 ))=7,8 $

$\chi _ ( obs ) ^2<\chi _ { кр } ^2 =3,26<7,8$

Záver nie je dôvod zamietnuť hypotézu.

KATEGÓRIE

POPULÁRNE ČLÁNKY

2023 "kingad.ru" - ultrazvukové vyšetrenie ľudských orgánov