Разпределение на Пиърсън с k равно на 19. Тест за съответствие на Пиърсън

Задача 1.

Използвайки теста на Pearson, на ниво на значимост а= 0,05 проверете дали хипотезата за нормалното разпределение на съвкупността е последователна хс емпирично разпределение на размера на извадката н = 200.

Решение.

1. Да изчислим и извадково стандартно отклонение .
2. Нека изчислим теоретичните честоти, като вземем предвид това н = 200, ч= 2, = 4,695, съгласно формулата
.

Нека създадем таблица за изчисление (функционални стойности й(х) са дадени в Приложение 1).


i

3. Нека сравним емпиричните и теоретичните честоти. Нека създадем изчислителна таблица, от която ще намерим наблюдаваната стойност на критерия :


i
Сума

Съгласно таблицата на критичните точки на разпределение (Приложение 6), по ниво на значимост а= 0,05 и броя на степените на свобода к = с– 3 = 9 – 3 = 6 намираме критичната точка на дясната критична област (0,05; 6) = 12,6.
Тъй като =22.2 > = 12.6, ние отхвърляме хипотезата за нормалното разпределение на населението. С други думи, емпиричните и теоретичните честоти се различават значително.

Проблем 2

Представени са статистически данни.

Резултати от измерване на диаметъра н= 200 рула след смилане са обобщени в табл. (mm):
ТаблицаСерия от честотни вариации на диаметрите на ролките

i

xi, мм

xi, мм

Задължително:

1) съставете дискретна вариационна серия, като я подредите, ако е необходимо;

2) определя основните числени характеристики на серията;

3) дайте графично представяне на серията под формата на полигон на разпределение (хистограма);

4) конструирайте крива на теоретично нормално разпределение и проверете съответствието на емпиричните и теоретичните разпределения, като използвате критерия на Pearson. Когато тествате статистическата хипотеза за вида на разпределението, приемете нивото на значимост a = 0,05

Решение: Ще намерим основните числени характеристики на дадена вариационна серия по дефиниция. Средният диаметър на ролките е (mm):
хср. = = 6,753;
коригирана дисперсия (mm2):
д = = 0,0009166;
коригирано средно квадратно (стандартно) отклонение (mm):
с = = 0,03028.


Ориз.Честотно разпределение на диаметрите на ролките

Оригиналното („сурово“) честотно разпределение на вариационната серия, т.е. кореспонденция ni(xi), се отличава с доста голямо разпространение на стойности niспрямо някаква хипотетична крива на „осредняване“ (фиг.). В този случай е за предпочитане да се конструира и анализира серия от интервални вариации, комбинирайки честоти за диаметри, попадащи в съответните интервали.
Брой интервални групи КНека го дефинираме с помощта на формулата на Стърджис:
К= 1 + log2 н= 1 + 3,322lg н,
Където н= 200 – размер на извадката. В нашия случай
К= 1 + 3,322×lg200 = 1 + 3,322×2,301 = 8,644 » 8.
Ширината на интервала е (6,83 – 6,68)/8 = 0,01875 » 0,02 mm.
Интервалните вариационни серии са представени в табл.

Таблица Серии от вариации на честотния интервал на диаметрите на ролките.

к

xk, мм

Интервална серия може да бъде визуално представена под формата на хистограма на честотното разпределение.


Ориз. Честотно разпределение на диаметрите на ролките. Плътната линия е изглаждаща нормална крива.

Появата на хистограмата ни позволява да направим предположението, че разпределението на диаметрите на ролките се подчинява на нормалния закон, според който теоретичните честоти могат да бъдат намерени като
нк, теория = н× н(а; с; xk)×D xk,
където от своя страна изглаждащата гаусова крива на нормалното разпределение се определя от израза:
н(а; с; xk) = .
В тези изрази xk– центрове на интервали в вариационните серии на честотния интервал.

Например, х 1 = (6,68 + 6,70)/2 = 6,69. Като централни оценки аи параметърът s на кривата на Гаус може да бъде взет:
а = хср
От фиг. може да се види, че кривата на нормалното разпределение на Гаус обикновено съответства на емпиричното интервално разпределение. Трябва обаче да се гарантира, че това съответствие е статистически значимо. За да проверим съответствието на емпиричното разпределение с емпиричното разпределение, ние използваме критерия за съответствие c2 на Pearson. За да направите това, изчислете емпиричната стойност на критерия като сума
= ,
Където нкИ нк,theor – съответно емпирични и теоретични (нормални) честоти. Удобно е резултатите от изчислението да се представят в таблична форма:
ТаблицаИзчисления с тест на Пиърсън


[xk, xk+ 1), мм

xk, мм

нк, теор

Ще намерим критичната стойност на критерия, използвайки таблицата на Pearson за нивото на значимост a = 0,05 и броя на степените на свобода д.f. = К – 1 – r, Където К= 8 – брой интервали от интервалната вариационна серия; r= 2 – броят на параметрите на теоретичното разпределение, оценен въз основа на данните от извадката (в този случай параметрите аи s). По този начин, д.f. = 5. Критичната стойност на критерия на Pearson е crit(a; д.f.) = 11,1. От c2emp< c2крит, заключаем, что согласие между эмпирическим и теоретическим нормальным распределением является статистическим значимым. Иными словами, теоретическое нормальное распределение удовлетворительно описывает эмпирические данные.

Проблем 3

Кутиите с шоколад се опаковат автоматично. По схемата за произволно еднократно вземане на проби са взети 130 от 2000 опаковки, съдържащи се в партидата, като са получени следните данни за теглото им:

Изисква се да се използва критерият на Pearson при ниво на значимост a=0,05, за да се провери хипотезата, че случайната променлива X - теглото на пакетите - се разпределя по нормален закон. Постройте хистограма на емпиричното разпределение и съответната нормална крива върху една графика.

Решение

1012,5
= 615,3846

Забележка:

По принцип коригираната дисперсия на извадката трябва да се приема като дисперсия на нормалния закон за разпределение. Но защото броят на наблюденията - 130 е достатъчно голям, тогава "обикновеният" ще свърши работа.
Следователно теоретичното нормално разпределение е:

Интервал

[xi; xi+1]

Емпирични честоти

ni

Вероятности
пи

Теоретични честоти
npi

(ni-npi)2

Статистически тест

Нарича се правилото, по което хипотезата I 0 се отхвърля или приема статистически критерий.Името на критерия, като правило, съдържа буква, която обозначава специално съставена характеристика от клауза 2 на алгоритъма за проверка на статистическата хипотеза (виж клауза 4.1), изчислена в критерия. При условията на този алгоритъм критерият ще бъде извикан „В- критерий".

При тестване на статистически хипотези са възможни два вида грешки:

  • - Грешка тип I(можете да отхвърлите хипотезата I 0, когато тя действително е вярна);
  • - грешка от втори тип(можете да приемете хипотезата I 0, когато тя всъщност не е вярна).

Вероятност Аизвършване на грешка от първия тип се нарича ниво на значимост на критерия.

Ако за Робозначават вероятността да направите грешка от втори тип, тогава (l - Р) -вероятността да не допуснете грешка от втория тип, която се нарича силата на критерия.

Тест за съответствие на Pearson x 2

Има няколко вида статистически хипотези:

  • - за закона за разпределението;
  • - хомогенност на пробите;
  • - числени стойности на параметрите на разпределението и др.

Ще разгледаме хипотезата за закона за разпределение, като използваме примера на теста за съответствие x 2 на Pearson.

Критерий за съгласиесе нарича статистически критерий за проверка на нулевата хипотеза за приетия закон на неизвестно разпределение.

Тестът за съответствие на Pearson се основава на сравнение на емпирични (наблюдавани) и теоретични честоти на наблюдения, изчислени при допускането на определен закон за разпределение. Хипотеза #0 тук е формулирана по следния начин: според изследваната характеристика популацията е нормално разпределена.

Алгоритъм за тестване на статистическа хипотеза #0 за критерий х 1Пиърсън:

  • 1) излагаме хипотезата I 0 - според изследваната характеристика генералната съвкупност е разпределена нормално;
  • 2) изчислете средната стойност на извадката и стандартното отклонение на извадката О V;

3) според наличната обемна проба Пизчисляваме специално съставена характеристика,

където: i са емпирични честоти, - теоретични честоти,

П -размер на извадката,

ч- размера на интервала (разликата между две съседни опции),

Нормализирани стойности на наблюдаваната характеристика,

- функция таблица. Също и теоретични честоти

може да се изчисли с помощта на стандартната функция MS Excel NORMIDIST по формулата;

4) използвайки разпределението на извадката, ние определяме критичната стойност на специално съставена характеристика xl P

5) когато хипотеза # 0 е отхвърлена, когато хипотеза # 0 е приета.

Пример.Нека разгледаме знака х- стойността на показателите за тестване на осъдените в една от поправителните колонии за някаква психологическа характеристика, представена под формата на вариационна серия:

При ниво на значимост 0,05 проверете хипотезата за нормалното разпределение на популацията.

1. Въз основа на емпиричното разпределение може да се изложи хипотеза H 0: според изследвания критерий „стойността на тестовия показател за дадена психологическа характеристика“, генералната съвкупност

се очаква да се разпредели нормално. Алтернативна хипотеза 1: според изследвания критерий „стойността на тестовия показател за дадена психологическа характеристика” генералната съвкупност от осъдени не е нормално разпределена.

2. Нека изчислим числените характеристики на извадката:

Интервали

x g y

Х) sch

3. Нека изчислим специално съставената характеристика j 2 . За да направите това, в предпоследната колона на предишната таблица намираме теоретичните честоти, използвайки формулата, а в последната колона

Нека изчислим характеристиките % 2. Получаваме х 2 = 0,185.

За по-голяма яснота ще изградим многоъгълник на емпиричното разпределение и нормална крива на базата на теоретични честоти (фиг. 6).

Ориз. 6.

4. Определете броя на степените на свобода с: k = 5, t = 2, s = 5-2-1 = 2.

Според таблицата или използвайки стандартната функция на MS Excel “HI20BR” за броя на степените на свобода 5 = 2 и нивото на значимост а = 0,05 ще намерим критичната стойност на критерия xl P .=5,99. За ниво на значимост А= 0,01 стойност на критичния критерий Х%. = 9,2.

5. Наблюдавана стойност на критерия х=0,185 по-малко от всички намерени стойности Hk R.->следователно хипотезата I 0 се приема и при двете нива на значимост. Несъответствието между емпиричните и теоретичните честоти е незначително. Следователно данните от наблюденията са в съответствие с хипотезата за нормално разпределение на населението. Така според изследвания критерий „стойността на тестовия показател за дадена психологическа характеристика” генералната съвкупност от осъдени се разпределя нормално.

  • 1. Корячко А.В., Куличенко А.Г. Висша математика и математически методи в психологията: ръководство за практически занятия за студенти от Факултета по психология. Рязан, 1994 г.
  • 2. Наследов А.Д. Математически методи на психологическо изследване. Анализ и интерпретация на данни: Учебник, пособие. Санкт Петербург, 2008 г.
  • 3. Сидоренко Е.В. Методи за математическа обработка в психологията. Санкт Петербург, 2010 г.
  • 4. Сошникова Л.А. и др.. Многомерен статистически анализ в икономиката: Учебник, ръководство за ВУЗ. М., 1999.
  • 5. Суходолски Е.В. Математически методи в психологията. Харков, 2004.
  • 6. Шмойлова Р.А., Минашкин В.Е., Садовникова Н.А. Практикум по теория на статистиката: Учебник, пособие. М., 2009.
  • Гмурман В.Е. Теория на вероятностите и математическа статистика. С. 465.
Предназначение на критерия χ 2 - критерият на Пиърсън Критерият χ 2 се използва за две цели: 1) да се сравни емпиричното разпределение на характеристика с теоретичното - равномерно, нормално или друго; 2) да се сравнят две, три или повече емпирични разпределения на една и съща характеристика. Описание на критерия Критерият χ 2 отговаря на въпроса дали различни стойности на дадена характеристика се срещат с еднаква честота в емпирични и теоретични разпределения или в две или повече емпирични разпределения. Предимството на метода е, че позволява да се сравняват разпределенията на характеристиките, представени във всякаква скала, като се започне от скалата на имената. В най-простия случай на алтернативно разпределение „да - не“, „допусна дефект - не позволи дефект“, „реши проблем - не реши проблем“ и т.н., вече можем да приложим критерия χ 2. Колкото по-голямо е несъответствието между двете сравнени разпределения, толкова по-голяма е емпиричната стойност на χ 2 . Автоматично изчисляване на χ 2 - критерий на Пиърсън За да извършите автоматично изчисление на χ 2 - критерий на Пиърсън, трябва да извършите две стъпки: Етап 1. Посочете броя на емпиричните разпределения (от 1 до 10); Стъпка 2. Въведете емпиричните честоти в таблицата; Стъпка 3. Получете отговор.

Предимството на критерия на Pearson е неговата универсалност: той може да се използва за проверка на хипотези за различни закони на разпределение.

1. Проверка на хипотезата за нормално разпределение.

Нека се получи достатъчно голяма проба Пс опция за много различни значения. За удобство на обработката разделяме интервала от най-малката до най-голямата стойност на опцията на сравни части и ще приемем, че стойностите на опциите, които попадат във всеки интервал, са приблизително равни на числото, което определя средата на интервала. Като преброим броя на опциите, които попадат във всеки интервал, ще създадем така наречената групирана извадка:

настроики……….. х 1 х 2 … x s

честоти…………. П 1 П 2 … n s ,

Където x iса стойностите на средните точки на интервалите и n i– брой опции, включени в i-интервал (емпирични честоти).



От получените данни можете да изчислите средната стойност на извадката и стандартното отклонение на извадката σ Б. Нека проверим предположението, че населението е разпределено по нормален закон с параметри М(х) = , д(х) = . След това можете да намерите броя на числата от размера на извадката П, които трябва да се появяват във всеки интервал при това предположение (т.е. теоретични честоти). За да направите това, използвайки таблицата със стойности на функцията на Лаплас, намираме вероятността да влезем iти интервал:

,

Където и азИ b i- граници i-ти интервал. Чрез умножаване на получените вероятности по размера на извадката n, намираме теоретичните честоти: p i =n·p iНашата цел е да сравним емпиричните и теоретичните честоти, които, разбира се, се различават една от друга, и да разберем дали тези разлики са незначителни и не опровергават хипотезата за нормално разпределение на изследваната случайна променлива или са толкова големи, че противоречат на тази хипотеза. За целта се използва критерий под формата на случайна променлива

. (20.1)

Значението му е очевидно: частите, които квадратите на отклоненията на емпиричните честоти от теоретичните съставляват от съответните теоретични честоти, се сумират. Може да се докаже, че независимо от реалния закон за разпределение на съвкупността, законът за разпределение на случайната променлива (20.1) клони към закона за разпределение (виж лекция 12) с броя на степените на свобода k = s – 1 – r, Където r– броя на параметрите на очакваното разпределение, оценени от извадковите данни. Следователно нормалното разпределение се характеризира с два параметъра k = s – 3. За избрания критерий се конструира дясна критична област, определена от условието

(20.2)

Където α - ниво на значимост. Следователно критичната област е дадена от неравенството и областта на приемане на хипотезата е.

И така, за да тестваме нулевата хипотеза н 0: популацията е нормално разпределена - трябва да изчислите наблюдаваната стойност на критерия от извадката:

, (20.1`)

и използвайки таблицата на критичните точки на разпределението χ 2, намерете критичната точка, като използвате известни стойности на α и k = s – 3. Ако - нулевата хипотеза се приема, ако се отхвърля.

2. Проверка на хипотезата за равномерно разпределение.

Когато използвате теста на Pearson за тестване на хипотезата, че популацията е равномерно разпределена с изчислената плътност на вероятността

Необходимо е, след като се изчисли стойността от наличната проба, да се оценят параметрите АИ bпо формулите:

Където А*И б*- оценки АИ b. Всъщност за равномерно разпределение М(х) = , , където можете да получите система за определяне А*И b*: , чието решение са изрази (20.3).

Тогава, ако приемем, че , можете да намерите теоретичните честоти, като използвате формулите

Тук с– броя на интервалите, на които е разделена пробата.

Наблюдаваната стойност на критерия на Пиърсън се изчислява по формула (20.1`), а критичната стойност се изчислява по таблицата, като се вземе предвид фактът, че броят на степените на свобода k = s – 3. След това се определят границите на критичната област по същия начин, както при проверка на хипотезата за нормално разпределение.

3. Проверка на хипотезата за експоненциалното разпределение.

В този случай, разделяйки съществуващата извадка на интервали с еднаква дължина, ние разглеждаме последователността от опции, разположени на еднакво разстояние една от друга (приемаме, че всички опции, които попадат в i- ти интервал, вземете стойност, съвпадаща със средата му), и съответните им честоти n i(брой примерни опции, включени в i– ти интервал). Нека изчислим от тези данни и вземем като оценка на параметъра λ размер. След това теоретичните честоти се изчисляват по формулата

След това се сравняват наблюдаваната и критичната стойност на критерия на Пиърсън, като се вземе предвид фактът, че броят на степените на свобода k = s – 2.

Критерий за съответствие за проверка на хипотеза за закона за разпределение на изследваната случайна променлива В много практически проблеми точният закон за разпределение е неизвестен. Следователно се излага хипотеза за съответствието на съществуващия емпиричен закон. изградена от наблюдения, до някаква теоретична. Тази хипотеза изисква статистическо тестване, резултатите от което или ще потвърдят, или ще опровергаят.

Нека X е изследваната случайна променлива. Необходимо е да се провери хипотезата H 0, че тази случайна променлива се подчинява на закона за разпределение F(x). За да направите това, е необходимо да направите извадка от n независими наблюдения и да я използвате за конструиране на емпиричен закон за разпределение F"(x). За да се сравнят емпиричните и хипотетичните закони, се използва правило, наречено критерий за добро съответствие Един от популярните е тестът за съответствие на хи-квадрат на K. Pearson.

Той изчислява статистиката хи-квадрат:

,

където N е броят на интервалите, според които е конструиран емпиричният закон за разпределение (броят на колоните на съответната хистограма), i е номерът на интервала, p t i е вероятността стойността на случайна променлива да попадне в i -ти интервал за теоретичния закон на разпределение, p e i е вероятността стойността на случайна променлива да попадне в i -интервал за емпиричния закон на разпределение. Трябва да се подчинява на разпределението хи-квадрат.

Ако изчислената стойност на статистиката надвишава квантила на разпределението хи-квадрат с k-p-1 степени на свобода за дадено ниво на значимост, тогава хипотезата H 0 се отхвърля при даденото ниво на значимост е броят на наблюденията, p е броят на оценените параметри на закона за разпределение.

Pearson ви позволява да проверите емпиричните и теоретичните (или други емпирични) разпределения на една характеристика. Този критерий се прилага главно в два случая:

Да се ​​сравни емпиричното разпределение на характеристика с теоретично разпределение (нормално, експоненциално, равномерно или по друг закон);

Да се ​​сравнят две емпирични разпределения на една и съща характеристика.

Идеята на метода е да се определи степента на несъответствие между съответните честоти n i и ; колкото по-голямо е несъответствието, толкова по-голяма е стойността

Размерът на извадката трябва да бъде поне 50 и се изискват равни суми от честоти

Нулева хипотеза H 0 = (две разпределения практически не се различават едно от друго); алтернативна хипотеза – H 1 = (разминаването между разпределенията е значително).

Ето диаграма за прилагане на критерия за сравняване на две емпирични разпределения:

Критерий - статистически критерий за проверка на хипотезата, че наблюдаваната случайна променлива се подчинява на някакъв теоретичен закон на разпределение.


В зависимост от стойността на критерия, хипотезата може да бъде приета или отхвърлена:

§ , хипотезата е изпълнена.

§ (попада в лявата „опашка“ на разпределението). Следователно теоретичните и практическите стойности са много близки. Ако, например, се тества генератор на случайни числа, който е генерирал n числа от сегмент и хипотезата е: извадката е разпределена равномерно на , тогава генераторът не може да се нарече случаен (хипотезата за случайността не е изпълнена), тъй като извадката е разпределена твърде равномерно, но хипотезата е вярна.

§ (попада в дясната “опашка” на разпределението) хипотезата се отхвърля.

Определение: Нека е дадена случайна променлива X.

Хипотеза: С. V. X се подчинява на закона за разпределение.

За да проверите хипотезата, разгледайте извадка, състояща се от n независими наблюдения на r.v. Х: . Въз основа на извадката ще изградим емпирично разпределение на r.v в X. Сравнението на емпиричното и теоретичното разпределение (прието в хипотезата) се прави с помощта на специално избрана функция - критерий за добро съответствие. Помислете за критерия за съответствие на Pearson (критерий):

Хипотеза: X n се генерира от функцията .

Разделете на k несвързани интервала ;

Нека е броят на наблюденията в j-тия интервал: ;

Вероятността наблюдението да попадне в j-тия интервал, когато хипотезата е изпълнена;

- очакван брой попадения в j-тия интервал;

Статистика: - Хи-квадрат разпределение с k-1 степени на свобода.

Критерият прави грешки в извадки с нискочестотни (редки) събития. Този проблем може да бъде решен чрез отхвърляне на нискочестотни събития или комбинирането им с други събития.

Тестът за съответствие на Pearson (χ 2) се използва за проверка на хипотезата, че емпиричното разпределение съответства на очакваното теоретично разпределение F(x) с голям размер на извадката (n ≥ 100). Критерият е приложим за всеки тип функция F(x), дори и с неизвестни стойности на техните параметри, което обикновено се случва при анализиране на резултатите от механични тестове. Това е неговата многофункционалност.

Използването на критерия χ 2 включва разделяне на обхвата на вариацията на извадката на интервали и определяне на броя наблюдения (честота) n j за всеки от динтервали. За удобство при оценяване на параметрите на разпределението се избират интервали с еднаква дължина.

Броят на интервалите зависи от размера на извадката. Обикновено се приема: при n = 100 д= 10 ÷ 15, с n = 200 д= 15 ÷ 20, с n = 400 д= 25 ÷ 30, с n = 1000 д= 35 ÷ 40.

Интервалите, съдържащи по-малко от пет наблюдения, се комбинират със съседни. Въпреки това, ако броят на тези интервали е по-малък от 20% от общия им брой, се допускат интервали с честота n j ≥ 2.

Статистиката на критерия на Пиърсън е стойността
, (3.91)
където p j е вероятността изследваната случайна променлива да попадне в j-интервала, изчислена в съответствие с хипотетичния закон на разпределение F(x). Когато изчислявате вероятността p j, трябва да имате предвид, че лявата граница на първия интервал и дясната граница на последния трябва да съвпадат с границите на областта на възможните стойности на случайната променлива, например с a нормално разпределение, първият интервал се простира до -∞, а последният до +∞.

Нулевата хипотеза за съответствието на извадковото разпределение с теоретичния закон F(x) се проверява чрез сравняване на стойността, изчислена по формула (3.91) с критичната стойност χ 2 α, намерена от таблицата. VI приложения за нивото на значимост α и броя на степените на свобода k = д 1 - m - 1. Тук д 1 - брой интервали след сливане; m е броят на параметрите, оценени от разглежданата извадка, ако неравенството е изпълнено
χ 2 ≤ χ 2 α (3.92)
тогава нулевата хипотеза не се отхвърля. Ако определеното неравенство не е изпълнено, се приема алтернативна хипотеза, че извадката принадлежи към неизвестно разпределение.

Недостатъкът на теста за съответствие на Pearson е загубата на част от първоначалната информация, свързана с необходимостта от групиране на резултатите от наблюдението в интервали и комбиниране на отделни интервали с малък брой наблюдения. В тази връзка се препоръчва допълване проверката на съответствието на разпределенията с помощта на критерия χ 2 с други критерии. Това е особено необходимо при относително малък обем проби (n ≈ 100).

Таблицата показва критичните стойности на разпределението хи-квадрат с даден брой степени на свобода. Желаната стойност се намира в пресечната точка на колоната със съответната стойност на вероятността и реда с броя на степените на свобода. Например критичната стойност на хи-квадрат на разпределение с 4 степени на свобода за вероятност от 0,25 е 5,38527. Това означава, че площта под кривата на плътността хи-квадрат с 4 степени на свобода вдясно от стойността 5,38527 е 0,25.

ОПРКритерият за проверка на хипотезата за приетия закон на неизвестно разпределение се нарича критерий за добро съответствие.

Има няколко теста за съответствие: $\chi ^2$ (хи-квадрат) от К. Пиърсън, Колмогоров, Смирнов и др.

Обикновено теоретичните и емпиричните честоти се различават. Случаят на несъответствие може да не е случаен, което означава, че се обяснява с факта, че хипотезата не е избрана правилно. Критерият на Pearson отговаря на поставения въпрос, но като всеки критерий не доказва нищо, а само установява съгласието или несъгласието си с данните от наблюденията на приетото ниво на значимост.

ОПРДостатъчно малка вероятност, при която дадено събитие може да се счита за практически невъзможно, се нарича ниво на значимост.

На практика нивата на значимост обикновено се приемат между 0,01 и 0,05, $\alpha =0,05$ е $5 (\% ) $ ниво на значимост.

Като критерий за проверка на хипотезата ще приемем стойността \begin(equation) \label ( eq1 ) \chi ^2=\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) \qquad (1) \ край (уравнение)

тук $n_i -$ емпирични честоти, получени от пробата, $n_i" -$ теоретични честоти, намерени теоретично.

Доказано е, че за $n\to \infty $ законът за разпределение на случайната променлива (1), независимо от закона, по който е разпределена популацията, клони към $\chi ^2$ закона (хи-квадрат) с $k$ степени на свобода.

ОПРБроят на степените на свобода се намира от равенството $k=S-1-r$, където $S-$ е броят на интервалните групи, $r-$ е броят на параметрите.

1) равномерно разпределение: $r=2, k=S-3 $

2) нормално разпределение: $r=2, k=S-3 $

3) експоненциално разпределение: $r=1, k=S-2$.

правило . Тестване на хипотезата с помощта на теста на Pearson.

  1. За да тествате хипотезата, изчислете теоретичните честоти и намерете $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $
  2. Използвайки таблицата на критичните точки на разпределението $\chi ^2$ за дадено ниво на значимост $\alpha $ и броя на степените на свобода $k$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$ са намерени.
  3. Ако $\chi _ ( obs ) ^2<\chi _ { кр } ^2 $ то нет оснований отвергать гипотезу, если не выполняется данное условие - то отвергают.

КоментирайтеЗа да контролирате изчисленията, използвайте формулата за $\chi ^2$ във формата $\chi _ (наблюдавано) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) $

Тестване на хипотезата за равномерно разпределение

Функцията на плътност на равномерното разпределение на величината $X$ има формата $f(x)=\frac ( 1 ) ( b-a ) x\in \left[ ( a,b )\right]$.

За да се провери хипотезата, че непрекъсната случайна променлива се разпределя по единен закон на ниво на значимост $\alpha $, се изисква:

1) Намерете примерната средна $\overline ( x_b ) $ и $\sigma _b =\sqrt ( D_b ) $ от дадено емпирично разпределение. Вземете като оценка на параметрите $a$ и $b$ количествата

$a = \overline x _b -\sqrt 3 \sigma _b $, $b = \overline x _b +\sqrt 3 \sigma _b $

2) Намерете вероятността случайна променлива $X$ да попадне в частични интервали $(( x_i ,x_ ( i+1 ) ))$ с помощта на формулата $ P_i =P(( x_i

3) Намерете теоретичните (изравняващи) честоти, като използвате формулата $n_i" =np_i $.

4) Като вземем броя на степените на свобода $k=S-3$ и нивото на значимост $\alpha =0.05$ от таблиците $\chi ^2$, намираме $\chi _ ( cr ) ^2 $ за даденото $\alpha $ и $k$, $\chi _ ( kr ) ^2 (( \alpha ,k ))$.

5) Използвайки формулата $\chi _ (наблюдавано) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ където $n_i -$ са емпирични честоти, намираме наблюдавана стойност $\ chi _ ( obs ) ^2 $.

6) Ако $\chi _ ( obs ) ^2<\chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу.

Нека проверим хипотезата с нашия пример.

1) $\overline x _b =13.00\,\,\sigma _b =\sqrt ( D_b ) = 6.51$

2) $a=13,00-\sqrt 3 \cdot 6,51=13,00-1,732\cdot 6,51=1,72468$

$b=13,00+1,732\cdot 6,51=24,27532$

$b-a=24,27532-1,72468=22,55064$

3) $P_i =P(( x_i

$P_2 =(( 3

$P_3 =(( 7

$P_4 =(( 11

$P_5 =(( 15

$P_6 =(( 19

При равномерно разпределение, ако дължината на интервала е една и съща, тогава $P_i -$ са еднакви.

4) Намерете $n_i" =np_i $.

5) Нека намерим $\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ и да намерим $\chi _ ( obs ) ^2 $.

Нека въведем всички получени стойности в таблицата

\begin(масив) ( |l|l|l|l|l|l|l| ) \hline i& n_i & n_i" =np_i & n_i -n_i" & (( n_i -n_i"))^2& \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) & Контрол~ \frac ( n_i^2 ) ( n_i" ) \\ \hline 1& 1& 4.43438& -3.43438& 11.7950& 2.659898& 0.22551 \\ \hline 2& 6& 4.43438& 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 3& 3& 4.43438& -1.43438& 2.05744& 0.471463& 2.0296 \\ \hline 4& 3& 4 ,43438 & -1.43438& 2.05744& 0.471463& 2.0296 \\ \hline 5& 6& 4.43438 & 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 6& 6& 4.43438& 1.56562& 2, 45117& 0.552765& 8.11838 \\ \hline & & & & & \sum = \chi _ ( obs ) ^2 =3.2 61119& \chi _ ( obs ) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) =3,63985 \\ \hline \end(масив)

$\chi _ ( cr ) ^2 (( 0,05,3 ))=7,8$

$\chi _ ( obs ) ^2<\chi _ { кр } ^2 =3,26<7,8$

Заключениеняма причина да отхвърлим хипотезата.

КАТЕГОРИИ

ПОПУЛЯРНИ СТАТИИ

2024 “kingad.ru” - ултразвуково изследване на човешки органи