Тъй като новата променлива е нормално разпределена, долната и горната граница на 95% доверителен интервал за променливата φ ще бъдат φ-1,96 и φ+1,96 отляво">

Вместо 1,96 за малки проби се препоръчва да се замени стойността t за N – 1 степени на свобода. Този метод не дава отрицателни стойности и позволява по-точни оценки на доверителните интервали за честотите от метода на Wald. В допълнение, той е описан в много местни справочници по медицинска статистика, което обаче не е довело до широкото му използване в медицинските изследвания. Изчисляването на доверителни интервали с помощта на ъглова трансформация не се препоръчва за честоти, близки до 0 или 1.

Това е мястото, където обикновено завършва описанието на методите за оценка на доверителните интервали в повечето книги за основите на статистиката за медицински изследователи и този проблем е типичен не само за местната, но и за чуждестранната литература. И двата метода се основават на централната гранична теорема, която предполага голяма извадка.

Като вземат предвид недостатъците на оценката на доверителните интервали с помощта на горните методи, Клопър и Пиърсън предлагат през 1934 г. метод за изчисляване на така наречения точен доверителен интервал, като се има предвид биномното разпределение на изследваната черта. Този метод е наличен в много онлайн калкулатори, но доверителните интервали, получени по този начин, в повечето случаи са твърде широки. В същото време този метод се препоръчва за използване в случаите, когато е необходима консервативна оценка. Степента на консервативност на метода се увеличава с намаляване на размера на извадката, особено когато N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Според много статистици най-оптималната оценка на доверителните интервали за честотите се извършва по метода на Уилсън, предложен още през 1927 г., но практически не се използва в домашните биомедицински изследвания. Този метод не само позволява да се оценят доверителните интервали както за много малки, така и за много големи честоти, но е приложим и за малък брой наблюдения. Най-общо доверителният интервал според формулата на Уилсън има формата

Каква е вероятността на доверителния интервал. Доверителен интервал

Интелигентността се състои не само в знанията, но и в способността да се прилагат знанията на практика. (Аристотел)

Доверителни интервали

общ преглед

Като вземем извадка от съвкупността, получаваме точкова оценка на параметъра от интерес и изчисляваме стандартната грешка, за да посочим точността на оценката.

В повечето случаи обаче стандартната грешка като такава не е приемлива. Много по-полезно е тази мярка за точност да се комбинира с интервална оценка за параметъра на населението.

Това може да бъде направено чрез използване на знания за теоретичното разпределение на вероятностите на извадковата статистика (параметър), за да се изчисли доверителен интервал (CI - Доверителен интервал, CI - Доверителен интервал) за параметъра.

Като цяло доверителният интервал разширява оценките и в двете посоки с определено кратно на стандартната грешка (на даден параметър); двете стойности (доверителни граници), определящи интервала, обикновено се разделят със запетая и се затварят в скоби.

Доверителен интервал за средната стойност

Използване на нормално разпределение

Средната стойност на извадката е нормално разпределена, ако размерът на извадката е голям, така че можете да приложите знанията за нормалното разпределение, когато разглеждате средната стойност на извадката.

По-конкретно, 95% от разпределението на извадковите средни стойности е в рамките на 1,96 стандартни отклонения (SD) от средната популация.

Когато имаме само една проба, ние я наричаме стандартна грешка на средната стойност (SEM) и изчисляваме 95% доверителен интервал за средната стойност, както следва:

Ако повторим този експеримент няколко пъти, интервалът ще съдържа истинската средна популация в 95% от времето.

Обикновено това е доверителен интервал, като интервала от стойности, в рамките на който истинската средна стойност на съвкупността (обща средна) се намира с 95% доверителна вероятност.

Въпреки че не е напълно строго (средната стойност на популацията е фиксирана стойност и следователно не може да има свързана с нея вероятност) да се тълкува доверителен интервал по този начин, концептуално е по-лесно за разбиране.

Използване T-разпространение

Можете да използвате нормалното разпределение, ако знаете стойността на дисперсията в популацията. Освен това, когато размерът на извадката е малък, средната стойност на извадката следва нормално разпределение, ако основните данни за популацията са нормално разпределени.

Ако данните, лежащи в основата на популацията, не са нормално разпределени и/или дисперсията на популацията е неизвестна, средната стойност на извадката се подчинява t-разпределение на Стюдънт.

Ние изчисляваме 95% доверителен интервал за средната стойност на общата популация, както следва:

Къде е процентната точка (персентил) T-Разпределение t на Стюдънт с (n-1) степени на свобода, което дава двустранна вероятност от 0,05.

Като цяло, то осигурява по-широк обхват от използването на нормалното разпределение, тъй като взема предвид допълнителната несигурност, въведена чрез оценяване на стандартното отклонение на популацията и/или поради малкия размер на извадката.

Когато размерът на извадката е голям (от порядъка на 100 или повече), разликата между двете разпределения ( t-Студенти нормално) е незначително. Те обаче винаги използват T-разпределение при изчисляване на доверителните интервали, дори ако размерът на извадката е голям.

Обикновено се отчита 95% CI. Могат да се изчислят и други доверителни интервали, като 99% CI за средната стойност.

Вместо произведението на стандартната грешка и табличната стойност T-разпределение, което съответства на двустранна вероятност от 0,05, умножете го (стандартна грешка) по стойността, която съответства на двустранна вероятност от 0,01. Това е по-широк доверителен интервал от 95% доверителен интервал, тъй като отразява повишената увереност, че интервалът всъщност включва средната стойност на съвкупността.

Доверителен интервал за пропорцията

Извадковото разпределение на пропорциите има биномиално разпределение. Въпреки това, ако размерът на извадката не разумно голямо, тогава извадковото разпределение на пропорцията е приблизително нормално със средната стойност .

Ние оценяваме чрез селективно съотношение p=r/n(Където r- броят на индивидите в извадката с характерните черти, които ни интересуват), и стандартната грешка се оценява:

95% доверителен интервал за пропорцията се изчислява:

Ако размерът на извадката е малък (обикновено когато н.п.или n(1-p)по-малко 5 ), тогава е необходимо да се използва биномното разпределение, за да се изчислят точни доверителни интервали.

Имайте предвид, че ако стризразено като процент, тогава (1-p)заменен от (100-p).

Тълкуване на доверителни интервали

Когато интерпретираме доверителен интервал, ние се интересуваме от следните въпроси:

Колко широк е доверителният интервал?

Широкият доверителен интервал показва, че оценката е неточна; тясна показва точна оценка.

Ширината на доверителния интервал зависи от размера на стандартната грешка, която от своя страна зависи от размера на извадката и, когато се разглежда цифрова променлива, променливостта на данните води до по-широки доверителни интервали, отколкото проучванията на голям набор от данни от няколко променливи .

CI включва ли стойности от особен интерес?

Можете да проверите дали вероятната стойност за параметър на популацията попада в доверителния интервал. Ако е така, резултатите са в съответствие с тази вероятна стойност. Ако не, тогава е малко вероятно (за 95% доверителен интервал шансът е почти 5%) параметърът да има тази стойност.

"Катрен-Стил" продължава публикуването на поредицата на Константин Кравчик за медицинска статистика. В две предишни статии авторът се занимава с обяснението на понятия като и.

Константин Кравчик

Математик-аналитик. Специалист по статистически изследвания в медицината и хуманитарните науки

град Москва

Много често в статии за клинични проучвания можете да намерите мистериозна фраза: „доверителен интервал“ (95 % CI или 95 % CI - доверителен интервал). Например в една статия може да пише: „За да се оцени значимостта на разликите, t-тестът на Стюдънт беше използван за изчисляване на 95 % доверителен интервал.“

Каква е стойността на „95 % доверителен интервал“ и защо да го изчисляваме?

Какво е доверителен интервал? - Това е диапазонът, в който истинската популация означава лъжа. Има ли „неверни“ средни стойности? В известен смисъл, да, те го правят. В ние обяснихме, че е невъзможно да се измери параметърът от интерес в цялата популация, така че изследователите се задоволяват с ограничена извадка. В тази извадка (например въз основа на телесно тегло) има една средна стойност (определено тегло), по която съдим за средната стойност в цялата популация. Въпреки това е малко вероятно средното тегло в извадка (особено малка) да съвпадне със средното тегло в общата популация. Следователно е по-правилно да се изчисли и използва обхватът на средните стойности на населението.

Например, представете си, че 95% доверителен интервал (95% CI) за хемоглобина е 110 до 122 g/L. Това означава, че има 95% шанс истинската средна стойност на хемоглобина в популацията да бъде между 110 и 122 g/L. С други думи, ние не знаем средната стойност на хемоглобина в популацията, но можем с 95 % вероятност да посочим диапазон от стойности за тази характеристика.

Доверителните интервали са особено подходящи за разликите в средните стойности между групите или както се наричат ​​размерите на ефекта.

Да кажем, че сравнихме ефективността на два препарата с желязо: един, който е на пазара от дълго време, и един, който току-що е регистриран. След курса на терапията оценихме концентрацията на хемоглобина в изследваните групи пациенти и статистическата програма изчисли, че разликата между средните стойности на двете групи е с 95 % вероятност в диапазона от 1,72 до 14,36 g/l (Таблица 1).

Таблица 1. Тест за независими проби
(групите се сравняват по нивото на хемоглобина)

Това трябва да се тълкува по следния начин: при някои пациенти от общата популация, които приемат ново лекарство, хемоглобинът ще бъде по-висок средно с 1,72–14,36 g/l, отколкото при тези, които са приемали вече известно лекарство.

С други думи, в общата популация разликата в средните стойности на хемоглобина между групите е в тези граници с 95% вероятност. Изследователят ще прецени дали това е много или малко. Смисълът на всичко това е, че не работим с една средна стойност, а с диапазон от стойности, следователно по-надеждно оценяваме разликата в параметъра между групите.

В статистическите пакети, по преценка на изследователя, можете независимо да стесните или разширите границите на доверителния интервал. Като намаляваме вероятностите на доверителния интервал, ние стесняваме диапазона от средни стойности. Например, при 90 % CI обхватът на средните стойности (или разликата в средните) ще бъде по-тесен, отколкото при 95 %.

Обратно, увеличаването на вероятността до 99 % разширява диапазона от стойности. При сравняване на групи долната граница на CI може да премине нулевата граница. Например, ако разширим границите на доверителния интервал до 99 %, тогава границите на интервала варират от –1 до 16 g/l. Това означава, че в генералната съвкупност има групи, разликата в средните между които за изследваната характеристика е равна на 0 (М = 0).

С помощта на доверителен интервал можете да тествате статистически хипотези. Ако доверителният интервал пресича нулевата стойност, тогава нулевата хипотеза, която предполага, че групите не се различават по параметъра, който се изследва, е вярна. Примерът е описан по-горе, където разширихме границите до 99 %. Някъде в общата популация открихме групи, които не се различават по никакъв начин.

95% доверителен интервал на разликата в хемоглобина, (g/l)


Фигурата показва 95% доверителен интервал за разликата в средните стойности на хемоглобина между двете групи. Линията минава през нулевия знак, следователно има разлика между средните стойности на нула, което потвърждава нулевата хипотеза, че групите не се различават. Диапазонът на разликата между групите е от –2 до 5 g / L. Това означава, че хемоглобинът може или да намалее с 2 g / L, или да се увеличи с 5 g / L.

Доверителният интервал е много важен показател. Благодарение на него можете да видите дали разликите в групите наистина се дължат на разликата в средните стойности или на голяма извадка, тъй като при голяма извадка шансовете за откриване на разлики са по-големи, отколкото при малка.

На практика може да изглежда така. Взехме проба от 1000 души, измерихме нивата на хемоглобина и установихме, че доверителният интервал за разликата в средните стойности варира от 1,2 до 1,5 g/l. Нивото на статистическа значимост в този случай p

Виждаме, че концентрацията на хемоглобина се повишава, но почти незабележимо, следователно се появява статистическа значимост именно поради размера на извадката.

Доверителните интервали могат да бъдат изчислени не само за средни стойности, но и за пропорции (и рискови съотношения). Например, ние се интересуваме от доверителния интервал на пропорциите на пациентите, които са постигнали ремисия, докато са приемали разработено лекарство. Нека приемем, че 95 % CI за пропорциите, т.е. за съотношението на такива пациенти, е в диапазона 0,60–0,80. Така можем да кажем, че нашето лекарство има терапевтичен ефект в 60 до 80 % от случаите.

Всяка извадка дава само приблизителна представа за генералната съвкупност и всички статистически характеристики на извадката (средна стойност, режим, дисперсия...) са някакво приближение или да речем оценка на общи параметри, които в повечето случаи не е възможно да се изчислят поради до недостъпността на общото население (Фигура 20) .

Фигура 20. Грешка при вземане на проби

Но можете да посочите интервала, в който с определена степен на вероятност се намира истинската (обща) стойност на статистическата характеристика. Този интервал се нарича д доверителен интервал (CI).

Така че общата средна стойност с вероятност от 95% е в рамките

от до, (20)

Където T – таблична стойност на теста на Студент за α =0,05 и f= н-1

В този случай може да се намери и 99% CI T избран за α =0,01.

Какво е практическото значение на доверителния интервал?

    Широкият доверителен интервал показва, че средната стойност на извадката не отразява точно средната стойност на популацията. Това обикновено се дължи на недостатъчен размер на извадката или на нейната хетерогенност, т.е. голяма дисперсия. И двете дават по-голяма грешка на средната стойност и съответно по-широк CI. И това е основата за връщане към етапа на планиране на изследванията.

    Горната и долната граница на CI дават оценка дали резултатите ще бъдат клинично значими

Нека се спрем по-подробно на въпроса за статистическата и клиничната значимост на резултатите от изследването на груповите свойства. Нека си припомним, че задачата на статистиката е да открие поне някои разлики в общите популации въз основа на извадкови данни. Предизвикателството за клиницистите е да открият разлики (не каквито и да е), които ще подпомогнат диагнозата или лечението. А статистическите заключения не винаги са основа за клинични заключения. По този начин, статистически значимо понижение на хемоглобина с 3 g/l не е причина за безпокойство. И обратно, ако някакъв проблем в човешкото тяло не е разпространен на ниво цялото население, това не е причина да не се справяме с този проблем.

Нека да разгледаме тази ситуация пример.

Изследователите се чудеха дали момчетата, които са страдали от някакво инфекциозно заболяване, изостават от връстниците си в растеж. За целта е проведено извадково изследване, в което са участвали 10 момчета, страдащи от това заболяване. Резултатите са представени в таблица 23.

Таблица 23. Резултати от статистическа обработка

долна граница

горен лимит

Стандарти (cm)

средно аритметично

От тези изчисления следва, че извадковият среден ръст на 10-годишните момчета, преболедували някакво инфекциозно заболяване, е близък до нормалния (132,5 cm). Но долната граница на доверителния интервал (126,6 cm) показва, че има 95% вероятност истинският среден ръст на тези деца да съответства на понятието „нисък ръст“, т.е. тези деца са закърнели.

В този пример резултатите от изчисленията на доверителния интервал са клинично значими.

ДОВЕРИТЕЛНИ ИНТЕРВАЛИ ЗА ЧЕСТОТИ И ДРОБИ

© 2008

Национален институт по обществено здраве, Осло, Норвегия

Статията описва и обсъжда изчисляването на доверителните интервали за честоти и пропорции с помощта на методите на Wald, Wilson, Clopper - Pearson, използвайки ъгловата трансформация и метода на Wald с корекция на Agresti - Coull. Представеният материал предоставя обща информация за методите за изчисляване на доверителни интервали за честоти и пропорции и има за цел да предизвика интереса на читателите на списанието не само към използването на доверителни интервали при представяне на резултатите от собствените си изследвания, но и към четене на специализирана литература преди започване на работа за бъдещи публикации.

Ключови думи: доверителен интервал, честота, пропорция

Една от предишните публикации накратко споменава описанието на качествени данни и съобщава, че тяхната интервална оценка е за предпочитане пред точковата оценка за описване на честотата на поява на характеристиката, която се изследва в популацията. Всъщност, тъй като изследванията се провеждат с използване на извадкови данни, проекцията на резултатите върху популацията трябва да съдържа елемент на неточност на извадката. Доверителният интервал е мярка за точността на оценявания параметър. Интересно е, че някои книги за основна статистика за лекари напълно игнорират темата за доверителните интервали за честотите. В тази статия ще разгледаме няколко начина за изчисляване на доверителни интервали за честоти, предполагащи такива характеристики на извадката като неповтаряне и представителност, както и независимостта на наблюденията едно от друго. В тази статия честотата се разбира не като абсолютно число, показващо колко пъти дадена стойност се среща в съвкупността, а като относителна стойност, която определя дела на участниците в изследването, при които се среща изследваната характеристика.

В биомедицинските изследвания най-често се използват 95% доверителни интервали. Този доверителен интервал е областта, в която истинската пропорция попада в 95% от времето. С други думи, можем да кажем с 95% надеждност, че истинската стойност на честотата на поява на черта в популацията ще бъде в рамките на 95% доверителен интервал.

Повечето статистически ръководства за медицински изследователи съобщават, че честотната грешка се изчислява с помощта на формулата

където p е честотата на поява на характеристиката в извадката (стойност от 0 до 1). Повечето вътрешни научни статии посочват честотата на поява на черта в проба (p), както и нейната грешка (и) във формата p ± s. По-подходящо е обаче да се представи 95% доверителен интервал за честотата на срещане на даден признак в популацията, който ще включва стойности от

преди.

Някои ръководства препоръчват за малки проби да се замени стойността от 1,96 със стойността на t за N – 1 степени на свобода, където N е броят на наблюденията в извадката. Стойността t се намира от таблици за t-разпределението, налични в почти всички учебници по статистика. Използването на t разпределението за метода на Wald не осигурява видими предимства в сравнение с други методи, обсъдени по-долу, и следователно не се препоръчва от някои автори.

Представеният по-горе метод за изчисляване на доверителни интервали за честоти или пропорции е наречен Wald в чест на Абрахам Wald (1902–1950), тъй като широкото му използване започва след публикуването на Wald и Wolfovitz през 1939 г. Самият метод обаче е предложен от Пиер Симон Лаплас (1749–1827) през 1812 г.

Методът на Wald е много популярен, но прилагането му е свързано със значителни проблеми. Методът не се препоръчва за малки размери на извадката, както и в случаите, когато честотата на поява на дадена характеристика клони към 0 или 1 (0% или 100%) и е просто невъзможна за честоти от 0 и 1. Освен това, апроксимацията на нормалното разпределение, която се използва при изчисляване на грешката, „не работи“ в случаите, когато n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.



където приема стойност 1,96 при изчисляване на 95% доверителен интервал, N е броят на наблюденията, а p е честотата на поява на характеристиката в извадката. Този метод е наличен в онлайн калкулаторите, така че използването му не е проблематично. и не препоръчваме използването на този метод за n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

В допълнение към метода на Wilson се смята, че методът на Wald с корекция на Agresti-Coll осигурява оптимална оценка на доверителния интервал за честотите. Корекцията на Agresti-Coll е замяна във формулата на Wald на честотата на поява на характеристика в извадка (p) с p`, при изчисляването на което 2 се добавя към числителя и 4 се добавя към знаменателя, т.е. p` = (X + 2) / (N + 4), където X е броят на участниците в проучването, които имат изследваната характеристика, а N е размерът на извадката. Тази модификация дава резултати, много подобни на формулата на Wilson, освен когато честотата на събитието се доближава до 0% или 100% и извадката е малка. В допълнение към горните методи за изчисляване на доверителните интервали за честотите са предложени корекции за непрекъснатост както за методите на Wald, така и за методите на Wilson за малки проби, но проучванията показват, че използването им е неподходящо.

Нека разгледаме приложението на горните методи за изчисляване на доверителни интервали, като използваме два примера. В първия случай изследваме голяма извадка от 1000 произволно избрани участници в проучването, от които 450 имат чертата, която се изследва (това може да е рисков фактор, резултат или друга черта), представляваща честота от 0,45 или 45 %. Във втория случай изследването се провежда с помощта на малка извадка, да речем, само 20 души и само 1 участник в изследването (5%) има изследваната черта. Доверителните интервали с помощта на метода на Wald, метода на Wald с корекция на Agresti-Coll и метода на Wilson бяха изчислени с помощта на онлайн калкулатор, разработен от Jeff Sauro (http://www. /wald. htm). Коригираните за непрекъснатост доверителни интервали на Wilson бяха изчислени с помощта на калкулатора, предоставен от Wassar Stats: Уеб сайт за статистически изчисления (http://faculty.vassar.edu/lowry/prop1.html). Изчисленията на ъгловата трансформация на Фишер бяха извършени ръчно, като се използва критичната t стойност съответно за 19 и 999 степени на свобода. Резултатите от изчисленията са представени в таблицата и за двата примера.

Доверителни интервали, изчислени по шест различни начина за два примера, описани в текста

Метод за изчисляване на доверителния интервал

P=0,0500 или 5%

95% CI за X=450, N=1000, P=0,4500 или 45%

–0,0455–0,2541

Wald с корекция на Agresti–Coll

<,0001–0,2541

Wilson с корекция на непрекъснатостта

"Точният метод" на Клопър-Пиърсън

Ъглова трансформация

<0,0001–0,1967

Както се вижда от таблицата, за първия пример доверителният интервал, изчислен чрез „общоприетия“ метод на Wald, влиза в отрицателната област, което не може да бъде случаят с честотите. За съжаление подобни инциденти не са рядкост в руската литература. Традиционният начин за представяне на данни по отношение на честотата и нейната грешка частично маскира този проблем. Например, ако честотата на поява на черта (в проценти) е представена като 2,1 ± 1,4, тогава това не е толкова „обидно за окото“ като 2,1% (95% CI: –0,7; 4,9), въпреки че и означава едно и също нещо. Методът на Wald с корекция на Agresti–Coll и изчисление с помощта на ъглова трансформация дава долна граница, клоняща към нула. Методът на Wilson с коригирана непрекъснатост и "точният метод" дават по-широки доверителни интервали от метода на Wilson. За втория пример всички методи дават приблизително еднакви доверителни интервали (разликите се появяват само в хилядни), което не е изненадващо, тъй като честотата на възникване на събитието в този пример не се различава много от 50%, а размерът на извадката е доста голям.

За читателите, които се интересуват от този проблем, можем да препоръчаме трудовете на R. G. Newcombe и Brown, Cai и Dasgupta, които предоставят предимствата и недостатъците на използването съответно на 7 и 10 различни метода за изчисляване на доверителните интервали. Сред местните ръководства препоръчваме книгата и, която в допълнение към подробното описание на теорията представя методите на Уолд и Уилсън, както и метод за изчисляване на доверителни интервали, като се вземе предвид биномното разпределение на честотата. В допълнение към безплатните онлайн калкулатори (http://www. /wald. htm и http://faculty. vassar. edu/lowry/prop1.html), доверителните интервали за честотите (и не само!) могат да бъдат изчислени с помощта на Програмата на CIA (анализ на доверителните интервали), която може да бъде изтеглена от http://www. медицинско училище. сотон. ак. uk/cia/.

Следващата статия ще разгледа едновариантни начини за сравняване на качествени данни.

Библиография

Банерджи А.Медицинска статистика на ясен език: въвеждащ курс / A. Banerjee. – М.: Практическа медицина, 2007. – 287 с. Медицинска статистика / . – М.: Агенция за медицинска информация, 2007. – 475 с. Гланц С.Медицинска и биологична статистика / С. Гланц. – М.: Практика, 1998. Типове данни, тестване на разпределението и описателна статистика // Екология на човека – 2008. – № 1. – С. 52–58. Жижин К. С.. Медицинска статистика: учебник / . – Ростов н/д: Феникс, 2007. – 160 с. Приложна медицинска статистика / , . - Санкт Петербург. : Фолиот, 2003. – 428 с. Лакин Г. Ф. Биометрични данни /. – М.: Висше училище, 1990. – 350 с. Медик В.А. Математическа статистика в медицината / , . – М.: Финанси и статистика, 2007. – 798 с. Математическа статистика в клиничните изследвания / , . – М.: ГЕОТАР-МЕД, 2001. – 256 с. Юнкеров В. И. Медико-статистическа обработка на данни от медицински изследвания / , . - Санкт Петербург. : ВмедА, 2002. – 266 с. Агрести А.Приблизителното е по-добро от точното за интервална оценка на биномни пропорции / A. Agresti, B. Coull // Американски статистик. – 1998. – N 52. – С. 119–126. Алтман Д.Статистика с увереност // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – Лондон: BMJ Books, 2000. – 240 с. Браун Л.Д.Интервална оценка за биномиална пропорция / L. D. Brown, T. T. Cai, A. Dasgupta // Статистическа наука. – 2001. – N 2. – С. 101–133. Clopper C.J.Използването на доверителни или фидуциални граници, илюстрирани в случая на бином / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – N 26. – С. 404–413. Гарсия-Перес М. А. Относно доверителния интервал за биномиалния параметър / M. A. Garcia-Perez // Качество и количество. – 2005. – N 39. – С. 467–481. Мотулски Х.Интуитивна биостатистика // H. Motulsky. – Oxford: Oxford University Press, 1995. – 386 p. Нюкомб Р. Г.Двустранни доверителни интервали за единичната пропорция: Сравнение на седем метода / R. G. Newcombe // Статистика в медицината. – 1998. – N. 17. – P. 857–872. Сауро Дж.Оценяване на нивата на завършване от малки проби с помощта на биномиални доверителни интервали: сравнения и препоръки / J. Sauro, J. R. Lewis // Сборник на годишната среща на обществото за човешки фактори и ергономия. – Орландо, Флорида, 2005 г. Уолд А.Доверителни граници за непрекъснати функции на разпределение // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. – 1939. – N 10. – С. 105–118. Уилсън Е.Б. Вероятно заключение, законът за наследството и статистическо заключение / E. B. Wilson // Journal of American Statistical Association. – 1927. – N 22. – С. 209–212.

ДОВЕРИТЕЛНИ ИНТЕРВАЛИ ЗА ПРОПОРЦИИ

А. М. Гржибовски

Национален институт по обществено здраве, Осло, Норвегия

Статията представя няколко метода за изчисляване на доверителните интервали за биномни пропорции, а именно методите на Wald, Wilson, арксинус, Agresti-Coull и точни методи на Clopper-Pearson. Документът дава само общо въведение в проблема с оценката на доверителния интервал на биномна пропорция и целта му е не само да стимулира читателите да използват доверителни интервали, когато представят резултати от собствените си емпирични изследвания, но и да ги насърчи да се консултират със статистически книги преди да анализирате собствените си данни и да подготвите ръкописи.

Ключови думи: доверителен интервал, пропорция

Информация за връзка:

Старши съветник, Национален институт по обществено здраве, Осло, Норвегия

В предишните подраздели разгледахме въпроса за оценката на неизвестен параметър Аедно число. Това се нарича „точкова“ оценка. В редица задачи не само трябва да намерите параметъра Аподходяща числена стойност, но и за оценка на нейната точност и надеждност. Трябва да знаете до какви грешки може да доведе подмяната на параметър Анеговата точкова оценка Аи с каква степен на увереност можем да очакваме, че тези грешки няма да надхвърлят известните граници?

Проблеми от този вид са особено актуални при малък брой наблюдения, когато точковата оценка и ве до голяма степен случаен и приблизителната замяна на a с a може да доведе до сериозни грешки.

Да се ​​даде представа за точността и надеждността на оценката А,

В математическата статистика се използват така наречените доверителни интервали и доверителни вероятности.

Нека за параметъра Абезпристрастна оценка, получена от опит А.Искаме да оценим възможната грешка в този случай. Нека зададем някаква достатъчно голяма вероятност p (например p = 0,9, 0,95 или 0,99), така че събитие с вероятност p да може да се счита за практически надеждно, и да намерим стойност s, за която

Тогава диапазонът от практически възможни стойности на грешката, възникваща по време на подмяната АНа А, ще бъде ± s; Големи грешки в абсолютната стойност ще се появят само с малка вероятност a = 1 - p. Нека пренапишем (14.3.1) като:

Равенството (14.3.2) означава, че с вероятност p неизвестната стойност на параметъра Апопада в интервала

Необходимо е да се отбележи едно обстоятелство. Преди многократно сме разглеждали вероятността случайна променлива да попадне в даден неслучаен интервал. Тук ситуацията е различна: величината Ане е случаен, но интервалът / p е случаен. Позицията му по оста x е произволна и се определя от центъра му А; Като цяло дължината на интервала 2s също е случайна, тъй като стойността на s се изчислява, като правило, от експериментални данни. Следователно в този случай би било по-добре стойността p да се тълкува не като вероятността за „уцелване“ на точката Ав интервала / p и като вероятността произволен интервал / p да покрие точката А(фиг. 14.3.1).

Ориз. 14.3.1

Вероятността p обикновено се нарича вероятност за довериеи интервал / p - доверителен интервал.Интервални граници Ако. a x =a-пясък а 2 = а +и се наричат граници на доверие.

Нека да дадем друга интерпретация на концепцията за доверителен интервал: той може да се разглежда като интервал от стойности на параметри а,съвместими с експерименталните данни и не им противоречат. Всъщност, ако се съгласим да считаме събитие с вероятност a = 1-p практически невъзможно, тогава тези стойности на параметъра a, за които а - а> s трябва да бъдат разпознати като противоречащи на експерименталните данни и тези, за които |a - А a t na 2 .

Нека за параметъра Аима безпристрастна оценка А.Ако знаехме закона за разпределение на количеството А, задачата за намиране на доверителен интервал ще бъде много проста: ще бъде достатъчно да се намери стойност s, за която

Трудността е, че законът за разпределение на оценките Азависи от закона за разпределение на количеството хи следователно върху неговите неизвестни параметри (по-специално върху самия параметър А).

За да преодолеете тази трудност, можете да използвате следната грубо приблизителна техника: заменете неизвестните параметри в израза за s с техните точкови оценки. С относително голям брой експерименти П(около 20...30) тази техника обикновено дава резултати, които са задоволителни по отношение на точността.

Като пример, разгледайте проблема с доверителния интервал за математическото очакване.

Нека се произвежда П Х,чиито характеристики са математическото очакване Tи дисперсия д- неизвестен. Бяха получени следните оценки за тези параметри:

Изисква се да се конструира доверителен интервал / p, съответстващ на доверителната вероятност p за математическото очакване Tколичества Х.

При решаването на тази задача ще използваме факта, че количеството Tпредставлява сумата Пнезависими еднакво разпределени случайни променливи Xhи според централната гранична теорема, за достатъчно голям Пнеговият закон на разпределение е близък до нормалния. На практика, дори и при относително малък брой термини (около 10...20), законът за разпределение на сумата може приблизително да се счита за нормален. Ще приемем, че стойността Tразпределени по нормалния закон. Характеристиките на този закон – математическото очакване и дисперсията – съответно са равни TИ

(вижте глава 13, подраздел 13.3). Да приемем, че стойността дзнаем и ще намерим стойност Ep, за която

Използвайки формула (6.3.5) от глава 6, ние изразяваме вероятността от лявата страна на (14.3.5) чрез функцията за нормално разпределение

където е стандартното отклонение на оценката T.

От ур.

намерете стойността на Sp:

където arg Ф* (х) е обратната функция на Ф* (Х),тези. такава стойност на аргумента, за която функцията на нормалното разпределение е равна на Х.

дисперсия Д,чрез които се изразява количеството А 1P, не знаем точно; като негова приблизителна стойност можете да използвате оценката д(14.3.4) и поставете приблизително:

По този начин проблемът за конструиране на доверителен интервал е приблизително решен, който е равен на:

където gp се определя по формула (14.3.7).

За да се избегне обратната интерполация в таблиците на функцията Ф * (l) при изчисляване на s p, е удобно да се състави специална таблица (Таблица 14.3.1), която дава стойностите на количеството

в зависимост от r. Стойността (p определя за нормалния закон броя на стандартните отклонения, които трябва да бъдат начертани вдясно и вляво от центъра на дисперсията, така че вероятността за попадане в получената област да е равна на p.

Използвайки стойността 7 p, доверителният интервал се изразява като:

Таблица 14.3.1

Пример 1. Проведени са 20 експеримента върху количеството Х;резултатите са показани в табл. 14.3.2.

Таблица 14.3.2

Изисква се да се намери оценка от математическото очакване на количеството хи конструирайте доверителен интервал, съответстващ на доверителната вероятност p = 0,8.

Решение.Ние имаме:

Избирайки l: = 10 като референтна точка, използвайки третата формула (14.2.14), намираме безпристрастната оценка д :

Според таблицата 14.3.1 намираме

Граници на доверието:

Доверителен интервал:

Стойности на параметрите T,лежащи в този интервал са съвместими с експерименталните данни, дадени в табл. 14.3.2.

По подобен начин може да се изгради доверителен интервал за дисперсията.

Нека се произвежда Пнезависими експерименти върху случайна променлива хс неизвестни параметри както за A, така и за дисперсията дполучена е безпристрастна оценка:

Изисква се приблизително да се изгради доверителен интервал за дисперсията.

От формула (14.3.11) става ясно, че количеството дпредставлява

количество Пслучайни променливи от формата . Тези стойности не са

независими, тъй като всеки от тях включва количеството T,зависим от всички останали. Въпреки това може да се покаже, че с увеличаване Пзаконът за разпределение на тяхната сума също се доближава до нормалния. Почти при П= 20...30 вече може да се счита за нормално.

Нека приемем, че това е така, и нека намерим характеристиките на този закон: математическо очакване и дисперсия. От оценката д- безпристрастен, значи M[D] = D.

Изчисляване на дисперсията Д Де свързано с относително сложни изчисления, така че представяме неговия израз без извод:

където q 4 е четвъртият централен момент на магнитуда Х.

За да използвате този израз, трябва да замените стойностите \u003d 4 и д(поне близките). Вместо дможете да използвате неговата оценка Д.По принцип четвъртият централен момент може също да бъде заменен с оценка, например стойност от формата:

но такава замяна ще даде изключително ниска точност, тъй като като цяло при ограничен брой експерименти моментите от висок ред се определят с големи грешки. Въпреки това, на практика често се случва, че видът на закона за разпределение на количеството хизвестен предварително: неизвестни са само неговите параметри. След това можете да опитате да изразите μ 4 чрез Д.

Да вземем най-често срещания случай, когато стойността хразпределени по нормалния закон. Тогава неговият четвърти централен момент се изразява чрез дисперсия (виж Глава 6, подраздел 6.2);

и формула (14.3.12) дава или

Замяна на неизвестното в (14.3.14) днеговата оценка д, получаваме: откъде

Моментът μ 4 може да бъде изразен чрез дсъщо и в някои други случаи, когато разпределението на стойността хне е нормално, но външният му вид е известен. Например, за закона за еднаква плътност (вижте Глава 5) имаме:

където (a, P) е интервалът, на който е определен законът.

следователно

Използвайки формула (14.3.12), получаваме: къде намираме приблизително

В случаите, когато видът на закона за разпределение на количеството 26 е неизвестен, когато се прави приблизителна оценка на стойността a/), все пак се препоръчва използването на формула (14.3.16), освен ако няма специални причини да се смята, че този закон е много различен от нормалния (има забележим положителен или отрицателен ексцес) .

Ако приблизителната стойност a/) е получена по един или друг начин, тогава можем да конструираме доверителен интервал за дисперсията по същия начин, както го изградихме за математическото очакване:

където стойността в зависимост от дадената вероятност p се намира съгласно таблицата. 14.3.1.

Пример 2. Намерете приблизително 80% доверителен интервал за дисперсията на случайна променлива хпри условията на пример 1, ако е известно, че стойността хразпределени по закон, близък до нормалния.

Решение.Стойността остава същата като в таблицата. 14.3.1:

Съгласно формулата (14.3.16)

Използвайки формула (14.3.18), намираме доверителния интервал:

Съответният диапазон от стойности на стандартното отклонение: (0,21; 0,29).

14.4. Точни методи за конструиране на доверителни интервали за параметрите на случайна променлива, разпределени по нормален закон

В предишния подраздел разгледахме грубо приблизителни методи за конструиране на доверителни интервали за математическо очакване и дисперсия. Тук ще дадем представа за точните методи за решаване на същия проблем. Подчертаваме, че за точното намиране на доверителните интервали е абсолютно необходимо да се знае предварително формата на закона за разпределение на количеството Х,докато за прилагането на приблизителни методи това не е необходимо.

Идеята за точни методи за конструиране на доверителни интервали се свежда до следното. Всеки доверителен интервал се намира от условие, изразяващо вероятността за изпълнение на определени неравенства, които включват оценката, която ни интересува А.Закон за разпределение на оценката Ав общия случай зависи от неизвестни параметри на количеството Х.Понякога обаче е възможно да се предадат неравенства от случайна променлива Акъм някаква друга функция на наблюдаваните стойности X p X 2, ..., X стр.чийто закон на разпределение не зависи от неизвестни параметри, а зависи само от броя на експериментите и от вида на закона за разпределение на количеството Х.Тези видове случайни променливи играят важна роля в математическата статистика; най-подробно са изследвани за случай на нормално разпределение на величината Х.

Например доказано е, че при нормално разпределение на стойността хпроизволна стойност

се подчинява на т.нар Закон за разпределението на студентитес П- 1 степен на свобода; плътността на този закон има формата

където G(x) е известната гама функция:

Доказано е също, че случайната величина

има "%2 разпространение" с П- 1 степени на свобода (виж глава 7), чиято плътност се изразява с формулата

Без да се спираме на извеждането на разпределенията (14.4.2) и (14.4.4), ще покажем как те могат да бъдат приложени при конструиране на доверителни интервали за параметри ти Д.

Нека се произвежда Пнезависими експерименти върху случайна променлива Х,нормално разпределени с неизвестни параметри ДА СЕ.За тези параметри бяха получени оценки

Необходимо е да се конструират доверителни интервали и за двата параметъра, съответстващи на доверителната вероятност p.

Нека първо изградим доверителен интервал за математическото очакване. Естествено е този интервал да се приеме симетричен по отношение на T; нека s p означава половината от дължината на интервала. Стойността s p трябва да бъде избрана така, че условието да е изпълнено

Нека се опитаме да преминем от лявата страна на равенството (14.4.5) от случайната променлива Tкъм случайна променлива T,разпределени по Закона на студента. За да направите това, умножете двете страни на неравенството |m-w?|

с положителна стойност: или, използвайки нотация (14.4.1),

Нека намерим число / p такова, че стойността / p да може да бъде намерена от условието

От формула (14.4.2) е ясно, че (1) е четна функция, следователно (14.4.8) дава

Равенството (14.4.9) определя стойността / p в зависимост от p. Ако имате на разположение таблица с интегрални стойности

тогава стойността на /p може да бъде намерена чрез обратна интерполация в таблицата. По-удобно е обаче да съставите предварително таблица с /p стойности. Такава таблица е дадена в Приложението (Таблица 5). Тази таблица показва стойностите в зависимост от нивото на доверие p и броя на степените на свобода П- 1. Като определи / p от табл. 5 и ако приемем

ще намерим половината от ширината на доверителния интервал / p и самия интервал

Пример 1. Проведени са 5 независими експеримента върху случайна променлива Х,нормално разпределени с неизвестни параметри Tи около. Резултатите от експериментите са дадени в табл. 14.4.1.

Таблица 14.4.1

Намерете рейтинг Tза математическото очакване и конструиране на 90% доверителен интервал / p за него (т.е. интервалът, съответстващ на доверителната вероятност p = 0,9).

Решение.Ние имаме:

Съгласно таблица 5 от заявлението за П - 1 = 4 и p = 0,9 намираме където

Доверителният интервал ще бъде

Пример 2. За условията на пример 1 от подраздел 14.3, приемайки стойността хнормално разпределени, намерете точния доверителен интервал.

Решение.Според таблица 5 от приложението намираме кога П - 1 = 19ir =

0,8 / р = 1,328; оттук

Сравнявайки с решението на пример 1 от подраздел 14.3 (e p = 0,072), ние сме убедени, че несъответствието е много незначително. Ако поддържаме точността до втория знак след десетичната запетая, тогава доверителните интервали, намерени чрез точния и приблизителния метод, съвпадат:

Нека да преминем към конструирането на доверителен интервал за дисперсията. Помислете за безпристрастния оценител на дисперсията

и изразете случайната променлива дчрез величина V(14.4.3), с разпределение x 2 (14.4.4):

Познаване на закона за разпределение на количеството V,можете да намерите интервала /(1), в който попада с дадена вероятност p.

Закон за разпределение kn_x(v)магнитуд I 7 има формата, показана на фиг. 14.4.1.

Ориз. 14.4.1

Възниква въпросът: как да изберем интервала / p? Ако законът за разпределение на величината Vбеше симетричен (като нормалния закон или разпределението на Стюдънт), би било естествено интервалът /p да се приеме за симетричен по отношение на математическото очакване. В случая законът k p_x (v)асиметричен. Нека се съгласим да изберем интервала /p, така че вероятността стойността да бъде Vотвъд интервала отдясно и отляво (защриховани области на фиг. 14.4.1) бяха еднакви и равни

За да конструираме интервал /p с това свойство, използваме таблицата. 4 приложения: съдържа числа y)такова, че

за стойността V,с x 2 -разпределение с r степени на свобода. В нашия случай r = n- 1. Да се ​​оправим r = n- 1 и намерете в съответния ред на таблицата. 4 две значения х 2 -едното съответства на вероятността, другото - вероятност Нека ги обозначим

стойности на 2И xl?Интервалът има y 2,с лявата си страна и y~десен край.

Сега нека намерим от интервала / p желания доверителен интервал /|, за дисперсията с граници D и D2,който покрива точката дс вероятност p:

Нека построим интервал / (, = (?> ь А), който покрива точката дако и само ако стойността Vпопада в интервала /r. Нека покажем, че интервалът

удовлетворява това условие. Наистина неравенствата са еквивалентни на неравенства

и тези неравенства са изпълнени с вероятност p. Така доверителният интервал за дисперсията е намерен и се изразява с формула (14.4.13).

Пример 3. Намерете доверителния интервал за дисперсията при условията на пример 2 от подраздел 14.3, ако е известно, че стойността хнормално разпределени.

Решение.Ние имаме . Съгласно таблица 4 от прил

намираме при r = n - 1 = 19

Използвайки формула (14.4.13) намираме доверителния интервал за дисперсията

Съответният интервал за стандартното отклонение е (0,21; 0,32). Този интервал само малко надвишава интервала (0,21; 0,29), получен в пример 2 на подраздел 14.3, използвайки приблизителния метод.

  • Фигура 14.3.1 разглежда доверителен интервал, симетричен относно a. Като цяло, както ще видим по-късно, това не е необходимо.
КАТЕГОРИИ

ПОПУЛЯРНИ СТАТИИ

2023 “kingad.ru” - ултразвуково изследване на човешки органи