Deoarece noua variabilă este distribuită în mod normal, limitele inferioare și superioare ale intervalului de încredere de 95% pentru variabila φ vor fi φ-1,96 și φ+1,96 stânga">

În loc de 1,96 pentru probe mici, se recomandă înlocuirea valorii t cu N – 1 grade de libertate. Această metodă nu produce valori negative și permite estimări mai precise ale intervalelor de încredere pentru frecvențe decât metoda Wald. În plus, este descris în multe cărți interne de referință privind statistica medicală, ceea ce, totuși, nu a condus la utilizarea sa pe scară largă în cercetarea medicală. Calcularea intervalelor de încredere folosind transformarea unghiulară nu este recomandată pentru frecvențele care se apropie de 0 sau 1.

Aici se termină de obicei descrierea metodelor de estimare a intervalelor de încredere în majoritatea cărților despre bazele statisticii pentru cercetătorii medicali, iar această problemă este tipică nu numai pentru literatura națională, ci și pentru literatura străină. Ambele metode se bazează pe teorema limită centrală, care implică un eșantion mare.

Ținând cont de neajunsurile estimării intervalelor de încredere folosind metodele de mai sus, Clopper și Pearson au propus în 1934 o metodă de calcul a așa-numitului interval de încredere exact, având în vedere distribuția binomială a trăsăturii studiate. Această metodă este disponibilă în multe calculatoare online, dar intervalele de încredere obținute astfel sunt în majoritatea cazurilor prea largi. În același timp, această metodă este recomandată pentru utilizare în cazurile în care este necesară o evaluare conservatoare. Gradul de conservativitate al metodei crește pe măsură ce dimensiunea eșantionului scade, mai ales când N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Potrivit multor statisticieni, cea mai optimă evaluare a intervalelor de încredere pentru frecvențe este realizată prin metoda Wilson, propusă încă din 1927, dar practic neutilizată în cercetarea biomedicală internă. Această metodă nu numai că permite estimarea intervalelor de încredere atât pentru frecvențe foarte mici, cât și pentru frecvențe foarte mari, dar este și aplicabilă pentru un număr mic de observații. În general, intervalul de încredere conform formulei lui Wilson are forma

Care este probabilitatea intervalului de încredere. Interval de încredere

Inteligența constă nu numai în cunoaștere, ci și în capacitatea de a aplica cunoștințele în practică. (Aristotel)

Intervale de încredere

revizuire generală

Luând un eșantion din populație, obținem o estimare punctuală a parametrului de interes și calculăm eroarea standard pentru a indica precizia estimării.

Cu toate acestea, pentru majoritatea cazurilor, eroarea standard ca atare nu este acceptabilă. Este mult mai util să combinați această măsură de precizie cu o estimare de interval pentru parametrul populației.

Acest lucru se poate face prin utilizarea cunoștințelor distribuției teoretice de probabilitate a statisticii (parametrului) eșantionului pentru a calcula un interval de încredere (CI - Intervalul de încredere, CI - Intervalul de încredere) pentru parametru.

În general, un interval de încredere extinde estimările în ambele direcții cu un anumit multiplu al erorii standard (a unui parametru dat); cele două valori (limitele de încredere) care definesc intervalul sunt de obicei separate prin virgulă și cuprinse între paranteze.

Interval de încredere pentru medie

Folosind distribuția normală

Media eșantionului este distribuită în mod normal dacă dimensiunea eșantionului este mare, astfel încât să puteți aplica cunoștințele despre distribuția normală atunci când luați în considerare media eșantionului.

Mai exact, 95% din distribuția mediilor eșantionului se află în 1,96 deviații standard (SD) față de media populației.

Când avem doar un eșantion, îl numim eroarea standard a mediei (SEM) și calculăm intervalul de încredere de 95% pentru medie după cum urmează:

Dacă repetăm ​​acest experiment de mai multe ori, intervalul va conține media reală a populației în 95% din timp.

De obicei, acesta este un interval de încredere, cum ar fi intervalul de valori în care se află media reală a populației (media generală) cu o probabilitate de încredere de 95%.

Deși nu este în întregime riguros (media populației este o valoare fixă ​​și, prin urmare, nu poate avea o probabilitate atașată) să interpretăm un interval de încredere în acest fel, este conceptual mai ușor de înțeles.

Utilizare t- distributie

Puteți folosi distribuția normală dacă cunoașteți valoarea varianței în populație. De asemenea, atunci când dimensiunea eșantionului este mică, media eșantionului urmează o distribuție normală dacă datele populației subiacente sunt distribuite normal.

Dacă datele care stau la baza populației nu sunt distribuite în mod normal și/sau varianța populației este necunoscută, media eșantionului se supune Distribuția t a studentului.

Calculăm intervalul de încredere de 95% pentru media populației generale după cum urmează:

Unde este punctul procentual (percentila) t- Distribuția t a lui Student cu (n-1) grade de libertate, care dă o probabilitate cu două fețe de 0,05.

În general, oferă o gamă mai largă decât utilizarea distribuției normale deoarece ia în considerare incertitudinea suplimentară introdusă prin estimarea abaterii standard a populației și/sau datorită dimensiunii reduse a eșantionului.

Când dimensiunea eșantionului este mare (de ordinul a 100 sau mai mult), diferența dintre cele două distribuții ( t-Studentși normal) este nesemnificativă. Cu toate acestea, ele folosesc întotdeauna t- distribuția la calcularea intervalelor de încredere, chiar dacă dimensiunea eșantionului este mare.

De obicei este raportat IC de 95%. Alte intervale de încredere pot fi calculate, cum ar fi IC 99% pentru medie.

În loc de produsul erorii standard și valoarea tabelului t- distribuția, care corespunde unei probabilități cu două fețe de 0,05, înmulțiți-o (eroarea standard) cu valoarea care corespunde unei probabilități cu două fețe de 0,01. Acesta este un interval de încredere mai larg decât intervalul de încredere de 95%, deoarece reflectă o încredere crescută că intervalul include de fapt media populației.

Interval de încredere pentru proporție

Distribuția de eșantionare a proporțiilor are o distribuție binomială. Cu toate acestea, dacă dimensiunea eșantionului n este rezonabil de mare, atunci distribuția de eșantionare a proporției este aproximativ normală cu media .

Evaluăm prin raport selectiv p=r/n(Unde r- numărul de indivizi din eșantion cu trăsăturile caracteristice care ne interesează), iar eroarea standard este estimată:

Intervalul de încredere de 95% pentru proporție este estimat:

Dacă dimensiunea eșantionului este mică (de obicei când n.p. sau n(1-p) Mai puțin 5 ), atunci este necesar să se utilizeze distribuția binomială pentru a calcula intervalele de încredere precise.

Rețineți că dacă p exprimat ca procent, atunci (1-p) inlocuit de (100-p).

Interpretarea intervalelor de încredere

Când interpretăm un interval de încredere, ne interesează următoarele întrebări:

Cât de larg este intervalul de încredere?

Un interval larg de încredere indică faptul că estimarea este imprecisă; îngust indică o estimare precisă.

Lățimea intervalului de încredere depinde de mărimea erorii standard, care, la rândul său, depinde de dimensiunea eșantionului și, atunci când se ia în considerare o variabilă numerică, variabilitatea datelor produce intervale de încredere mai largi decât studiile unui set mare de date cu puține variabile. .

CI include valori de interes deosebit?

Puteți verifica dacă valoarea probabilă pentru un parametru de populație se încadrează în intervalul de încredere. Dacă da, rezultatele sunt în concordanță cu această valoare probabilă. Dacă nu, atunci este puțin probabil (pentru un interval de încredere de 95% șansa este de aproape 5%) ca parametrul să aibă acea valoare.

„Katren-Style” continuă publicarea seriei lui Konstantin Kravchik despre statistica medicală. În două articole anterioare, autorul s-a ocupat de explicarea unor concepte precum și.

Constantin Kravcik

Matematician-analist. Specialist în cercetare statistică în medicină și științe umaniste

Orașul Moscova

Foarte des în articolele despre studii clinice puteți găsi o frază misterioasă: „interval de încredere” (95 % CI sau 95 % CI - interval de încredere). De exemplu, un articol ar putea scrie: „Pentru a evalua semnificația diferențelor, a fost folosit testul t Student pentru a calcula intervalul de încredere de 95 %”.

Care este valoarea „intervalului de încredere 95 %” și de ce să-l calculăm?

Ce este un interval de încredere? - Acesta este intervalul în care adevărata populație înseamnă minciună. Există medii „neadevărate”? Într-un fel, da, o fac. Am explicat că este imposibil să se măsoare un parametru de interes în întreaga populație, așa că cercetătorii se mulțumesc cu un eșantion limitat. În acest eșantion (de exemplu, pe baza greutății corporale) există o valoare medie (o anumită greutate), după care judecăm valoarea medie în întreaga populație. Cu toate acestea, este puțin probabil ca greutatea medie dintr-un eșantion (în special unul mic) să coincidă cu ponderea medie în populația generală. Prin urmare, este mai corect să se calculeze și să se utilizeze intervalul de valori medii ale populației.

De exemplu, imaginați-vă că intervalul de încredere de 95% (IC 95%) pentru hemoglobină este de 110 până la 122 g/L. Aceasta înseamnă că există o șansă de 95% ca valoarea medie reală a hemoglobinei în populație să fie între 110 și 122 g/L. Cu alte cuvinte, nu cunoaștem valoarea medie a hemoglobinei în populație, dar putem, cu o probabilitate de 95 %, să indicăm o gamă de valori pentru această trăsătură.

Intervalele de încredere sunt deosebit de relevante pentru diferențele de medii între grupuri sau mărimea efectului, așa cum sunt numite.

Să presupunem că am comparat eficiența a două preparate de fier: unul care este pe piață de mult timp și unul care tocmai a fost înregistrat. După cursul terapiei, am evaluat concentrația de hemoglobină în loturile de pacienți studiate, iar programul statistic a calculat că diferența dintre valorile medii ale celor două loturi a fost, cu o probabilitate de 95 %, în intervalul de la 1,72 la 14,36 g/l (Tabelul 1).

Masa 1. Testare pentru mostre independente
(grupurile sunt comparate în funcție de nivelul hemoglobinei)

Acest lucru ar trebui interpretat după cum urmează: la unii pacienți din populația generală care iau un medicament nou, hemoglobina va fi mai mare în medie cu 1,72-14,36 g/l decât la cei care au luat un medicament deja cunoscut.

Cu alte cuvinte, în populația generală, diferența de valori medii ale hemoglobinei între grupuri este în aceste limite cu o probabilitate de 95%. Va rămâne la latitudinea cercetătorului să judece dacă este mult sau puțin. Ideea tuturor acestor lucruri este că nu lucrăm cu o valoare medie, ci cu o gamă de valori, prin urmare, estimăm mai fiabil diferența unui parametru între grupuri.

În pachetele statistice, la discreția cercetătorului, puteți îngusta sau extinde în mod independent granițele intervalului de încredere. Prin scăderea probabilităților intervalului de încredere, restrângem intervalul de medii. De exemplu, la 90 % CI intervalul de medii (sau diferența de medii) va fi mai restrâns decât la 95 %.

În schimb, creșterea probabilității la 99 % extinde gama de valori. Când se compară grupuri, limita inferioară a CI poate depăși marcajul zero. De exemplu, dacă am extins limitele intervalului de încredere la 99 %, atunci limitele intervalului au variat între –1 și 16 g/l. Aceasta înseamnă că în populația generală există grupuri, diferența de medii între care pentru caracteristica studiată este egală cu 0 (M = 0).

Folosind un interval de încredere, puteți testa ipotezele statistice. Dacă intervalul de încredere depășește valoarea zero, atunci ipoteza nulă, care presupune că grupurile nu diferă în funcție de parametrul studiat, este adevărată. Exemplul este descris mai sus în care am extins limitele la 99 %. Undeva în populația generală am găsit grupuri care nu diferă în niciun fel.

Interval de încredere de 95% al ​​diferenței de hemoglobină, (g/l)


Figura arată intervalul de încredere de 95% pentru diferența dintre valorile medii ale hemoglobinei dintre cele două grupuri. Linia trece prin marcajul zero, prin urmare există o diferență între mediile lui zero, ceea ce confirmă ipoteza nulă că grupurile nu diferă. Intervalul de diferență dintre grupuri este de la –2 la 5 g/L. Aceasta înseamnă că hemoglobina poate fie să scadă cu 2 g/L, fie să crească cu 5 g/L.

Intervalul de încredere este un indicator foarte important. Datorită acesteia, puteți vedea dacă diferențele dintre grupuri s-au datorat într-adevăr diferenței de medii sau datorită unui eșantion mare, deoarece la un eșantion mare șansele de a găsi diferențe sunt mai mari decât la unul mic.

În practică ar putea arăta așa. Am luat un eșantion de 1000 de persoane, am măsurat nivelurile de hemoglobină și am constatat că intervalul de încredere pentru diferența de medii a variat între 1,2 și 1,5 g/l. Nivelul semnificației statistice în acest caz p

Vedem că concentrația de hemoglobină a crescut, dar aproape imperceptibil, prin urmare, semnificația statistică a apărut tocmai datorită dimensiunii eșantionului.

Intervalele de încredere pot fi calculate nu numai pentru medii, ci și pentru proporții (și rapoarte de risc). De exemplu, ne interesează intervalul de încredere al proporțiilor de pacienți care au obținut remisie în timp ce luau un medicament dezvoltat. Să presupunem că 95 % CI pentru proporții, adică pentru proporția de astfel de pacienți, se află în intervalul 0,60-0,80. Astfel, putem spune că medicamentul nostru are un efect terapeutic în 60 până la 80 % din cazuri.

Orice eșantion oferă doar o idee aproximativă a populației generale, iar toate caracteristicile statistice ale eșantionului (medie, mod, varianță...) sunt o aproximare sau spunem o estimare a parametrilor generali, care în majoritatea cazurilor nu sunt posibile de calculat datorită la inaccesibilitatea populaţiei generale (Figura 20) .

Figura 20. Eroare de eșantionare

Dar se poate preciza intervalul în care se află, cu un anumit grad de probabilitate, valoarea adevărată (generală) a caracteristicii statistice. Acest interval se numește d interval de încredere (IC).

Deci, valoarea medie generală cu o probabilitate de 95% se află în interior

de la până la, (20)

Unde t – valoarea de tabel a testului Student pentru α =0,05 și f= n-1

Un CI de 99% poate fi găsit, de asemenea, în acest caz t selectat pentru α =0,01.

Care este semnificația practică a unui interval de încredere?

    Un interval larg de încredere indică faptul că media eșantionului nu reflectă cu acuratețe media populației. Acest lucru se datorează de obicei unei dimensiuni insuficiente a eșantionului sau eterogenității acestuia, de exemplu. dispersie mare. Ambele dau o eroare mai mare a mediei și, în consecință, un CI mai larg. Și aceasta este baza pentru revenirea la etapa de planificare a cercetării.

    Limitele superioare și inferioare ale CI oferă o estimare a faptului dacă rezultatele vor fi semnificative clinic

Să ne oprim în detaliu asupra chestiunii semnificației statistice și clinice a rezultatelor studiului proprietăților grupului. Să ne amintim că sarcina statisticilor este de a detecta cel puțin unele diferențe în populațiile generale pe baza datelor eșantionului. Provocarea pentru clinicieni este de a detecta diferențele (nu oricare) care vor ajuta la diagnostic sau tratament. Iar concluziile statistice nu sunt întotdeauna la baza concluziilor clinice. Astfel, o scădere semnificativă statistic a hemoglobinei cu 3 g/l nu este un motiv de îngrijorare. Și, invers, dacă vreo problemă din corpul uman nu este răspândită la nivelul întregii populații, acesta nu este un motiv pentru a nu face față acestei probleme.

Să ne uităm la această situație exemplu.

Cercetătorii s-au întrebat dacă băieții care au suferit de vreun fel de boală infecțioasă sunt în urmă față de semenii lor în creștere. În acest scop, s-a realizat un studiu tip eșantion la care au participat 10 băieți care suferiseră de această boală. Rezultatele sunt prezentate în Tabelul 23.

Tabelul 23. Rezultatele prelucrărilor statistice

limita inferioara

Limita superioară

Standarde (cm)

in medie

Din aceste calcule rezultă că înălțimea medie a eșantionului a băieților de 10 ani care au suferit de vreo boală infecțioasă este aproape de normal (132,5 cm). Cu toate acestea, limita inferioară a intervalului de încredere (126,6 cm) indică faptul că există o probabilitate de 95% ca înălțimea medie adevărată a acestor copii să corespundă conceptului de „înălțime mică”, adică. acești copii sunt pipernici.

În acest exemplu, rezultatele calculelor intervalului de încredere sunt semnificative clinic.

INTERVALE DE ÎNCREDERE PENTRU FRECVENȚE ȘI FRACȚII

© 2008

Institutul Național de Sănătate Publică, Oslo, Norvegia

Articolul descrie și discută calculul intervalelor de încredere pentru frecvențe și proporții folosind metodele Wald, Wilson, Clopper - Pearson, folosind transformarea unghiulară și metoda Wald cu corecția Agresti - Coull. Materialul prezentat oferă informații generale despre metodele de calculare a intervalelor de încredere pentru frecvențe și proporții și are scopul de a trezi interesul cititorilor de reviste nu numai pentru utilizarea intervalelor de încredere în prezentarea rezultatelor propriilor cercetări, ci și pentru citirea literaturii de specialitate înainte de a începe munca. asupra viitoarelor publicații.

Cuvinte cheie: interval de încredere, frecvență, proporție

Una dintre publicațiile anterioare a menționat pe scurt descrierea datelor calitative și a raportat că estimarea intervalului acestora este preferabilă estimării punctuale pentru descrierea frecvenței de apariție a caracteristicii studiate în populație. Într-adevăr, întrucât cercetarea este efectuată folosind date eșantionate, proiecția rezultatelor asupra populației trebuie să conțină un element de imprecizie a eșantionării. Intervalul de încredere este o măsură a acurateței parametrului estimat. Este interesant că unele cărți despre statistici de bază pentru medici ignoră complet subiectul intervalelor de încredere pentru frecvențe. În acest articol vom analiza mai multe moduri de a calcula intervalele de încredere pentru frecvențe, implicând astfel de caracteristici ale eșantionului precum nerepetiția și reprezentativitatea, precum și independența observațiilor unele față de altele. În acest articol, frecvența este înțeleasă nu ca un număr absolut care arată de câte ori apare o anumită valoare în agregat, ci ca o valoare relativă care determină proporția de participanți la studiu la care apare caracteristica studiată.

În cercetarea biomedicală, intervalele de încredere de 95% sunt cel mai frecvent utilizate. Acest interval de încredere este zona în care proporția reală se încadrează în 95% din timp. Cu alte cuvinte, putem spune cu o fiabilitate de 95% că adevărata valoare a frecvenței de apariție a unei trăsături în populație va fi în intervalul de încredere de 95%.

Majoritatea manualelor de statistică pentru cercetătorii medicali raportează că eroarea de frecvență este calculată folosind formula

unde p este frecvența de apariție a caracteristicii în eșantion (valoare de la 0 la 1). Majoritatea articolelor științifice interne indică frecvența de apariție a unei trăsături într-un eșantion (p), precum și eroarea (e) acesteia sub forma p ± s. Este mai indicat, însă, să se prezinte un interval de încredere de 95% pentru frecvența de apariție a unei trăsături în populație, care va include valori de la

inainte de.

Unele manuale recomandă ca pentru eșantioane mici să înlocuiți valoarea de 1,96 cu valoarea lui t pentru N – 1 grade de libertate, unde N este numărul de observații din eșantion. Valoarea t este găsită din tabelele pentru distribuția t, disponibile în aproape toate manualele de statistică. Utilizarea distribuției t pentru metoda Wald nu oferă avantaje vizibile în comparație cu alte metode discutate mai jos și, prin urmare, nu este recomandată de unii autori.

Metoda prezentată mai sus pentru calcularea intervalelor de încredere pentru frecvențe sau proporții este numită Wald în onoarea lui Abraham Wald (1902–1950), deoarece utilizarea sa pe scară largă a început după publicarea lui Wald și Wolfowitz în 1939. Cu toate acestea, metoda în sine a fost propusă de Pierre Simon Laplace (1749–1827) încă din 1812.

Metoda Wald este foarte populară, dar aplicarea ei este asociată cu probleme semnificative. Metoda nu este recomandată pentru eșantioane de dimensiuni mici, precum și în cazurile în care frecvența de apariție a unei caracteristici tinde spre 0 sau 1 (0% sau 100%) și este pur și simplu imposibilă pentru frecvențele de 0 și 1. În plus, aproximarea distribuției normale, care este utilizată la calcularea erorii, „nu funcționează” în cazurile în care n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.



unde ia valoarea 1,96 la calcularea intervalului de încredere de 95%, N este numărul de observații, iar p este frecvența de apariție a caracteristicii în eșantion. Această metodă este disponibilă în calculatoarele online, astfel încât utilizarea sa nu este problematică. și nu recomandăm utilizarea acestei metode pentru n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Pe lângă metoda Wilson, se crede că metoda Wald cu corecție Agresti-Coll oferă o estimare optimă a intervalului de încredere pentru frecvențe. Corecția Agresti-Coll este o înlocuire în formula Wald a frecvenței de apariție a unei caracteristici într-un eșantion (p) cu p`, la calculul care 2 se adaugă la numărător și 4 se adaugă la numitor, adică p` = (X + 2) / (N + 4), unde X este numărul de participanți la studiu care au caracteristica studiată și N este dimensiunea eșantionului. Această modificare produce rezultate foarte asemănătoare cu formula lui Wilson, cu excepția cazului în care frecvența evenimentelor se apropie de 0% sau 100% și eșantionul este mic. Pe lângă metodele de mai sus pentru calcularea intervalelor de încredere pentru frecvențe, au fost propuse corecții de continuitate atât pentru metodele Wald, cât și pentru cele Wilson pentru eșantioane mici, dar studiile au arătat că utilizarea lor este inadecvată.

Să luăm în considerare aplicarea metodelor de mai sus pentru calcularea intervalelor de încredere folosind două exemple. În primul caz, studiem un eșantion mare de 1.000 de participanți la studiu selectați aleatoriu, dintre care 450 au trăsătura studiată (aceasta ar putea fi un factor de risc, un rezultat sau orice altă trăsătură), reprezentând o frecvență de 0,45 sau 45. %. În al doilea caz, studiul se desfășoară folosind un eșantion mic, să zicem, doar 20 de persoane și doar 1 participant la studiu (5%) are trăsătura studiată. Intervalele de încredere folosind metoda Wald, metoda Wald cu corecție Agresti–Coll și metoda Wilson au fost calculate folosind un calculator online dezvoltat de Jeff Sauro (http://www. /wald. htm). Intervalele de încredere corectate ale lui Wilson au fost calculate utilizând calculatorul furnizat de Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Calculele de transformare Angular Fisher au fost efectuate manual folosind valoarea critică t pentru 19 și, respectiv, 999 de grade de libertate. Rezultatele calculului sunt prezentate în tabel pentru ambele exemple.

Intervalele de încredere calculate în șase moduri diferite pentru două exemple descrise în text

Metoda de calcul a intervalului de încredere

P=0,0500 sau 5%

95% CI pentru X=450, N=1000, P=0,4500 sau 45%

–0,0455–0,2541

Wald cu corectie Agresti–Coll

<,0001–0,2541

Wilson cu corecție de continuitate

„metoda exactă” Clopper-Pearson

Transformare unghiulară

<0,0001–0,1967

După cum se poate observa din tabel, pentru primul exemplu intervalul de încredere calculat folosind metoda Wald „general acceptată” intră în regiunea negativă, ceea ce nu poate fi cazul frecvențelor. Din păcate, astfel de incidente nu sunt neobișnuite în literatura rusă. Modul tradițional de prezentare a datelor în termeni de frecvență și eroarea acesteia maschează parțial această problemă. De exemplu, dacă frecvența de apariție a unei trăsături (în procente) este prezentată ca 2,1 ± 1,4, atunci aceasta nu este la fel de „ofensivă pentru ochi” ca 2,1% (IC 95%: -0,7; 4,9), deși și înseamnă același lucru. Metoda Wald cu corecția Agresti–Coll și calculul folosind transformarea unghiulară oferă o limită inferioară care tinde spre zero. Metoda lui Wilson corectată în funcție de continuitate și „metoda exactă” produc intervale de încredere mai largi decât metoda lui Wilson. Pentru al doilea exemplu, toate metodele dau aproximativ aceleași intervale de încredere (diferențele apar doar în miimi), ceea ce nu este surprinzător, deoarece frecvența de apariție a evenimentului din acest exemplu nu este mult diferită de 50%, iar dimensiunea eșantionului este destul de mare.

Pentru cititorii interesați de această problemă, le putem recomanda lucrările lui R. G. Newcombe și Brown, Cai și Dasgupta, care oferă avantajele și dezavantajele utilizării a 7 și, respectiv, 10 metode diferite pentru calcularea intervalelor de încredere. Dintre manualele interne, recomandăm cartea și, care, pe lângă o descriere detaliată a teoriei, prezintă metodele lui Wald și Wilson, precum și o metodă de calcul a intervalelor de încredere ținând cont de distribuția binomială a frecvenței. Pe lângă calculatoarele online gratuite (http://www. /wald. htm și http://faculty. vassar. edu/lowry/prop1.html), intervalele de încredere pentru frecvențe (și nu numai!) pot fi calculate folosind Programul CIA (Confidence Intervals Analysis), care poate fi descărcat de pe http://www. scoala medicala. soton. ac. uk/cia/ .

Următorul articol va analiza modalități univariate de a compara datele calitative.

Bibliografie

Banerji A. Statistica medicală în limbaj clar: un curs introductiv / A. Banerjee. – M.: Medicină practică, 2007. – 287 p. Statistici medicale / . – M.: Agenția de Informații Medicale, 2007. – 475 p. Glanz S. Statistică medicală şi biologică / S. Glanz. – M.: Praktika, 1998. Tipuri de date, testare de distribuție și statistică descriptivă // Ecologie umană – 2008. – Nr. 1. – P. 52–58. Zhizhin K. S.. Statistici medicale: manual / . – Rostov n/d: Phoenix, 2007. – 160 p. Statistici medicale aplicate / , . - St.Petersburg. : Foliot, 2003. – 428 p. Lakin G. F. Biometrie / . – M.: Şcoala superioară, 1990. – 350 p. Medicul V. A. Statistica matematică în medicină / , . – M.: Finanțe și Statistică, 2007. – 798 p. Statistica matematică în cercetarea clinică / , . – M.: GEOTAR-MED, 2001. – 256 p. Junkerov V. ȘI. Prelucrarea medicala si statistica a datelor de cercetare medicala / , . - St.Petersburg. : VmedA, 2002. – 266 p. Agresti A. Aproximat este mai bine decât exact pentru estimarea pe intervale a proporțiilor binomiale / A. Agresti, B. Coull // Statistician american. – 1998. – N 52. – P. 119–126. Altman D. Statistici cu încredere // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – Londra: BMJ Books, 2000. – 240 p. Brown L.D. Estimarea intervalului pentru o proporție binomială / L. D. Brown, T. T. Cai, A. Dasgupta // Statistical science. – 2001. – N 2. – P. 101–133. Clopper C.J. Utilizarea limitelor de încredere sau fiduciale ilustrate în cazul binomului / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – N 26. – P. 404–413. Garcia-Perez M.A. Despre intervalul de încredere pentru parametrul binom / M. A. Garcia-Perez // Calitate și cantitate. – 2005. – N 39. – P. 467–481. Motulsky H. Biostatistică intuitivă // H. Motulsky. – Oxford: Oxford University Press, 1995. – 386 p. Newcombe R. G. Intervale de încredere pe două părți pentru o singură proporție: comparație a șapte metode / R. G. Newcombe // Statistics in Medicine. – 1998. – N. 17. – P. 857–872. Sauro J. Estimarea ratelor de finalizare din eșantioane mici folosind intervale de încredere binomiale: comparații și recomandări / J. Sauro, J. R. Lewis // Proceedings of the human factors and ergonomics society annual meeting. – Orlando, FL, 2005. Wald A. Limite de încredere pentru funcțiile de distribuție continuă // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. – 1939. – N 10. – P. 105–118. Wilson E.B. Inferență probabilă, legea succesiunii și inferență statistică / E. B. Wilson // Journal of American Statistical Association. – 1927. – N 22. – P. 209–212.

INTERVALE DE ÎNCREDERE PENTRU PROPORȚII

A. M. Grjibovski

Institutul Național de Sănătate Publică, Oslo, Norvegia

Articolul prezintă mai multe metode de calcul a intervalelor de încredere pentru proporții binomiale, și anume, metodele Wald, Wilson, arcsinus, Agresti-Coull și exacte Clopper-Pearson. Lucrarea oferă doar o introducere generală a problemei estimării intervalului de încredere a unei proporții binomiale și scopul său este nu numai de a stimula cititorii să folosească intervalele de încredere atunci când prezintă rezultatele propriilor cercetări empirice, ci și de a-i încuraja să consulte cărți de statistică. înainte de a analiza propriile date și de a pregăti manuscrise.

Cuvinte cheie: interval de încredere, proporție

Informații de contact:

Consilier principal, Institutul Național de Sănătate Publică, Oslo, Norvegia

În subsecțiunile anterioare am luat în considerare problema estimării unui parametru necunoscut A un numar. Aceasta se numește estimare „punctară”. Într-o serie de sarcini, nu trebuie doar să găsiți parametrul A valoare numerică adecvată, dar și pentru a evalua acuratețea și fiabilitatea acesteia. Trebuie să știți la ce erori poate duce la înlocuirea unui parametru A estimarea sa punctuală Ași cu ce grad de încredere ne putem aștepta ca aceste erori să nu depășească limitele cunoscute?

Problemele de acest fel sunt deosebit de relevante cu un număr mic de observații, atunci când estimarea punctuală si in este în mare parte aleatorie și înlocuirea aproximativă a lui a cu a poate duce la erori grave.

Pentru a da o idee despre acuratețea și fiabilitatea estimării A,

În statistica matematică se folosesc așa-numitele intervale de încredere și probabilități de încredere.

Lăsați pentru parametru A estimare imparțială obținută din experiență A. Dorim să estimăm eroarea posibilă în acest caz. Să atribuim o probabilitate p suficient de mare (de exemplu, p = 0,9, 0,95 sau 0,99) astfel încât un eveniment cu probabilitatea p poate fi considerat practic de încredere și să găsim o valoare s pentru care

Apoi, gama de valori practic posibile ale erorii apărute în timpul înlocuirii A pe A, va fi ± s; Erorile mari în valoare absolută vor apărea numai cu o probabilitate mică a = 1 - p. Să rescriem (14.3.1) ca:

Egalitatea (14.3.2) înseamnă că cu probabilitatea p valoarea necunoscută a parametrului A se încadrează în interval

Este necesar să rețineți o circumstanță. Anterior, am luat în considerare în mod repetat probabilitatea ca o variabilă aleatoare să se încadreze într-un interval nealeatoriu dat. Aici situația este alta: amploarea A nu este aleatoriu, dar intervalul / p este aleatoriu. Poziția sa pe axa x este aleatorie, determinată de centrul său A; În general, lungimea intervalului 2s este de asemenea aleatorie, deoarece valoarea lui s este calculată, de regulă, din date experimentale. Prin urmare, în acest caz, ar fi mai bine să interpretăm valoarea p nu ca probabilitatea de a „lovi” punctul Aîn intervalul / p și ca probabilitatea ca un interval aleator / p să acopere punctul A(Fig. 14.3.1).

Orez. 14.3.1

Probabilitatea p este de obicei numită probabilitatea de încredere, și interval / p - interval de încredere. Limite de interval Dacă. a x =a- s și a 2 = a +și sunt chemați limitele de încredere.

Să dăm o altă interpretare conceptului de interval de încredere: acesta poate fi considerat ca un interval de valori ale parametrilor A, compatibile cu datele experimentale și necontrazicându-le. Într-adevăr, dacă suntem de acord să considerăm un eveniment cu probabilitatea a = 1-p practic imposibil, atunci acele valori ale parametrului a pentru care a - a> s trebuie recunoscute ca fiind contrazice ale datelor experimentale, iar cele pentru care |a - A a t na 2 .

Lăsați pentru parametru A există o estimare imparțială A. Dacă am cunoaște legea distribuției cantității A, sarcina de a găsi un interval de încredere ar fi foarte simplă: ar fi suficient să găsim o valoare s pentru care

Dificultatea este că legea distribuției estimărilor A depinde de legea de distribuție a cantității Xși, prin urmare, asupra parametrilor săi necunoscuți (în special, asupra parametrului însuși A).

Pentru a ocoli această dificultate, puteți utiliza următoarea tehnică aproximativ aproximativă: înlocuiți parametrii necunoscuți din expresia pentru s cu estimările lor punctuale. Cu un număr relativ mare de experimente P(aproximativ 20...30) această tehnică dă de obicei rezultate satisfăcătoare din punct de vedere al preciziei.

Ca exemplu, luați în considerare problema unui interval de încredere pentru așteptarea matematică.

Lasă-l să fie produs P X, ale căror caracteristici sunt așteptarea matematică T si varianta D- necunoscut. Pentru acești parametri s-au obținut următoarele estimări:

Este necesar să se construiască un interval de încredere / p corespunzător probabilității de încredere p pentru așteptarea matematică T cantități X.

Când rezolvăm această problemă, vom folosi faptul că cantitatea T reprezintă suma P variabile aleatoare independente distribuite identic X h iar conform teoremei limitei centrale, pentru un suficient de mare P legea sa de distribuție este aproape de normal. În practică, chiar și cu un număr relativ mic de termeni (aproximativ 10...20), legea de distribuție a sumei poate fi considerată aproximativ normală. Vom presupune că valoarea T distribuite conform legii normale. Caracteristicile acestei legi - așteptarea matematică și, respectiv, varianța - sunt egale TȘi

(a se vedea capitolul 13 subsecțiunea 13.3). Să presupunem că valoarea D cunoaştem şi vom găsi o valoare Ep pentru care

Folosind formula (6.3.5) din capitolul 6, exprimăm probabilitatea din partea stângă a (14.3.5) prin funcția de distribuție normală

unde este abaterea standard a estimării T.

Din Ec.

găsiți valoarea lui Sp:

unde arg Ф* (х) este funcția inversă a lui Ф* (X), acestea. o astfel de valoare a argumentului pentru care funcția de distribuție normală este egală cu X.

Dispersia D, prin care se exprimă cantitatea A 1P, nu știm exact; ca valoare aproximativă, puteți utiliza estimarea D(14.3.4) și puneți aproximativ:

Astfel, problema construirii unui interval de încredere a fost aproximativ rezolvată, care este egal cu:

unde gp este determinat prin formula (14.3.7).

Pentru a evita interpolarea inversă în tabelele funcției Ф* (l) atunci când se calculează s p, este convenabil să se întocmească un tabel special (Tabelul 14.3.1), care oferă valorile cantității

in functie de r. Valoarea (p determină pentru legea normală numărul de abateri standard care trebuie trasate la dreapta și la stânga din centrul dispersiei, astfel încât probabilitatea de a ajunge în zona rezultată să fie egală cu p.

Folosind valoarea 7 p, intervalul de încredere este exprimat astfel:

Tabelul 14.3.1

Exemplul 1. S-au efectuat 20 de experimente pe cantitate X; rezultatele sunt prezentate în tabel. 14.3.2.

Tabelul 14.3.2

Este necesar să se găsească o estimare din pentru așteptarea matematică a cantității Xși construiți un interval de încredere corespunzător probabilității de încredere p = 0,8.

Soluţie. Avem:

Alegând l: = 10 ca punct de referință, folosind a treia formulă (14.2.14) găsim estimarea nepărtinitoare D :

Conform tabelului 14.3.1 găsim

Limite de încredere:

Interval de încredere:

Valorile parametrilor T, situate în acest interval sunt compatibile cu datele experimentale date în tabel. 14.3.2.

Un interval de încredere pentru varianță poate fi construit într-un mod similar.

Lasă-l să fie produs P experimente independente pe o variabilă aleatorie X cu parametri necunoscuți atât pentru A cât și pentru dispersie D a fost obținută o estimare imparțială:

Este necesar să se construiască aproximativ un interval de încredere pentru varianță.

Din formula (14.3.11) este clar că cantitatea D reprezintă

Cantitate P variabile aleatorii de forma . Aceste valori nu sunt

independent, deoarece oricare dintre ele include cantitatea T, dependent de toți ceilalți. Cu toate acestea, se poate demonstra că odată cu creșterea P legea de distribuție a sumei lor se apropie și ea de normal. Aproape la P= 20...30 poate fi deja considerat normal.

Să presupunem că așa este și să găsim caracteristicile acestei legi: așteptarea și dispersia matematică. De la evaluare D- nepărtinitoare, atunci M[D] = D.

Calculul variației D D este asociat cu calcule relativ complexe, așa că vă prezentăm expresia fără derivare:

unde q 4 este al patrulea moment central al mărimii X.

Pentru a utiliza această expresie, trebuie să înlocuiți valorile \u003d 4 și D(cel putin cele apropiate). În loc de D poți folosi evaluarea lui D.În principiu, al patrulea moment central poate fi înlocuit și cu o estimare, de exemplu, o valoare de forma:

dar o astfel de înlocuire va oferi o precizie extrem de scăzută, deoarece, în general, cu un număr limitat de experimente, momentele de ordin înalt sunt determinate cu erori mari. Cu toate acestea, în practică se întâmplă adesea ca tipul de lege de distribuție a cantității X cunoscut dinainte: doar parametrii săi sunt necunoscuți. Apoi puteți încerca să exprimați μ 4 prin D.

Să luăm cel mai frecvent caz, când valoarea X distribuite conform legii normale. Apoi, al patrulea moment central al său este exprimat în termeni de dispersie (vezi Capitolul 6, subsecțiunea 6.2);

iar formula (14.3.12) dă sau

Înlocuirea necunoscutului în (14.3.14) D evaluarea lui D, obținem: de unde

Momentul μ 4 poate fi exprimat prin D de asemenea, în alte cazuri, când distribuirea valorii X nu este normal, dar aspectul ei este cunoscut. De exemplu, pentru legea densității uniforme (vezi capitolul 5) avem:

unde (a, P) este intervalul pe care este specificată legea.

Prin urmare,

Folosind formula (14.3.12) obținem: unde găsim aproximativ

În cazurile în care tipul legii de distribuție a mărimii 26 este necunoscut, atunci când se face o estimare aproximativă a valorii a/) se recomandă totuși folosirea formulei (14.3.16), cu excepția cazului în care există motive speciale pentru a crede că această lege este foarte diferit de cel normal (are o curtoză pozitivă sau negativă vizibilă) .

Dacă valoarea aproximativă a/) este obținută într-un fel sau altul, atunci putem construi un interval de încredere pentru varianță în același mod în care l-am construit pentru așteptarea matematică:

unde valoarea în funcţie de probabilitatea dată p se găseşte conform tabelului. 14.3.1.

Exemplul 2. Găsiți un interval de încredere de aproximativ 80% pentru varianța unei variabile aleatoare Xîn condiţiile exemplului 1, dacă se ştie că valoarea X distribuite după o lege apropiată de normal.

Soluţie. Valoarea rămâne aceeași ca în tabel. 14.3.1:

Conform formulei (14.3.16)

Folosind formula (14.3.18) găsim intervalul de încredere:

Intervalul corespunzător al valorilor abaterii standard: (0,21; 0,29).

14.4. Metode exacte de construire a intervalelor de încredere pentru parametrii unei variabile aleatoare distribuite conform unei legi normale

În subsecțiunea anterioară, am examinat metode aproximative aproximative pentru construirea intervalelor de încredere pentru așteptarea și varianța matematică. Aici vom da o idee despre metodele exacte pentru a rezolva aceeași problemă. Subliniem că pentru a găsi cu exactitate intervalele de încredere este absolut necesar să se cunoască în prealabil forma legii de distribuție a cantității. X,întrucât pentru aplicarea metodelor aproximative acest lucru nu este necesar.

Ideea unor metode precise pentru construirea intervalelor de încredere se rezumă la următoarele. Orice interval de încredere se găsește dintr-o condiție care exprimă probabilitatea îndeplinirii anumitor inegalități, care includ estimarea care ne interesează A. Legea distribuției evaluării Aîn cazul general depinde de parametrii necunoscuți ai cantității X. Cu toate acestea, uneori este posibil să treci inegalități dintr-o variabilă aleatoare A la o altă funcție a valorilor observate X p X 2, ..., X p. a cărui lege de distribuție nu depinde de parametri necunoscuți, ci depinde doar de numărul de experimente și de tipul legii de distribuție a cantității X. Aceste tipuri de variabile aleatoare joacă un rol important în statistica matematică; au fost studiate în cel mai detaliu pentru cazul unei distribuţii normale a cantităţii X.

De exemplu, s-a dovedit că cu o distribuție normală a valorii X valoare aleatorie

se supune așa-zisului Legea distribuirii studenților Cu P- 1 grad de libertate; densitatea acestei legi are forma

unde G(x) este funcția gamma cunoscută:

De asemenea, s-a dovedit că variabila aleatoare

are o „distribuție %2” cu P- 1 grad de libertate (vezi capitolul 7), a cărui densitate este exprimată prin formula

Fără să ne oprim asupra derivărilor distribuțiilor (14.4.2) și (14.4.4), vom arăta cum acestea pot fi aplicate la construirea intervalelor de încredere pentru parametri. ty D.

Lasă-l să fie produs P experimente independente pe o variabilă aleatorie X, distribuite în mod normal cu parametri necunoscuți LA. Pentru acești parametri s-au obținut estimări

Este necesar să se construiască intervale de încredere pentru ambii parametri corespunzători probabilității de încredere p.

Să construim mai întâi un interval de încredere pentru așteptarea matematică. Este firesc să luăm acest interval simetric în raport cu T; fie s p să desemnăm jumătate din lungimea intervalului. Valoarea s p trebuie aleasă astfel încât condiția să fie îndeplinită

Să încercăm să ne mutăm în partea stângă a egalității (14.4.5) din variabila aleatoare T la o variabilă aleatorie T, distribuite conform legii Studentului. Pentru a face acest lucru, înmulțiți ambele părți ale inegalității |m-w?|

printr-o valoare pozitivă: sau, folosind notația (14.4.1),

Să găsim un număr / p astfel încât valoarea / p poate fi găsită din condiție

Din formula (14.4.2) este clar că (1) este o funcție pară, prin urmare (14.4.8) dă

Egalitatea (14.4.9) determină valoarea / p în funcție de p. Daca aveti la dispozitie un tabel de valori integrale

atunci valoarea lui /p poate fi găsită prin interpolare inversă în tabel. Cu toate acestea, este mai convenabil să întocmești un tabel cu valorile /p în avans. Un astfel de tabel este prezentat în Anexă (Tabelul 5). Acest tabel prezintă valorile în funcție de nivelul de încredere p și de numărul de grade de libertate P- 1. După ce a determinat / p din tabel. 5 și presupunând

vom găsi jumătate din lățimea intervalului de încredere / p și intervalul în sine

Exemplul 1. S-au efectuat 5 experimente independente pe o variabilă aleatorie X, distribuite în mod normal cu parametri necunoscuți Tși despre. Rezultatele experimentelor sunt prezentate în tabel. 14.4.1.

Tabelul 14.4.1

Găsiți evaluare T pentru așteptarea matematică și construiți un interval de încredere de 90% / p pentru aceasta (adică intervalul corespunzător probabilității de încredere p = 0,9).

Soluţie. Avem:

Conform tabelului 5 al cererii pentru P - 1 = 4 și p = 0,9 găsim Unde

Intervalul de încredere va fi

Exemplul 2. Pentru condițiile exemplului 1 al subsecțiunii 14.3, presupunând valoarea X distribuite în mod normal, găsiți intervalul de încredere exact.

Soluţie. Conform tabelului 5 al anexei aflăm când P - 1 = 19ir =

0,8/p = 1,328; de aici

Comparând cu soluția exemplului 1 din subsecțiunea 14.3 (e p = 0,072), suntem convinși că discrepanța este foarte nesemnificativă. Dacă menținem acuratețea până la a doua zecimală, atunci intervalele de încredere găsite prin metoda exactă și cea aproximativă coincid:

Să trecem la construirea unui interval de încredere pentru varianță. Luați în considerare estimatorul de varianță imparțial

și exprimă variabila aleatoare D prin magnitudine V(14.4.3), având distribuția x 2 (14.4.4):

Cunoașterea legii distribuției cantității V, puteți găsi intervalul /(1) în care se încadrează cu o probabilitate dată p.

Legea distribuției kn_x(v) magnitudinea I 7 are forma prezentată în Fig. 14.4.1.

Orez. 14.4.1

Apare întrebarea: cum să alegeți intervalul / p? Dacă legea distribuţiei mărimii V era simetric (ca legea normală sau distribuția Student), ar fi firesc să luăm intervalul /p simetric în raport cu așteptarea matematică. În acest caz legea k p_x (v) asimetric. Să fim de acord să alegem intervalul /p astfel încât probabilitatea ca valoarea să fie V dincolo de intervalul la dreapta și la stânga (zonele umbrite din Fig. 14.4.1) au fost aceleași și egale

Pentru a construi un interval /p cu această proprietate, folosim tabelul. 4 aplicații: conține numere y) astfel încât

pentru valoare V, având x 2 -distribuţie cu r grade de libertate. În cazul nostru r = n- 1. Să reparăm r = n- 1 și găsiți în rândul corespunzător al tabelului. 4 două sensuri x 2 - unul corespunzând probabilităţii celălalt - probabilitate Să le notăm pe acestea

valorile la 2Și xl? Intervalul are y 2, cu stânga, și y~ capătul drept.

Acum să găsim din intervalul / p intervalul de încredere dorit /|, pentru dispersia cu granițele D și D2, care acoperă punctul D cu probabilitatea p:

Să construim un interval / (, = (?> ь А) care acoperă punctul D dacă și numai dacă valoarea V se încadrează în intervalul /r. Să arătăm că intervalul

indeplineste aceasta conditie. Într-adevăr, inegalitățile sunt echivalente cu inegalitățile

iar aceste inegalități sunt satisfăcute cu probabilitatea p. Astfel, intervalul de încredere pentru varianță a fost găsit și este exprimat prin formula (14.4.13).

Exemplul 3. Găsiți intervalul de încredere pentru varianță în condițiile exemplului 2 din subsecțiunea 14.3, dacă se știe că valoarea X distribuite normal.

Soluţie. Avem . Conform tabelului 4 din anexa

găsim la r = n - 1 = 19

Folosind formula (14.4.13) găsim intervalul de încredere pentru varianță

Intervalul corespunzător pentru abaterea standard este (0,21; 0,32). Acest interval depășește doar puțin intervalul (0,21; 0,29) obținut în exemplul 2 din subsecțiunea 14.3 folosind metoda aproximativă.

  • Figura 14.3.1 consideră un interval de încredere simetric în jurul a. În general, așa cum vom vedea mai târziu, acest lucru nu este necesar.
CATEGORII

ARTICOLE POPULARE

2023 „kingad.ru” - examinarea cu ultrasunete a organelor umane