Keďže nová premenná je normálne rozdelená, dolná a horná hranica 95 % intervalu spoľahlivosti pre premennú φ bude φ-1,96 a φ+1,96 vľavo">

Namiesto 1,96 pre malé vzorky sa odporúča nahradiť hodnotu t za N - 1 stupňov voľnosti. Táto metóda nedáva záporné hodnoty a umožňuje presnejšie odhadnúť intervaly spoľahlivosti pre frekvencie ako Waldova metóda. Okrem toho je opísaný v mnohých domácich referenčných knihách o lekárskej štatistike, čo však neviedlo k jeho širokému použitiu v lekárskom výskume. Výpočet intervalov spoľahlivosti pomocou transformácie uhla sa neodporúča pre frekvencie blížiace sa k 0 alebo 1.

Tu popis metód na odhadovanie intervalov spoľahlivosti vo väčšine kníh o základoch štatistiky pre medicínskych výskumníkov zvyčajne končí a tento problém je typický nielen pre domácu, ale aj zahraničnú literatúru. Obe metódy sú založené na centrálnej limitnej vete, čo znamená veľkú vzorku.

Vzhľadom na nedostatky odhadu intervalov spoľahlivosti pomocou vyššie uvedených metód navrhli Clopper (Clopper) a Pearson (Pearson) v roku 1934 metódu na výpočet takzvaného presného intervalu spoľahlivosti, berúc do úvahy binomické rozdelenie študovaného znaku. Táto metóda je dostupná v mnohých online kalkulačkách, avšak takto získané intervaly spoľahlivosti sú vo väčšine prípadov príliš široké. Zároveň sa táto metóda odporúča použiť v prípadoch, keď je potrebný konzervatívny odhad. Stupeň konzervatívnosti metódy sa zvyšuje so znižovaním veľkosti vzorky, najmä pre N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Podľa mnohých štatistikov sa najoptimálnejší odhad intervalov spoľahlivosti pre frekvencie vykonáva Wilsonovou metódou, navrhnutou už v roku 1927, ale prakticky sa nepoužíva v domácom biomedicínskom výskume. Táto metóda nielenže umožňuje odhadnúť intervaly spoľahlivosti pre veľmi malé aj veľmi vysoké frekvencie, ale je použiteľná aj pre malý počet pozorovaní. Vo všeobecnosti má interval spoľahlivosti podľa Wilsonovho vzorca tvar od

Aká je pravdepodobnosť intervalu spoľahlivosti. Interval spoľahlivosti

Myseľ nie je len vo vedomostiach, ale aj v schopnosti aplikovať poznatky v praxi. (Aristoteles)

Intervaly spoľahlivosti

všeobecný prehľad

Odoberaním vzorky z populácie získame bodový odhad parametra, ktorý nás zaujíma, a vypočítame štandardnú chybu, aby sme naznačili presnosť odhadu.

Vo väčšine prípadov však štandardná chyba ako taká nie je prijateľná. Je oveľa užitočnejšie kombinovať túto mieru presnosti s intervalovým odhadom pre parameter populácie.

Dá sa to urobiť pomocou znalosti teoretickej pravdepodobnosti rozdelenia štatistiky vzorky (parametra) na výpočet intervalu spoľahlivosti (CI - interval spoľahlivosti, CI - interval spoľahlivosti) pre parameter.

Vo všeobecnosti interval spoľahlivosti rozširuje odhady v oboch smeroch o nejaký násobok štandardnej chyby (daného parametra); dve hodnoty (limity spoľahlivosti), ktoré definujú interval, sú zvyčajne oddelené čiarkou a uzavreté v zátvorkách.

Interval spoľahlivosti pre priemer

Použitie normálneho rozdelenia

Ak je veľkosť vzorky veľká, má výberová priemerná distribúciu normálnu distribúciu, takže znalosť normálnej distribúcie možno použiť pri zvažovaní priemernej vzorky.

Konkrétne, 95 % distribúcie priemeru vzorky je v rámci 1,96 štandardnej odchýlky (SD) priemeru populácie.

Keď máme iba jednu vzorku, nazývame to štandardná chyba priemeru (SEM) a vypočítame 95% interval spoľahlivosti pre priemer takto:

Ak sa tento experiment opakuje niekoľkokrát, potom bude interval obsahovať skutočný priemer populácie 95 % času.

Zvyčajne ide o interval spoľahlivosti, ako je rozsah hodnôt, v rámci ktorého skutočný priemer populácie (všeobecný priemer) leží s úrovňou spoľahlivosti 95 %.

Aj keď nie je celkom striktné (priemer populácie je pevná hodnota, a preto s ňou nemôže súvisieť pravdepodobnosť), interpretovať interval spoľahlivosti týmto spôsobom, je koncepčne ľahšie pochopiteľné.

Použitie t- distribúcia

Ak poznáte hodnotu rozptylu v populácii, môžete použiť normálne rozdelenie. Tiež, keď je veľkosť vzorky malá, priemer vzorky sleduje normálne rozdelenie, ak sú údaje, ktoré sú základom populácie, normálne rozdelené.

Ak údaje o populácii nie sú normálne rozdelené a/alebo všeobecný rozptyl (rozptyl populácie) nie je známy, priemer vzorky sa riadi Študentovo t-rozdelenie.

Vypočítajte 95 % interval spoľahlivosti pre priemer populácie takto:

Kde – percentuálny bod (percentil) t-Študentské rozdelenie s (n-1) stupňami voľnosti, ktoré dáva obojstrannú pravdepodobnosť 0,05.

Vo všeobecnosti poskytuje širší interval ako pri použití normálneho rozdelenia, pretože berie do úvahy dodatočnú neistotu, ktorá je zavedená odhadom štandardnej odchýlky populácie a/alebo v dôsledku malej veľkosti vzorky.

Keď je veľkosť vzorky veľká (rádovo 100 alebo viac), rozdiel medzi týmito dvoma distribúciami ( t-študent a normálne) je zanedbateľné. Vždy však používajte t- pri výpočte intervalov spoľahlivosti, aj keď je veľkosť vzorky veľká.

Zvyčajne sa podáva 95 % CI. Môžu sa vypočítať aj iné intervaly spoľahlivosti, ako napríklad 99 % CI pre priemer.

Namiesto súčinu štandardnej chyby a tabuľkovej hodnoty t- rozdelenie, ktoré zodpovedá dvojstrannej pravdepodobnosti 0,05, vynásobte ho (štandardná chyba) hodnotou, ktorá zodpovedá dvojstrannej pravdepodobnosti 0,01. Toto je širší interval spoľahlivosti ako prípad 95 %, pretože odráža zvýšenú istotu, že interval skutočne zahŕňa priemer populácie.

Interval spoľahlivosti pre pomer

Výberové rozdelenie proporcií má binomické rozdelenie. Ak však veľkosť vzorky n primerane veľké, potom je podielové rozdelenie vzorky približne normálne so strednou hodnotou .

Odhad podľa vzorkovacieho pomeru p=r/n(kde r- počet jednotlivcov vo vzorke s charakteristikami, ktoré nás zaujímajú) a odhaduje sa štandardná chyba:

95 % interval spoľahlivosti pre podiel sa odhaduje:

Ak je veľkosť vzorky malá (zvyčajne keď np alebo n(1-p) menej 5 ), potom sa na výpočet presných intervalov spoľahlivosti musí použiť binomické rozdelenie.

Všimnite si, že ak p vyjadrené v percentách, teda (1-p) nahradené (100p).

Interpretácia intervalov spoľahlivosti

Pri interpretácii intervalu spoľahlivosti nás zaujímajú nasledujúce otázky:

Aký široký je interval spoľahlivosti?

Široký interval spoľahlivosti naznačuje, že odhad je nepresný; úzky označuje dobrý odhad.

Šírka intervalu spoľahlivosti závisí od veľkosti štandardnej chyby, ktorá zase závisí od veľkosti vzorky a pri posudzovaní numerickej premennej z variability údajov poskytuje širšie intervaly spoľahlivosti ako štúdie veľkého súboru údajov. niekoľkých premenných.

Obsahuje KI nejaké hodnoty, ktoré sú mimoriadne zaujímavé?

Môžete skontrolovať, či pravdepodobná hodnota parametra populácie spadá do intervalu spoľahlivosti. Ak áno, potom výsledky zodpovedajú tejto pravdepodobnej hodnote. Ak nie, potom je nepravdepodobné (pre 95 % interval spoľahlivosti je šanca takmer 5 %), že parameter má túto hodnotu.

"Katren-Style" pokračuje v publikovaní cyklu Konstantina Kravchika o lekárskych štatistikách. V dvoch predchádzajúcich článkoch sa autor dotkol vysvetlenia takých pojmov ako a.

Konštantín Kravčík

Matematik-analytik. Špecialista v oblasti štatistického výskumu v medicíne a humanitných vedách

Mesto Moskva

Veľmi často v článkoch o klinických štúdiách môžete nájsť záhadnú frázu: „interval spoľahlivosti“ (95% CI alebo 95% CI - interval spoľahlivosti). Napríklad článok môže znieť: „Na posúdenie významnosti rozdielov sa použil študentský t-test s vypočítaným 95 % intervalom spoľahlivosti.“

Aká je hodnota „intervalu spoľahlivosti 95 %“ a prečo ho počítať?

Čo je interval spoľahlivosti? - Toto je rozsah, do ktorého spadajú skutočné priemerné hodnoty v populácii. A čo, existujú "nepravdivé" priemery? V istom zmysle áno, robia. Vysvetlili sme, že nie je možné merať parameter záujmu v celej populácii, takže výskumníci sú spokojní s obmedzenou vzorkou. V tejto vzorke (napríklad podľa telesnej hmotnosti) existuje jedna priemerná hodnota (určitá hmotnosť), podľa ktorej posudzujeme priemernú hodnotu v celej bežnej populácii. Je však nepravdepodobné, že by sa priemerná hmotnosť vo vzorke (najmä malej) zhodovala s priemernou hmotnosťou vo všeobecnej populácii. Preto je správnejšie vypočítať a použiť rozsah priemerných hodnôt bežnej populácie.

Predpokladajme napríklad, že 95 % interval spoľahlivosti (95 % CI) pre hemoglobín je medzi 110 a 122 g/l. To znamená, že s 95 % pravdepodobnosťou bude skutočná stredná hodnota hemoglobínu v bežnej populácii v rozmedzí od 110 do 122 g/l. Inými slovami, nepoznáme priemerný hemoglobín vo všeobecnej populácii, ale môžeme určiť rozsah hodnôt pre túto vlastnosť s 95% pravdepodobnosťou.

Intervaly spoľahlivosti sú obzvlášť dôležité pre rozdiel v priemeroch medzi skupinami alebo to, čo sa nazýva veľkosť účinku.

Predpokladajme, že sme porovnali účinnosť dvoch prípravkov železa: jedného, ​​ktorý je na trhu už dlho, a jedného, ​​ktorý bol práve zaregistrovaný. Po ukončení terapie bola hodnotená koncentrácia hemoglobínu v skúmaných skupinách pacientov a štatistický program nám vypočítal, že rozdiel medzi priemernými hodnotami oboch skupín s pravdepodobnosťou 95 % je v rozmedzí od 1,72 až 14,36 g/l (tabuľka 1).

Tab. 1. Kritérium pre nezávislé vzorky
(skupiny sa porovnávajú podľa hladiny hemoglobínu)

Treba to interpretovať nasledovne: u časti pacientov z bežnej populácie, ktorí užívajú nový liek, bude hemoglobín vyšší v priemere o 1,72–14,36 g/l ako u tých, ktorí užili už známy liek.

Inými slovami, vo všeobecnej populácii je rozdiel v priemerných hodnotách hemoglobínu v skupinách s 95% pravdepodobnosťou v rámci týchto limitov. Či je to veľa alebo málo, posúdi výskumník. Pointou toho všetkého je, že nepracujeme s jednou priemernou hodnotou, ale s rozsahom hodnôt, preto spoľahlivejšie odhadneme rozdiel v parametri medzi skupinami.

V štatistických balíkoch, podľa uváženia výskumníka, je možné nezávisle zúžiť alebo rozšíriť hranice intervalu spoľahlivosti. Znižovaním pravdepodobností intervalu spoľahlivosti zužujeme rozsah priemerov. Napríklad pri 90 % CI bude rozsah priemerov (alebo priemerných rozdielov) užší ako pri 95 % CI.

Naopak, zvýšenie pravdepodobnosti na 99 % rozširuje rozsah hodnôt. Pri porovnávaní skupín môže spodná hranica CI prekročiť nulovú značku. Napríklad, ak sme rozšírili hranice intervalu spoľahlivosti na 99 %, potom sa hranice intervalu pohybovali od –1 do 16 g/l. To znamená, že vo všeobecnej populácii existujú skupiny, medzi ktorými je rozdiel medzi priemermi pre skúmaný znak 0 (M=0).

Intervaly spoľahlivosti možno použiť na testovanie štatistických hypotéz. Ak interval spoľahlivosti prekročí nulovú hodnotu, potom platí nulová hypotéza, ktorá predpokladá, že skupiny sa v skúmanom parametri nelíšia. Príklad je popísaný vyššie, keď sme rozšírili hranice na 99%. Niekde v bežnej populácii sme našli skupiny, ktoré sa nijako nelíšili.

95 % interval spoľahlivosti rozdielu hemoglobínu, (g/l)


Obrázok znázorňuje 95 % interval spoľahlivosti priemerného hemoglobínového rozdielu medzi týmito dvoma skupinami ako čiaru. Čiara prechádza nulovou značkou, preto je rozdiel medzi priemermi rovný nule, čo potvrdzuje nulovú hypotézu, že skupiny sa nelíšia. Rozdiel medzi skupinami sa pohybuje od -2 do 5 g/l, čo znamená, že hemoglobín sa môže buď znížiť o 2 g/l, alebo zvýšiť o 5 g/l.

Interval spoľahlivosti je veľmi dôležitým ukazovateľom. Vďaka nej môžete vidieť, či rozdiely v skupinách boli naozaj spôsobené rozdielom v priemeroch alebo kvôli veľkej vzorke, pretože pri veľkej vzorke je šanca nájsť rozdiely väčšia ako pri malej.

V praxi to môže vyzerať takto. Odobrali sme vzorku 1000 ľudí, zmerali sme hladinu hemoglobínu a zistili sme, že interval spoľahlivosti pre rozdiel v priemeroch leží od 1,2 do 1,5 g/l. Hladina štatistickej významnosti v tomto prípade p

Vidíme, že koncentrácia hemoglobínu sa zvýšila, ale takmer nebadateľne, preto sa štatistická významnosť prejavila práve kvôli veľkosti vzorky.

Intervaly spoľahlivosti možno vypočítať nielen pre priemery, ale aj pre podiely (a rizikové pomery). Zaujíma nás napríklad interval spoľahlivosti podielov pacientov, ktorí dosiahli remisiu pri užívaní vyvinutého lieku. Predpokladajme, že 95 % CI pre proporcie, t. j. pre podiel takýchto pacientov, je v rozmedzí 0,60–0,80. Môžeme teda povedať, že náš liek má terapeutický účinok v 60 až 80 % prípadov.

Akákoľvek vzorka poskytuje iba približnú predstavu o všeobecnej populácii a všetky štatistické charakteristiky vzorky (priemer, režim, rozptyl ...) sú aproximáciou alebo odhadom všeobecných parametrov, ktoré sa vo väčšine prípadov nedajú vypočítať z dôvodu neprístupnosť bežnej populácie (obrázok 20) ​​.

Obrázok 20. Chyba pri odbere vzoriek

Môžete však určiť interval, v ktorom s určitou mierou pravdepodobnosti leží skutočná (všeobecná) hodnota štatistickej charakteristiky. Tento interval sa nazýva d interval spoľahlivosti (CI).

Takže všeobecný priemer s pravdepodobnosťou 95 % leží v rámci

od do, (20)

kde t - tabuľková hodnota študentského kritéria pre α = 0,05 a f= n-1

V tomto prípade možno nájsť 99% CI t vybraný pre α =0,01.

Aký je praktický význam intervalu spoľahlivosti?

    Široký interval spoľahlivosti naznačuje, že priemer vzorky presne neodráža priemer populácie. Je to zvyčajne spôsobené nedostatočnou veľkosťou vzorky, prípadne jej heterogenitou, t.j. veľký rozptyl. Obidve poskytujú veľkú chybu v priemere, a teda aj širší CI. A to je dôvod vrátiť sa do fázy plánovania výskumu.

    Horná a dolná hranica CI hodnotia, či budú výsledky klinicky významné

Zastavme sa podrobnejšie pri otázke štatistickej a klinickej významnosti výsledkov štúdia skupinových vlastností. Pripomeňme, že úlohou štatistiky je na základe vzorových údajov odhaliť aspoň nejaké rozdiely vo všeobecných populáciách. Úlohou lekára je nájsť také (nie žiadne) rozdiely, ktoré pomôžu diagnostike alebo liečbe. A nie vždy štatistické závery sú základom pre klinické závery. Štatisticky významný pokles hemoglobínu o 3 g/l teda nie je dôvodom na obavy. A naopak, ak nejaký problém v ľudskom tele nemá masový charakter na úrovni celej populácie, nie je to dôvod sa týmto problémom nezaoberať.

Túto pozíciu zvážime v príklad.

Vedcov zaujímalo, či chlapci, ktorí mali nejaké infekčné ochorenie, nezaostávajú v raste za svojimi rovesníkmi. Za týmto účelom bola vykonaná selektívna štúdia, ktorej sa zúčastnilo 10 chlapcov, ktorí mali toto ochorenie. Výsledky sú uvedené v tabuľke 23.

Tabuľka 23. Štatistické výsledky

nižší limit

Horná hranica

Špecifikácie (cm)

stredná

Z týchto výpočtov vyplýva, že selektívna priemerná výška 10-ročných chlapcov, ktorí prekonali nejaký druh infekčného ochorenia, sa blíži k normálu (132,5 cm). Spodná hranica intervalu spoľahlivosti (126,6 cm) však naznačuje, že existuje 95 % pravdepodobnosť, že skutočná priemerná výška týchto detí zodpovedá pojmu „nízky vzrast“, t.j. tieto deti sú zakrpatené.

V tomto príklade sú výsledky výpočtov intervalu spoľahlivosti klinicky významné.

INTERVALY BEZPEČNOSTI PRE FREKVENCIE A ČASTI

© 2008

Národný inštitút verejného zdravia, Oslo, Nórsko

Článok popisuje a rozoberá výpočet intervalov spoľahlivosti pre frekvencie a proporcie pomocou Waldovej, Wilsonovej, Klopperovej-Pearsonovej metódy, pomocou uhlovej transformácie a Waldovej metódy s Agresti-Cowllovou korekciou. Predkladaný materiál poskytuje všeobecné informácie o metódach výpočtu intervalov spoľahlivosti pre frekvencie a podiely a má vzbudiť záujem čitateľov časopisu nielen o používanie intervalov spoľahlivosti pri prezentovaní výsledkov vlastného výskumu, ale aj o prečítanie odbornej literatúry pred začatím práce. pracovať na budúcich publikáciách.

Kľúčové slová: interval spoľahlivosti, frekvencia, podiel

V jednej z predchádzajúcich publikácií bol stručne spomenutý popis kvalitatívnych údajov a bolo oznámené, že ich intervalový odhad je vhodnejší ako bodový odhad na popis frekvencie výskytu študovanej charakteristiky v bežnej populácii. Vzhľadom na to, že štúdie sa vykonávajú s použitím údajov zo vzorky, projekcia výsledkov na všeobecnú populáciu musí obsahovať prvok nepresnosti v odhade vzorky. Interval spoľahlivosti je mierou presnosti odhadovaného parametra. Je zaujímavé, že v niektorých knihách o základoch štatistiky pre lekárov je téma intervalov spoľahlivosti pre frekvencie úplne ignorovaná. V tomto článku zvážime niekoľko spôsobov, ako vypočítať intervaly spoľahlivosti pre frekvencie, za predpokladu charakteristík vzorky, ako je neopakovanie sa a reprezentatívnosť, ako aj nezávislosť pozorovaní od seba navzájom. Frekvencia v tomto článku nie je chápaná ako absolútne číslo, ktoré ukazuje, koľkokrát sa tá či oná hodnota vyskytuje v súhrne, ale ako relatívna hodnota, ktorá určuje podiel účastníkov štúdie, ktorí majú skúmanú vlastnosť.

V biomedicínskom výskume sa najčastejšie používajú 95% intervaly spoľahlivosti. Tento interval spoľahlivosti je oblasť, do ktorej skutočný podiel spadá 95 % času. Inými slovami, s 95% istotou možno povedať, že skutočná hodnota frekvencie výskytu znaku v bežnej populácii bude v rámci 95% intervalu spoľahlivosti.

Väčšina štatistických učebníc pre medicínskych výskumníkov uvádza, že frekvenčná chyba sa vypočítava pomocou vzorca

kde p je frekvencia výskytu znaku vo vzorke (hodnota od 0 do 1). Vo väčšine domácich vedeckých článkov sa uvádza hodnota frekvencie výskytu znaku vo vzorke (p), ako aj jeho chyba (s) v tvare p ± s. Je však účelnejšie uviesť 95 % interval spoľahlivosti pre frekvenciu výskytu znaku vo všeobecnej populácii, ktorý bude zahŕňať hodnoty od

predtým.

V niektorých učebniciach sa pre malé vzorky odporúča nahradiť hodnotu 1,96 hodnotou t pre N - 1 stupňov voľnosti, kde N je počet pozorovaní vo vzorke. Hodnota t sa nachádza v tabuľkách pre t-rozdelenie, ktoré sú dostupné takmer vo všetkých učebniciach štatistiky. Použitie distribúcie t pre Waldovu metódu neposkytuje viditeľné výhody oproti iným metódam diskutovaným nižšie, a preto nie je niektorými autormi vítané.

Vyššie uvedená metóda na výpočet intervalov spoľahlivosti pre frekvencie alebo zlomky je pomenovaná po Abrahamovi Waldovi (Abraham Wald, 1902–1950), pretože sa začala široko používať po publikácii Walda a Wolfowitza v roku 1939. Samotnú metódu však navrhol Pierre Simon Laplace (1749–1827) už v roku 1812.

Waldova metóda je veľmi populárna, no jej aplikácia je spojená so značnými problémami. Metóda sa neodporúča pre malé veľkosti vzoriek, ako aj v prípadoch, keď frekvencia výskytu prvku má tendenciu k 0 alebo 1 (0 % alebo 100 %) a pri frekvenciách 0 a 1 jednoducho nie je možná. aproximácia normálneho rozdelenia, ktorá sa používa pri výpočte chyby, "nefunguje" v prípadoch, keď n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.



kde pri výpočte 95 % intervalu spoľahlivosti nadobúda hodnotu 1,96, N je počet pozorovaní a p je frekvencia znaku vo vzorke. Táto metóda je dostupná v online kalkulačkách, takže jej aplikácia nie je problematická. a neodporúčame používať túto metódu pre n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Okrem Wilsonovej metódy sa tiež predpokladá, že Waldova metóda korigovaná Agresti-Caull poskytuje optimálny odhad intervalu spoľahlivosti pre frekvencie. Korekcia Agresti-Coulle je vo Waldovom vzorci nahradením frekvencie výskytu znaku vo vzorke (p) za p`, pri výpočte, ktorá 2 sa pripočíta k čitateľovi a 4 k menovateľovi, tj. , p` = (X + 2) / (N + 4), kde X je počet účastníkov štúdie, ktorí majú skúmanú vlastnosť, a N je veľkosť vzorky. Táto modifikácia poskytuje výsledky veľmi podobné výsledkom Wilsonovho vzorca, s výnimkou prípadov, keď sa frekvencia udalostí blíži k 0 % alebo 100 % a vzorka je malá. Okrem vyššie uvedených metód na výpočet intervalov spoľahlivosti pre frekvencie boli navrhnuté korekcie kontinuity pre Waldovu metódu aj Wilsonovu metódu pre malé vzorky, ale štúdie ukázali, že ich použitie je nevhodné.

Zvážte použitie vyššie uvedených metód na výpočet intervalov spoľahlivosti pomocou dvoch príkladov. V prvom prípade študujeme veľkú vzorku 1000 náhodne vybraných účastníkov štúdie, z ktorých 450 má skúmanú vlastnosť (či už ide o rizikový faktor, výsledok alebo akúkoľvek inú vlastnosť), čo je frekvencia 0,45, resp. 45 %. V druhom prípade sa štúdia uskutočňuje na malej vzorke, povedzme, len 20 ľudí a iba 1 účastník štúdie (5 %) má skúmanú vlastnosť. Intervaly spoľahlivosti pre Waldovu metódu, Waldovu metódu s Agresti-Coll korekciou, Wilsonovu metódu boli vypočítané pomocou online kalkulačky vyvinutej Jeffom Saurom (http://www./wald.htm). Wilsonove intervaly spoľahlivosti korigované na kontinuitu sa vypočítali pomocou kalkulačky poskytnutej Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Výpočty pomocou Fisherovej uhlovej transformácie sa uskutočňovali "ručne" s použitím kritickej hodnoty t pre 19 a 999 stupňov voľnosti. Výsledky výpočtu sú uvedené v tabuľke pre oba príklady.

Intervaly spoľahlivosti vypočítané šiestimi rôznymi spôsobmi pre dva príklady opísané v texte

Metóda výpočtu intervalu spoľahlivosti

P = 0,0500 alebo 5 %

95 % CI pre X = 450, N = 1 000, P = 0,4500 alebo 45 %

–0,0455–0,2541

Walda s korekciou Agresti-Coll

<,0001–0,2541

Wilson s korekciou kontinuity

Klopper-Pearsonova "presná metóda"

Uhlová transformácia

<0,0001–0,1967

Ako je možné vidieť z tabuľky, v prvom príklade interval spoľahlivosti vypočítaný „všeobecne akceptovanou“ Waldovou metódou ide do zápornej oblasti, čo nemôže byť prípad frekvencií. Bohužiaľ, takéto incidenty nie sú v ruskej literatúre nezvyčajné. Tradičný spôsob reprezentácie údajov ako frekvencie a jej chyba tento problém čiastočne maskuje. Napríklad, ak je frekvencia výskytu vlastnosti (v percentách) prezentovaná ako 2,1 ± 1,4, potom to nie je také „dráždivé“ ako 2,1 % (95 % CI: –0,7; 4,9), hoci a znamená to isté. Waldova metóda s Agresti-Coullovou korekciou a výpočtom pomocou uhlovej transformácie dáva dolnú hranicu smerujúcu k nule. Wilsonova metóda s korekciou kontinuity a „presná metóda“ poskytujú širšie intervaly spoľahlivosti ako Wilsonova metóda. V druhom príklade všetky metódy poskytujú približne rovnaké intervaly spoľahlivosti (rozdiely sa objavujú iba v tisícinách), čo nie je prekvapujúce, pretože frekvencia udalosti v tomto príklade sa príliš nelíši od 50 % a veľkosť vzorky je dosť veľká. .

Čitateľom, ktorí sa zaujímajú o tento problém, môžeme odporučiť práce R. G. Newcomba a Browna, Caia a Dasguptu, ktoré uvádzajú klady a zápory použitia 7 a 10 rôznych metód na výpočet intervalov spoľahlivosti, resp. Z domácich príručiek sa odporúča kniha a, v ktorej sú okrem podrobného popisu teórie uvedené aj Waldova a Wilsonova metóda, ako aj metóda na výpočet intervalov spoľahlivosti s prihliadnutím na binomické rozdelenie frekvencií. Okrem bezplatných online kalkulačiek (http://www./wald.htm a http://faculty.vassar.edu/lowry/prop1.html) možno intervaly spoľahlivosti pre frekvencie (nielen!) vypočítať pomocou Program CIA (Confidence Intervals Analysis), ktorý si môžete stiahnuť z http://www. lekárska škola. soton. ac. uk/cia/ .

Nasledujúci článok sa bude zaoberať jednorozmernými spôsobmi porovnávania kvalitatívnych údajov.

Bibliografia

Banerjee A. Lekárska štatistika v jednoduchom jazyku: úvodný kurz / A. Banerzhi. - M. : Praktické lekárstvo, 2007. - 287 s. Lekárska štatistika / . - M. : Lekárska informačná agentúra, 2007. - 475 s. Glanz S. Mediko-biologická štatistika / S. Glants. - M. : Prax, 1998. Typy údajov, overovanie distribúcie a popisná štatistika / // Ekológia človeka - 2008. - č. 1. - S. 52–58. Zhizhin K.S.. Lekárska štatistika: učebnica / . - Rostov n / D: Phoenix, 2007. - 160 s. Aplikovaná lekárska štatistika / , . - St. Petersburg. : Folio, 2003. - 428 s. Lakin G. F. Biometria / . - M. : Vyššia škola, 1990. - 350 s. Medik V. A. Matematická štatistika v medicíne / , . - M. : Financie a štatistika, 2007. - 798 s. Matematická štatistika v klinickom výskume / , . - M. : GEOTAR-MED, 2001. - 256 s. Junkerov V. A. Medicínsko-štatistické spracovanie údajov medicínskeho výskumu /,. - St. Petersburg. : VmedA, 2002. - 266 s. Agresti A. Pre intervalový odhad binomických proporcií je približné lepšie ako presné / A. Agresti, B. Coull // Americký štatistik. - 1998. - N 52. - S. 119-126. Altman D.Štatistika s istotou // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - Londýn: BMJ Books, 2000. - 240 s. Brown L.D. Intervalový odhad pre binomický podiel / L. D. Brown, T. T. Cai, A. Dasgupta // Štatistická veda. - 2001. - N 2. - S. 101-133. Clopper C.J. Použitie spoľahlivosti alebo fiduciálnych limitov ilustrované v prípade binomickej / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - S. 404-413. Garcia-Perez M.A. O intervale spoľahlivosti pre binomický parameter / M. A. Garcia-Perez // Kvalita a kvantita. - 2005. - N 39. - S. 467-481. Motulsky H. Intuitívna bioštatistika // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 s. Newcombe R.G. Obojstranné intervaly spoľahlivosti pre jednu proporciu: Porovnanie siedmich metód / R. G. Newcombe // Štatistika v medicíne. - 1998. - N. 17. - S. 857–872. Sauro J. Odhadovanie miery dokončenia z malých vzoriek pomocou binomických intervalov spoľahlivosti: porovnania a odporúčania / J. Sauro, J. R. Lewis // Zborník výročného stretnutia spoločnosti pre ľudské faktory a ergonómiu. – Orlando, FL, 2005. Wald A. Limity spoľahlivosti pre spojité distribučné funkcie // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - S. 105–118. Wilson E. B. Pravdepodobná inferencia, zákon nástupníctva a štatistická inferencia / E. B. Wilson // Journal of American Statistical Association. - 1927. - N 22. - S. 209-212.

INTERVALY DÔVERY PRE PROPORCIE

A. M. Grjibovski

Národný inštitút verejného zdravia, Oslo, Nórsko

Článok predstavuje niekoľko metód na výpočty intervalov spoľahlivosti pre binomické proporcie, a to Waldovu, Wilsonovu, arcsínusovú, Agresti-Coullovu a presnú Clopper-Pearsonovu metódu. Príspevok poskytuje len všeobecný úvod do problematiky odhadu intervalu spoľahlivosti binomickej proporcie a jeho cieľom je nielen podnietiť čitateľov k používaniu intervalov spoľahlivosti pri prezentovaní výsledkov vlastných empirických výskumných intervalov, ale aj podnietiť ich k tomu, aby si prečítali štatistické knihy pred na analýzu vlastných údajov a prípravu rukopisov.

Kľúčové slová: interval spoľahlivosti, podiel

Kontaktné informácie:

Senior Advisor, National Institute of Public Health, Oslo, Nórsko

V predchádzajúcich podkapitolách sme sa zaoberali otázkou odhadu neznámeho parametra a jedno číslo. Takéto hodnotenie sa nazýva „bod“. V mnohých úlohách je potrebné nielen nájsť parameter a vhodnú číselnú hodnotu, ale aj zhodnotiť jej presnosť a spoľahlivosť. Je potrebné vedieť, k akým chybám môže zámena parametrov viesť a jeho bodový odhad a a s akou mierou istoty môžeme očakávať, že tieto chyby nepresiahnu známe hranice?

Problémy tohto druhu sú relevantné najmä pre malý počet pozorovaní, keď bodový odhad a v je z veľkej časti náhodný a približné nahradenie a za a môže viesť k vážnym chybám.

Aby ste získali predstavu o presnosti a spoľahlivosti odhadu a,

v matematickej štatistike sa používajú takzvané intervaly spoľahlivosti a pravdepodobnosti spoľahlivosti.

Pre parameter a odvodené zo skúseností nestranný odhad a. V tomto prípade chceme odhadnúť možnú chybu. Priraďme nejakú dostatočne veľkú pravdepodobnosť p (napríklad p = 0,9, 0,95 alebo 0,99) takú, že udalosť s pravdepodobnosťou p možno považovať za prakticky istú a nájdime hodnotu s, pre ktorú

Potom rozsah prakticky možných hodnôt chyby, ktorá sa vyskytuje pri výmene a na a, bude ± s; veľké absolútne chyby sa objavia len s malou pravdepodobnosťou a = 1 - p. Prepíšme (14.3.1) ako:

Rovnosť (14.3.2) znamená, že s pravdepodobnosťou p je neznáma hodnota parametra a spadá do intervalu

V tomto prípade si treba uvedomiť jednu okolnosť. Predtým sme opakovane zvažovali pravdepodobnosť, že náhodná premenná spadne do daného nenáhodného intervalu. Tu je situácia iná: a nie náhodný, ale náhodný interval / r. Náhodne jeho poloha na osi x, určená jeho stredom a; vo všeobecnosti je dĺžka intervalu 2s tiež náhodná, pretože hodnota s sa vypočítava spravidla z experimentálnych údajov. Preto by v tomto prípade bolo lepšie interpretovať hodnotu p nie ako pravdepodobnosť „trafenia“ bodu a do intervalu / p, ale ako pravdepodobnosť, že náhodný interval / p pokryje bod a(obr. 14.3.1).

Ryža. 14.3.1

Pravdepodobnosť p sa nazýva úroveň sebavedomia a interval / p - interval spoľahlivosti. Hranice intervalov ak. a x \u003d a- s a a 2 = a + a sú povolaní hranice dôvery.

Uveďme ešte jeden výklad pojmu interval spoľahlivosti: možno ho považovať za interval hodnôt parametrov a, kompatibilné s experimentálnymi údajmi a nie sú v rozpore s nimi. Ak totiž súhlasíme s tým, že udalosť s pravdepodobnosťou a = 1-p považujeme za prakticky nemožnú, potom tie hodnoty parametra a, pre ktoré a - a> s musia byť uznané ako odporujúce experimentálnym údajom a tým, pre ktoré |a - a a t na 2.

Pre parameter a existuje nestranný odhad a. Keby sme poznali zákon rozdelenia množstva a, problém nájdenia intervalu spoľahlivosti by bol celkom jednoduchý: stačilo by nájsť hodnotu s, pre ktorú

Problém spočíva v tom, že distribučný zákon odhadu a závisí od zákona rozdelenia množstva X a následne na jeho neznáme parametre (najmä na samotný parameter a).

Na obídenie tohto problému je možné použiť nasledujúci približne približný trik: nahraďte neznáme parametre vo výraze pre s ich bodovými odhadmi. S pomerne veľkým počtom experimentov P(asi 20 ... 30) táto technika zvyčajne poskytuje uspokojivé výsledky z hľadiska presnosti.

Ako príklad uvažujme problém intervalu spoľahlivosti pre matematické očakávania.

Nechajte vyrobiť P X, ktorých charakteristikou je matematické očakávanie t a rozptyl D- neznámy. Pre tieto parametre sa získali tieto odhady:

Je potrebné vytvoriť interval spoľahlivosti / р, zodpovedajúci pravdepodobnosti spoľahlivosti р, pre matematické očakávanie t množstvá X.

Pri riešení tohto problému využívame fakt, že množstvo t je suma P nezávislé identicky rozdelené náhodné premenné X h a podľa centrálnej limitnej vety pre dostatočne veľké P jeho distribučný zákon je blízky normálu. V praxi aj pri relatívne malom počte členov (rádovo 10 ... 20) možno distribučný zákon súčtu považovať približne za normálny. Budeme predpokladať, že hodnota t distribuované podľa bežného zákona. Charakteristiky tohto zákona – matematické očakávanie a rozptyl – sú rovnaké, resp t a

(pozri kapitolu 13 pododdiel 13.3). Predpokladajme, že hodnota D je nám známy a nájdeme takú hodnotu Ep, pre ktorú

Použitím vzorca (6.3.5) z kapitoly 6 vyjadríme pravdepodobnosť na ľavej strane (14.3.5) z hľadiska funkcie normálneho rozdelenia

kde je štandardná odchýlka odhadu t.

Z rovnice

nájdite hodnotu Sp:

kde arg Ф* (x) je inverzná funkcia k Ф* (X), tie. taká hodnota argumentu, pre ktorú sa funkcia normálneho rozdelenia rovná X.

Disperzia D, prostredníctvom ktorého sa hodnota vyjadruje a 1P, nevieme presne; ako jeho približnú hodnotu môžete použiť odhad D(14.3.4) a uveďte približne:

Problém konštrukcie intervalu spoľahlivosti je teda približne vyriešený, čo sa rovná:

kde gp je definované vzorcom (14.3.7).

Aby sa predišlo spätnej interpolácii v tabuľkách funkcie Ф * (l) pri výpočte s p, je vhodné zostaviť špeciálnu tabuľku (tabuľka 14.3.1), v ktorej sú uvedené hodnoty množstva

v závislosti od r. Hodnota (p určuje pre normálny zákon počet smerodajných odchýlok, ktoré je potrebné odložiť napravo a naľavo od stredu disperzie, aby sa pravdepodobnosť pádu do výslednej oblasti rovnala p.

Prostredníctvom hodnoty 7 p je interval spoľahlivosti vyjadrený ako:

Tabuľka 14.3.1

Príklad 1. Na hodnote sa uskutočnilo 20 experimentov X; výsledky sú uvedené v tabuľke. 14.3.2.

Tabuľka 14.3.2

Je potrebné nájsť odhad pre matematické očakávanie množstva X a zostrojte interval spoľahlivosti zodpovedajúci úrovni spoľahlivosti p = 0,8.

Riešenie. Máme:

Voľbou počiatku n: = 10 podľa tretieho vzorca (14.2.14) nájdeme nezaujatý odhad D :

Podľa tabuľky 14.3.1 nájdeme

Hranice spoľahlivosti:

Interval spoľahlivosti:

Hodnoty parametrov t, ležiace v tomto intervale sú kompatibilné s experimentálnymi údajmi uvedenými v tabuľke. 14.3.2.

Podobným spôsobom možno skonštruovať interval spoľahlivosti pre rozptyl.

Nechajte vyrobiť P nezávislé experimenty na náhodnej premennej X s neznámymi parametrami od a A, a pre rozptyl D nestranný odhad sa získa:

Je potrebné približne vytvoriť interval spoľahlivosti pre rozptyl.

Zo vzorca (14.3.11) je zrejmé, že hodnota D predstavuje

čiastka P náhodné premenné formulára . Tieto hodnoty nie sú

nezávislé, pretože ktorýkoľvek z nich zahŕňa množstvo t, závislý na všetkých ostatných. Dá sa však ukázať, že ako P distribučný zákon ich súčtu je tiež blízky normálu. Takmer o P= 20...30 to už možno považovať za normálne.

Predpokladajme, že je to tak, a nájdime charakteristiky tohto zákona: matematické očakávanie a rozptyl. Od skóre D- teda nezaujatý M[D] = D.

Výpočet rozptylu D D je spojená s pomerne zložitými výpočtami, takže jej vyjadrenie uvádzame bez odvodenia:

kde c 4 - štvrtý centrálny moment veličiny X.

Ak chcete použiť tento výraz, musíte v ňom nahradiť hodnoty 4 a D(aspoň približné). Namiesto D môžete použiť hodnotenie D. V zásade môže byť štvrtý centrálny moment nahradený aj jeho odhadom, napríklad hodnotou tvaru:

ale takáto výmena poskytne extrémne nízku presnosť, pretože vo všeobecnosti sa pri obmedzenom počte experimentov určujú momenty vysokého rádu s veľkými chybami. V praxi sa však často stáva, že tvar distribučného zákona množstva X vopred známy: neznáme sú len jeho parametre. Potom sa môžeme pokúsiť vyjadriť u4 v termínoch D.

Zoberme si najbežnejší prípad, keď hodnota X distribuované podľa bežného zákona. Potom sa jeho štvrtý centrálny moment vyjadrí pomocou rozptylu (pozri kapitolu 6 pododdiel 6.2);

a vzorec (14.3.12) dáva alebo

Nahradenie v (14.3.14) neznámeho D jeho hodnotenie D, dostávame: odkiaľ

Okamih u 4 možno vyjadriť v termínoch D aj v niektorých iných prípadoch, keď rozdelenie množstva X nie je normálne, ale jeho vzhľad je známy. Napríklad pre zákon rovnomernej hustoty (pozri kapitolu 5) máme:

kde (a, P) je interval, na ktorom je daný zákon.

v dôsledku toho

Podľa vzorca (14.3.12) dostaneme: odkiaľ nájdeme približne

V prípadoch, keď nie je známa forma zákona o rozdelení hodnoty 26, sa pri odhade hodnoty a/ stále odporúča použiť vzorec (14.3.16), ak neexistujú žiadne osobitné dôvody domnievať sa, že zákon je veľmi odlišný od bežného (má znateľný kladný alebo záporný hrot).

Ak sa približná hodnota a /) získa tak či onak, potom je možné zostrojiť interval spoľahlivosti pre rozptyl rovnakým spôsobom, ako sme ho vytvorili pre matematické očakávanie:

kde hodnota závislá od danej pravdepodobnosti p sa nachádza v tabuľke. 14.3.1.

Príklad 2. Nájdite približne 80% interval spoľahlivosti pre rozptyl náhodnej premennej X za podmienok príkladu 1, ak je známe, že hodnota X distribuované podľa zákona blízkeho normálu.

Riešenie. Hodnota zostáva rovnaká ako v tabuľke. 14.3.1:

Podľa vzorca (14.3.16)

Podľa vzorca (14.3.18) zistíme interval spoľahlivosti:

Zodpovedajúci rozsah hodnôt štandardnej odchýlky: (0,21; 0,29).

14.4. Presné metódy konštrukcie intervalov spoľahlivosti pre parametre náhodnej premennej rozloženej podľa normálneho zákona

V predchádzajúcej podkapitole sme uvažovali o zhruba približných metódach konštrukcie intervalov spoľahlivosti pre priemer a rozptyl. Tu uvádzame predstavu o presných metódach riešenia rovnakého problému. Zdôrazňujeme, že pre presné nájdenie intervalov spoľahlivosti je bezpodmienečne nutné vopred poznať formu zákona o rozdelení množstva X, keďže to nie je potrebné na aplikáciu približných metód.

Myšlienka presných metód na zostavenie intervalov spoľahlivosti je nasledovná. Akýkoľvek interval spoľahlivosti sa zistí z podmienky vyjadrujúcej pravdepodobnosť splnenia niektorých nerovností, medzi ktoré patrí aj odhad, ktorý nás zaujíma a. Zákon o rozdelení stupňov a vo všeobecnom prípade závisí od neznámych parametrov veličiny X. Niekedy je však možné prejsť v nerovnostiach z náhodnej premennej a na nejakú inú funkciu pozorovaných hodnôt X p X 2, ..., X str. ktorého distribučný zákon nezávisí od neznámych parametrov, ale závisí len od počtu pokusov a od tvaru distribučného zákona množstva X. Náhodné premenné tohto druhu hrajú veľkú úlohu v matematickej štatistike; boli najpodrobnejšie študované pre prípad normálneho rozdelenia množstva X.

Napríklad bolo dokázané, že pri normálnom rozdelení množstva X náhodná hodnota

podliehať tzv Študentov distribučný zákon s P- 1 stupeň voľnosti; hustota tohto zákona má tvar

kde G(x) je známa funkcia gama:

Je tiež dokázané, že náhodná premenná

má "distribúciu % 2" s P- 1 stupeň voľnosti (pozri kapitolu 7), ktorého hustota je vyjadrená vzorcom

Bez toho, aby sme sa zaoberali deriváciami rozdelení (14.4.2) a (14.4.4), ukážeme, ako ich možno použiť pri konštrukcii intervalov spoľahlivosti pre parametre Ty D.

Nechajte vyrobiť P nezávislé experimenty na náhodnej premennej X, rozdelené podľa normálneho zákona s neznámymi parametrami TIO. Pre tieto parametre, odhady

Je potrebné zostrojiť intervaly spoľahlivosti pre oba parametre zodpovedajúce pravdepodobnosti spoľahlivosti p.

Najprv zostrojme interval spoľahlivosti pre matematické očakávanie. Je prirodzené brať tento interval symetrický vzhľadom na t; označme s p polovicu dĺžky intervalu. Hodnota sp musí byť zvolená tak, aby bola splnená podmienka

Skúsme prejsť na ľavú stranu rovnosti (14.4.5) z náhodnej premennej t na náhodnú premennú T, distribuované podľa študentského zákona. Aby sme to dosiahli, vynásobíme obe časti nerovnosti |m-w?|

na kladnú hodnotu: alebo pomocou zápisu (14.4.1),

Nájdite číslo / p také, že hodnotu / p možno nájsť z podmienky

Zo vzorca (14.4.2) je zrejmé, že (1) je párna funkcia, takže (14.4.8) dáva

Rovnosť (14.4.9) určuje hodnotu / p v závislosti od p. Ak máte k dispozícii tabuľku integrálnych hodnôt

potom hodnotu / p možno nájsť reverznou interpoláciou v tabuľke. Je však pohodlnejšie zostaviť tabuľku hodnôt / p vopred. Takáto tabuľka je uvedená v prílohe (tabuľka 5). Táto tabuľka zobrazuje hodnoty v závislosti od pravdepodobnosti spoľahlivosti p a počtu stupňov voľnosti P- 1. Po určení / p podľa tabuľky. 5 a za predpokladu

nájdeme polovičnú šírku intervalu spoľahlivosti / p a samotný interval

Príklad 1. Uskutočnilo sa 5 nezávislých experimentov s náhodnou premennou X, normálne distribuované s neznámymi parametrami t a o. Výsledky experimentov sú uvedené v tabuľke. 14.4.1.

Tabuľka 14.4.1

Nájdite odhad t pre matematické očakávanie a zostrojte preň 90 % interval spoľahlivosti / p (t. j. interval zodpovedajúci pravdepodobnosti spoľahlivosti p \u003d 0,9).

Riešenie. Máme:

Podľa tabuľky 5 žiadosti o P - 1 = 4 a p = 0,9 nájdeme kde

Interval spoľahlivosti bude

Príklad 2. Pre podmienky príkladu 1 pododdielu 14.3, za predpokladu hodnoty X normálne rozložené, nájdite presný interval spoľahlivosti.

Riešenie. Podľa tabuľky 5 prihlášky nájdeme na P - 1 = 19ir =

0,8 / p = 1,328; odtiaľ

Pri porovnaní s riešením z príkladu 1 pododdielu 14.3 (e p = 0,072) vidíme, že nezrovnalosť je veľmi malá. Ak dodržíme presnosť na dve desatinné miesta, potom sú intervaly spoľahlivosti zistené presnou a približnou metódou rovnaké:

Prejdime ku konštrukcii intervalu spoľahlivosti pre rozptyl. Zvážte nezaujatý odhad rozptylu

a vyjadriť náhodnú premennú D cez hodnotu V(14.4.3) s rozdelením x 2 (14.4.4):

Poznať distribučný zákon množstva V, je možné nájsť interval / (1 ), do ktorého spadá s danou pravdepodobnosťou p.

distribučný zákon k n _ x (v) hodnota I7 má tvar znázornený na obr. 14.4.1.

Ryža. 14.4.1

Vynára sa otázka: ako zvoliť interval / p? Ak zákon o rozdelení množstva V bol symetrický (ako normálny zákon alebo Studentovo rozdelenie), bolo by prirodzené brať interval /p symetrický vzhľadom na matematické očakávanie. V tomto prípade zákon k n _ x (v) asymetrické. Dohodneme sa, že interval /p zvolíme tak, aby boli pravdepodobnosti výstupu veličiny V mimo intervalu vpravo a vľavo (tieňované oblasti na obr. 14.4.1) boli rovnaké a rovnaké

Na vytvorenie intervalu / p s touto vlastnosťou použijeme tabuľku. 4 aplikácie: obsahuje čísla y) také že

pre množstvo V, s x 2 -distribúciou s r stupňami voľnosti. V našom prípade r = n- 1. Opraviť r = n- 1 a nájdite v príslušnom riadku tabuľky. 4 dve hodnoty x 2 - jedna zodpovedá pravdepodobnosti druhá - pravdepodobnosti Označme tieto

hodnoty o 2 a xl? Interval má y 2,ľavou stranou a y~ pravý koniec.

Teraz nájdeme požadovaný interval spoľahlivosti /| pre rozptyl s hranicami D, a D2, ktorý pokrýva pointu D s pravdepodobnosťou p:

Zostrojme taký interval / (, = (?> b A), ktorý pokrýva bod D vtedy a len vtedy, ak hodnota V spadá do intervalu / r. Ukážme, že interval

spĺňa túto podmienku. Pravdaže, nerovnosti sú ekvivalentné nerovnostiam

a tieto nerovnosti platia s pravdepodobnosťou p. Tak sa zistí interval spoľahlivosti pre disperziu a vyjadrí sa vzorcom (14.4.13).

Príklad 3. Nájdite interval spoľahlivosti pre rozptyl za podmienok príkladu 2 pododdielu 14.3, ak je známe, že hodnota X distribuované normálne.

Riešenie. Máme . Podľa tabuľky 4 prihlášky

nájdeme na r = n - 1 = 19

Podľa vzorca (14.4.13) nájdeme interval spoľahlivosti pre rozptyl

Zodpovedajúci interval pre štandardnú odchýlku: (0,21; 0,32). Tento interval len mierne presahuje interval (0,21; 0,29) získaný v príklade 2 pododdielu 14.3 približnou metódou.

  • Obrázok 14.3.1 uvažuje interval spoľahlivosti, ktorý je symetrický okolo a. Vo všeobecnosti, ako uvidíme neskôr, to nie je potrebné.
KATEGÓRIE

POPULÁRNE ČLÁNKY

2022 "kingad.ru" - ultrazvukové vyšetrenie ľudských orgánov