Mivel az új változó normális eloszlású, a φ változó 95%-os konfidenciaintervallumának alsó és felső határa φ-1,96 és φ+1,96left">

A kis minták 1,96 helyett javasolt N - 1 szabadságfok helyett t értékkel helyettesíteni. Ez a módszer nem ad negatív értékeket, és lehetővé teszi a gyakoriságok konfidenciaintervallumának pontosabb becslését, mint a Wald-módszer. Emellett számos hazai orvosstatisztikai referenciakönyv is leírja, ami azonban nem vezetett az orvosi kutatásokban való széles körű használatához. A konfidenciaintervallumok szögtranszformációval történő kiszámítása nem javasolt 0-hoz vagy 1-hez közelítő gyakoriságok esetén.

Ezzel általában véget is ér a legtöbb statisztika alapjaival foglalkozó, orvoskutatók számára készült könyv konfidenciaintervallum-becslési módszereinek ismertetése, és ez a probléma nemcsak a hazai, hanem a külföldi szakirodalomra is jellemző. Mindkét módszer a központi határérték tételen alapul, ami nagy mintát jelent.

Tekintettel a konfidenciaintervallumok fenti módszerekkel történő becslésének hiányosságaira, Clopper (Clopper) és Pearson (Pearson) 1934-ben egy módszert javasolt az úgynevezett egzakt konfidenciaintervallum kiszámítására, figyelembe véve a vizsgált tulajdonság binomiális eloszlását. Ez a módszer számos online számológépben elérhető, azonban az így kapott konfidencia intervallumok a legtöbb esetben túl szélesek. Ugyanakkor ez a módszer olyan esetekben javasolt, amikor óvatos becslésre van szükség. A módszer konzervatívságának foka a minta méretének csökkenésével nő, különösen N esetében< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Sok statisztikus szerint a gyakoriságok konfidenciaintervallumának legoptimálisabb becslését az 1927-ben javasolt, de a hazai orvosbiológiai kutatásokban gyakorlatilag nem használt Wilson-módszer végzi. Ez a módszer nemcsak nagyon kicsi és nagyon magas gyakoriságok konfidenciaintervallumának becslését teszi lehetővé, hanem kis számú megfigyelésre is alkalmazható. Általában a Wilson-képlet szerinti konfidenciaintervallum alakja a következő

Mekkora a valószínűsége a konfidenciaintervallumnak. Megbízhatósági intervallum

Az elme nemcsak a tudásban rejlik, hanem a tudás gyakorlati alkalmazásának képességében is. (Arisztotelész)

Bizalmi intervallumok

általános áttekintés

A sokaságból mintát veszünk, pontbecslést kapunk a számunkra érdekes paraméterről, és kiszámítjuk a standard hibát, hogy jelezzük a becslés pontosságát.

A legtöbb esetben azonban a standard hiba önmagában nem elfogadható. Sokkal hasznosabb ezt a pontossági mértéket a populációs paraméter intervallumbecslésével kombinálni.

Ez megtehető a minta statisztika (paraméter) elméleti valószínűség-eloszlásának ismeretével a paraméter konfidenciaintervallumának (CI - Confidence Interval, CI - Confidence Interval) kiszámításához.

Általánosságban elmondható, hogy a konfidenciaintervallum mindkét irányban kiterjeszti a becsléseket (egy adott paraméter standard hibájának valamilyen többszörösével); az intervallumot meghatározó két értéket (megbízhatósági határértéket) általában vessző választja el és zárójelbe tesz.

Konfidenciaintervallum az átlaghoz

A normál eloszlást használva

A mintaátlag normális eloszlású, ha a minta mérete nagy, így a normális eloszlás ismerete alkalmazható a mintaátlag figyelembevételekor.

Konkrétan, a mintaátlagok eloszlásának 95%-a a sokaság átlagának 1,96 szórásán (SD) belül van.

Ha csak egy mintánk van, ezt az átlag standard hibájának (SEM) nevezzük, és kiszámítjuk az átlag 95%-os konfidencia intervallumát a következőképpen:

Ha ezt a kísérletet többször megismételjük, akkor az intervallum az idő 95%-ában tartalmazza a valódi populáció átlagát.

Ez általában egy konfidenciaintervallum, például az az értéktartomány, amelyen belül a valódi populációs átlag (általános átlag) 95%-os konfidenciaszinttel esik.

Bár nem egészen szigorú (a sokaság átlaga fix érték, ezért nem lehet vele összefüggésbe hozni a valószínűséget), a konfidenciaintervallumot így értelmezni, de fogalmilag könnyebben érthető.

Használat t- terjesztés

A normál eloszlást akkor használhatja, ha ismeri a sokaság varianciájának értékét. Továbbá, ha a minta mérete kicsi, a minta átlaga normális eloszlást követ, ha a sokaság alapjául szolgáló adatok normális eloszlásúak.

Ha a sokaság alapjául szolgáló adatok nem normális eloszlásúak és/vagy az általános variancia (populációs variancia) ismeretlen, a minta átlaga engedelmeskedik Diák t-eloszlása.

Számítsa ki a sokaság átlagának 95%-os konfidencia intervallumát a következőképpen:

Ahol - százalékpont (percentilis) t- Diákeloszlás (n-1) szabadságfokkal, ami 0,05 kétirányú valószínűséget ad.

Általánosságban elmondható, hogy szélesebb intervallumot biztosít, mint normál eloszlás esetén, mert figyelembe veszi a sokaság szórásának becslésével és/vagy a kis mintaméretből adódó további bizonytalanságot.

Ha a minta mérete nagy (100 vagy nagyobb nagyságrendű), a két eloszlás közötti különbség ( t-diákés normál) elhanyagolható. Azonban mindig használja t- eloszlást a konfidenciaintervallumok kiszámításakor, még akkor is, ha a minta mérete nagy.

Általában 95%-os CI-t jeleznek. Más konfidenciaintervallumok is számíthatók, például az átlag 99%-os CI.

A standard hiba és a táblázatérték szorzata helyett t- 0,05-ös kétirányú valószínűségnek megfelelő eloszlás szorozza meg (standard hiba) egy 0,01-es kétirányú valószínűségnek megfelelő értékkel. Ez szélesebb konfidenciaintervallum, mint a 95%-os eset, mert megnövekedett bizalmat tükröz, hogy az intervallum valóban tartalmazza a sokaság átlagát.

Konfidencia intervallum az arányhoz

Az arányok mintavételi eloszlása ​​binomiális eloszlású. Ha azonban a mintanagyság nésszerűen nagy, akkor az arányos mintaeloszlás megközelítőleg normális az átlaggal.

Becslés mintavételi arány alapján p=r/n(ahol r- a számunkra érdekes tulajdonságokkal rendelkező egyedek száma a mintában), és a standard hiba becslése:

Az arány 95%-os konfidencia intervallumát becsüljük:

Ha a minta mérete kicsi (általában amikor np vagy n(1-p) Kevésbé 5 ), akkor a binomiális eloszlást kell használni a pontos konfidenciaintervallumok kiszámításához.

Vegye figyelembe, hogy ha p akkor százalékban kifejezve (1-p) kicserélve (100p).

Konfidenciaintervallumok értelmezése

A konfidenciaintervallum értelmezésekor a következő kérdések érdekelnek bennünket:

Milyen széles a konfidencia intervallum?

A széles konfidenciaintervallum azt jelzi, hogy a becslés pontatlan; szűk finom becslést jelez.

A konfidencia intervallum szélessége a standard hiba nagyságától függ, ami viszont a minta méretétől függ, és ha az adatok változékonyságából egy numerikus változót veszünk figyelembe, akkor szélesebb konfidenciaintervallumot ad, mint egy nagy adathalmaz vizsgálata. néhány változóból.

Tartalmaz-e a CI valamilyen különös érdeklődésre számot tartó értéket?

Ellenőrizheti, hogy egy populációs paraméter valószínű értéke egy konfidenciaintervallumba esik-e. Ha igen, akkor az eredmények összhangban vannak ezzel a valószínű értékkel. Ha nem, akkor nem valószínű (95%-os konfidenciaintervallumhoz közel 5%), hogy a paraméternek ez az értéke van.

A "Katren-Style" továbbra is Konstantin Kravchik ciklusát publikálja az orvosi statisztikákról. A szerző két korábbi cikkében olyan fogalmak magyarázatát érintette, mint és.

Konstantin Kravchik

Matematikus-elemző. Az orvostudományi és humán tudományok statisztikai kutatásának szakembere

Moszkva város

Nagyon gyakran a klinikai vizsgálatokról szóló cikkekben találhat egy titokzatos kifejezést: "konfidenciaintervallum" (95% CI vagy 95% CI - konfidencia intervallum). Például egy cikkben ez állhat: "A tanulói t-tesztet a különbségek szignifikanciájának felmérésére használták, 95%-os konfidenciaintervallumot számítva."

Mi a "95%-os konfidencia intervallum" értéke, és miért kell kiszámítani?

Mi az a konfidenciaintervallum? - Ez az a tartomány, amelybe a népesség valódi átlagértékei esnek. És mi van, vannak "valótlan" átlagok? Bizonyos értelemben igen, igen. Ebben kifejtettük, hogy a teljes populációban nem lehet mérni az érdeklődésre számot tartó paramétert, ezért a kutatók megelégszenek egy korlátozott mintával. Ebben a mintában (például testtömeg szerint) van egy átlagérték (egy bizonyos súly), amely alapján a teljes általános sokaság átlagát ítéljük meg. Nem valószínű azonban, hogy a mintában (különösen egy kicsiben) az átlagos tömeg egybeesik az általános sokaság átlagos súlyával. Ezért helyesebb az általános populáció átlagértékeinek tartományának kiszámítása és használata.

Tegyük fel például, hogy a hemoglobin 95%-os konfidencia intervalluma (95% CI) 110 és 122 g/l között van. Ez azt jelenti, hogy 95 %-os valószínűséggel a hemoglobin valódi átlagértéke az általános populációban 110-122 g/l tartományba esik. Más szóval, nem ismerjük az átlagos hemoglobint az általános populációban, de ennek a tulajdonságnak az értéktartományát 95%-os valószínűséggel tudjuk jelezni.

A bizalmi intervallumok különösen fontosak a csoportok közötti átlagok különbsége, vagy az úgynevezett hatásméret szempontjából.

Tegyük fel, hogy összehasonlítottuk két vaskészítmény hatékonyságát: egy régóta forgalomban lévő és egy most bejegyzett vaskészítményt. A terápia lefolytatása után a vizsgált betegcsoportokban felmértük a hemoglobin koncentrációját, és a statisztikai program számunkra kiszámolta, hogy a két csoport átlagértékei közötti különbség 95%-os valószínűséggel az 1,72-14,36 g/l (1. táblázat).

Tab. 1. Független minták kritériuma
(a csoportokat hemoglobinszint alapján hasonlítják össze)

Ezt a következőképpen kell értelmezni: az általános populációban az új gyógyszert szedő betegek egy részénél átlagosan 1,72-14,36 g/l-rel lesz magasabb a hemoglobin, mint azoknál, akik már ismert gyógyszert szedtek.

Más szóval, az általános populációban a csoportok hemoglobin átlagértékeinek különbsége 95% -os valószínűséggel ezeken a határokon belül van. A kutatónak kell eldöntenie, hogy ez sok vagy kevés. Mindennek az a lényege, hogy nem egy átlagértékkel dolgozunk, hanem egy értéktartománnyal, ezért megbízhatóbban becsüljük meg egy paraméter különbségét a csoportok között.

A statisztikai csomagokban a kutató döntése alapján a konfidenciaintervallum határai önállóan szűkíthetők vagy bővíthetők. A konfidenciaintervallum valószínűségeinek csökkentésével szűkítjük az átlagok körét. Például 90%-os CI-nél az átlagok tartománya (vagy az átlagkülönbségek) szűkebb lesz, mint 95%-os CI-nél.

Ezzel szemben a valószínűség 99%-ra növelése szélesíti az értékek tartományát. A csoportok összehasonlításakor a CI alsó határa átlépheti a nullát. Például, ha a konfidenciaintervallum határait kiterjesztettük 99 %-ra, akkor az intervallum határai –1 és 16 g/L között mozogtak. Ez azt jelenti, hogy az általános populációban vannak olyan csoportok, amelyek közötti átlagok különbsége a vizsgált tulajdonságnál 0 (M=0).

A megbízhatósági intervallumok statisztikai hipotézisek tesztelésére használhatók. Ha a konfidencia intervallum átlépi a nulla értéket, akkor igaz a nullhipotézis, amely feltételezi, hogy a csoportok nem különböznek a vizsgált paraméterben. A fentebb leírt példa, amikor a határokat 99%-ra bővítettük. Valahol az általános populációban találtunk olyan csoportokat, amelyek semmiben sem különböztek egymástól.

A hemoglobin különbségének 95%-os konfidencia intervalluma, (g/l)


Az ábra a két csoport átlagos hemoglobin-különbségének 95%-os konfidencia intervallumát mutatja vonalként. A vonal átmegy a nulla ponton, ezért a nullával egyenlő átlagok között különbség van, ami megerősíti azt a nullhipotézist, hogy a csoportok nem különböznek egymástól. A csoportok közötti különbség -2 és 5 g/l között van, ami azt jelenti, hogy a hemoglobin vagy 2 g/l-rel csökkenhet, vagy 5 g/l-rel emelkedhet.

A konfidenciaintervallum nagyon fontos mutató. Ennek köszönhetően látható, hogy a csoportok közötti különbségek valóban az átlagok eltéréséből, vagy a nagy mintából származtak-e, mert nagy mintánál nagyobb az esély a különbségek megtalálására, mint egy kicsinél.

A gyakorlatban ez így nézhet ki. 1000 fős mintát vettünk, megmértük a hemoglobinszintet, és megállapítottuk, hogy az átlagok különbségének konfidencia intervalluma 1,2-1,5 g/l. A statisztikai szignifikancia szintje ebben az esetben p

Azt látjuk, hogy a hemoglobin koncentráció nőtt, de szinte észrevehetetlenül, ezért a statisztikai szignifikancia éppen a mintanagyság miatt jelent meg.

A bizalmi intervallumok nemcsak átlagokra, hanem arányokra (és kockázati arányokra) is számíthatók. Például arra vagyunk kíváncsiak, hogy a kifejlesztett gyógyszer szedése közben milyen arányban értek el remissziót a betegek konfidencia intervalluma. Tételezzük fel, hogy az arányok, azaz az ilyen betegek arányának 95%-os CI-je a 0,60-0,80 tartományba esik. Így elmondhatjuk, hogy gyógyszerünk az esetek 60-80%-ában terápiás hatású.

Bármely minta csak hozzávetőleges képet ad az általános sokaságról, és a minta összes statisztikai jellemzője (átlag, módusz, szórás...) az általános paraméterek valamilyen közelítése vagy mondjuk becslése, ami a legtöbb esetben nem számítható ki, mivel a lakosság elérhetetlensége (20. ábra) .

20. ábra Mintavételi hiba

De megadhatja azt az intervallumot, amelyben bizonyos valószínűséggel a statisztikai jellemző valódi (általános) értéke található. Ezt az intervallumot ún d konfidencia intervallum (CI).

Tehát az általános átlag 95%-os valószínűséggel belül van

tól ig, (20)

ahol t - a Student-féle kritérium táblázatos értéke α =0,05 és f= n-1

Megtalálható és 99% CI, ebben az esetben t számára választották α =0,01.

Mi a gyakorlati jelentősége egy konfidenciaintervallumnak?

    A széles konfidenciaintervallum azt jelzi, hogy a minta átlaga nem tükrözi pontosan a sokaság átlagát. Ennek oka általában az elégtelen mintanagyság, vagy annak heterogenitása, pl. nagy szórás. Mindkettő nagy hibát ad az átlagban, és ennek megfelelően szélesebb CI-t ad. És ez az oka annak, hogy visszatérjünk a kutatás tervezési szakaszához.

    A felső és alsó CI határértékek azt értékelik, hogy az eredmények klinikailag jelentősek lesznek-e

Foglalkozzunk részletesebben a csoporttulajdonságok vizsgálata eredményeinek statisztikai és klinikai jelentőségének kérdésével. Emlékezzünk vissza, hogy a statisztika feladata legalább néhány eltérés kimutatása az általános sokaságban, mintaadatok alapján. A klinikus feladata, hogy olyan (nem bármilyen) különbséget találjon, amely segíti a diagnózist vagy a kezelést. És nem mindig a statisztikai következtetések képezik a klinikai következtetések alapját. Így a hemoglobin statisztikailag szignifikáns 3 g/l-es csökkenése nem ad okot aggodalomra. És fordítva, ha az emberi test valamely problémája nem tömegjellegű a teljes népesség szintjén, ez nem ok arra, hogy ne foglalkozzunk ezzel a problémával.

Ezt a pozíciót figyelembe vesszük példa.

A kutatók arra voltak kíváncsiak, hogy azok a fiúk, akik valamilyen fertőző betegségben szenvedtek, lemaradnak-e társaikhoz képest növekedésben. Ebből a célból szelektív vizsgálatot végeztek, amelyben 10 ilyen betegségben szenvedő fiú vett részt. Az eredményeket a 23. táblázat tartalmazza.

23. táblázat Statisztikai eredmények

alsó határ

felső határ

Műszaki adatok (cm)

középső

Ezekből a számításokból az következik, hogy a 10 éves, valamilyen fertőző betegségben szenvedő fiúk szelektív átlagmagassága megközelíti a normális értéket (132,5 cm). A konfidenciaintervallum alsó határa (126,6 cm) azonban azt jelzi, hogy 95%-os valószínűséggel ezeknek a gyerekeknek a valódi átlagmagassága megfelel az "alacsony termet" fogalmának, azaz. ezek a gyerekek csökevényesek.

Ebben a példában a konfidenciaintervallum-számítások eredményei klinikailag szignifikánsak.

FREKVENCIÁK ÉS ALKATRÉSZEK BIZTONSÁGI INTERVALLUMAI

© 2008

Országos Közegészségügyi Intézet, Oslo, Norvégia

A cikk leírja és tárgyalja a gyakoriságok és arányok konfidenciaintervallumainak kiszámítását Wald, Wilson, Klopper-Pearson módszerekkel, szögtranszformációval és Wald módszerrel Agresti-Cowll korrekcióval. A bemutatott anyag általános tájékoztatást nyújt a gyakoriságok és arányok konfidenciaintervallumának kiszámításának módszereiről, és célja, hogy felkeltse a folyóirat olvasóinak érdeklődését nemcsak a konfidenciaintervallumok használatára vonatkozóan saját kutatásaik eredményeinek bemutatásakor, hanem a szakirodalom elolvasása iránt is, mielőtt elkezdené. dolgozzon a jövőbeni kiadványokon.

Kulcsszavak: konfidencia intervallum, gyakoriság, arány

Az egyik korábbi publikációban röviden megemlítették a kvalitatív adatok leírását, és közölték, hogy ezek intervallumbecslése előnyösebb, mint a pontbecslés a vizsgált jellemző általános populációban való előfordulási gyakoriságának leírására. Valójában, mivel a vizsgálatokat mintaadatok felhasználásával végzik, az eredmények általános sokaságra való vetítésének tartalmaznia kell egy pontatlanságot a mintabecslésben. A konfidencia intervallum a becsült paraméter pontosságának mértéke. Érdekes, hogy egyes, a statisztika alapjairól szóló könyvekben az orvosok számára teljesen figyelmen kívül hagyják a gyakoriságok konfidenciaintervallumának témáját. Ebben a cikkben számos módszert megvizsgálunk a gyakoriságok konfidenciaintervallumának kiszámítására, feltételezve a minta jellemzőit, például a nem ismétlődést és a reprezentativitást, valamint a megfigyelések egymástól való függetlenségét. Ebben a cikkben a gyakoriság nem egy abszolút szám, amely megmutatja, hogy ez vagy az az érték hányszor fordul elő az aggregátumban, hanem egy relatív érték, amely meghatározza a vizsgálatban résztvevők arányát, akik rendelkeznek a vizsgált tulajdonsággal.

Az orvosbiológiai kutatásokban leggyakrabban 95%-os konfidencia intervallumokat alkalmaznak. Ez a konfidenciaintervallum az a régió, amelybe a valós arány az idő 95%-ában esik. Más szóval, 95%-os biztonsággal állítható, hogy egy tulajdonság előfordulási gyakoriságának valós értéke az általános populációban a 95%-os konfidencia intervallumon belül lesz.

Az orvoskutatók számára készült statisztikai tankönyvek többsége arról számol be, hogy a gyakorisági hibát a képlet segítségével számítják ki

ahol p a jellemző előfordulási gyakorisága a mintában (0 és 1 közötti érték). A legtöbb hazai tudományos cikkben egy jellemző előfordulási gyakoriságának értéke a mintában (p), valamint annak hibája (s) szerepel p ± s formában. Célszerűbb azonban egy 95%-os konfidenciaintervallumot bemutatni egy tulajdonság általános populációban való előfordulásának gyakoriságára, amely tartalmazza majd a

előtt.

Egyes tankönyvekben kis minták esetén javasolt az 1,96-os értéket a t értékkel helyettesíteni N - 1 szabadsági fok esetén, ahol N a mintában lévő megfigyelések száma. A t értéke megtalálható a t-eloszlás táblázataiban, amelyek szinte minden statisztikai tankönyvben megtalálhatók. A t eloszlásának használata a Wald-módszerhez nem nyújt látható előnyöket az alább tárgyalt többi módszerhez képest, ezért egyes szerzők nem üdvözlik.

A gyakoriságok vagy törtek konfidenciaintervallumainak kiszámítására szolgáló fenti módszer Abraham Waldról (Abraham Wald, 1902–1950) kapta a nevét, mivel Wald és Wolfowitz 1939-es publikációja után kezdték széles körben használni. Magát a módszert azonban Pierre Simon Laplace (1749–1827) javasolta már 1812-ben.

A Wald-módszer nagyon népszerű, de alkalmazása jelentős problémákkal jár. A módszer nem ajánlott kis mintaméreteknél, valamint olyan esetekben, amikor egy jellemző előfordulási gyakorisága 0 vagy 1 (0% vagy 100%) felé hajlik, és egyszerűen nem lehetséges 0 és 1 gyakoriság esetén. a normál eloszlási közelítés, amelyet a hiba kiszámításakor használunk, "nem működik" olyan esetekben, amikor n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.



ahol a 95%-os konfidencia intervallum kiszámításakor 1,96 értéket vesz fel, N a megfigyelések száma, p pedig a jellemző gyakorisága a mintában. Ez a módszer az online számológépekben elérhető, így alkalmazása nem okoz problémát. és nem javasoljuk ennek a módszernek a használatát n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Úgy gondolják, hogy a Wilson-módszer mellett az Agresti–Caull-korrigált Wald-módszer is optimális becslést ad a gyakoriságok konfidenciaintervallumára vonatkozóan. Az Agresti-Coulle korrekció a Wald-képletben egy tulajdonság előfordulási gyakoriságát a mintában (p) helyettesíti p`-vel, amikor kiszámítjuk, hogy melyik 2-t adjuk a számlálóhoz, és 4-et a nevezőhöz, azaz , p` = (X + 2) / (N + 4), ahol X a vizsgálatban résztvevők száma, akik rendelkeznek a vizsgált tulajdonsággal, N pedig a minta mérete. Ez a módosítás nagyon hasonló eredményeket ad a Wilson-képletéhez, kivéve, ha az eseményarány megközelíti a 0%-ot vagy a 100%-ot, és a minta kicsi. A gyakoriságok konfidenciaintervallumának kiszámítására szolgáló fenti módszereken kívül folytonossági korrekciókat javasoltak mind a Wald-módszerhez, mind a Wilson-módszerhez kis minták esetén, de a vizsgálatok kimutatták, hogy ezek alkalmazása nem megfelelő.

Tekintsük a fenti módszerek alkalmazását a konfidenciaintervallumok kiszámítására két példa segítségével. Az első esetben egy nagy, 1000, véletlenszerűen kiválasztott vizsgálati résztvevőből álló mintát vizsgálunk, amelyből 450 fő rendelkezik a vizsgált tulajdonsággal (legyen szó rizikófaktorról, kimenetelről vagy bármilyen más tulajdonságról), ami 0,45-ös gyakoriságú, ill. 45%. A második esetben a vizsgálatot kis mintán, mondjuk csak 20 fős mintán végzik, és a vizsgálatban csak 1 résztvevő (5%) rendelkezik a vizsgált tulajdonsággal. A megbízhatósági intervallumokat a Wald-módszerhez, a Wald-módszerhez Agresti-Coll-korrekcióval, a Wilson-módszerhez a Jeff Sauro által kifejlesztett online számológép segítségével számítottuk ki (http://www./wald.htm). A folytonossággal korrigált Wilson konfidencia intervallumokat a Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html) által biztosított számológép segítségével számítottuk ki. A Fisher szögtranszformációt használó számításokat "manuálisan" hajtottuk végre a t kritikus értékével 19, illetve 999 szabadsági fokra. A számítási eredményeket mindkét példa táblázatában mutatjuk be.

A konfidencia intervallumok hat különböző módon számítva a szövegben leírt két példához

Konfidenciaintervallum számítási módszer

P=0,0500 vagy 5%

95% CI X=450, N=1000, P=0,4500 vagy 45% esetén

–0,0455–0,2541

Walda Agresti-Coll korrekcióval

<,0001–0,2541

Wilson folytonossági korrekcióval

Klopper-Pearson "pontos módszere"

Szögtranszformáció

<0,0001–0,1967

A táblázatból látható, hogy az első példában az "általánosan elfogadott" Wald-módszerrel számított konfidenciaintervallum a negatív tartományba kerül, ami a gyakoriságok esetében nem mondható el. Sajnos az orosz irodalomban nem ritkák az ilyen esetek. Az adatok gyakoriságként való megjelenítésének hagyományos módja és hibája részben elfedi ezt a problémát. Például, ha egy tulajdonság előfordulási gyakorisága (százalékban) 2,1 ± 1,4, akkor ez nem olyan „irritáló”, mint 2,1% (95% CI: –0,7; 4,9), bár és ugyanazt jelenti. A Wald-módszer Agresti-Coulle korrekcióval és a szögtranszformációt használó számítás egy nullára hajló alsó korlátot ad. A folytonossági korrekciós Wilson-módszer és az "egzakt módszer" szélesebb konfidenciaintervallumokat ad, mint a Wilson-módszer. A második példában minden módszer megközelítőleg azonos konfidenciaintervallumot ad (a különbségek csak ezredrészben jelennek meg), ami nem meglepő, mivel az esemény gyakorisága ebben a példában nem sokban tér el az 50%-tól, és a minta mérete meglehetősen nagy. .

A probléma iránt érdeklődő olvasók figyelmébe ajánlhatjuk R. G. Newcombe és Brown, Cai és Dasgupta munkáit, amelyek 7, illetve 10 különböző konfidenciaintervallum-számítási módszer használatának előnyeit és hátrányait adják meg. Hazai kézikönyvekből ajánlott a és a könyv, melyben az elmélet részletes ismertetése mellett bemutatásra kerül a Wald- és Wilson-módszer, valamint a binomiális gyakorisági eloszlást figyelembe vevő konfidenciaintervallumok számítási módszere. Az ingyenes online számológépek (http://www./wald.htm és http://faculty.vassar.edu/lowry/prop1.html) mellett a gyakoriságok (és nem csak!) konfidenciaintervallumai kiszámíthatók a CIA program ( Confidence Intervals Analysis ), amely letölthető a http://www. orvosi egyetem. soton. ac. uk/cia/ .

A következő cikk a minőségi adatok összehasonlításának egyváltozós módjait vizsgálja meg.

Bibliográfia

Banerjee A. Orvosi statisztika közérthető nyelven: bevezető tanfolyam / A. Banerzhi. - M. : Gyakorlati orvostudomány, 2007. - 287 p. Orvosi statisztika / . - M. : Orvosi Információs Ügynökség, 2007. - 475 p. Glanz S. Orvosbiológiai statisztika / S. Glants. - M. : Gyakorlat, 1998. Adattípusok, eloszlásellenőrzés és leíró statisztika / // Humánökológia - 2008. - 1. sz. - 52–58. Zhizhin K.S.. Orvosi statisztika: tankönyv / . - Rostov n/D: Főnix, 2007. - 160 p. Alkalmazott orvosi statisztika / , . - Szentpétervár. : Folio, 2003. - 428 p. Lakin G. F. Biometrikus adatok / . - M. : Felsőiskola, 1990. - 350 p. Orvos V. A. Matematikai statisztika az orvostudományban / , . - M. : Pénzügy és statisztika, 2007. - 798 p. Matematikai statisztika a klinikai kutatásban / , . - M. : GEOTAR-MED, 2001. - 256 p. Junkerov V. És. Orvosi kutatási adatok orvosstatisztikai feldolgozása /,. - Szentpétervár. : VmedA, 2002. - 266 p. Agresti A. A közelítő jobb, mint a pontos a binomiális arányok intervallumbecsléséhez / A. Agresti, B. Coull // Amerikai statisztikus. - 1998. - N 52. - S. 119-126. Altman D. Magabiztos statisztikák // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - London: BMJ Books, 2000. - 240 p. Brown L.D. Interval estimation for a binomial ratio / L. D. Brown, T. T. Cai, A. Dasgupta // Statisztikai tudomány. - 2001. - N 2. - P. 101-133. Clopper C.J. A bizalmi vagy fiduciális határok használata a binomiális esetében / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - P. 404-413. Garcia-Perez M. A. A binomiális paraméter konfidenciaintervallumáról / M. A. Garcia-Perez // Minőség és mennyiség. - 2005. - N 39. - P. 467-481. Motulsky H. Intuitív biostatisztika // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 p. Newcombe R.G. Kétoldalú bizalmi intervallumok az egyarányhoz: Hét módszer összehasonlítása / R. G. Newcombe // Statisztikák az orvostudományban. - 1998. - N. 17. - P. 857–872. Sauro J. A befejezési arányok becslése kis mintákból binomiális konfidencia intervallumok segítségével: összehasonlítások és ajánlások / J. Sauro, J. R. Lewis // Proceedings of the human factor and ergonomics Society year meeting. – Orlando, FL, 2005. Wald A. A folytonos eloszlásfüggvények bizalmi határai // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - P. 105–118. Wilson E. B. Valószínű következtetés, az utódlás törvénye és a statisztikai következtetés / E. B. Wilson // Journal of American Statistical Association. - 1927. - N 22. - P. 209-212.

AZ ARÁNYOK BIZTONSÁGI IDŐKÖNYVE

A. M. Grjibovski

Országos Közegészségügyi Intézet, Oslo, Norvégia

A cikk számos módszert mutat be a binomiális arányok konfidenciaintervallumának kiszámítására, nevezetesen Wald, Wilson, arcszinusz, Agresti-Coull és egzakt Clopper-Pearson módszereket. A cikk csak általános bevezetést ad a binomiális arány konfidenciaintervallum-becslésének problémájába, és célja nem csak az, hogy az olvasókat a konfidenciaintervallumok használatára ösztönözze a saját empirikus kutatási intervallumok eredményeinek bemutatásakor, hanem arra is ösztönözze őket, hogy előzetesen tanulmányozzák a statisztikai könyveket. saját adatok elemzésére és kéziratok készítésére.

kulcsszavak: konfidencia intervallum, arány

Elérhetőség:

Vezető tanácsadó, Országos Közegészségügyi Intézet, Oslo, Norvégia

Az előző alfejezetekben megvizsgáltuk az ismeretlen paraméter becslésének kérdését a egy szám. Az ilyen értékelést "pontnak" nevezik. Számos feladatnál nem csak a paramétert kell megkeresni a megfelelő számértéket, hanem értékelje annak pontosságát és megbízhatóságát is. Szükséges tudni, hogy a paramétercsere milyen hibákhoz vezethet a pontbecslését aés milyen fokú biztonsággal számíthatunk arra, hogy ezek a hibák nem lépik túl az ismert határokat?

Az ilyen jellegű problémák különösen fontosak kis számú megfigyelésnél, amikor a pontbecslést és be nagyrészt véletlenszerű, és az a hozzávetőleges helyettesítése a-val súlyos hibákhoz vezethet.

Képet adni a becslés pontosságáról és megbízhatóságáról a,

a matematikai statisztikában úgynevezett konfidenciaintervallumokat és konfidenciavalószínűségeket használnak.

Legyen a paraméter a tapasztalatból származik elfogulatlan becslés a. Ebben az esetben szeretnénk megbecsülni a lehetséges hibát. Adjunk hozzá elég nagy p valószínűséget (például p = 0,9, 0,95 vagy 0,99) ahhoz, hogy egy p valószínűségű esemény gyakorlatilag biztosnak tekinthető, és keressünk egy s értéket, amelyre

Ezután a csere során fellépő hiba gyakorlatilag lehetséges értékeinek tartománya a a a, ± s lesz; nagy abszolút hibák csak kis valószínűséggel jelennek meg a = 1 - p. Írjuk át (14.3.1) így:

Az egyenlőség (14.3.2) azt jelenti, hogy p valószínűséggel a paraméter ismeretlen értéke a intervallumba esik

Ebben az esetben meg kell jegyezni egy körülményt. Korábban többször is figyelembe vettük annak a valószínűségét, hogy egy valószínűségi változó egy adott nem véletlenszerű intervallumba esik. Itt más a helyzet: a nem véletlenszerű, hanem véletlenszerű intervallum / r. Véletlenszerűen a helyzete az x tengelyen, a középpontja határozza meg a; általában a 2s intervallum hossza is véletlenszerű, mivel az s értékét általában kísérleti adatokból számítjuk. Ezért ebben az esetben jobb lenne a p értékét nem a pont "eltalálásának" valószínűségeként értelmezni. a a / p intervallumba, hanem annak valószínűségeként, hogy egy / p véletlenszerű intervallum lefedi a pontot a(14.3.1. ábra).

Rizs. 14.3.1

A p valószínűséget nevezzük bizalmi szint, és a / p - intervallum megbízhatósági intervallum. Intervallumhatárok ha. a x \u003d a- s és a 2 = a +és hívják bizalom határai.

Adjunk még egy értelmezést a konfidenciaintervallum fogalmának: tekinthető paraméterértékek intervallumának a, kompatibilis a kísérleti adatokkal, és nem mond ellent azoknak. Valóban, ha egyetértünk abban, hogy egy a = 1-p valószínűségű eseményt gyakorlatilag lehetetlennek tekintünk, akkor az a paraméter azon értékei, amelyekre a - a> s ellentmondónak kell lenni a kísérleti adatoknak, és azokat, amelyeknél |a - a a t na 2 .

Legyen a paraméter a van egy elfogulatlan becslés a. Ha ismernénk a mennyiség eloszlásának törvényét a, a konfidenciaintervallum megtalálásának problémája meglehetősen egyszerű lenne: elég lenne megtalálni egy s értéket, amelyre

A nehézség abban rejlik, hogy a becslés eloszlási törvénye a a mennyiség eloszlásának törvényétől függ xés következésképpen annak ismeretlen paraméterein (különösen magán a paraméteren a)

Ennek a nehézségnek a megkerülésére alkalmazhatjuk a következő durván közelítő trükköt: cseréljük ki az s kifejezésben szereplő ismeretlen paramétereket a pontbecsléseikre. Viszonylag sok kísérlettel P(kb. 20 ... 30) ez a technika általában kielégítő eredményeket ad a pontosság tekintetében.

Példaként tekintsük a matematikai elvárás konfidenciaintervallumának problémáját.

Legyen előállított P x, amelynek jellemzői a matematikai elvárás tés variancia D- ismeretlen. Ezekre a paraméterekre a következő becsléseket kaptuk:

A matematikai elvárásokhoz meg kell építeni egy / р konfidenciaintervallumot, amely megfelel a р konfidenciavalószínűségnek t mennyiségeket x.

A probléma megoldásában azt a tényt használjuk fel, hogy a mennyiség t az összeg P független, azonos eloszlású valószínűségi változók X hés a centrális határértéktétel szerint kellően nagy P eloszlási törvénye közel áll a normálishoz. A gyakorlatban még viszonylag kis számú tag esetén is (10 ... 20 nagyságrendű) az összeg eloszlási törvénye megközelítőleg normálisnak tekinthető. Feltételezzük, hogy az érték t a normál törvény szerint osztják el. Ennek a törvénynek a jellemzői - a matematikai elvárás és a variancia - egyenlőek, ill tés

(lásd a 13. fejezet 13.3. alpontját). Tegyük fel, hogy az érték D ismert számunkra, és találunk olyan Ep értéket, amelyre

A 6. fejezet (6.3.5) képletével a (14.3.5) bal oldalán lévő valószínűséget a normális eloszlás függvényében fejezzük ki.

ahol a becslés szórása t.

Az egyenletből

keresse meg az Sp értéket:

ahol arg Ф* (x) a Ф* inverz függvénye (X), azok. az argumentum olyan értéke, amelyre a normális eloszlásfüggvény egyenlő X.

Diszperzió D, amelyen keresztül az érték kifejeződik a 1P, nem tudjuk pontosan; hozzávetőleges értékeként használhatja a becslést D(14.3.4), és körülbelül:

Így a konfidenciaintervallum felépítésének problémája megközelítőleg megoldott, ami egyenlő:

ahol a gp-t a (14.3.7) képlet határozza meg.

Annak érdekében, hogy elkerüljük a fordított interpolációt az Ф * (l) függvény táblázataiban az s p kiszámításakor, célszerű egy speciális táblázatot összeállítani (14.3.1. táblázat), amely felsorolja a mennyiség értékeit.

attól függően, hogy r. A (p érték a normáltörvényhez határozza meg a szórások számát, amelyeket a diszperziós középponttól jobbra és balra félre kell tenni, hogy a kapott területre való esés valószínűsége egyenlő legyen p-vel.

7 p értékén keresztül a konfidencia intervallum a következőképpen fejeződik ki:

14.3.1. táblázat

1. példa Az értékkel 20 kísérletet végeztünk x; az eredmények a táblázatban láthatók. 14.3.2.

14.3.2. táblázat

Meg kell találni a becslést a mennyiség matematikai elvárására xés állítsunk össze egy p = 0,8 konfidenciaszintnek megfelelő konfidenciaintervallumot.

Megoldás. Nekünk van:

Az n origót választva: = 10, a harmadik képlet (14.2.14) szerint megkapjuk a torzítatlan becslést D :

táblázat szerint 14.3.1 találjuk

Bizalmi határok:

Megbízhatósági intervallum:

Paraméterértékek t, Az ebben az intervallumban lévő adatok kompatibilisek a táblázatban megadott kísérleti adatokkal. 14.3.2.

Hasonló módon a variancia konfidenciaintervallumát is meg lehet alkotni.

Legyen előállított P független kísérletek egy valószínűségi változón x ismeretlen paraméterekkel -ból és A-ból, valamint a szóráshoz D az elfogulatlan becslést kapjuk:

A variancia konfidenciaintervallumának közelítő felépítése szükséges.

A (14.3.11) képletből látható, hogy az érték D képviseli

összeg P alak valószínűségi változói . Ezek az értékek nem

független, hiszen bármelyik tartalmazza a mennyiséget t, mindenki mástól függ. Kimutatható azonban, hogy mint Pösszegük eloszlási törvénye is közel áll a normálishoz. Majdnem at P= 20...30 már normálisnak tekinthető.

Tegyük fel, hogy ez így van, és keressük meg ennek a törvénynek a jellemzőit: a matematikai elvárást és szórást. A pontszám óta D- akkor elfogulatlan M[D] = D.

Variancia számítás D D viszonylag bonyolult számításokhoz kapcsolódik, ezért a kifejezését levezetés nélkül adjuk meg:

ahol c 4 - a mennyiség negyedik központi momentuma x.

Ennek a kifejezésnek a használatához helyettesítenie kell benne a 4 és a D(legalábbis hozzávetőlegesen). Ahelyett D használhatja az értékelést D. Elvileg a negyedik központi momentum helyettesíthető a becsült értékével is, például a következő alakzat értékével:

de egy ilyen csere rendkívül alacsony pontosságot ad, mivel általában korlátozott számú kísérlettel a nagyfokú nyomatékokat nagy hibákkal határozzák meg. A gyakorlatban azonban gyakran előfordul, hogy a mennyiség eloszlási törvényének formája x előre ismert: csak a paraméterei ismeretlenek. Ezután megpróbálhatjuk az u4-et kifejezésekkel kifejezni D.

Vegyük a leggyakoribb esetet, amikor az érték x a normál törvény szerint osztják el. Ekkor a negyedik központi momentum a szórással fejeződik ki (lásd a 6. fejezet 6.2. alfejezetét);

és a (14.3.12) képlet megadja vagy

A (14.3.14)-ben az ismeretlen helyettesítése Dértékelését D, kapjuk: honnan

Az u 4 pillanata kifejezéssel fejezhető ki D más esetekben is, amikor a mennyiség elosztását x nem normális, de a megjelenése ismert. Például az egyenletes sűrűség törvényéhez (lásd az 5. fejezetet) a következőket kapjuk:

ahol (a, P) az az intervallum, amelyen a törvény adott.

Következésképpen,

A (14.3.12) képlet szerint a következőket kapjuk: ahonnan kb

Azokban az esetekben, amikor a 26-os érték eloszlási törvényének alakja ismeretlen, az a /) értékének becslésénél továbbra is a (14.3.16) képlet használata javasolt, ha nincs különösebb ok azt hinni, hogy ez törvény nagyon eltér a normáltól (észrevehető pozitív vagy negatív kurtózisa van).

Ha a /) közelítő értékét így vagy úgy megkapjuk, akkor ugyanúgy meg lehet alkotni a variancia konfidenciaintervallumát, mint ahogy azt a matematikai elváráshoz építettük:

táblázatban található az adott p valószínűségtől függő érték. 14.3.1.

2. példa. Keressen egy körülbelül 80%-os megbízhatósági intervallumot egy véletlen változó varianciájához x az 1. példa feltételei szerint, ha ismert, hogy az érték x a normálishoz közeli törvény szerint elosztva.

Megoldás. Az érték ugyanaz marad, mint a táblázatban. 14.3.1:

A (14.3.16) képlet szerint

A (14.3.18) képlet szerint megtaláljuk a konfidencia intervallumot:

A szórás megfelelő értéktartománya: (0,21; 0,29).

14.4. Pontos módszerek megbízhatósági intervallumok felépítésére a normális törvény szerint eloszló valószínűségi változó paramétereihez

Az előző alfejezetben nagyjából közelítő módszereket vettünk figyelembe az átlag és a variancia konfidencia-intervallumának felépítésére. Itt adunk egy ötletet ugyanazon probléma megoldásának pontos módszereiről. Hangsúlyozzuk, hogy a konfidenciaintervallumok pontos megtalálásához feltétlenül szükséges előre ismerni a mennyiség eloszlási törvényének alakját. x, míg ez közelítő módszerek alkalmazásához nem szükséges.

A megbízhatósági intervallumok felépítésének pontos módszereinek ötlete a következő. Bármely konfidenciaintervallum megtalálható néhány egyenlőtlenség teljesülésének valószínűségét kifejező feltételből, amely magában foglalja a számunkra érdekes becslést a. Osztályelosztási törvény aáltalános esetben a mennyiség ismeretlen paramétereitől függ x. Néha azonban lehetséges az egyenlőtlenségek átadása egy valószínűségi változóból a a megfigyelt értékek valamilyen más függvényéhez X p X 2, ..., X o. amelynek eloszlási törvénye nem ismeretlen paraméterektől, hanem csak a kísérletek számától és a mennyiség eloszlási törvényének alakjától függ x. Az ilyen véletlenszerű változók nagy szerepet játszanak a matematikai statisztikában; legrészletesebben a mennyiség normális eloszlásának esetére tanulmányozták őket x.

Például bebizonyosodott, hogy a mennyiség normális eloszlása ​​mellett x véletlenszerű érték

figyelemmel az ún Hallgatói elosztási törvény Val vel P- 1 szabadságfok; ennek a törvénynek a sűrűsége a formája

ahol G(x) az ismert gammafüggvény:

Az is bebizonyosodott, hogy a valószínűségi változó

a következővel rendelkezik: "eloszlás % 2". P- 1 szabadságfok (lásd 7. fejezet), melynek sűrűségét a képlet fejezi ki

Anélkül, hogy a (14.4.2) és (14.4.4) eloszlások származtatásain foglalkoznánk, bemutatjuk, hogyan alkalmazhatók ezek a paraméterek konfidenciaintervallumának felépítésekor. Ty D .

Legyen előállított P független kísérletek egy valószínűségi változón x, a normál törvény szerint elosztva ismeretlen paraméterekkel TIO. Ezeknél a paramétereknél becslések

Mindkét paraméterre meg kell alkotni a konfidencia intervallumot, amely megfelel a p konfidenciavalószínűségnek.

Először alkossunk meg egy konfidenciaintervallumot a matematikai elváráshoz. Természetes, hogy ezt az intervallumot szimmetrikusan vesszük a -hoz képest t; jelöljük s p-vel az intervallum hosszának felét. Az sp értékét úgy kell megválasztani, hogy a feltétel

Próbáljuk meg átadni a (14.4.5) egyenlőség bal oldalát egy valószínűségi változóból t egy valószínűségi változóhoz T, a Student törvénye szerint terjesztik. Ehhez megszorozzuk az |m-w?| egyenlőtlenség mindkét részét

pozitív értékre: vagy a (14.4.1) jelöléssel,

Keressünk egy olyan / p számot, hogy a / p értéke megtalálható legyen a feltételből

A (14.4.2) képletből látható, hogy (1) páros függvény, így (14.4.8) megadja

Az egyenlőség (14.4.9) határozza meg a / p értéket p függvényében. Ha rendelkezésére áll egy integrál értékek táblázata

akkor a / p értéke fordított interpolációval megtalálható a táblázatban. Kényelmesebb azonban előre összeállítani egy értéktáblázatot / p. Egy ilyen táblázatot a Függelék (5. táblázat) tartalmaz. Ez a táblázat a p konfidenciavalószínűségtől és a szabadságfokok számától függő értékeket mutatja P- 1. Miután meghatározta a / p-t a táblázat szerint. 5 és feltételezve

megtaláljuk a / p konfidenciaintervallum szélességének felét és magát az intervallumot

1. példa 5 független kísérletet végeztünk egy valószínűségi változón x, normál eloszlású, ismeretlen paraméterekkel tés róla. A kísérletek eredményeit a táblázat tartalmazza. 14.4.1.

14.4.1. táblázat

Keressen egy becslést t a matematikai várakozáshoz, és állítson össze egy 90%-os / p konfidenciaintervallumot (azaz a p \u003d 0,9 konfidenciavalószínűségnek megfelelő intervallumot).

Megoldás. Nekünk van:

iránti kérelem 5. táblázata szerint P - 1 = 4 és p = 0,9 azt találjuk ahol

A konfidencia intervallum az lesz

2. példa A 14.3. alszakasz 1. példájának feltételeire, az értéket feltételezve x normál eloszlású, keresse meg a pontos konfidenciaintervallumot.

Megoldás. A kérelem 5. táblázata szerint a címen találjuk P - 1 = 19ir =

0,8/p=1,328; innen

A 14.3. alfejezet 1. példájának megoldásával (e p = 0,072) összehasonlítva azt látjuk, hogy az eltérés nagyon kicsi. Ha a pontosságot a második tizedesjegyig tartjuk, akkor a pontos és közelítő módszerrel kapott konfidencia intervallumok megegyeznek:

Folytassuk a variancia konfidenciaintervallumának felépítését. Tekintsük az elfogulatlan varianciabecslést

és fejezzük ki a valószínűségi változót D az értéken keresztül V(14.4.3), amelynek eloszlása ​​x 2 (14.4.4):

A mennyiség eloszlási törvényének ismerete V, meg lehet találni azt a / (1 ) intervallumot, amelybe adott p valószínűséggel esik.

elosztási törvény k n _ x (v) az I 7 értéke az ábrán látható formában van. 14.4.1.

Rizs. 14.4.1

Felmerül a kérdés: hogyan válasszuk ki a / p intervallumot? Ha a mennyiség eloszlási törvénye V szimmetrikus volt (mint egy normál törvény vagy Student-eloszlás), természetes lenne a /p intervallumot szimmetrikusnak venni a matematikai elvárásokhoz képest. Ebben az esetben a törvény k n _ x (v) aszimmetrikus. Állapodjunk meg, hogy a /p intervallumot úgy választjuk meg, hogy a mennyiség kimeneti valószínűsége legyen V az intervallumon kívül jobbra és balra (a 14.4.1. ábrán az árnyékolt területek) azonosak és egyenlőek

Egy / p intervallum létrehozásához ezzel a tulajdonsággal a táblázatot használjuk. 4 alkalmazás: számokat tartalmaz y) oly módon, hogy

a mennyiséghez V, x 2 -eloszlású r szabadságfokkal. A mi esetünkben r = n- 1. Javítás r = n- 1, és keresse meg a táblázat megfelelő sorában. 4 két érték x 2 - az egyik valószínűségnek megfelelő a másik - valószínűségek Jelöljük ezeket

értékeket 2-korés xl? Az intervallum rendelkezik y 2 , a baljával, és y ~ jobb vége.

Most megtaláljuk a szükséges /| konfidenciaintervallumot a D, és határvonalú variancia esetén D2, amely lefedi a lényeget D p valószínűséggel:

Szerkesszünk egy olyan / (, = (?> b A) intervallumot, amely lefedi a pontot D akkor és csak akkor, ha az érték V intervallumba esik / r. Mutassuk meg, hogy az intervallum

megfelel ennek a feltételnek. Valóban, az egyenlőtlenségek egyenértékűek az egyenlőtlenségekkel

és ezek az egyenlőtlenségek p valószínűséggel fennállnak. Így a diszperzió konfidencia intervallumát megtaláljuk, és a (14.4.13) képlettel fejezzük ki.

3. példa Keresse meg a variancia konfidenciaintervallumát a 14.3. alfejezet 2. példájának feltételei mellett, ha ismert, hogy az érték x normálisan elosztva.

Megoldás. Nekünk van . A pályázat 4. táblázata szerint

címen találjuk r = n - 1 = 19

A (14.4.13) képlet alapján megtaláljuk a diszperzió konfidencia intervallumát

A szórásra vonatkozó megfelelő intervallum: (0,21; 0,32). Ez az intervallum csak kis mértékben haladja meg a 14.3 alfejezet 2. példájában kapott intervallumot (0,21; 0,29), közelítő módszerrel.

  • A 14.3.1. ábra olyan konfidenciaintervallumot vesz figyelembe, amely szimmetrikus az a-ra. Általában, mint később látni fogjuk, erre nincs szükség.
KATEGÓRIÁK

NÉPSZERŰ CIKKEK

2022 "kingad.ru" - az emberi szervek ultrahangvizsgálata