Mivel az új változó normális eloszlású, a φ változó 95%-os konfidencia intervallumának alsó és felső határa φ-1,96 és φ+1,96left">

A kis minták 1,96 helyett az N – 1 szabadságfok helyett a t értékkel javasolt helyettesíteni. Ez a módszer nem ad negatív értékeket, és pontosabb becslést tesz lehetővé a gyakoriságok konfidencia intervallumaira, mint a Wald-módszer. Emellett számos hazai orvosstatisztikai referenciakönyv is leírja, ami azonban nem vezetett széles körű alkalmazásához az orvosi kutatásokban. A konfidenciaintervallumok szögtranszformációval történő kiszámítása nem javasolt 0-hoz vagy 1-hez közelítő gyakoriságok esetén.

Ezzel általában véget is ér az orvoskutatóknak szánt statisztika alapjaival foglalkozó könyvek többségében a konfidenciaintervallum-becslési módszerek leírása, és ez a probléma nemcsak a hazai, hanem a külföldi szakirodalomra is jellemző. Mindkét módszer a központi határérték tételen alapul, ami nagy mintát jelent.

Figyelembe véve a konfidenciaintervallumok fenti módszerekkel történő becslésének hiányosságait, Clopper és Pearson 1934-ben egy módszert javasolt az úgynevezett egzakt konfidenciaintervallum kiszámítására, tekintettel a vizsgált tulajdonság binomiális eloszlására. Ez a módszer számos online számológépben elérhető, de az így kapott konfidencia intervallumok a legtöbb esetben túl szélesek. Ugyanakkor ez a módszer olyan esetekben javasolt, ahol konzervatív értékelésre van szükség. A módszer konzervativitása a minta méretének csökkenésével nő, különösen, ha N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Sok statisztikus szerint a gyakoriságok konfidenciaintervallumának legoptimálisabb értékelését az 1927-ben javasolt, de a hazai orvosbiológiai kutatásokban gyakorlatilag nem használt Wilson-módszer végzi. Ez a módszer nemcsak nagyon kicsi és nagyon nagy gyakoriságú konfidenciaintervallumok becslését teszi lehetővé, hanem kis számú megfigyelésre is alkalmazható. Általában a Wilson-képlet szerinti konfidenciaintervallum a következővel rendelkezik

Mekkora a valószínűsége a konfidenciaintervallumnak. Megbízhatósági intervallum

Az intelligencia nemcsak tudásból áll, hanem a tudás gyakorlati alkalmazásának képességéből is. (Arisztotelész)

Bizalmi intervallumok

általános áttekintés

A sokaságból mintát véve megkapjuk a kérdéses paraméter pontbecslését, és kiszámítjuk a standard hibát, amely jelzi a becslés pontosságát.

A legtöbb esetben azonban a standard hiba önmagában nem elfogadható. Sokkal hasznosabb ezt a pontossági mértéket kombinálni a populációs paraméter intervallumbecslésével.

Ez megtehető a minta statisztika (paraméter) elméleti valószínűség-eloszlásának ismeretével a paraméter konfidenciaintervallumának (CI - Confidence Interval, CI - Confidence Interval) kiszámításához.

Általánosságban elmondható, hogy a konfidenciaintervallum mindkét irányban kiterjeszti a becsléseket (egy adott paraméter standard hibájának bizonyos többszörösével); az intervallumot meghatározó két értéket (megbízhatósági határt) általában vessző választja el és zárójelbe tesz.

Konfidencia intervallum az átlaghoz

Normál elosztás használata

A mintaátlag normál eloszlású, ha a minta mérete nagy, így a normál eloszlás ismeretét a mintaátlag figyelembe vételekor alkalmazhatja.

Pontosabban, a mintaátlagok eloszlásának 95%-a a sokaság átlagának 1,96 szórásán (SD) belül van.

Ha csak egy mintánk van, azt az átlag standard hibájának (SEM) nevezzük, és kiszámítjuk az átlag 95%-os konfidencia intervallumát a következőképpen:

Ha ezt a kísérletet többször megismételjük, az intervallum az esetek 95%-ában tartalmazza a valódi populáció átlagát.

Jellemzően ez egy konfidenciaintervallum, például azon értékek intervalluma, amelyen belül a valódi populáció átlaga (általános átlag) 95%-os valószínűséggel esik.

Bár nem teljesen szigorú (a sokaság átlaga fix érték, ezért nem lehet hozzá való valószínűséget kötni), a konfidenciaintervallum ilyen értelmezése, de fogalmilag könnyebb megérteni.

Használat t- terjesztés

A normál eloszlást akkor használhatja, ha ismeri a sokaság varianciájának értékét. Ezenkívül, ha a minta mérete kicsi, a minta átlaga normális eloszlást követ, ha az alapul szolgáló populációs adatok normális eloszlásúak.

Ha a sokaság alapjául szolgáló adatok nem normális eloszlásúak és/vagy a populáció variancia ismeretlen, a minta átlaga engedelmeskedik Diák t-eloszlása.

A 95%-os konfidencia intervallumot az általános sokaság átlagára a következőképpen számítjuk ki:

Hol van a százalékpont (percentilis) t- Student-féle t eloszlás (n-1) szabadságfokkal, ami 0,05 kétoldali valószínűséget ad.

Általában szélesebb tartományt biztosít, mint a normál eloszlás használata, mert figyelembe veszi a sokaság szórásának becsléséből és/vagy a kis mintaméretből adódó további bizonytalanságot.

Ha a minta mérete nagy (100 vagy több nagyságrendű), a két eloszlás közötti különbség ( t-Diákés normális) jelentéktelen. Azonban mindig használják t- eloszlást a konfidenciaintervallumok kiszámításakor, még akkor is, ha a minta mérete nagy.

Általában a 95%-os CI-t jelentik. Más konfidenciaintervallumok is kiszámíthatók, például az átlag 99%-os CI.

A standard hiba és a táblázat értékének szorzata helyett t- eloszlást, amely 0,05 kétoldali valószínűségnek felel meg, szorozza meg (standard hiba) azzal az értékkel, amely 0,01 kétoldali valószínűségnek felel meg. Ez szélesebb konfidenciaintervallum, mint a 95%-os konfidenciaintervallum, mert megnövekedett bizalmat tükröz, hogy az intervallum valóban tartalmazza a sokaság átlagát.

Konfidencia intervallum az arányhoz

Az arányok mintavételi eloszlása ​​binomiális eloszlású. Ha azonban a mintanagyság n elég nagy, akkor az arány mintavételi eloszlása ​​megközelítőleg normális az átlaggal.

Szelektív arány szerint értékeljük p=r/n(Ahol r- a számunkra érdekes jellemzőkkel rendelkező egyedek száma a mintában), és a standard hiba becslése:

Az arány 95%-os konfidencia intervallumát becsüljük:

Ha a minta mérete kicsi (általában amikor n.p. vagy n(1-p) Kevésbé 5 ), akkor a pontos konfidenciaintervallumok kiszámításához a binomiális eloszlást kell használni.

Vegye figyelembe, hogy ha p akkor százalékban kifejezve (1-p) kicserélve (100 p).

Konfidenciaintervallumok értelmezése

A konfidenciaintervallum értelmezésekor a következő kérdések érdekelnek bennünket:

Milyen széles a konfidencia intervallum?

A széles konfidenciaintervallum azt jelzi, hogy a becslés pontatlan; szűk pontos becslést jelez.

A konfidenciaintervallum szélessége a standard hiba nagyságától függ, ami viszont a minta méretétől függ, és ha egy numerikus változót veszünk figyelembe, az adatok változékonysága szélesebb konfidenciaintervallumokat eredményez, mint egy nagy, néhány változóból álló adathalmaz vizsgálata. .

Tartalmaz-e a CI valamilyen különös érdeklődésre számot tartó értéket?

Ellenőrizheti, hogy egy populációs paraméter valószínű értéke a konfidenciaintervallumba esik-e. Ha igen, az eredmények összhangban vannak ezzel a valószínű értékkel. Ha nem, akkor nem valószínű (95%-os konfidenciaintervallumhoz közel 5%), hogy a paraméternek ez az értéke.

A "Katren-Style" folytatja Konstantin Kravchik orvosi statisztikákról szóló sorozatának kiadását. A szerző két korábbi cikkében olyan fogalmak magyarázatával foglalkozott, mint pl.

Konstantin Kravchik

Matematikus-elemző. Az orvos- és bölcsészettudományi statisztikai kutatások specialistája

Moszkva város

A klinikai tanulmányokról szóló cikkekben nagyon gyakran találhatunk egy titokzatos kifejezést: „konfidenciaintervallum” (95 % CI vagy 95 % CI - konfidencia intervallum). Például egy cikk ezt írhatja: „A különbségek szignifikanciájának felméréséhez a Student-féle t-próbát használták a 95 %-os konfidenciaintervallum kiszámításához.”

Mi a „95 %-os konfidencia intervallum” értéke, és miért kell kiszámolni?

Mi az a konfidenciaintervallum? - Ez az a tartomány, amelyen belül fekszik a valódi népesség jelentése. Vannak „valótlan” átlagok? Bizonyos értelemben igen, igen. Kifejtettük, hogy a teljes populációban nem lehet mérni az érdeklődésre számot tartó paramétert, ezért a kutatók megelégszenek egy korlátozott mintával. Ebben a mintában (például testtömeg alapján) van egy átlagérték (egy bizonyos súly), amely alapján a teljes populáció átlagértékét ítéljük meg. Nem valószínű azonban, hogy egy mintában (különösen egy kicsiben) az átlagos tömeg egybeesik az általános sokaság átlagos súlyával. Ezért helyesebb a populáció átlagértékeinek tartományának kiszámítása és használata.

Képzelje el például, hogy a hemoglobin 95%-os konfidencia intervalluma (95% CI) 110-122 g/l. Ez azt jelenti, hogy 95%-os esély van arra, hogy a populáció valódi átlagos hemoglobinértéke 110 és 122 g/l között lesz. Más szóval, nem ismerjük a populáció átlagos hemoglobin értékét, de 95 %-os valószínűséggel egy értéktartományt jelezhetünk erre a tulajdonságra.

A megbízhatósági intervallumok különösen fontosak a csoportok közötti átlagok vagy a hatásméretek közötti különbségek esetében.

Tegyük fel, hogy két vaskészítmény hatékonyságát hasonlítottuk össze: egy régóta forgalomba hozott és egy most bejegyzett vaskészítményt. A terápia lefolytatása után a vizsgált betegcsoportokban felmértük a hemoglobin koncentrációt, és a statisztikai program kiszámította, hogy a két csoport átlagértékei közötti különbség 95 %-os valószínűséggel 1,72 és 1,72 közötti tartományba esik. 14,36 g/l (1. táblázat).

asztal 1. Független minták tesztelése
(a csoportokat hemoglobinszint alapján hasonlítják össze)

Ezt a következőképpen kell értelmezni: az általános populáció néhány olyan betegében, akik új gyógyszert szednek, a hemoglobin átlagosan 1,72-14,36 g/l-rel lesz magasabb, mint azoknál, akik már ismert gyógyszert szedtek.

Más szóval, az általános populációban az átlagos hemoglobin értékek különbsége a csoportok között 95%-os valószínűséggel ezeken a határokon belül van. A kutatónak kell eldöntenie, hogy ez sok vagy kevés. Mindennek az a lényege, hogy nem egy átlagértékkel dolgozunk, hanem egy értéktartománnyal, ezért megbízhatóbban becsüljük meg egy paraméter különbségét a csoportok között.

A statisztikai csomagokban a kutató belátása szerint önállóan szűkítheti vagy bővítheti a konfidenciaintervallum határait. A konfidenciaintervallum valószínűségeinek csökkentésével szűkítjük az átlagok tartományát. Például 90 %-os CI-nél az átlagok tartománya (vagy az átlagok különbsége) szűkebb lesz, mint 95 %-nál.

Ezzel szemben a valószínűség 99 %-ra növelése kibővíti az értékek tartományát. A csoportok összehasonlításakor a CI alsó határa átlépheti a nullát. Például, ha a konfidenciaintervallum határait kiterjesztettük 99 %-ra, akkor az intervallum határai –1 és 16 g/l között mozogtak. Ez azt jelenti, hogy az általános populációban vannak olyan csoportok, amelyek közötti átlagkülönbség a vizsgált jellemzőnél 0 (M = 0).

Konfidenciaintervallum segítségével statisztikai hipotéziseket tesztelhet. Ha a konfidencia intervallum átlépi a nulla értéket, akkor igaz a nullhipotézis, amely feltételezi, hogy a csoportok nem különböznek a vizsgált paraméterben. A példát fentebb leírtuk, ahol a határokat 99 %-ra bővítettük. Valahol az általános populációban találtunk olyan csoportokat, amelyek semmiben sem különböztek egymástól.

A hemoglobin különbségének 95%-os konfidencia intervalluma, (g/l)


Az ábra a két csoport közötti átlagos hemoglobin-értékek különbségének 95%-os konfidencia intervallumát mutatja. Az egyenes átmegy a nulla ponton, ezért különbség van a nulla átlaga között, ami megerősíti azt a nullhipotézist, hogy a csoportok nem különböznek egymástól. A csoportok közötti különbség –2 és 5 g/l között van. Ez azt jelenti, hogy a hemoglobin vagy 2 g/l-rel csökkenhet, vagy 5 g/l-rel emelkedhet.

A konfidenciaintervallum nagyon fontos mutató. Ennek köszönhetően látható, hogy a csoportok közötti különbségek valóban az átlagkülönbségből, vagy a nagy mintából származtak-e, hiszen nagy mintánál nagyobb az esély a különbségek megtalálására, mint egy kicsinél.

A gyakorlatban így nézhet ki. 1000 fős mintát vettünk, megmértük a hemoglobinszintet, és megállapítottuk, hogy az átlagok különbségének konfidencia intervalluma 1,2-1,5 g/l között van. A statisztikai szignifikancia szintje ebben az esetben p

Látjuk, hogy a hemoglobin koncentráció nőtt, de szinte észrevehetetlenül, ezért statisztikai szignifikancia éppen a mintanagyság miatt jelent meg.

A bizalmi intervallumok nem csak az átlagokra, hanem az arányokra (és kockázati arányokra) is számíthatók. Például arra vagyunk kíváncsiak, hogy egy kifejlesztett gyógyszer szedése közben milyen arányban értek el remissziót a betegek konfidencia intervallumát. Tegyük fel, hogy az arányok, azaz az ilyen betegek arányának 95 %-os CI-je a 0,60-0,80 tartományba esik. Így elmondhatjuk, hogy gyógyszerünk az esetek 60-80 %-ában terápiás hatású.

Bármely minta csak hozzávetőleges képet ad az általános sokaságról, és a minta összes statisztikai jellemzője (átlag, módusz, szórás...) az általános paraméterek valamilyen közelítése vagy mondjuk becslése, amelyeket a legtöbb esetben nem lehet kiszámítani. az általános lakosság elérhetetlenségére (20. ábra).

20. ábra Mintavételi hiba

De megadhatja azt az intervallumot, amelyben bizonyos valószínűséggel a statisztikai jellemző valódi (általános) értéke található. Ezt az intervallumot ún d konfidencia intervallum (CI).

Tehát az általános átlagérték 95%-os valószínűséggel belül van

tól ig, (20)

Ahol t – a Student’s teszt táblázatértéke α =0,05 és f= n-1

Ebben az esetben 99%-os CI is megtalálható t számára kiválasztott α =0,01.

Mi a gyakorlati jelentősége egy konfidenciaintervallumnak?

    A széles konfidenciaintervallum azt jelzi, hogy a minta átlaga nem tükrözi pontosan a sokaság átlagát. Ennek oka általában az elégtelen mintanagyság, vagy annak heterogenitása, pl. nagy szórás. Mindkettő nagyobb átlaghibát és ennek megfelelően szélesebb CI-t ad. És ez az alapja annak, hogy visszatérjünk a kutatás tervezési szakaszához.

    A CI felső és alsó határa becslést ad arra vonatkozóan, hogy az eredmények klinikailag jelentősek lesznek-e

Foglalkozzunk kicsit részletesebben a csoporttulajdonságok vizsgálata eredményeinek statisztikai és klinikai jelentőségének kérdésével. Emlékezzünk arra, hogy a statisztika feladata, hogy a mintaadatok alapján legalább néhány eltérést kimutatjon az általános sokaságban. A klinikusok számára az a kihívás, hogy felismerjék azokat a különbségeket (nem akármilyeneket), amelyek elősegítik a diagnózist vagy a kezelést. A statisztikai következtetések pedig nem mindig képezik a klinikai következtetések alapját. Így a hemoglobin statisztikailag szignifikáns 3 g/l-es csökkenése nem ad okot aggodalomra. És fordítva, ha az emberi szervezet valamely problémája nem terjedt el a teljes lakosság szintjén, ez nem ok arra, hogy ne foglalkozzunk ezzel a problémával.

Nézzük ezt a helyzetet példa.

A kutatók arra voltak kíváncsiak, hogy azok a fiúk, akik valamilyen fertőző betegségben szenvedtek, lemaradnak-e társaikhoz képest növekedésben. Ebből a célból mintavizsgálatot végeztek, amelyben 10 olyan fiú vett részt, akik szenvedtek ebben a betegségben. Az eredményeket a 23. táblázat tartalmazza.

23. táblázat A statisztikai feldolgozás eredményei

alsó határ

felső határ

Szabványok (cm)

átlagos

Ezekből a számításokból az következik, hogy a 10 éves, valamilyen fertőző betegségben szenvedő fiúk átlagos testmagassága a normálhoz közeli (132,5 cm). A konfidenciaintervallum alsó határa (126,6 cm) azonban azt jelzi, hogy 95%-os valószínűséggel ezeknek a gyerekeknek a valódi átlagmagassága megfelel az „alacsony magasság” fogalmának, azaz. ezek a gyerekek csökevényesek.

Ebben a példában a konfidenciaintervallum-számítások eredményei klinikailag szignifikánsak.

A FREKVENCIÁK ÉS TÖRTEK BIZTONSÁGI INTERVALLUMAI

© 2008

Országos Közegészségügyi Intézet, Oslo, Norvégia

A cikk leírja és tárgyalja a gyakoriságok és arányok konfidenciaintervallumainak kiszámítását Wald, Wilson, Clopper - Pearson módszerekkel, szögtranszformációval és Wald módszerrel Agresti - Coull korrekcióval. A bemutatott anyag általános információkat ad a gyakoriságok és arányok konfidenciaintervallumának kiszámításának módszereiről, és célja, hogy felkeltse a folyóirat olvasóinak érdeklődését nemcsak a konfidenciaintervallumok használatára saját kutatásaik eredményeinek bemutatásakor, hanem a szakirodalom olvasására is a munka megkezdése előtt. a jövőbeni kiadványokról.

Kulcsszavak: konfidencia intervallum, gyakoriság, arány

Az egyik korábbi publikáció röviden megemlítette a kvalitatív adatok leírását, és arról számolt be, hogy ezek intervallumbecslése előnyösebb, mint a pontbecslés a vizsgált jellemző populációban való előfordulási gyakoriságának leírására. Valójában, mivel a kutatás mintaadatok felhasználásával történik, az eredmények sokaságra vetítésének tartalmaznia kell a mintavételi pontatlanság elemét. A konfidenciaintervallum a becsült paraméter pontosságának mértéke. Érdekes, hogy egyes, az orvosok számára készült alapvető statisztikákról szóló könyvek teljesen figyelmen kívül hagyják a gyakoriságok konfidenciaintervallumának témáját. Ebben a cikkben több módszert is megvizsgálunk a gyakoriságok konfidenciaintervallumának kiszámítására, beleértve az olyan mintajellemzőket, mint az ismétlődésmentesség és a reprezentativitás, valamint a megfigyelések egymástól való függetlensége. Ebben a cikkben a gyakoriság alatt nem egy abszolút számot értünk, amely megmutatja, hogy egy adott érték hányszor fordul elő az aggregátumban, hanem relatív értékként, amely meghatározza a vizsgálatban résztvevők arányát, akiknél a vizsgált jellemző előfordul.

Az orvosbiológiai kutatásokban leggyakrabban 95%-os konfidencia intervallumokat alkalmaznak. Ez a konfidenciaintervallum az a terület, amelyen belül a valós arány az idő 95%-ában esik. Vagyis 95%-os megbízhatósággal kijelenthetjük, hogy egy tulajdonság populációban való előfordulási gyakoriságának valódi értéke a 95%-os konfidencia intervallumon belül lesz.

Az orvoskutatók számára készült statisztikai kézikönyvek többsége arról számol be, hogy a gyakorisági hibát a képlet segítségével számítják ki

ahol p a jellemző előfordulási gyakorisága a mintában (0-tól 1-ig terjedő érték). A legtöbb hazai tudományos cikk egy tulajdonság előfordulási gyakoriságát egy mintában (p), valamint hibáját (s) jelzi p ± s formában. Célszerűbb azonban egy 95%-os konfidencia intervallumot bemutatni egy tulajdonság populációban való előfordulásának gyakoriságára, amely magában foglalja a

előtt.

Egyes kézikönyvek azt javasolják, hogy kis minták esetén az 1,96-os értéket cseréljék ki t értékre N – 1 szabadsági fok esetén, ahol N a megfigyelések száma a mintában. A t értéket a t-eloszlás táblázataiból találjuk meg, amelyek szinte minden statisztikai tankönyvben megtalálhatók. A t eloszlás alkalmazása a Wald-módszerhez nem nyújt látható előnyöket az alább tárgyalt többi módszerhez képest, ezért egyes szerzők nem ajánlják.

A gyakoriságok vagy arányok konfidenciaintervallumának kiszámítására szolgáló fent bemutatott módszert Abraham Wald (1902–1950) tiszteletére Wald-nak nevezték el, mivel széles körű alkalmazása Wald és Wolfowitz 1939-es publikációja után kezdődött. Magát a módszert azonban Pierre Simon Laplace (1749–1827) javasolta még 1812-ben.

A Wald-módszer nagyon népszerű, de alkalmazása jelentős problémákkal jár. A módszer nem ajánlott kis mintaméreteknél, valamint olyan esetekben, amikor egy jellemző előfordulási gyakorisága 0 vagy 1 (0% vagy 100%) felé hajlik, és egyszerűen lehetetlen 0 és 1 gyakoriság esetén. a normál eloszlás közelítése, amelyet a hiba kiszámításakor használunk, „nem működik” olyan esetekben, amikor n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.



ahol a 95%-os konfidencia intervallum kiszámításakor 1,96 értéket vesz fel, N a megfigyelések száma, p pedig a jellemző előfordulási gyakorisága a mintában. Ez a módszer elérhető az online számológépekben, így használata nem okoz problémát. és nem javasoljuk ennek a módszernek a használatát n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Úgy gondolják, hogy a Wilson-módszer mellett az Agresti–Coll korrekciót alkalmazó Wald-módszer is optimális becslést ad a gyakoriságok konfidenciaintervallumára vonatkozóan. Az Agresti-Coll korrekció a Wald-képletben a mintában (p) szereplő jellemző előfordulási gyakoriságának p`-vel való helyettesítése, amikor annak kiszámításakor melyik 2-t adjuk a számlálóhoz és 4-et a nevezőhöz, azaz p` = (X + 2) / (N + 4), ahol X a vizsgálatban résztvevők száma, akik rendelkeznek a vizsgált jellemzővel, N pedig a minta mérete. Ez a módosítás nagyon hasonló eredményeket ad a Wilson-képlethez, kivéve ha az események gyakorisága megközelíti a 0%-ot vagy a 100%-ot, és a minta kicsi. A gyakoriságok konfidenciaintervallumának kiszámításához a fenti módszereken kívül folytonossági korrekciókat javasoltak mind a Wald-, mind a Wilson-módszerhez kis minták esetén, de a vizsgálatok kimutatták, hogy ezek használata nem megfelelő.

Tekintsük a fenti módszerek alkalmazását a konfidenciaintervallumok kiszámítására két példán keresztül. Az első esetben egy nagy, 1000 véletlenszerűen kiválasztott vizsgálati résztvevőből álló mintát vizsgálunk, akik közül 450-en rendelkeznek a vizsgált tulajdonsággal (ez lehet kockázati tényező, kimenetel vagy bármilyen más tulajdonság), ami 0,45-ös vagy 45-ös gyakoriságot jelent. %. A második esetben a vizsgálatot kis mintán, mondjuk csak 20 fős mintán végzik, és csak 1 vizsgálati résztvevő (5%) rendelkezik a vizsgált tulajdonsággal. A megbízhatósági intervallumokat Wald módszerrel, Wald módszerrel Agresti–Coll korrekcióval és Wilson módszerrel egy Jeff Sauro által kifejlesztett online számológép segítségével (http://www. /wald. htm) számítottuk ki. A Wilson-féle folytonosság-korrigált konfidenciaintervallumokat a Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html) által biztosított számológép segítségével számítottuk ki. Az Angular Fisher transzformáció számításait manuálisan végeztük a kritikus t érték felhasználásával 19, illetve 999 szabadsági fokra. A számítási eredményeket mindkét példa táblázatában mutatjuk be.

Hat különböző módon kiszámított konfidencia intervallumok a szövegben leírt két példához

Konfidencia intervallum számítási módszer

P=0,0500 vagy 5%

95% CI X=450, N=1000, P=0,4500 vagy 45% esetén

–0,0455–0,2541

Wald Agresti–Coll korrekcióval

<,0001–0,2541

Wilson folytonossági korrekcióval

Clopper–Pearson "pontos módszer"

Szögtranszformáció

<0,0001–0,1967

A táblázatból látható, hogy az első példában az „általánosan elfogadott” Wald-módszerrel számított konfidenciaintervallum a negatív tartományba kerül, ami a gyakoriságok esetében nem mondható el. Sajnos az orosz irodalomban nem ritkák az ilyen esetek. A hagyományos adatmegjelenítés gyakorisága és hibája részben elfedi ezt a problémát. Például, ha egy tulajdonság előfordulási gyakorisága (százalékban) 2,1 ± 1,4, akkor ez nem olyan „sértő a szemre”, mint 2,1% (95% CI: –0,7; 4,9), bár és azt jelenti ugyanaz a dolog. A Wald-módszer Agresti–Coll korrekcióval és szögtranszformációval történő számítással a nullára hajló alsó korlátot ad. A Wilson-féle folytonosság-korrigált módszer és az „egzakt módszer” szélesebb konfidenciaintervallumokat eredményez, mint a Wilson-féle módszer. A második példa esetében minden módszer megközelítőleg azonos konfidencia intervallumot ad (a különbségek csak ezredrészben jelennek meg), ami nem meglepő, hiszen az esemény előfordulási gyakorisága ebben a példában nem sokban tér el az 50%-tól, a minta mérete pedig elég nagy.

A probléma iránt érdeklődő olvasók figyelmébe ajánlhatjuk R. G. Newcombe és Brown, Cai és Dasgupta munkáit, amelyek 7, illetve 10 különböző konfidenciaintervallum-számítási módszer alkalmazásának előnyeit és hátrányait mutatják be. A hazai kézikönyvek közül ajánljuk figyelmébe az és a könyvet, amely az elmélet részletes ismertetése mellett bemutatja Wald és Wilson módszereit, valamint a binomiális gyakorisági eloszlást figyelembe vevő konfidenciaintervallumok számítási módszerét. Az ingyenes online számológépek (http://www. /wald. htm és http://faculty. vassar. edu/lowry/prop1.html) mellett a gyakoriságok (és nem csak!) konfidenciaintervallumai kiszámíthatók a CIA program ( Confidence Intervals Analysis ), amely letölthető a http://www. orvosi egyetem. soton. ac. uk/cia/ .

A következő cikk a minőségi adatok összehasonlításának egyváltozós módjait vizsgálja meg.

Bibliográfia

Banerji A. Orvosi statisztika tiszta nyelven: bevezető tanfolyam / A. Banerjee. – M.: Gyakorlati Orvostudomány, 2007. – 287 p. Orvosi statisztika / . – M.: Orvosi Információs Ügynökség, 2007. – 475 p. Glanz S. Orvosi és biológiai statisztika / S. Glanz. – M.: Praktika, 1998. Adattípusok, eloszlásvizsgálat és leíró statisztika // Humánökológia – 2008. – 1. sz. – P. 52–58. Zhizhin K. S.. Orvosi statisztika: tankönyv / . – Rostov n/d: Főnix, 2007. – 160 p. Alkalmazott orvosi statisztika / , . - Szentpétervár. : Foliot, 2003. – 428 p. Lakin G. F. Biometrikus adatok / . – M.: Felsőiskola, 1990. – 350 p. Orvos V. A. Matematikai statisztika az orvostudományban / , . – M.: Pénzügy és Statisztika, 2007. – 798 p. Matematikai statisztika a klinikai kutatásban / , . – M.: GEOTAR-MED, 2001. – 256 p. Junkerov V. ÉS. Orvosi kutatási adatok orvosi és statisztikai feldolgozása / , . - Szentpétervár. : VmedA, 2002. – 266 p. Agresti A. A közelítő jobb, mint a pontos a binomiális arányok intervallumbecsléséhez / A. Agresti, B. Coull // Amerikai statisztikus. – 1998. – N 52. – P. 119–126. Altman D. Magabiztos statisztikák // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – London: BMJ Books, 2000. – 240 p. Brown L.D. Interval estimation for a binomial ratio / L. D. Brown, T. T. Cai, A. Dasgupta // Statisztikai tudomány. – 2001. – N 2. – P. 101–133. Clopper C.J. A bizalmi vagy fiduciális határok használata a binomiális esetében / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – N 26. – P. 404–413. Garcia-Perez M. A. A binomiális paraméter konfidenciaintervallumáról / M. A. Garcia-Perez // Minőség és mennyiség. – 2005. – N 39. – P. 467–481. Motulsky H. Intuitív biostatisztika // H. Motulsky. – Oxford: Oxford University Press, 1995. – 386 p. Newcombe R. G. Kétoldalú bizalmi intervallumok az egyarányhoz: Hét módszer összehasonlítása / R. G. Newcombe // Statisztikák az orvostudományban. – 1998. – N. 17. – P. 857–872. Sauro J. A befejezési arányok becslése kis mintákból binomiális konfidencia intervallumok segítségével: összehasonlítások és ajánlások / J. Sauro, J. R. Lewis // Proceedings of the human factor and ergonomics Society year meeting. – Orlando, FL, 2005. Wald A. A folytonos eloszlásfüggvények bizalmi határai // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. – 1939. – N 10. – P. 105–118. Wilson E.B. Valószínű következtetés, az utódlás törvénye és a statisztikai következtetés / E. B. Wilson // Journal of American Statistical Association. – 1927. – N 22. – P. 209–212.

AZ ARÁNYOK BIZTONSÁGI IDŐKÖNYVE

A. M. Grjibovski

Országos Közegészségügyi Intézet, Oslo, Norvégia

A cikk számos módszert mutat be a binomiális arányok konfidenciaintervallumának kiszámítására, nevezetesen Wald, Wilson, arcszinusz, Agresti-Coull és egzakt Clopper-Pearson módszereket. A cikk csak egy általános bevezetést ad a binomiális arány konfidenciaintervallum-becslésének problémájába, és célja nem csak az, hogy ösztönözze az olvasókat a konfidenciaintervallumok használatára saját empirikus kutatásaik eredményeinek bemutatásakor, hanem arra is ösztönözze őket, hogy tanulmányozzák a statisztikai könyveket. saját adatok elemzése és kéziratok elkészítése előtt.

Kulcsszavak: konfidencia intervallum, arány

Elérhetőség:

Vezető tanácsadó, Országos Közegészségügyi Intézet, Oslo, Norvégia

Az előző alfejezetekben egy ismeretlen paraméter becslésének kérdésével foglalkoztunk A egy szám. Ezt nevezik „pont” becslésnek. Számos feladatnál nem csak a paramétert kell megkeresnie A megfelelő számérték, hanem annak pontosságának és megbízhatóságának értékelése is. Tudnia kell, hogy egy paraméter cseréje milyen hibákhoz vezethet A pontbecslését Aés milyen fokú biztonsággal számíthatunk arra, hogy ezek a hibák nem lépik túl az ismert határokat?

Az ilyen jellegű problémák különösen fontosak kis számú megfigyelés esetén, amikor a pontbecslést és be nagyrészt véletlenszerű, és az a hozzávetőleges helyettesítése a-val súlyos hibákhoz vezethet.

Képet adni a becslés pontosságáról és megbízhatóságáról A,

A matematikai statisztikában úgynevezett konfidenciaintervallumokat és konfidenciavalószínűségeket használnak.

Legyen a paraméter A tapasztalatból nyert elfogulatlan becslés A. Ebben az esetben szeretnénk megbecsülni a lehetséges hibát. Adjunk hozzá elég nagy p valószínűséget (például p = 0,9, 0,95 vagy 0,99), hogy egy p valószínűségű esemény gyakorlatilag megbízhatónak tekinthető, és keressünk egy s értéket, amelyre

Ezután a csere során fellépő hiba gyakorlatilag lehetséges értékeinek tartománya A tovább A, ± s lesz; Az abszolút értékben mért nagy hibák csak kis valószínűséggel jelennek meg a = 1 - p. Írjuk át (14.3.1) így:

Az egyenlőség (14.3.2) azt jelenti, hogy p valószínűséggel a paraméter ismeretlen értéke A intervallumba esik

Meg kell jegyezni egy körülményt. Korábban többször is figyelembe vettük annak a valószínűségét, hogy egy valószínűségi változó egy adott nem véletlenszerű intervallumba esik. Itt más a helyzet: a nagyságrend A nem véletlenszerű, de a / p intervallum véletlenszerű. Helyzete az x tengelyen véletlenszerű, a középpontja határozza meg A; Általában a 2s intervallum hossza is véletlenszerű, mivel az s értékét általában kísérleti adatokból számítjuk. Ezért ebben az esetben jobb lenne a p értéket nem a pont „eltalálásának” valószínűségeként értelmezni. A a / p intervallumban, és annak valószínűségeként, hogy egy / p véletlenszerű intervallum lefedi a pontot A(14.3.1. ábra).

Rizs. 14.3.1

A p valószínűséget általában ún megbízhatósági valószínűség, és intervallum / p - megbízhatósági intervallum. Intervallumhatárok Ha. a x =a- s és a 2 = a +és hívják bizalom határai.

Adjunk egy másik értelmezést a konfidenciaintervallum fogalmának: tekinthető paraméterértékek intervallumának A, kompatibilis a kísérleti adatokkal, és nem mond ellent azoknak. Valóban, ha egyetértünk abban, hogy egy a = 1-p valószínűségű eseményt gyakorlatilag lehetetlennek tekintünk, akkor az a paraméter azon értékei, amelyekre a - a> s ellentmondó kísérleti adatoknak kell tekinteni, és azokat, amelyeknél |a - A a t na 2 .

Legyen a paraméter A van egy elfogulatlan becslés A. Ha ismernénk a mennyiség eloszlásának törvényét A, a konfidenciaintervallum megtalálásának feladata nagyon egyszerű lenne: elég lenne egy olyan s értéket találni, amelyre

A nehézséget az jelenti, hogy a becslések eloszlásának törvénye A a mennyiség eloszlási törvényétől függ xés ezért az ismeretlen paraméterein (különösen magán a paraméteren A).

Ennek a nehézségnek a megkerülésére használhatja a következő nagyjából közelítő technikát: cserélje ki az s kifejezésben szereplő ismeretlen paramétereket a pontbecsléseikre. Viszonylag sok kísérlettel P(kb. 20...30) ez a technika általában kielégítő eredményt ad a pontosság szempontjából.

Példaként tekintsük a matematikai elvárás konfidenciaintervallumának problémáját.

Hagyd előállítani P X, amelynek jellemzői a matematikai elvárás Tés variancia D- ismeretlen. A következő becsléseket kaptuk ezekre a paraméterekre:

A matematikai elvárás p konfidenciavalószínűségének megfelelő / p konfidenciaintervallumot kell alkotni T mennyiségeket X.

A probléma megoldásánál azt fogjuk használni, hogy a mennyiség T az összeget jelenti P független, azonos eloszlású valószínűségi változók Xhés a centrális határeloszlástétel szerint egy kellően nagy P eloszlási törvénye közel áll a normálishoz. A gyakorlatban még viszonylag kis számú tag (kb. 10...20) esetén is megközelítőleg normálisnak tekinthető az összeg eloszlási törvénye. Feltételezzük, hogy az érték T a normál törvény szerint osztják el. Ennek a törvénynek a jellemzői - a matematikai elvárás és a variancia - egyenlőek, ill TÉs

(lásd a 13. fejezet 13.3. alpontját). Tegyük fel, hogy az érték D tudunk és találunk olyan Ep értéket, amelyre

A 6. fejezet (6.3.5) képletével a (14.3.5) bal oldalán lévő valószínűséget a normális eloszlási függvényen keresztül fejezzük ki

ahol a becslés szórása T.

Az Eq.

keresse meg Sp értékét:

ahol arg Ф* (х) a Ф* inverz függvénye (X), azok. az argumentum olyan értéke, amelyre a normális eloszlásfüggvény egyenlő X.

Diszperzió D, amelyen keresztül a mennyiség kifejeződik A 1P, nem tudjuk pontosan; hozzávetőleges értékeként használhatja a becslést D(14.3.4), és körülbelül:

Így a konfidenciaintervallum felépítésének problémája megközelítőleg megoldódott, ami egyenlő:

ahol a gp-t a (14.3.7) képlet határozza meg.

A fordított interpoláció elkerülése érdekében az Ф* (l) függvény táblázataiban az s p kiszámításakor célszerű egy speciális táblázatot összeállítani (14.3.1. táblázat), amely megadja a mennyiség értékeit.

attól függően, hogy r. A (p érték a normáltörvényhez határozza meg a szórások számát, amelyeket a szórás középpontjától jobbra és balra kell ábrázolni, hogy a kapott területre való bejutás valószínűsége egyenlő legyen p-vel.

A 7 p értéket használva a konfidencia intervallumot a következőképpen fejezzük ki:

14.3.1. táblázat

1. példa A mennyiséggel 20 kísérletet végeztünk X; az eredmények a táblázatban láthatók. 14.3.2.

14.3.2. táblázat

A mennyiség matematikai elvárására becslést kell találni a -ból xés a p = 0,8 konfidenciavalószínűségnek megfelelő konfidenciaintervallumot készítsünk.

Megoldás. Nekünk van:

Az l: = 10 referenciapontot választva a harmadik képlet (14.2.14) segítségével megkapjuk a torzítatlan becslést D :

táblázat szerint 14.3.1 találjuk

Bizalmi határok:

Megbízhatósági intervallum:

Paraméterértékek T, Az ebben az intervallumban lévő adatok kompatibilisek a táblázatban megadott kísérleti adatokkal. 14.3.2.

A variancia konfidenciaintervallumát hasonló módon lehet megszerkeszteni.

Hagyd előállítani P független kísérletek egy valószínűségi változón x ismeretlen paraméterekkel mind az A-ra, mind a diszperzióra vonatkozóan D elfogulatlan becslést kaptunk:

Közelítőleg meg kell alkotni a variancia konfidencia intervallumát.

A (14.3.11) képletből jól látható, hogy a mennyiség D képviseli

összeg P alakú valószínűségi változók . Ezek az értékek nem

független, hiszen bármelyik tartalmazza a mennyiséget T, mindenki mástól függ. Azonban kimutatható, hogy a növekvő Pösszegük eloszlási törvénye is megközelíti a normált. Majdnem at P= 20...30 már normálisnak tekinthető.

Tegyük fel, hogy ez így van, és keressük meg ennek a törvénynek a jellemzőit: a matematikai elvárást és a diszperziót. Az értékelés óta D- akkor elfogulatlan M[D] = D.

Variancia számítás D D viszonylag bonyolult számításokhoz kapcsolódik, ezért a kifejezését levezetés nélkül mutatjuk be:

ahol q 4 a nagyság negyedik központi momentuma X.

A kifejezés használatához be kell cserélnie az értékeket\u003d 4 és D(legalábbis közeliek). Ahelyett D használhatod az értékelését D. Elvileg a negyedik központi momentum helyettesíthető egy becsléssel is, például a következő alakzat értékével:

de egy ilyen csere rendkívül alacsony pontosságot ad, mivel általában korlátozott számú kísérlet mellett a nagyfokú nyomatékokat nagy hibákkal határozzák meg. A gyakorlatban azonban gyakran előfordul, hogy a mennyiségi eloszlási törvény típusa x előre ismert: csak a paraméterei ismeretlenek. Ezután megpróbálhatja μ 4-en keresztül kifejezni D.

Vegyük a leggyakoribb esetet, amikor az érték x a normál törvény szerint osztják el. Ekkor negyedik központi momentumát szórással fejezzük ki (lásd a 6. fejezet 6.2. alfejezetét);

és a (14.3.12) képlet megadja vagy

Az ismeretlen cseréje a (14.3.14)-ben Dértékelését D, kapjuk: honnan

A μ 4 nyomaték keresztül fejezhető ki D más esetekben is, amikor az érték eloszlását x nem normális, de a megjelenése ismert. Például az egyenletes sűrűség törvényéhez (lásd az 5. fejezetet) a következőket kapjuk:

ahol (a, P) az az intervallum, amelyen a törvény megadásra kerül.

Ennélfogva,

A (14.3.12) képlet segítségével a következőket kapjuk: hol találjuk hozzávetőlegesen

Azokban az esetekben, amikor a 26-os mennyiségre vonatkozó eloszlási törvény típusa ismeretlen, az a/) érték közelítő becslésekor továbbra is javasolt a (14.3.16) képlet használata, kivéve, ha különleges okunk van feltételezni, hogy ez a törvény nagyon eltér a normáltól (észrevehető pozitív vagy negatív kurtózisa van).

Ha így vagy úgy megkapjuk az a/) közelítő értéket, akkor a variancia konfidenciaintervallumát ugyanúgy megszerkeszthetjük, mint ahogy azt a matematikai elváráshoz építettük:

ahol az adott p valószínűségtől függő értéket találjuk a táblázat szerint. 14.3.1.

2. példa Keressen körülbelül 80%-os konfidencia intervallumot egy valószínűségi változó varianciájához x az 1. példa feltételei szerint, ha ismert, hogy az érték x a normálishoz közeli törvény szerint elosztva.

Megoldás. Az érték ugyanaz marad, mint a táblázatban. 14.3.1:

A (14.3.16) képlet szerint

A (14.3.18) képlet segítségével megtaláljuk a konfidencia intervallumot:

A szórások megfelelő tartománya: (0,21; 0,29).

14.4. Pontos módszerek megbízhatósági intervallumok felépítésére egy normális törvény szerint eloszló valószínűségi változó paramétereihez

Az előző alfejezetben nagyjából közelítő módszereket vizsgáltunk a matematikai elvárások és variancia konfidenciaintervallumok felépítésére. Itt adunk egy ötletet ugyanazon probléma megoldásának pontos módszereiről. Hangsúlyozzuk, hogy a konfidenciaintervallumok pontos megtalálásához feltétlenül szükséges előre ismerni a mennyiség eloszlási törvényének formáját. X, míg közelítő módszerek alkalmazásához ez nem szükséges.

A megbízhatósági intervallumok felépítésére szolgáló pontos módszerek ötlete a következőkben rejlik. Bármely konfidenciaintervallumot egy olyan feltételből találunk, amely kifejezi bizonyos egyenlőtlenségek teljesülésének valószínűségét, amelyek magukban foglalják a minket érdeklő becslést A. Az értékelési eloszlás törvénye Aáltalános esetben a mennyiség ismeretlen paramétereitől függ X. Néha azonban lehetséges az egyenlőtlenségek átadása egy valószínűségi változóból A a megfigyelt értékek valamilyen más függvényéhez X p X 2, ..., X o. amelynek eloszlási törvénye nem ismeretlen paraméterektől, hanem csak a kísérletek számától és a mennyiség eloszlási törvényének típusától függ X. Az ilyen típusú valószínűségi változók fontos szerepet játszanak a matematikai statisztikában; legrészletesebben a mennyiség normális eloszlásának esetére tanulmányozták őket X.

Például bebizonyosodott, hogy az érték normál eloszlásával x véletlenszerű érték

engedelmeskedik az ún Diákelosztási törvény Val vel P- 1 szabadságfok; ennek a törvénynek a sűrűsége a formája

ahol G(x) az ismert gammafüggvény:

Az is bebizonyosodott, hogy a valószínűségi változó

"%2 disztribúciója" van P- 1 szabadságfok (lásd 7. fejezet), melynek sűrűségét a képlet fejezi ki

Anélkül, hogy a (14.4.2) és (14.4.4) eloszlások származtatásain foglalkoznánk, bemutatjuk, hogyan alkalmazhatók ezek a paraméterek konfidenciaintervallumának felépítésekor. ty D.

Hagyd előállítani P független kísérletek egy valószínűségi változón X, normál eloszlású, ismeretlen paraméterekkel NAK NEK. Ezekre a paraméterekre becsléseket kaptunk

Mindkét paraméterre meg kell alkotni a konfidencia intervallumot, amely megfelel a p konfidenciavalószínűségnek.

Először alkossunk meg egy konfidenciaintervallumot a matematikai elváráshoz. Természetes, hogy ezt az intervallumot szimmetrikusan vesszük a -hoz képest T; jelölje s p az intervallum hosszának felét. Az s p értéket úgy kell megválasztani, hogy a feltétel teljesüljön

Próbáljunk meg a (14.4.5) egyenlőség bal oldalán mozogni a valószínűségi változóból T egy valószínűségi változóhoz T, a Student törvénye szerint terjesztik. Ehhez szorozzuk meg az |m-w?| egyenlőtlenség mindkét oldalát

pozitív értékkel: vagy jelöléssel (14.4.1),

Keressünk egy olyan / p számot, hogy a / p értéke megtalálható legyen a feltételből

A (14.4.2) képletből világos, hogy (1) páros függvény, ezért (14.4.8) megadja

Az egyenlőség (14.4.9) határozza meg a / p értéket p függvényében. Ha rendelkezésére áll egy integrál értékek táblázata

akkor a /p értéke fordított interpolációval megtalálható a táblázatban. Kényelmesebb azonban előre elkészíteni a /p értékek táblázatát. Egy ilyen táblázatot a Függelék (5. táblázat) tartalmaz. Ez a táblázat a p konfidenciaszinttől és a szabadságfokok számától függő értékeket mutatja P- 1. Miután meghatározta a / p-t a táblázatból. 5 és feltételezve

megtaláljuk a / p konfidenciaintervallum szélességének felét és magát az intervallumot

1. példa 5 független kísérletet végeztünk egy valószínűségi változón X, normál eloszlású, ismeretlen paraméterekkel Tés róla. A kísérletek eredményeit a táblázat tartalmazza. 14.4.1.

14.4.1. táblázat

Értékelés keresése T a matematikai elvárásra, és konstruáljon rá egy 90%-os / p konfidenciaintervallumot (azaz a p = 0,9 konfidenciavalószínűségnek megfelelő intervallumot).

Megoldás. Nekünk van:

iránti kérelem 5. táblázata szerint P - 1 = 4 és p = 0,9 azt találjuk ahol

A konfidencia intervallum az lesz

2. példa A 14.3. alszakasz 1. példájának feltételeire, az értéket feltételezve x normál eloszlású, keresse meg a pontos konfidenciaintervallumot.

Megoldás. A melléklet 5. táblázata szerint azt találjuk, hogy mikor P - 1 = 19ir =

0,8/p=1,328; innen

A 14.3. alfejezet 1. példájának megoldásával (e p = 0,072) összehasonlítva meggyőződésünk, hogy az eltérés nagyon jelentéktelen. Ha megtartjuk a pontosságot a második tizedesjegyig, akkor a pontos és közelítő módszerrel talált konfidencia intervallumok egybeesnek:

Folytassuk a variancia konfidenciaintervallumának felépítését. Tekintsük az elfogulatlan varianciabecslőt

és fejezzük ki a valószínűségi változót D nagyságrenden keresztül V(14.4.3), amelynek eloszlása ​​x 2 (14.4.4):

A mennyiségeloszlás törvényének ismerete V, megkeresheti az /(1) intervallumot, amelybe adott p valószínűséggel esik.

Az elosztás törvénye kn_x(v) Az I 7 magnitúdó alakja az ábrán látható. 14.4.1.

Rizs. 14.4.1

Felmerül a kérdés: hogyan válasszuk ki a / p intervallumot? Ha a nagyságeloszlás törvénye V szimmetrikus volt (mint a normál törvény vagy a Student-eloszlás), természetes lenne a /p intervallumot szimmetrikusnak venni a matematikai elvárásokhoz képest. Ebben az esetben a törvény k p_x (v) aszimmetrikus. Állapodjunk meg, hogy a /p intervallumot úgy választjuk meg, hogy az érték valószínűsége legyen V az intervallumon túl jobbra és balra (a 14.4.1. ábrán árnyékolt területek) azonosak és egyenlőek

Egy /p intervallum létrehozásához ezzel a tulajdonsággal a táblázatot használjuk. 4 alkalmazás: számokat tartalmaz y) oly módon, hogy

az értékért V, x 2 -eloszlású r szabadságfokkal. A mi esetünkben r = n- 1. Javítsuk ki r = n- 1, és keresse meg a táblázat megfelelő sorában. 4 két jelentése x 2 - az egyik a valószínűségnek megfelelő a másik - valószínűség Jelöljük ezeket

értékeket 2-korÉs xl? Az intervallum rendelkezik y 2, baljával, és y ~ jobb vége.

Most keressük meg a /p intervallumból a kívánt /| konfidenciaintervallumot a D határú diszperzióhoz, és D2, amely lefedi a lényeget D p valószínűséggel:

Szerkesszünk egy / (, = (?> ь А) intervallumot, amely lefedi a pontot D akkor és csak akkor, ha az érték V az /r intervallumba esik. Mutassuk meg, hogy az intervallum

megfelel ennek a feltételnek. Valóban, az egyenlőtlenségek egyenlőtlenségekkel egyenértékűek

és ezek az egyenlőtlenségek megelégednek p valószínűséggel. Így a variancia konfidencia intervallumát megtaláltuk, és a (14.4.13) képlettel fejezzük ki.

3. példa Keresse meg a variancia konfidenciaintervallumát a 14.3. alfejezet 2. példájának feltételei mellett, ha ismert, hogy az érték x normál eloszlású.

Megoldás. Nekünk van . melléklet 4. táblázata szerint

címen találjuk r = n - 1 = 19

A (14.4.13) képlet segítségével megtaláljuk a variancia konfidencia intervallumát

A szóráshoz tartozó megfelelő intervallum (0,21; 0,32). Ez az intervallum csak kis mértékben haladja meg a 14.3. alfejezet 2. példájában a közelítő módszerrel kapott intervallumot (0,21; 0,29).

  • A 14.3.1. ábra az a körül szimmetrikus konfidenciaintervallumot tekint. Általában, mint később látni fogjuk, erre nincs szükség.
KATEGÓRIÁK

NÉPSZERŰ CIKKEK

2023 „kingad.ru” - az emberi szervek ultrahangvizsgálata