Ponieważ nowa zmienna ma rozkład normalny, dolna i górna granica 95% przedziału ufności dla zmiennej φ wyniesie φ-1,96 i φ+1,96 w lewo">

Zamiast 1,96 dla małych próbek zaleca się zastąpienie N - 1 stopni swobody wartością t. Ta metoda nie daje wartości ujemnych i pozwala dokładniej oszacować przedziały ufności dla częstotliwości niż metoda Walda. Ponadto jest opisany w wielu krajowych podręcznikach statystyki medycznej, co jednak nie doprowadziło do jego szerokiego zastosowania w badaniach medycznych. Obliczanie przedziałów ufności przy użyciu transformacji kątowej nie jest zalecane dla częstotliwości zbliżających się do 0 lub 1.

Na tym zwykle kończy się opis metod szacowania przedziałów ufności w większości książek z podstaw statystyki dla badaczy medycznych, a problem ten jest typowy nie tylko dla literatury krajowej, ale także zagranicznej. Obie metody opierają się na centralnym twierdzeniu granicznym, co oznacza dużą próbę.

Biorąc pod uwagę wady szacowania przedziałów ufności przy użyciu powyższych metod, Clopper (Clopper) i Pearson (Pearson) zaproponowali w 1934 r. metodę obliczania tzw. dokładnego przedziału ufności, uwzględniającą rozkład dwumianowy badanej cechy. Metoda ta jest dostępna w wielu kalkulatorach internetowych, jednak uzyskane w ten sposób przedziały ufności są w większości przypadków zbyt szerokie. Jednocześnie metoda ta jest zalecana do stosowania w przypadkach, gdy wymagane jest ostrożne oszacowanie. Stopień konserwatywności metody wzrasta wraz ze zmniejszaniem się liczebności próby, zwłaszcza dla N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Według wielu statystyków najbardziej optymalne oszacowanie przedziałów ufności dla częstotliwości przeprowadza się metodą Wilsona, zaproponowaną jeszcze w 1927 r., Ale praktycznie niestosowaną w krajowych badaniach biomedycznych. Ta metoda nie tylko umożliwia oszacowanie przedziałów ufności zarówno dla bardzo małych, jak i bardzo wysokich częstotliwości, ale ma również zastosowanie do niewielkiej liczby obserwacji. Ogólnie przedział ufności według wzoru Wilsona ma postać od

Jakie jest prawdopodobieństwo przedziału ufności. Przedział ufności

Umysł to nie tylko wiedza, ale także umiejętność zastosowania wiedzy w praktyce. (Arystoteles)

Przedziały ufności

przegląd ogólny

Pobierając próbę z populacji uzyskamy oszacowanie punktowe interesującego nas parametru i obliczymy błąd standardowy w celu wskazania dokładności oszacowania.

Jednak w większości przypadków błąd standardowy jako taki jest nie do zaakceptowania. O wiele bardziej przydatne jest połączenie tej miary dokładności z oszacowaniem przedziału dla parametru populacji.

Można tego dokonać wykorzystując wiedzę o teoretycznym rozkładzie prawdopodobieństwa statystyki (parametru) próby w celu obliczenia przedziału ufności (CI – Confidence Interval, CI – Confidence Interval) dla parametru.

Ogólnie rzecz biorąc, przedział ufności rozszerza oszacowania w obu kierunkach o pewną wielokrotność błędu standardowego (danego parametru); dwie wartości (granice ufności), które definiują przedział, są zwykle oddzielone przecinkiem i ujęte w nawiasy.

Przedział ufności dla średniej

Korzystanie z rozkładu normalnego

Średnia próbki ma rozkład normalny, jeśli wielkość próby jest duża, więc przy rozważaniu średniej próbki można zastosować znajomość rozkładu normalnego.

W szczególności 95% rozkładu średnich z próby mieści się w granicach 1,96 odchylenia standardowego (SD) średniej populacji.

Gdy mamy tylko jedną próbkę, nazywamy to błędem standardowym średniej (SEM) i obliczamy 95% przedział ufności dla średniej w następujący sposób:

Jeśli ten eksperyment zostanie powtórzony kilka razy, przedział będzie zawierał prawdziwą średnią populacji w 95% przypadków.

Zwykle jest to przedział ufności, taki jak zakres wartości, w którym prawdziwa średnia populacji (ogólna średnia) leży z 95% poziomem ufności.

Chociaż interpretacja przedziału ufności w ten sposób nie jest dość ścisła (średnia populacji jest wartością stałą i dlatego nie może być z nią związana), jest koncepcyjnie łatwiejsza do zrozumienia.

Stosowanie T- dystrybucja

Możesz użyć rozkładu normalnego, jeśli znasz wartość wariancji w populacji. Ponadto, gdy wielkość próby jest mała, średnia próbki ma rozkład normalny, jeśli dane leżące u podstaw populacji mają rozkład normalny.

Jeśli dane leżące u podstaw populacji nie mają rozkładu normalnego i/lub ogólna wariancja (wariancja populacji) jest nieznana, średnia z próby jest zgodna Rozkład t-Studenta.

Oblicz 95% przedział ufności dla średniej populacji w następujący sposób:

Gdzie - punkt procentowy (centyl) T- Rozkład studentów z (n-1) stopniami swobody, co daje dwustronne prawdopodobieństwo 0,05.

Ogólnie zapewnia szerszy przedział niż przy użyciu rozkładu normalnego, ponieważ bierze pod uwagę dodatkową niepewność, która jest wprowadzana przez oszacowanie odchylenia standardowego populacji i/lub ze względu na małą wielkość próby.

Gdy wielkość próby jest duża (rzędu 100 lub więcej), różnica między dwoma rozkładami ( t-student i normalny) jest pomijalny. Jednak zawsze używaj T- rozkładu przy obliczaniu przedziałów ufności, nawet jeśli wielkość próby jest duża.

Zwykle wskazuje się 95% CI. Można obliczyć inne przedziały ufności, takie jak 99% CI dla średniej.

Zamiast iloczynu błędu standardowego i wartości tabeli T- rozkład odpowiadający dwustronnemu prawdopodobieństwu równemu 0,05, pomnóż go (błąd standardowy) przez wartość odpowiadającą dwustronnemu prawdopodobieństwu równemu 0,01. Jest to szerszy przedział ufności niż przypadek 95%, ponieważ odzwierciedla zwiększoną pewność, że przedział rzeczywiście obejmuje średnią populacji.

Przedział ufności dla proporcji

Rozkład losowy proporcji ma rozkład dwumianowy. Jeśli jednak wielkość próbki N rozsądnie duży, wówczas proporcjonalny rozkład próbki jest w przybliżeniu normalny ze średnią .

Oszacuj przez współczynnik próbkowania p=r/n(Gdzie R- liczba osobników w próbie o interesujących nas cechach) i szacowany jest błąd standardowy:

Oszacowano 95% przedział ufności dla proporcji:

Jeśli wielkość próby jest mała (zwykle kiedy np Lub n(1-p) mniej 5 ), to w celu obliczenia dokładnych przedziałów ufności należy zastosować rozkład dwumianowy.

Zauważ, że jeśli P wyrażone zatem w procentach (1-p) zastąpione przez (100 pensów).

Interpretacja przedziałów ufności

Podczas interpretacji przedziału ufności interesują nas następujące pytania:

Jak szeroki jest przedział ufności?

Szeroki przedział ufności wskazuje, że oszacowanie jest nieprecyzyjne; wąski wskazuje na dokładne oszacowanie.

Szerokość przedziału ufności zależy od wielkości błędu standardowego, który z kolei zależy od wielkości próby, a biorąc pod uwagę zmienną numeryczną na podstawie zmienności danych, daje szersze przedziały ufności niż badania dużego zbioru danych z kilku zmiennych.

Czy CI zawiera jakieś wartości o szczególnym znaczeniu?

Można sprawdzić, czy prawdopodobna wartość parametru populacji mieści się w przedziale ufności. Jeśli tak, to wyniki są zgodne z tą prawdopodobną wartością. Jeśli nie, to jest mało prawdopodobne (dla 95% przedziału ufności szansa wynosi prawie 5%), aby parametr miał taką wartość.

„Katren-Style” nadal publikuje cykl Konstantina Kravchika na temat statystyki medycznej. W dwóch poprzednich artykułach autor poruszył kwestię wyjaśnienia takich pojęć jak i.

Konstanty Krawczyk

Matematyk-analityk. Specjalista w zakresie badań statystycznych w medycynie i naukach humanistycznych

Moskwa

Bardzo często w artykułach dotyczących badań klinicznych można znaleźć tajemnicze sformułowanie: „przedział ufności” (95% CI lub 95% CI – przedział ufności). Na przykład artykuł może brzmieć: „Test t-Studenta został użyty do oceny istotności różnic, z obliczonym 95% przedziałem ufności”.

Jaka jest wartość „95% przedziału ufności” i po co go obliczać?

Co to jest przedział ufności? - Jest to zakres, w którym mieszczą się prawdziwe średnie wartości w populacji. I co, są "nieprawdziwe" średnie? W pewnym sensie tak, mają. W wyjaśniliśmy, że nie da się zmierzyć interesującego nas parametru w całej populacji, więc badacze zadowalają się ograniczoną próbą. W tej próbie (na przykład według masy ciała) występuje jedna wartość średnia (określona waga), na podstawie której oceniamy wartość średnią w całej populacji ogólnej. Jest jednak mało prawdopodobne, aby średnia waga w próbie (zwłaszcza małej) pokrywała się ze średnią wagą w populacji ogólnej. Dlatego bardziej poprawne jest obliczenie i wykorzystanie zakresu średnich wartości populacji ogólnej.

Załóżmy na przykład, że 95% przedział ufności (95% CI) dla hemoglobiny wynosi od 110 do 122 g/l. Oznacza to, że z prawdopodobieństwem 95 % prawdziwa średnia wartość hemoglobiny w populacji ogólnej będzie mieścić się w przedziale od 110 do 122 g/l. Innymi słowy, nie znamy średniej hemoglobiny w populacji ogólnej, ale możemy wskazać zakres wartości dla tej cechy z 95% prawdopodobieństwem.

Przedziały ufności są szczególnie istotne dla różnicy średnich między grupami lub tak zwanej wielkości efektu.

Załóżmy, że porównaliśmy skuteczność dwóch preparatów żelaza: tego, który jest na rynku od dłuższego czasu i tego, który właśnie został zarejestrowany. Po przebiegu terapii oceniono stężenie hemoglobiny w badanych grupach pacjentów, a program statystyczny wyliczył nam, że różnica między średnimi wartościami obu grup z prawdopodobieństwem 95% mieści się w przedziale od 1,72 do 14,36 g/l (Tabela 1).

Patka. 1. Kryterium dla prób niezależnych
(grupy są porównywane według poziomu hemoglobiny)

Należy to interpretować następująco: u części pacjentów z populacji ogólnej, którzy przyjmują nowy lek, stężenie hemoglobiny będzie wyższe średnio o 1,72–14,36 g/l niż u osób, które przyjmowały już znany lek.

Innymi słowy, w populacji ogólnej różnica średnich wartości hemoglobiny w grupach z 95% prawdopodobieństwem mieści się w tych granicach. O tym, czy to dużo, czy mało, zadecyduje badacz. Chodzi o to, że nie pracujemy z jedną wartością średnią, ale z zakresem wartości, dlatego bardziej wiarygodnie szacujemy różnicę parametru między grupami.

W pakietach statystycznych, według uznania badacza, można samodzielnie zawęzić lub rozszerzyć granice przedziału ufności. Obniżając prawdopodobieństwa przedziału ufności, zawężamy przedział średnich. Na przykład przy 90% CI zakres średnich (lub średnich różnic) będzie węższy niż przy 95% CI.

I odwrotnie, zwiększenie prawdopodobieństwa do 99% poszerza zakres wartości. Podczas porównywania grup dolna granica CI może przekraczać zero. Na przykład, gdybyśmy rozszerzyli granice przedziału ufności do 99 %, to granice przedziału wahałyby się od –1 do 16 g/L. Oznacza to, że w populacji ogólnej istnieją grupy, których różnica między średnimi dla badanej cechy wynosi 0 (M=0).

Przedziały ufności można wykorzystać do testowania hipotez statystycznych. Jeżeli przedział ufności przekracza wartość zero, to prawdziwa jest hipoteza zerowa, która zakłada, że ​​grupy nie różnią się badanym parametrem. Przykład opisano powyżej, kiedy rozszerzyliśmy granice do 99%. Gdzieś w populacji ogólnej znaleźliśmy grupy, które nie różniły się w żaden sposób.

95% przedział ufności różnicy w hemoglobinie, (g/l)


Rysunek przedstawia 95% przedział ufności średniej różnicy hemoglobiny między dwiema grupami jako linię. Linia przechodzi przez punkt zerowy, zatem występuje różnica między średnimi równa zeru, co potwierdza hipotezę zerową, że grupy nie różnią się. Różnica między grupami wynosi od -2 do 5 g/l, co oznacza, że ​​stężenie hemoglobiny może spaść o 2 g/l lub wzrosnąć o 5 g/l.

Przedział ufności jest bardzo ważnym wskaźnikiem. Dzięki niemu widać, czy różnice w grupach rzeczywiście wynikały z różnicy średnich, czy z dużej próby, bo przy dużej próbie szanse na znalezienie różnic są większe niż przy małej.

W praktyce może to wyglądać tak. Pobraliśmy próbkę 1000 osób, zmierzyliśmy poziom hemoglobiny i stwierdziliśmy, że przedział ufności dla różnicy średnich wynosi od 1,2 do 1,5 g/l. Poziom istotności statystycznej w tym przypadku p

Widzimy, że stężenie hemoglobiny wzrosło, ale prawie niezauważalnie, dlatego istotność statystyczna pojawiła się właśnie ze względu na wielkość próby.

Przedziały ufności można obliczyć nie tylko dla średnich, ale także dla proporcji (i współczynników ryzyka). Interesuje nas na przykład przedział ufności odsetka pacjentów, którzy uzyskali remisję podczas przyjmowania opracowanego leku. Przyjmijmy, że 95% CI dla proporcji, czyli dla odsetka takich pacjentów, mieści się w przedziale 0,60–0,80. Można więc powiedzieć, że nasz lek ma działanie terapeutyczne w 60 do 80% przypadków.

Każda próbka daje jedynie przybliżone wyobrażenie o ogólnej populacji, a wszystkie cechy statystyczne próbki (średnia, tryb, wariancja ...) są pewnym przybliżeniem lub powiedzmy oszacowaniem ogólnych parametrów, których w większości przypadków nie można obliczyć ze względu na niedostępność ogółu ludności (Wykres 20).

Rysunek 20. Błąd próbkowania

Ale możesz określić przedział, w którym z pewnym stopniem prawdopodobieństwa leży prawdziwa (ogólna) wartość cechy statystycznej. Ten interwał nazywa się D przedział ufności (CI).

Tak więc ogólna średnia z prawdopodobieństwem 95% mieści się w granicach

od do, (20)

Gdzie T - wartość tabelaryczna Kryterium Studenta dla α =0,05 i F= N-1

Można znaleźć i 99% CI, w tym przypadku T wybrany dla α =0,01.

Jakie jest praktyczne znaczenie przedziału ufności?

    Szeroki przedział ufności wskazuje, że średnia z próby nie odzwierciedla dokładnie średniej z populacji. Wynika to zwykle z niewystarczającej liczebności próby lub jej heterogeniczności, tj. duża dyspersja. Oba dają duży błąd średniej i odpowiednio szerszy CI. I to jest powód, aby powrócić do etapu planowania badań.

    Górne i dolne granice CI oceniają, czy wyniki będą istotne klinicznie

Zastanówmy się bardziej szczegółowo nad kwestią statystycznego i klinicznego znaczenia wyników badania właściwości grupowych. Przypomnijmy, że zadaniem statystyki jest wykrycie przynajmniej niektórych różnic w populacjach ogólnych na podstawie danych z próby. Zadaniem klinicysty jest znalezienie takich (nie żadnych) różnic, które pomogą w postawieniu diagnozy lub leczeniu. I nie zawsze wnioski statystyczne są podstawą wniosków klinicznych. Statystycznie istotny spadek stężenia hemoglobiny o 3 g/l nie jest więc powodem do niepokoju. I odwrotnie, jeśli jakiś problem w organizmie człowieka nie ma charakteru masowego na poziomie całej populacji, nie jest to powód, aby nie zajmować się tym problemem.

Rozważymy tę pozycję w przykład.

Naukowcy zastanawiali się, czy chłopcy, którzy cierpieli na jakąś chorobę zakaźną, nie byli w tyle za swoimi rówieśnikami. W tym celu przeprowadzono wybiórcze badanie, w którym wzięło udział 10 chłopców z tą chorobą. Wyniki przedstawiono w tabeli 23.

Tabela 23. Wyniki statystyczne

dolna granica

Górna granica

Dane techniczne (cm)

środek

Z tych obliczeń wynika, że ​​selektywny średni wzrost 10-letnich chłopców, którzy przebyli jakąś chorobę zakaźną, jest zbliżony do normalnego (132,5 cm). Jednak dolna granica przedziału ufności (126,6 cm) wskazuje, że istnieje 95% prawdopodobieństwo, że prawdziwy średni wzrost tych dzieci odpowiada pojęciu „niskiego wzrostu”, tj. te dzieci są skarłowaciałe.

W tym przykładzie wyniki obliczeń przedziału ufności są istotne klinicznie.

PRZEDZIAŁY UFNOŚCI DLA CZĘSTOTLIWOŚCI I CZĘŚCI

© 2008

Narodowy Instytut Zdrowia Publicznego, Oslo, Norwegia

W artykule opisano i omówiono obliczanie przedziałów ufności dla częstości i proporcji metodami Walda, Wilsona, Kloppera-Pearsona, z wykorzystaniem transformacji kątowej oraz metodą Walda z poprawką Agrestiego-Cowlla. Prezentowany materiał zawiera ogólne informacje o metodach obliczania przedziałów ufności dla częstości i proporcji i ma na celu wzbudzenie zainteresowania czytelników czasopisma nie tylko wykorzystaniem przedziałów ufności przy prezentacji wyników własnych badań, ale także zapoznaniem się z literaturą fachową przed rozpoczęciem praca nad kolejnymi publikacjami.

Słowa kluczowe: przedział ufności, częstotliwość, proporcja

W jednej z poprzednich publikacji pokrótce wspomniano o opisie danych jakościowych i podano, że dla opisu częstości występowania badanej cechy w populacji generalnej preferowane jest ich oszacowanie przedziałowe niż oszacowanie punktowe. Rzeczywiście, ponieważ badania są prowadzone na podstawie danych z próby, projekcja wyników na populację ogólną musi zawierać element niedokładności w oszacowaniu próby. Przedział ufności jest miarą dokładności estymowanego parametru. Co ciekawe, w niektórych książkach z podstaw statystyki dla lekarzy temat przedziałów ufności dla częstości jest całkowicie pomijany. W tym artykule rozważymy kilka sposobów obliczania przedziałów ufności dla częstości, zakładając cechy próbki, takie jak niepowtarzalność i reprezentatywność, a także niezależność obserwacji od siebie. Częstość w tym artykule nie jest rozumiana jako liczba bezwzględna pokazująca, ile razy ta lub inna wartość występuje w agregacie, ale wartość względna, która określa odsetek uczestników badania, którzy mają badaną cechę.

W badaniach biomedycznych najczęściej stosuje się 95% przedziały ufności. Ten przedział ufności to obszar, w którym prawdziwa proporcja mieści się w 95% przypadków. Innymi słowy, można z 95% pewnością stwierdzić, że prawdziwa wartość częstości występowania cechy w populacji ogólnej będzie mieściła się w 95% przedziale ufności.

Większość podręczników statystycznych dla naukowców medycznych podaje, że błąd częstotliwości oblicza się za pomocą wzoru

gdzie p jest częstością występowania cechy w próbie (wartość od 0 do 1). W większości krajowych artykułów naukowych wskazywana jest wartość częstości występowania cechy w próbce (p), a także jej błąd (s) w postaci p ± s. Bardziej celowe jest jednak przedstawienie 95% przedziału ufności dla częstości występowania cechy w populacji ogólnej, który będzie obejmował wartości od

zanim.

W niektórych podręcznikach dla małych prób zaleca się zastąpienie wartości 1,96 wartością t dla N - 1 stopni swobody, gdzie N to liczba obserwacji w próbie. Wartość t znajduje się w tablicach rozkładu t, które są dostępne w prawie wszystkich podręcznikach statystyki. Wykorzystanie rozkładu t dla metody Walda nie zapewnia widocznej przewagi nad innymi metodami omówionymi poniżej i dlatego niektórzy autorzy nie są mile widziani.

Powyższa metoda obliczania przedziałów ufności dla częstości lub ułamków nosi imię Abrahama Walda (Abraham Wald, 1902–1950), ponieważ zaczęła być szeroko stosowana po publikacji Walda i Wolfowitza w 1939 r. Jednak sama metoda została zaproponowana przez Pierre'a Simona Laplace'a (1749-1827) już w 1812 roku.

Metoda Walda jest bardzo popularna, jednak jej zastosowanie wiąże się z istotnymi problemami. Metoda nie jest zalecana dla próbek o małej liczebności, a także w przypadkach, gdy częstość występowania cechy dąży do 0 lub 1 (0% lub 100%) i po prostu nie jest możliwa dla częstości 0 i 1. Ponadto przybliżenie rozkładu normalnego, które jest używane przy obliczaniu błędu , „nie działa” w przypadkach, gdy n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.



gdzie przy obliczaniu 95% przedziału ufności przyjmuje wartość 1,96, N to liczba obserwacji, a p to częstość występowania cechy w próbie. Ta metoda jest dostępna w kalkulatorach online, więc jej zastosowanie nie nastręcza problemów. i nie zalecamy używania tej metody dla n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Uważa się, że oprócz metody Wilsona, metoda Walda z korektą Agrestiego-Caulla zapewnia również optymalne oszacowanie przedziału ufności dla częstotliwości. Poprawka Agresti-Coulle'a polega na zastąpieniu we wzorze Walda częstości występowania cechy w próbie (p) przez p`, przy obliczaniu której do licznika dodaje się 2, a do mianownika 4, czyli , p` = (X + 2) / (N + 4), gdzie X to liczba uczestników badania, którzy mają badaną cechę, a N to wielkość próby. Ta modyfikacja daje wyniki bardzo podobne do tych ze wzoru Wilsona, z wyjątkiem sytuacji, gdy częstość zdarzeń zbliża się do 0% lub 100%, a próba jest mała. Oprócz powyższych metod obliczania przedziałów ufności dla częstotliwości, zaproponowano poprawki ciągłości zarówno dla metody Walda, jak i metody Wilsona dla małych próbek, ale badania wykazały, że ich użycie jest niewłaściwe.

Rozważ zastosowanie powyższych metod do obliczania przedziałów ufności na dwóch przykładach. W pierwszym przypadku badamy dużą próbę 1000 losowo wybranych uczestników badania, z których 450 ma badaną cechę (niezależnie od tego, czy jest to czynnik ryzyka, wynik, czy jakakolwiek inna cecha), co jest częstością 0,45, lub 45%. W drugim przypadku badanie przeprowadzane jest na małej próbie, powiedzmy tylko 20 osób, a tylko 1 uczestnik badania (5%) ma badaną cechę. Przedziały ufności dla metody Walda, dla metody Walda z poprawką Agresti-Coll, dla metody Wilsona obliczono za pomocą internetowego kalkulatora opracowanego przez Jeffa Sauro (http://www./wald.htm). Skorygowane o ciągłość przedziały ufności Wilsona obliczono przy użyciu kalkulatora dostarczonego przez Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Obliczenia z wykorzystaniem transformacji kątowej Fishera wykonano „ręcznie” z wartością krytyczną t odpowiednio dla 19 i 999 stopni swobody. Wyniki obliczeń przedstawiono w tabeli dla obu przykładów.

Przedziały ufności obliczono na sześć różnych sposobów dla dwóch przykładów opisanych w tekście

Metoda obliczania przedziału ufności

P=0,0500, czyli 5%

95% CI dla X=450, N=1000, P=0,4500 lub 45%

–0,0455–0,2541

Waldy z korekcją Agresti-Coll

<,0001–0,2541

Wilsona z korekcją ciągłości

„Dokładna metoda” Kloppera-Pearsona

Transformacja kątowa

<0,0001–0,1967

Jak widać z tabeli, w pierwszym przykładzie przedział ufności obliczony „ogólnie akceptowaną” metodą Walda przechodzi w obszar ujemny, co nie może mieć miejsca w przypadku częstości. Niestety, takie incydenty nie są rzadkością w literaturze rosyjskiej. Tradycyjny sposób przedstawiania danych jako częstotliwości i jej błędu częściowo maskuje ten problem. Na przykład, jeśli częstość występowania cechy (w procentach) jest przedstawiona jako 2,1 ± 1,4, to nie jest to tak „irytujące” jak 2,1% (95% CI: –0,7; 4,9), chociaż i oznacza to samo. Metoda Walda z poprawką Agresti-Coulle'a i obliczenia z wykorzystaniem transformacji kątowej dają dolną granicę dążącą do zera. Metoda Wilsona z poprawką na ciągłość i „metoda dokładna” dają szersze przedziały ufności niż metoda Wilsona. Dla drugiego przykładu wszystkie metody dają w przybliżeniu takie same przedziały ufności (różnice pojawiają się tylko w tysięcznych), co nie jest zaskakujące, ponieważ częstotliwość zdarzenia w tym przykładzie nie różni się zbytnio od 50%, a liczebność próby jest dość duża .

Czytelnikom zainteresowanym tym problemem możemy polecić prace R. G. Newcombe oraz Brown, Cai i Dasgupta, które przedstawiają wady i zalety stosowania odpowiednio 7 i 10 różnych metod obliczania przedziałów ufności. Z podręczników krajowych polecana jest książka i, w której oprócz szczegółowego opisu teorii przedstawiono metody Walda i Wilsona, a także metodę obliczania przedziałów ufności z uwzględnieniem dwumianowego rozkładu częstości. Oprócz bezpłatnych kalkulatorów online (http://www./wald.htm i http://faculty.vassar.edu/lowry/prop1.html), przedziały ufności dla częstości (i nie tylko!) program CIA (Analiza przedziałów ufności), który można pobrać ze strony http://www. Szkoła Medyczna. soton ak. Wielka Brytania/cia/ .

W następnym artykule przyjrzymy się jednowymiarowym sposobom porównywania danych jakościowych.

Bibliografia

Banerjee A. Statystyka medyczna w prostym języku: kurs wprowadzający / A. Banerzhi. - M. : Medycyna praktyczna, 2007. - 287 s. Statystyka medyczna / . - M. : Agencja Informacji Medycznej, 2007. - 475 s. Glanz S. Statystyka medyczno-biologiczna / S. Glants. - M. : Praktyka, 1998. Typy danych, weryfikacja dystrybucji i statystyki opisowe / // Ekologia człowieka - 2008. - nr 1. - s. 52–58. Żyżyn K.S.. Statystyka medyczna: podręcznik / . - Rostów n / D: Phoenix, 2007. - 160 s. Stosowana Statystyka Medyczna / , . - Sankt Petersburg. : Folio, 2003. - 428 s. Lakin GF. Biometria / . - M. : Szkoła wyższa, 1990r. - 350 s. Medyk V. A. Statystyka matematyczna w medycynie / , . - M.: Finanse i statystyka, 2007. - 798 s. Statystyka matematyczna w badaniach klinicznych / , . - M. : GEOTAR-MED, 2001. - 256 s. Junkerov V. I. Przetwarzanie medyczno-statystyczne danych z badań medycznych /,. - Sankt Petersburg. : VmedA, 2002. - 266 s. Agrest A. Przybliżenie jest lepsze niż dokładne dla estymacji przedziałowej proporcji dwumianowych / A. Agresti, B. Coull // Statystyk amerykański. - 1998. - N 52. - S. 119-126. Altman D. Pewne statystyki // D. Altman, D. Machin, T. Bryant, MJ Gardner. - Londyn: BMJ Books, 2000. - 240 s. Brązowy LD Estymacja przedziałowa dla proporcji dwumianowej / LD Brown, TT Cai, A. Dasgupta // Nauki statystyczne. - 2001. - N 2. - s. 101-133. Clopper C.J. Wykorzystanie granic ufności lub wiarygodności zilustrowane na przykładzie dwumianu / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - s. 404-413. Garcia-Perez MA. O przedziale ufności dla parametru dwumianowego / M. A. Garcia-Perez // Jakość i ilość. - 2005. - N 39. - s. 467-481. Motulski H. Intuicyjna biostatystyka // H. Motulsky. - Oksford: Oxford University Press, 1995. - 386 s. Newcombe RG Dwustronne przedziały ufności dla pojedynczej proporcji: porównanie siedmiu metod / RG Newcombe // Statystyka w medycynie. - 1998. - N. 17. - P. 857–872. Sauro J. Szacowanie wskaźników ukończenia na podstawie małych próbek przy użyciu dwumianowych przedziałów ufności: porównania i zalecenia / J. Sauro, JR Lewis // Doroczne spotkanie Proceedings of Human Factor and Ergonomics Society. – Orlando, Floryda, 2005. Wald A. Granice ufności dla funkcji rozkładu ciągłego // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - s. 105–118. Wilson EB. Wnioskowanie prawdopodobne, prawo sukcesji i wnioskowanie statystyczne / EB Wilson // Journal of American Statistical Association. - 1927. - N 22. - s. 209-212.

PRZEDZIAŁY UFNOŚCI DLA PROPORCJONALNOŚCI

A. M. Grjibovski

Narodowy Instytut Zdrowia Publicznego, Oslo, Norwegia

W artykule przedstawiono kilka metod obliczania przedziałów ufności dla proporcji dwumianowych, a mianowicie metodę Walda, Wilsona, arcsinus, Agresti-Coull oraz dokładną metodę Cloppera-Pearsona. Artykuł stanowi jedynie ogólne wprowadzenie do problematyki estymacji przedziału ufności proporcji dwumianowej i ma na celu nie tylko zachęcenie czytelników do stosowania przedziałów ufności przy przedstawianiu wyników własnych badań empirycznych, ale także zachęcenie do sięgania do książek statystycznych przed do analizy własnych danych i przygotowania manuskryptów.

słowa kluczowe: przedział ufności, proporcja

Informacje kontaktowe:

Starszy doradca, Narodowy Instytut Zdrowia Publicznego, Oslo, Norwegia

W poprzednich podrozdziałach rozważaliśmy kwestię oszacowania nieznanego parametru A jeden numer. Taka ocena nazywana jest „punktem”. W wielu zadaniach wymagane jest nie tylko znalezienie parametru A odpowiednią wartość liczbową, ale także ocenić jej dokładność i wiarygodność. Trzeba wiedzieć, do jakich błędów może prowadzić podstawianie parametrów A jego oszacowanie punktowe A iz jakim stopniem pewności możemy oczekiwać, że te błędy nie przekroczą znanych granic?

Problemy tego rodzaju są szczególnie istotne dla niewielkiej liczby obserwacji, gdy estymacja punktowa i w jest w dużej mierze przypadkowy, a przybliżone zastąpienie a przez a może prowadzić do poważnych błędów.

Aby dać wyobrażenie o dokładności i wiarygodności oszacowania A,

w statystyce matematycznej stosuje się tzw. przedziały ufności i prawdopodobieństwa ufności.

Niech dla parametru A oparte na doświadczeniu, bezstronne oszacowanie A. Chcemy oszacować możliwy błąd w tym przypadku. Przypiszmy wystarczająco duże prawdopodobieństwo p (na przykład p = 0,9, 0,95 lub 0,99) takie, że zdarzenie z prawdopodobieństwem p można uznać za praktycznie pewne, i znajdźmy wartość s, dla której

Następnie zakres praktycznie możliwych wartości błędu, który występuje podczas wymiany A NA A, będzie ± s; duże błędy bezwzględne pojawią się tylko z małym prawdopodobieństwem a = 1 - p. Przepiszmy (14.3.1) jako:

Równość (14.3.2) oznacza, że ​​z prawdopodobieństwem p nieznana wartość parametru A mieści się w przedziale

W tym przypadku należy zwrócić uwagę na jedną okoliczność. Wcześniej wielokrotnie rozważaliśmy prawdopodobieństwo, że zmienna losowa znajdzie się w danym nielosowym przedziale. Tutaj sytuacja jest inna: A nie losowy, ale losowy przedział / r. Losowo jego położenie na osi x, określone przez jego środek A; ogólnie długość przedziału 2s jest również losowa, ponieważ wartość s jest z reguły obliczana na podstawie danych eksperymentalnych. Dlatego w tym przypadku lepiej byłoby interpretować wartość p nie jako prawdopodobieństwo „trafienia” w punkt A w przedziale / p, ale jako prawdopodobieństwo, że losowy przedział / p obejmie punkt A(Rys. 14.3.1).

Ryż. 14.3.1

Prawdopodobieństwo p nazywa się poziom zaufania, a przedział / p - przedział ufności. Granice interwałów Jeśli. x \u003d a- s i za 2 = za + i nazywają się granice zaufania.

Podajmy jeszcze jedną interpretację pojęcia przedziału ufności: można go traktować jako przedział wartości parametrów A, zgodne z danymi eksperymentalnymi i nie zaprzeczają im. Rzeczywiście, jeśli zgodzimy się uznać zdarzenie z prawdopodobieństwem a = 1-p praktycznie niemożliwe, to te wartości parametru a, dla których a - a> s należy uznać za sprzeczne z danymi eksperymentalnymi oraz te, dla których |a - A a t na 2 .

Niech dla parametru A istnieje obiektywna ocena A. Gdybyśmy znali prawo dystrybucji ilości A, problem znalezienia przedziału ufności byłby dość prosty: wystarczyłoby znaleźć wartość s dla której

Trudność polega na tym, że prawo dystrybucji oszacowania A zależy od prawa rozkładu ilości X a w konsekwencji na jego nieznanych parametrach (w szczególności na samym parametrze A).

Aby obejść tę trudność, można zastosować następującą z grubsza przybliżoną sztuczkę: zastąpić nieznane parametry w wyrażeniu dla s ich oszacowaniami punktowymi. Przy stosunkowo dużej liczbie eksperymentów P(około 20...30) technika ta zazwyczaj daje zadowalające wyniki pod względem dokładności.

Jako przykład rozważmy problem przedziału ufności dla oczekiwań matematycznych.

Niech produkowane P X, którego charakterystyką jest oczekiwanie matematyczne T i wariancji D- nieznany. Dla tych parametrów uzyskano następujące oszacowania:

Wymagane jest zbudowanie przedziału ufności / đ odpowiadającego prawdopodobieństwu ufności đ dla oczekiwania matematycznego T wielkie ilości X.

Rozwiązując ten problem, wykorzystujemy fakt, że ilość T jest sumą P niezależne zmienne losowe o identycznym rozkładzie X godz i zgodnie z centralnym twierdzeniem granicznym dla wystarczająco dużych P jego prawo dystrybucji jest bliskie normalnemu. W praktyce, nawet przy stosunkowo niewielkiej liczbie wyrazów (rzędu 10 ... 20), prawo dystrybucji sumy można w przybliżeniu uznać za normalne. Przyjmiemy, że wartość T dystrybuowane zgodnie z normalnym prawem. Charakterystyki tego prawa - matematyczne oczekiwanie i wariancja - są odpowiednio równe T I

(patrz rozdział 13 podsekcja 13.3). Załóżmy, że wartość D jest nam znana i znajdziemy taką wartość Ep dla której

Stosując wzór (6.3.5) z rozdziału 6, wyrażamy prawdopodobieństwo po lewej stronie (14.3.5) w funkcji rozkładu normalnego

gdzie jest odchylenie standardowe oszacowania T.

Z równania

znajdź wartość Sp:

gdzie arg Ф* (x) jest funkcją odwrotną Ф* (X), te. taka wartość argumentu, dla której funkcja rozkładu normalnego jest równa X.

Dyspersja D, przez które wyrażana jest wartość A 1P, dokładnie nie wiemy; jako przybliżoną wartość, możesz użyć oszacowania D(14.3.4) i umieścić w przybliżeniu:

W ten sposób problem konstruowania przedziału ufności jest w przybliżeniu rozwiązany, który jest równy:

gdzie gp jest określone wzorem (14.3.7).

Aby uniknąć odwrotnej interpolacji w tabelach funkcji Ф * (l) podczas obliczania s p, wygodnie jest skompilować specjalną tabelę (Tabela 14.3.1), która zawiera wartości ilości

w zależności od r. Wartość (p określa dla prawa normalnego liczbę odchyleń standardowych, które należy odłożyć na prawo i lewo od centrum dyspersji, aby prawdopodobieństwo wpadnięcia w wynikowy obszar było równe p.

Przez wartość 7 p przedział ufności wyraża się jako:

Tabela 14.3.1

Przykład 1. Na wartości przeprowadzono 20 eksperymentów X; wyniki przedstawiono w tabeli. 14.3.2.

Tabela 14.3.2

Wymagane jest znalezienie oszacowania dla matematycznego oczekiwania wielkości X i skonstruować przedział ufności odpowiadający poziomowi ufności p = 0,8.

Rozwiązanie. Mamy:

Wybierając dla pochodzenia n: = 10, zgodnie z trzecim wzorem (14.2.14) znajdujemy oszacowanie nieobciążone D :

Zgodnie z tabelą 14.3.1 znajdujemy

Granice zaufania:

Przedział ufności:

Wartości parametrów T, leżące w tym przedziale są zgodne z danymi eksperymentalnymi podanymi w tabeli. 14.3.2.

W podobny sposób można skonstruować przedział ufności dla wariancji.

Niech produkowane P niezależne eksperymenty na zmiennej losowej X o nieznanych parametrach z i A oraz dla wariancji D otrzymuje się nieobciążone oszacowanie:

Wymagane jest zbudowanie w przybliżeniu przedziału ufności dla wariancji.

Ze wzoru (14.3.11) widać, że wartość D reprezentuje

kwota P zmienne losowe postaci . Te wartości nie są

niezależne, ponieważ każdy z nich zawiera ilość T, zależny od wszystkich innych. Można jednak wykazać, że jako P prawo dystrybucji ich sumy jest również zbliżone do normalnego. Prawie o godz P= 20...30 można to już uznać za normalne.

Załóżmy, że tak jest i znajdźmy charakterystykę tego prawa: matematyczne oczekiwanie i wariancję. Od wyniku D- w takim razie bezstronny M[D] = D.

Obliczanie wariancji D D wiąże się ze stosunkowo skomplikowanymi obliczeniami, dlatego podajemy jego wyrażenie bez wyprowadzenia:

gdzie c 4 - czwarty centralny moment wielkości X.

Aby użyć tego wyrażenia, musisz zastąpić w nim wartości 4 i D(przynajmniej w przybliżeniu). Zamiast D możesz skorzystać z oceny D. W zasadzie czwarty moment centralny można również zastąpić jego oszacowaniem, na przykład wartością postaci:

ale takie zastąpienie da wyjątkowo niską dokładność, ponieważ ogólnie przy ograniczonej liczbie eksperymentów momenty wysokiego rzędu są określane z dużymi błędami. Jednak w praktyce często zdarza się, że postać prawa dystrybucji ilości X znany z góry: nieznane są tylko jego parametry. Następnie możemy spróbować wyrazić u4 w kategoriach D.

Weźmy najczęstszy przypadek, gdy wartość X dystrybuowane zgodnie z normalnym prawem. Następnie jego czwarty centralny moment jest wyrażony w kategoriach wariancji (patrz rozdział 6, podsekcja 6.2);

a wzór (14.3.12) daje Lub

Zastąpienie w (14.3.14) nieznane D jego ocena D, otrzymujemy: skąd

Moment u 4 można wyrazić w kategoriach D również w niektórych innych przypadkach, gdy dystrybucja ilości X nie jest normalne, ale jego wygląd jest znany. Na przykład dla prawa jednolitej gęstości (patrz rozdział 5) mamy:

gdzie (a, P) jest przedziałem, w którym dane jest prawo.

Stąd,

Zgodnie ze wzorem (14.3.12) otrzymujemy: skąd znajdujemy ok

W przypadkach, gdy postać prawa rozkładu o wartości 26 jest nieznana, przy szacowaniu wartości a /) nadal zaleca się stosowanie wzoru (14.3.16), jeżeli nie ma szczególnych podstaw, by sądzić, że to prawo bardzo różni się od normalnego (ma zauważalną dodatnią lub ujemną kurtozę).

Jeśli przybliżona wartość a /) zostanie uzyskana w taki czy inny sposób, to możliwe jest skonstruowanie przedziału ufności dla wariancji w taki sam sposób, w jaki zbudowaliśmy go dla matematycznego oczekiwania:

gdzie wartość zależna od zadanego prawdopodobieństwa p znajduje się w tabeli. 14.3.1.

Przykład 2. Znajdź około 80% przedział ufności dla wariancji zmiennej losowej X w warunkach z przykładu 1, jeśli wiadomo, że wartość X dystrybuowane zgodnie z prawem zbliżonym do normalnego.

Rozwiązanie. Wartość pozostaje taka sama jak w tabeli. 14.3.1:

Zgodnie ze wzorem (14.3.16)

Zgodnie ze wzorem (14.3.18) znajdujemy przedział ufności:

Odpowiedni zakres wartości odchylenia standardowego: (0,21; 0,29).

14.4. Dokładne metody konstruowania przedziałów ufności dla parametrów zmiennej losowej o rozkładzie normalnym

W poprzednim podrozdziale rozważaliśmy z grubsza przybliżone metody konstruowania przedziałów ufności dla średniej i wariancji. Tutaj dajemy wyobrażenie o dokładnych metodach rozwiązania tego samego problemu. Podkreślamy, że aby dokładnie znaleźć przedziały ufności, absolutnie konieczna jest wcześniejsza znajomość postaci prawa rozkładu wielkości X, podczas gdy nie jest to konieczne do zastosowania metod przybliżonych.

Idea dokładnych metod konstruowania przedziałów ufności jest następująca. Dowolny przedział ufności znajduje się na podstawie warunku wyrażającego prawdopodobieństwo spełnienia pewnych nierówności, które zawierają interesującą nas estymatę A. Prawo dystrybucji ocen A w ogólnym przypadku zależy od nieznanych parametrów wielkości X. Czasami jednak możliwe jest przekazanie nierówności ze zmiennej losowej A do jakiejś innej funkcji obserwowanych wartości X p X 2, ..., X str. którego prawo dystrybucji nie zależy od nieznanych parametrów, ale zależy tylko od liczby eksperymentów i postaci prawa dystrybucji ilości X. Zmienne losowe tego rodzaju odgrywają dużą rolę w statystyce matematycznej; zostały one zbadane najbardziej szczegółowo dla przypadku rozkładu normalnego wielkości X.

Na przykład udowodniono, że przy normalnym rozkładzie ilości X losowa wartość

podlega tzw Prawo dystrybucyjne Studenta Z P- 1 stopień swobody; gęstość tego prawa ma postać

gdzie G(x) jest znaną funkcją gamma:

Udowodniono również, że zmienna losowa

ma „rozkład % 2” z P- 1 stopień swobody (patrz rozdział 7), którego gęstość wyraża wzór

Nie zagłębiając się w wyprowadzenia rozkładów (14.4.2) i (14.4.4), pokażemy, jak można je zastosować przy konstruowaniu przedziałów ufności dla parametrów Ty D.

Niech produkowane P niezależne eksperymenty na zmiennej losowej X, rozłożone zgodnie z prawem normalnym o nieznanych parametrach TIO. Dla tych parametrów oszacowania

Wymagane jest skonstruowanie przedziałów ufności dla obu parametrów odpowiadających prawdopodobieństwu ufności p.

Skonstruujmy najpierw przedział ufności dla matematycznego oczekiwania. Naturalne jest przyjęcie tego przedziału symetrycznie względem T; oznaczmy przez s p połowę długości przedziału. Wartość sp musi być tak dobrana, aby warunek

Spróbujmy przekazać lewą stronę równości (14.4.5) ze zmiennej losowej T do zmiennej losowej T, dystrybuowane zgodnie z Prawem Studenta. W tym celu mnożymy obie części nierówności |m-w?|

do wartości dodatniej: lub używając zapisu (14.4.1),

Znajdźmy liczbę / p taką, że wartość / p można znaleźć na podstawie warunku

Ze wzoru (14.4.2) widać, że (1) jest funkcją parzystą, więc (14.4.8) daje

Równość (14.4.9) określa wartość / p w zależności od p. Jeśli masz do dyspozycji tabelę wartości całkowitych

wtedy wartość / p można znaleźć w tabeli przez interpolację odwrotną. Jednak wygodniej jest wcześniej skompilować tabelę wartości / p. Taka tabela znajduje się w Załączniku (tabela 5). Ta tabela pokazuje wartości w zależności od prawdopodobieństwa ufności p i liczby stopni swobody P- 1. Po ustaleniu / p zgodnie z tabelą. 5 i zakładając

znajdujemy połowę szerokości przedziału ufności / p i sam przedział

Przykład 1. Przeprowadzono 5 niezależnych eksperymentów na zmiennej losowej X, o rozkładzie normalnym o nieznanych parametrach T i o. Wyniki eksperymentów podano w tabeli. 14.4.1.

Tabela 14.4.1

Znajdź kosztorys T dla matematycznego oczekiwania i skonstruuj dla niego 90% przedział ufności / p (tj. przedział odpowiadający prawdopodobieństwu ufności p \u003d 0,9).

Rozwiązanie. Mamy:

Zgodnie z tabelą 5 wniosku o P - 1 = 4 i p = 0,9 znajdujemy Gdzie

Przedział ufności będzie

Przykład 2. Dla warunków z przykładu 1 podrozdziału 14.3, przyjmując wartość X o rozkładzie normalnym, znajdź dokładny przedział ufności.

Rozwiązanie. Zgodnie z tabelą 5 wniosku znajdujemy o godz P - 1 = 19ir =

0,8 / p = 1,328; stąd

Porównując rozwiązanie z przykładu 1 z podrozdziału 14.3 (e p = 0,072), widzimy, że rozbieżność jest bardzo mała. Jeśli zachowamy dokładność do drugiego miejsca po przecinku, to przedziały ufności znalezione metodami dokładnymi i przybliżonymi są takie same:

Przejdźmy do konstruowania przedziału ufności dla wariancji. Rozważmy nieobciążone oszacowanie wariancji

i wyrazić zmienną losową D poprzez wartość V(14.4.3) o rozkładzie x 2 (14.4.4):

Znajomość prawa dystrybucji wielkości V, można znaleźć przedział / (1 ), w którym wypada z zadanym prawdopodobieństwem p.

prawo dystrybucji k n _ x (v) wartość I 7 ma postać pokazaną na ryc. 14.4.1.

Ryż. 14.4.1

Powstaje pytanie: jak wybrać interwał / p? Jeśli prawo dystrybucji ilości V był symetryczny (jak prawo normalne lub rozkład Studenta), naturalne byłoby przyjęcie przedziału /p jako symetrycznego względem matematycznego oczekiwania. W tym przypadku prawo k n _ x (v) asymetryczny. Umówmy się na taki przedział /p, aby prawdopodobieństwa wyjścia wielkości V poza przedziałem po prawej i po lewej stronie (obszary zacienione na ryc. 14.4.1) były takie same i równe

Aby skonstruować przedział / p z tą właściwością, używamy tabeli. 4 aplikacje: zawiera cyfry y) takie że

dla ilości V, mający rozkład x 2 z r stopniami swobody. W naszym przypadku r = n- 1. Napraw r = n- 1 i znajdź w odpowiednim wierszu tabeli. 4 dwie wartości x 2 - jedno odpowiadające prawdopodobieństwu drugie - prawdopodobieństwa Oznaczmy je

wartości o 2 I XL? Interwał ma y 2 , z lewej strony i y~ prawy koniec.

Teraz znajdujemy wymagany przedział ufności /| dla wariancji z granicami D i D2, który obejmuje punkt D z prawdopodobieństwem p:

Skonstruujmy taki przedział / (, = (?> b A), który obejmuje punkt D wtedy i tylko wtedy, gdy wartość V mieści się w przedziale / r. Pokażmy, że przedział

spełnia ten warunek. Dokładnie, nierówności są równoważne nierównościom

i te nierówności są spełnione z prawdopodobieństwem p. W ten sposób znajduje się przedział ufności dla dyspersji, który wyraża się wzorem (14.4.13).

Przykład 3. Znajdź przedział ufności dla wariancji w warunkach przykładu 2 z podsekcji 14.3, jeśli wiadomo, że wartość X dystrybuowane normalnie.

Rozwiązanie. Mamy . Zgodnie z tabelą 4 wniosku

znajdujemy o godz r = n- 1 = 19

Zgodnie ze wzorem (14.4.13) znajdujemy przedział ufności dla dyspersji

Odpowiedni przedział dla odchylenia standardowego: (0,21; 0,32). Przedział ten tylko nieznacznie przekracza przedział (0,21; 0,29) uzyskany w przykładzie 2 podrozdziału 14.3 metodą przybliżoną.

  • Rysunek 14.3.1 uwzględnia przedział ufności, który jest symetryczny względem a. Ogólnie rzecz biorąc, jak zobaczymy później, nie jest to konieczne.
KATEGORIE

POPULARNE ARTYKUŁY

2023 „kingad.ru” - badanie ultrasonograficzne narządów ludzkich