Tabelaryczna wartość testu t-Studenta. Podstawowe statystyki i test t-Studenta

Kiedy można zastosować test t Studenta?

Aby zastosować test t-Studenta, konieczne jest, aby oryginalne dane: normalna dystrybucja. W przypadku zastosowania testu dwupróbkowego dla prób niezależnych konieczne jest również spełnienie warunku równość (homoskedastyczność) wariancji.

Jeśli te warunki nie są spełnione, przy porównywaniu średnich próbek należy zastosować podobne metody. statystyki nieparametryczne, wśród których najbardziej znane są Test U Manna-Whitneya(jako test z dwiema próbami dla próbek niezależnych), oraz kryterium znaku oraz Test Wilcoxona(stosowane w przypadku próbek zależnych).

Aby porównać średnie, test t-Studenta oblicza się według następującego wzoru:

gdzie M 1- średnia arytmetyczna pierwszej porównywanej populacji (grupy), M 2- średnia arytmetyczna drugiej porównywanej populacji (grupy), m 1- błąd średni pierwszej średniej arytmetycznej, m2- błąd średni drugiej średniej arytmetycznej.

Jak interpretować wartość testu t-Studenta?

Wynikowa wartość testu t-Studenta musi być poprawnie zinterpretowana. Aby to zrobić, musimy znać liczbę przedmiotów w każdej grupie (n 1 i n 2). Znajdowanie liczby stopni swobody f według wzoru:

f \u003d (n 1 + n 2) - 2

Następnie wyznaczamy wartość krytyczną testu t-Studenta dla wymaganego poziomu istotności (np. p=0,05) i dla danej liczby stopni swobody f zgodnie z tabelą ( patrz poniżej).

Porównujemy wartości krytyczne i obliczone kryterium:

Jeżeli obliczona wartość testu t-Studenta równy lub większy krytyczne, znajdujące się w tabeli, wnioskujemy, że różnice między porównywanymi wartościami są istotne statystycznie.

Jeżeli wartość obliczonego testu t-Studenta mniej tabelaryczne, co oznacza, że ​​różnice pomiędzy porównywanymi wartościami nie są istotne statystycznie.

Przykład testu t-Studenta

W celu zbadania skuteczności nowego preparatu żelaza wybrano dwie grupy pacjentów z anemią. W pierwszej grupie pacjenci otrzymywali nowy lek przez dwa tygodnie, a w drugiej grupie otrzymywali placebo. Następnie zmierzono poziom hemoglobiny we krwi obwodowej. W pierwszej grupie średni poziom hemoglobiny wynosił 115,4±1,2 g/l, a w drugiej 103,7±2,3 g/l (dane przedstawiono w formacie M±m), porównywane populacje mają rozkład normalny. Liczebność pierwszej grupy wynosiła 34, a drugiej 40 pacjentów. Niezbędne jest wyciągnięcie wniosków na temat istotności statystycznej uzyskanych różnic oraz skuteczności nowego preparatu żelaza.

Rozwiązanie: Do oceny istotności różnic stosujemy test t-Studenta, obliczony jako różnica między średnimi podzielona przez sumę kwadratów błędów:

Po wykonaniu obliczeń wartość testu t wyniosła 4,51. Liczbę stopni swobody wyznaczamy jako (34 + 40) - 2 = 72. Porównujemy uzyskaną wartość testu t-Studenta 4,51 z wartością krytyczną przy p=0,05 wskazaną w tabeli: 1,993. Ponieważ obliczona wartość kryterium jest większa od wartości krytycznej, wnioskujemy, że zaobserwowane różnice są istotne statystycznie (poziom istotności p<0,05).

Rozkład Fishera jest rozkładem zmiennej losowej

gdzie zmienne losowe X 1 oraz X 2 są niezależne i mają rozkłady chi - kwadrat z liczbą stopni swobody k 1 oraz k2 odpowiednio. W tym samym czasie para (k 1 , k 2) jest parą „liczb stopni swobody” rozkładu Fishera, a mianowicie k 1 jest liczbą stopni swobody licznika, a k2 jest liczbą stopni swobody mianownika. Rozkład zmiennej losowej F nazwany na cześć wielkiego angielskiego statystyka R. Fishera (1890-1962), który aktywnie używał go w swojej pracy.

Rozkład Fishera służy do testowania hipotez o adekwatności modelu w analizie regresji, o równości wariancji oraz w innych problemach statystyki stosowanej.

Tabela wartości krytycznych studenta.

Początek formularza

Liczba stopni swobody, f Wartość testu t-Studenta przy p=0,05
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.040
2.037
2.035
2.032
2.030
2.028
2.026
2.024
40-41 2.021
42-43 2.018
44-45 2.015
46-47 2.013
48-49 2.011
50-51 2.009
52-53 2.007
54-55 2.005
56-57 2.003
58-59 2.002
60-61 2.000
62-63 1.999
64-65 1.998
66-67 1.997
68-69 1.995
70-71 1.994
72-73 1.993
74-75 1.993
76-77 1.992
78-79 1.991
80-89 1.990
90-99 1.987
100-119 1.984
120-139 1.980
140-159 1.977
160-179 1.975
180-199 1.973
1.972
1.960

Test t-Studenta to ogólna nazwa klasy metod statystycznego testowania hipotez (testy statystyczne) na podstawie rozkładu Studenta. Najczęstsze przypadki zastosowania testu t dotyczą sprawdzenia równości średnich w dwóch próbach.

1. Historia rozwoju testu t

To kryterium zostało opracowane William Gosset do oceny jakości piwa w Guinness. W związku z zobowiązaniem firmy do nieujawniania tajemnic handlowych, artykuł Gosseta został opublikowany w 1908 roku w czasopiśmie Biometrics pod pseudonimem „Student” (Student).

2. Do czego służy test t Studenta?

Test t-Studenta służy do określenia istotności statystycznej różnic średnich. Może być stosowany zarówno w przypadku porównywania niezależnych próbek ( na przykład grupy pacjentów z cukrzycą i grupy zdrowych) oraz przy porównywaniu powiązanych zestawów ( np. średnia częstość akcji serca u tych samych pacjentów przed i po przyjęciu leku antyarytmicznego).

3. Kiedy można zastosować test t Studenta?

Aby zastosować test t-Studenta, konieczne jest, aby oryginalne dane: normalna dystrybucja. W przypadku zastosowania testu dwupróbkowego dla prób niezależnych konieczne jest również spełnienie warunku równość (homoskedastyczność) wariancji.

Jeśli te warunki nie są spełnione, przy porównywaniu średnich próbek należy zastosować podobne metody. statystyki nieparametryczne, wśród których najbardziej znane są Test U Manna-Whitneya(jako test z dwiema próbami dla próbek niezależnych), oraz kryterium znaku oraz Test Wilcoxona(stosowane w przypadku próbek zależnych).

4. Jak obliczyć test t-Studenta?

Aby porównać średnie, test t-Studenta oblicza się według następującego wzoru:

gdzie M 1- średnia arytmetyczna pierwszej porównywanej populacji (grupy), M 2- średnia arytmetyczna drugiej porównywanej populacji (grupy), m 1- błąd średni pierwszej średniej arytmetycznej, m2- błąd średni drugiej średniej arytmetycznej.

5. Jak interpretować wartość testu t-Studenta?

Wynikowa wartość testu t-Studenta musi być poprawnie zinterpretowana. Aby to zrobić, musimy znać liczbę przedmiotów w każdej grupie (n 1 i n 2). Znajdowanie liczby stopni swobody f według wzoru:

f \u003d (n 1 + n 2) - 2

Następnie wyznaczamy wartość krytyczną testu t-Studenta dla wymaganego poziomu istotności (np. p=0,05) i dla danej liczby stopni swobody f zgodnie z tabelą ( patrz poniżej).

Porównujemy wartości krytyczne i obliczone kryterium:

  • Jeżeli obliczona wartość testu t-Studenta równy lub większy krytyczne, znajdujące się w tabeli, wnioskujemy, że różnice między porównywanymi wartościami są istotne statystycznie.
  • Jeżeli wartość obliczonego testu t-Studenta mniej tabelaryczne, co oznacza, że ​​różnice pomiędzy porównywanymi wartościami nie są istotne statystycznie.

6. Przykład obliczenia testu t-Studenta

W celu zbadania skuteczności nowego preparatu żelaza wybrano dwie grupy pacjentów z anemią. W pierwszej grupie pacjenci otrzymywali nowy lek przez dwa tygodnie, a w drugiej grupie otrzymywali placebo. Następnie zmierzono poziom hemoglobiny we krwi obwodowej. W pierwszej grupie średni poziom hemoglobiny wynosił 115,4±1,2 g/l, a w drugiej 103,7±2,3 g/l (dane przedstawiono w formacie M±m), porównywane populacje mają rozkład normalny. Liczebność pierwszej grupy wynosiła 34, a drugiej 40 pacjentów. Niezbędne jest wyciągnięcie wniosków na temat istotności statystycznej uzyskanych różnic oraz skuteczności nowego preparatu żelaza.

Rozwiązanie: Do oceny istotności różnic stosujemy test t-Studenta, obliczony jako różnica między średnimi podzielona przez sumę kwadratów błędów:

Po wykonaniu obliczeń wartość testu t wyniosła 4,51. Liczbę stopni swobody wyznaczamy jako (34 + 40) - 2 = 72. Porównujemy uzyskaną wartość testu t-Studenta 4,51 z wartością krytyczną przy p=0,05 wskazaną w tabeli: 1,993. Ponieważ obliczona wartość kryterium jest większa od wartości krytycznej, wnioskujemy, że zaobserwowane różnice są istotne statystycznie (poziom istotności p<0,05).

Testowanie hipotezy statystycznej pozwala na wyciągnięcie rygorystycznych wniosków dotyczących charakterystyki populacji ogólnej na podstawie danych z próby. Hipotezy są różne. Jedną z nich jest hipoteza o średniej (oczekiwanie matematyczne). Jego istotą jest sformułowanie prawidłowego wniosku o tym, gdzie ogólna średnia może opierać się lub nie tylko na dostępnej próbce (nigdy nie poznamy dokładnej prawdy, ale możemy zawęzić krąg poszukiwań).

Opisano ogólne podejście do testowania hipotez, więc od razu do rzeczy. Załóżmy najpierw, że próba jest pobierana z normalnego zestawu zmiennych losowych X z ogólną średnią μ i dyspersja σ2(Wiem, wiem, że tak się nie dzieje, ale nie musisz mi przerywać!). Średnia arytmetyczna tej próby jest oczywiście sama w sobie zmienną losową. Jeśli wyodrębnimy wiele takich próbek i obliczymy dla nich średnie, to będą one również miały z matematycznym oczekiwaniem μ oraz

Następnie zmienna losowa

Powstaje pytanie: czy ogólna średnia z prawdopodobieństwem 95% będzie w zakresie ±1,96 s x̅. Innymi słowy, czy rozkłady zmiennych losowych?

równowartość.

Po raz pierwszy pytanie to zostało postawione (i rozwiązane) przez chemika, który pracował w fabryce piwa Guinness w Dublinie (Irlandia). Chemik nazywał się William Seeley Gosset i pobierał próbki piwa do analizy chemicznej. Najwyraźniej w pewnym momencie William zaczął mieć niejasne wątpliwości co do rozkładu średnich. Okazało się, że jest nieco bardziej rozłożony niż powinien być normalny rozkład.

Po zebraniu matematycznego uzasadnienia i obliczeniu wartości odkrytej funkcji rozkładu, dubliński chemik William Gosset napisał notatkę, która została opublikowana w numerze czasopisma Biometrics z marca 1908 (redaktor naczelny - Karl Pearson) . Dlatego Guinness surowo zabronił ujawniania tajników warzenia piwa, Gosset sygnował pod pseudonimem Student.

Pomimo tego, że K. Pearson już wymyślił dystrybucję, nadal dominowała ogólna idea normalności. Nikt nie pomyślałby, że rozkład szacunków próby może nie być normalny. Dlatego artykuł W. Gosseta pozostał praktycznie niezauważony i zapomniany. I tylko Ronald Fisher docenił odkrycie Gosseta. Fischer wykorzystał nową dystrybucję w swojej pracy i nadał jej nazwę Rozkład t-Studenta. Kryterium testowania hipotez stało się odpowiednio: Test t-Studenta. Nastąpiła więc „rewolucja” w statystyce, która wkroczyła w erę analizy przykładowych danych. To była krótka dygresja do historii.

Zobaczmy, co mógł zobaczyć W. Gosset. Wygenerujmy 20 tysięcy normalnych próbek z 6 obserwacji ze średnią ( X) 50 i odchylenie standardowe ( σ ) 10. Następnie normalizujemy średnie z próbki za pomocą ogólna wariancja:

Otrzymane 20 tysięcy średnich grupujemy w przedziały o długości 0,1 i obliczamy częstotliwości. Wykreślmy na wykresie rzeczywisty (Norm) i teoretyczny (ENorm) rozkład częstotliwości średnich próbek.

Punkty (częstotliwości obserwowane) prawie pokrywają się z linią (częstotliwości teoretyczne). Jest to zrozumiałe, ponieważ dane pochodzą z tej samej populacji ogólnej, a różnice to tylko błędy próbkowania.

Zróbmy nowy eksperyment. Normalizujemy średnie za pomocą wariancja próbki.

Policzmy ponownie częstotliwości i wykreślmy je na wykresie jako kropki, pozostawiając dla porównania linię standardowego rozkładu normalnego. Oznaczmy empiryczną częstotliwość średnich, powiedzmy, literą t.

Widać, że rozkłady tym razem nie są bardzo podobne. Blisko tak, ale nie to samo. Ogony stały się bardziej „ciężkie”.

Gosset-Student nie miał najnowszej wersji MS Excel, ale to właśnie zauważył. Dlaczego tak jest? Wyjaśnienie jest takie, że zmienna losowa

zależy nie tylko od błędu próby (licznik), ale także od błędu standardowego średniej (mianownika), który również jest zmienną losową.

Zastanówmy się trochę, jaki rozkład powinna mieć taka zmienna losowa. Najpierw musisz zapamiętać (lub nauczyć się) czegoś ze statystyk matematycznych. Istnieje takie twierdzenie Fishera, które mówi, że w próbce z rozkładu normalnego:

1. średnie X i wariancji próbki s2 są niezależnymi ilościami;

2. Stosunek próbki i ogólnej wariancji pomnożony przez liczbę stopni swobody ma rozkład 2(chi-kwadrat) o tej samej liczbie stopni swobody, tj.

gdzie k- liczba stopni swobody (w języku angielskim stopni swobody (d.f.))

Wiele innych wyników w statystykach modeli normalnych opiera się na tym prawie.

Wróćmy do rozkładu średniej. Podziel licznik i mianownik wyrażenia

na σX̅. Dostać

Licznik jest standardową normalną zmienną losową (oznaczamy ξ (xi)). Mianownik można wyrazić z twierdzenia Fishera.

Wtedy oryginalne wyrażenie przybierze formę

To jest w kategoriach ogólnych (wskaźnik Studenta). Jest już możliwe bezpośrednie wyprowadzenie jego funkcji dystrybucyjnej, ponieważ: znane są rozkłady obu zmiennych losowych w tym wyrażeniu. Zostawmy tę przyjemność matematykom.

Funkcja rozkładu t-Studenta ma dość trudną do zrozumienia formułę, więc nie ma sensu jej analizować. Zresztą nikt tego nie używa, bo. prawdopodobieństwa podane są w specjalnych tablicach rozkładu Studenta (czasami nazywane tablicami współczynników Studenta) lub są wbijane we wzory PC.

Tak więc, uzbrojony w nową wiedzę, będziesz w stanie zrozumieć oficjalną definicję dystrybucji Studenta.
Zmienna losowa zgodna z rozkładem Studenta z k stopnie swobody to stosunek niezależnych zmiennych losowych

gdzie ξ dystrybuowane zgodnie ze standardowym prawem normalnym, oraz χ 2 tys podlega dystrybucji 2 c k stopnie swobody.

Zatem wzór na kryterium Studenta dla średniej arytmetycznej

Jest szczególny przypadek relacji studenckiej

Ze wzoru i definicji wynika, że ​​rozkład testu t-Studenta zależy tylko od liczby stopni swobody.

Na k> 30 t-test praktycznie nie odbiega od standardowego rozkładu normalnego.

W przeciwieństwie do testu chi-kwadrat, test t może być jedno- lub dwustronny. Zwykle stosuje się dwustronność, zakładając, że odchylenie może wystąpić w obu kierunkach od średniej. Ale jeśli stan problemu pozwala na odchylenie tylko w jednym kierunku, to rozsądne jest zastosowanie jednostronnego kryterium. To nieznacznie zwiększa moc, tk. przy ustalonym poziomie istotności wartość krytyczna nieznacznie zbliża się do zera.

Warunki stosowania testu t-Studenta

Pomimo tego, że odkrycie Studenta dokonało swego czasu rewolucji w statystyce, test t jest nadal dość ograniczony w swojej stosowalności, ponieważ samo pochodzi z założenia normalnego rozkładu pierwotnych danych. Jeśli dane nie są normalne (co zwykle ma miejsce), test t nie będzie już miał rozkładu Studenta. Jednak ze względu na działanie centralnego twierdzenia granicznego średnia, nawet dla danych nienormalnych, szybko uzyskuje rozkład w kształcie dzwonu.

Rozważmy na przykład dane, które mają wyraźne pochylenie w prawo, takie jak rozkład chi-kwadrat z 5 stopniami swobody.

Teraz stwórzmy 20 tysięcy próbek i obserwujmy, jak zmienia się rozkład średnich w zależności od ich wielkości.

Różnica jest dość zauważalna w małych próbkach do 15–20 obserwacji. Ale potem szybko znika. A zatem nienormalność rozkładu nie jest oczywiście dobra, ale nie krytyczna.

Przede wszystkim kryterium t „boi się” wartości odstających, tj. nienormalne odchylenia. Weźmy 20 tysięcy normalnych próbek z 15 obserwacji i do niektórych z nich dodajmy jedną losową wartość odstającą.

Obraz jest nieszczęśliwy. Rzeczywiste częstości średnich bardzo różnią się od teoretycznych. Wykorzystanie rozkładu t w takiej sytuacji staje się przedsięwzięciem bardzo ryzykownym.

Tak więc w niezbyt małych próbach (z 15 obserwacji) test t jest stosunkowo odporny na nienormalny rozkład danych wyjściowych. Jednak wartości odstające w danych silnie zniekształcają rozkład testu t, co z kolei może prowadzić do błędów wnioskowania statystycznego, dlatego obserwacje anomalne należy wyeliminować. Często z próbki usuwane są wszystkie wartości, które wykraczają poza ±2 odchylenia standardowe od średniej.

Przykład testowania hipotezy oczekiwań matematycznych za pomocą testu t-Studenta w programie MS Excel

Excel ma kilka funkcji związanych z rozkładem t. Rozważmy je.

ROZKŁ.STUDENTA - "klasyczny" lewostronny rozkład t-Studenta. Dane wejściowe to wartość kryterium t, liczba stopni swobody oraz opcja (0 lub 1) określająca, co należy obliczyć: gęstość lub wartość funkcji. Na wyjściu otrzymujemy odpowiednio gęstość lub prawdopodobieństwo, że zmienna losowa będzie mniejsza niż podane w argumencie kryterium t.

STUDENT.DIST.2X - dystrybucja dwukierunkowa. Jako argument podano wartość bezwzględną (modulo) kryterium t oraz liczbę stopni swobody. Na wyjściu otrzymujemy prawdopodobieństwo uzyskania tej lub nawet większej wartości kryterium t, tj. rzeczywisty poziom istotności (poziom p).

ROZKŁ.STUDENCKI.PR - prawoskrętny rozkład t. Tak więc ROZKŁ.1.UCZNIA(2;5;1) = ROZKŁ.UCZNIA.PX(2;5) = 0,05097. Jeśli test t jest pozytywny, to wynikające z niego prawdopodobieństwo jest równe p-poziomowi.

ROZKŁAD.STUDENT.ODW — służy do obliczania lewostronnej odwrotności rozkładu t. Argumentem jest prawdopodobieństwo i liczba stopni swobody. Na wyjściu otrzymujemy wartość kryterium t odpowiadającego temu prawdopodobieństwu. Prawdopodobieństwo liczone jest po lewej stronie. Dlatego dla lewego ogona potrzebny jest sam poziom istotności α , a dla prawego 1 - α .

STUDENT.ORD.2X jest odwrotnością dwustronnego rozkładu Studenta, tj. Wartość testu t (modulo). Jako dane wejściowe podaje się również poziom istotności. α . Tylko tym razem odliczanie odbywa się z obu stron jednocześnie, więc prawdopodobieństwo rozkłada się na dwa reszki. A więc STUDENT.OBR (1-0,025; 5) \u003d STUDENT. OBR. 2X (0,05; 5) \u003d 2,57058

STUDENT.TEST to funkcja do testowania hipotezy o równości oczekiwań matematycznych w dwóch próbach. Zastępuje sporo obliczeń, bo. wystarczy podać tylko dwa zakresy z danymi i kilka dodatkowych parametrów. Wyjście jest na poziomie p.

PEWNOŚĆ UCZNIÓW - obliczenie przedziału ufności średniej z uwzględnieniem rozkładu t-Studenta.

Rozważmy taki przykład szkolenia. Firma pakuje cement w worki po 50 kg. Przypadkowo w jednej torbie dopuszczalne jest odchylenie od oczekiwanej masy, ale ogólna średnia powinna wynosić 50 kg. Dział kontroli jakości zważył losowo 9 worków i uzyskał następujące wyniki: średnia waga ( X) wyniosło 50,3 kg, odchylenie standardowe ( s) - 0,5 kg.

Czy wynik jest zgodny z hipotezą zerową, że ogólna średnia wynosi 50 kg? Innymi słowy, czy możliwe jest uzyskanie takiego wyniku przez czysty przypadek, jeśli sprzęt działa prawidłowo i produkuje średnio 50 kg napełnienia? Jeśli hipoteza nie zostanie odrzucona, to wynikowa różnica mieści się w zakresie wahań losowych, ale jeśli hipoteza zostanie odrzucona, najprawdopodobniej wystąpiła awaria w ustawieniach aparatu wypełniającego worki. Trzeba to sprawdzić i wyregulować.

Tak wygląda krótki warunek w ogólnie przyjętej notacji.

H0: μ = 50 kg

H1: μ ≠ 50 kg

Istnieją powody, by przypuszczać, że rozkład zajętości toreb jest zgodny z rozkładem normalnym (lub niewiele się od niego różni). Tak więc, aby przetestować hipotezę matematycznych oczekiwań, możesz użyć testu t-Studenta. Odchylenia losowe mogą wystąpić w dowolnym kierunku, dlatego potrzebny jest dwustronny test t.

Najpierw stosujemy środki przedpotopowe: ręcznie obliczamy test t i porównujemy go z krytyczną wartością z tabeli. Szacowany test t:

Ustalmy teraz, czy otrzymana liczba wykracza poza poziom krytyczny na poziomie istotności α = 0,05. Skorzystajmy z tabeli rozkładu t-Studenta (dostępnej w każdym podręczniku statystyki).

Kolumny pokazują prawdopodobieństwo prawej strony rozkładu, wiersze liczbę stopni swobody. Interesuje nas dwustronny test t z poziomem istotności 0,05, co odpowiada wartości t dla połowy poziomu istotności po prawej stronie: 1 - 0,05 / 2 = 0,975. Liczba stopni swobody to wielkość próbki minus 1, tj. 9 - 1 = 8. Na przecięciu znajdujemy tabelaryczną wartość testu t - 2,306. Gdybyśmy użyli standardowego rozkładu normalnego, to punkt krytyczny wynosiłby 1,96, ale tutaj jest więcej, ponieważ Rozkład t na małych próbkach ma bardziej spłaszczoną formę.

Porównujemy wartość rzeczywistą (1,8) i tabelaryczną (2,306). Obliczone kryterium okazało się mniejsze niż tabelaryczne. Dostępne dane nie są zatem sprzeczne z hipotezą H 0, że ogólna średnia wynosi 50 kg (ale też tego nie udowadniają). To wszystko, czego możemy się dowiedzieć, korzystając z tabel. Możesz oczywiście nadal próbować znaleźć poziom p, ale będzie on przybliżony. Z reguły poziom p służy do testowania hipotez. Przejdźmy więc do Excela.

Nie ma gotowej funkcji do obliczania testu t w Excelu. Ale to nie jest przerażające, ponieważ wzór testu t Studenta jest dość prosty i można go łatwo zbudować bezpośrednio w komórce Excela.

Mam to samo 1.8. Najpierw znajdźmy wartość krytyczną. Bierzemy alfa 0,05, kryterium jest dwustronne. Potrzebujemy funkcji odwrotnej wartości rozkładu t dla dwustronnej hipotezy STUDENT.OBR.2X.

Wynikowa wartość odcina region krytyczny. Obserwowany test t nie mieści się w nim, więc hipoteza nie jest odrzucana.

Jest to jednak ten sam sposób testowania hipotezy za pomocą wartości tabeli. Bardziej pouczające będzie obliczenie poziomu p, tj. prawdopodobieństwo uzyskania obserwowanego lub nawet większego odchylenia od średniej 50kg, jeśli ta hipoteza jest poprawna. Będziesz potrzebować funkcji rozkładu Studenta dla hipotezy dwustronnej STUDENT.DIST.2X.

Poziom P jest równy 0,1096, czyli więcej niż dopuszczalny poziom istotności 0,05 – nie odrzucamy hipotezy. Ale teraz możemy ocenić stopień dowodów. Poziom P okazał się dość zbliżony do poziomu, w którym hipoteza została odrzucona, a to prowadzi do różnych myśli. Na przykład, że próbka była zbyt mała, aby wykryć znaczące odchylenie.

Załóżmy, że po pewnym czasie dział kontroli ponownie postanowił sprawdzić, jak zachowany jest standard napełniania worków. Tym razem dla większej niezawodności wybrano nie 9, a 25 worków. Intuicyjnie widać, że rozpiętość średniej zmniejszy się, a co za tym idzie szanse na znalezienie awarii w systemie będą większe.

Załóżmy, że za pierwszym razem uzyskano te same wartości średniej i odchylenia standardowego dla próbki (odpowiednio 50,3 i 0,5). Obliczmy test t.


Wartość krytyczna dla 24 stopni swobody i α = 0,05 wynosi 2,064. Poniższy rysunek pokazuje, że test t mieści się w obszarze odrzucenia hipotezy.

Można stwierdzić, że z prawdopodobieństwem ufności większym niż 95%, ogólna średnia różni się od 50 kg. Aby być bardziej przekonującym, spójrzmy na poziom p (ostatni wiersz w tabeli). Prawdopodobieństwo uzyskania średniej z tym lub nawet większym odchyleniem od 50, jeśli hipoteza jest poprawna, wynosi 0,0062, czyli 0,62%, co jest prawie niemożliwe przy pojedynczym pomiarze. Generalnie odrzucamy hipotezę jako mało prawdopodobną.

Obliczanie przedziału ufności za pomocą rozkładu t-Studenta

Inną metodą statystyczną ściśle związaną z testowaniem hipotez jest: obliczanie przedziałów ufności. Jeżeli wartość odpowiadająca hipotezie zerowej mieści się w otrzymanym przedziale, to jest to równoznaczne z tym, że hipoteza zerowa nie jest odrzucana. W przeciwnym razie hipoteza zostaje odrzucona z odpowiednim poziomem ufności. W niektórych przypadkach analitycy w ogóle nie testują hipotez w formie klasycznej, a jedynie obliczają przedziały ufności. Takie podejście pozwala wydobyć jeszcze więcej przydatnych informacji.

Obliczmy przedziały ufności dla średniej dla 9 i 25 obserwacji. W tym celu użyjemy funkcji Excela ZAUFANIE.STUDENT. Tutaj, co dziwne, wszystko jest dość proste. W argumentach funkcji należy podać tylko poziom istotności α , odchylenie standardowe próbki i wielkość próby. Na wyjściu otrzymujemy połowę szerokości przedziału ufności, czyli wartość, którą należy odłożyć na bok po obu stronach średniej. Po wykonaniu obliczeń i narysowaniu wizualnego diagramu otrzymujemy, co następuje.

Jak widać, przy próbie 9 obserwacji wartość 50 mieści się w przedziale ufności (hipoteza nie jest odrzucana), a przy 25 obserwacjach nie spada (hipoteza jest odrzucana). Jednocześnie w eksperymencie z 25 workami można argumentować, że z prawdopodobieństwem 97,5% ogólna średnia przekracza 50,1 kg (dolna granica przedziału ufności to 50,094 kg). A to bardzo cenna informacja.

W ten sposób rozwiązaliśmy ten sam problem na trzy sposoby:

1. Starożytne podejście, porównujące obliczoną i tabelaryczną wartość kryterium t
2. Bardziej nowoczesne, poprzez obliczenie poziomu p, dodając stopień pewności odrzucenia hipotezy.
3. Jeszcze więcej informacji, obliczając przedział ufności i uzyskując minimalną wartość ogólnej średniej.

Należy pamiętać, że test t odnosi się do metod parametrycznych, ponieważ w oparciu o rozkład normalny (posiada dwa parametry: średnią i wariancję). Dlatego dla jego pomyślnego zastosowania ważna jest przynajmniej przybliżona normalność danych początkowych i brak wartości odstających.

Na koniec proponuję obejrzeć film o tym, jak przeprowadzić obliczenia związane z testem t-Studenta w Excelu.

Tabela dystrybucji uczniów

Tabele całkowe prawdopodobieństwa są używane dla dużych próbek z nieskończenie dużej populacji. Ale już w (n)< 100 получается Несоответствие между

dane tabelaryczne i prawdopodobieństwo graniczne; w (n)< 30 погрешность становится значительной. Несоответствие вызывается главным образом характером распределения единиц генеральной совокупности. При большом объеме выборки особенность распределения в гене-

Nie ma to znaczenia dla populacji ogólnej, ponieważ rozkład odchyleń wskaźnika próby od ogólnej charakterystyki przy dużej próbie zawsze okazuje się normalny.

nym. W próbkach o małych rozmiarach (n)< 30 характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибки выборки при небольшом объеме наблюдения (уже менее 100 единиц) отбор должен проводиться из со-

populacja o normalnym rozkładzie. Teorię małych próbek opracował angielski statystyk W. Gosset (piszący pod pseudonimem Student) na początku XX wieku. W

W 1908 r. skonstruował specjalny rozkład, który pozwala, nawet przy małych próbach, skorelować (t) z prawdopodobieństwem ufności F(t). Dla (n) > 100, tabele rozkładu Studenta dają takie same wyniki jak tabele całkowe prawdopodobieństwa Laplace'a dla 30< (n ) <

100 różnic jest niewielkich. Dlatego w praktyce małe próbki obejmują próbki o objętości mniejszej niż 30 jednostek (oczywiście próbka o objętości większej niż 100 jednostek jest uważana za dużą).

Stosowanie małych prób w niektórych przypadkach wynika z charakteru badanej populacji. Tak więc w pracy hodowlanej „czyste” doświadczenie jest łatwiejsze do osiągnięcia na małej liczbie

działki. Eksperyment produkcyjno-ekonomiczny, związany z kosztami ekonomicznymi, jest również przeprowadzany na niewielkiej liczbie prób. Jak już wspomniano, w przypadku małej próby tylko dla populacji ogólnej o rozkładzie normalnym można obliczyć zarówno prawdopodobieństwa ufności, jak i granice ufności średniej ogólnej.

Gęstość prawdopodobieństwa rozkładu Studenta jest opisana funkcją.

1 + t2

f (t ,n) := Bn

n − 1

t - aktualna zmienna, n - wielkość próby;

B to wartość zależna tylko od (n).

Rozkład Studenta ma tylko jeden parametr: (d.f. ) - liczbę stopni swobody (czasami oznaczanych przez (k)). Rozkład ten jest, podobnie jak normalny, symetryczny względem punktu (t) = 0, ale jest bardziej płaski. Wraz ze wzrostem wielkości próby, a co za tym idzie liczby stopni swobody, rozkład Studenta szybko zbliża się do normy. Liczba stopni swobody jest równa liczbie tych indywidualnych wartości cech, które muszą być

załóżmy, że określisz pożądaną charakterystykę. Tak więc, aby obliczyć wariancję, musi być znana wartość średnia. Dlatego przy obliczaniu dyspersji stosuje się (d.f.) = n - 1.

Tabele rozkładu uczniów publikowane są w dwóch wersjach:

1. podobnie jak w tablicach całki prawdopodobieństwa wartości ( t) i

prawdopodobieństwa skumulowane F(t) dla różnej liczby stopni swobody;

2. wartości (t) podano dla najczęściej stosowanych prawdopodobieństw ufności

0,70; 0,75; 0,80; 0,85; 0,90; 0,95 i 0,99 lub dla 1 - 0,70 = 0,3; 1 - 0,80 = 0,2; …… 1 - 0,99 = 0,01.

3. z różną liczbą stopni swobody. Taka tabela znajduje się w załączniku.

(Tabela 1 - 20), a także wartość (t) - Test Studenta na poziomie istotności 0,7

W trakcie przykładu wykorzystamy fikcyjne informacje, aby czytelnik mógł samodzielnie dokonać niezbędnych przekształceń.

Na przykład w trakcie badań badaliśmy wpływ leku A na zawartość substancji B (w mmol/g) w tkance C i stężenie substancji D we krwi (w mmol/l) u pacjentów podzielone według pewnego kryterium E na 3 grupy o równej objętości (n = 10). Wyniki tego fikcyjnego badania przedstawiono w tabeli:

Zawartość substancji B, mmol/g

Substancja D, mmol/l

wzrost koncentracji


Uprzejmie informujemy, że próbki o wielkości 10 są przez nas brane pod uwagę ze względu na łatwość prezentacji danych i obliczeń, w praktyce taka wielkość próby zwykle nie wystarcza do sformułowania wniosku statystycznego.

Jako przykład rozważ dane z pierwszej kolumny tabeli.

Opisowe statystyki

średnia próbki

Średnią arytmetyczną, którą bardzo często określa się po prostu jako „średnią”, uzyskuje się przez zsumowanie wszystkich wartości i podzielenie tej sumy przez liczbę wartości w zbiorze. Można to pokazać za pomocą wzoru algebraicznego. Zbiór n obserwacji zmiennej x można przedstawić jako x 1 , x 2 , x 3 , ..., x n

Wzór na określenie średniej arytmetycznej obserwacji (wymawiane „X z myślnikiem”):

\u003d (X 1 + X 2 + ... + X n) / n

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

Wariancja próbki

Jednym ze sposobów pomiaru rozrzutu danych jest określenie, jak bardzo każda obserwacja odbiega od średniej arytmetycznej. Oczywiście im większe odchylenie, tym większa zmienność, zmienność obserwacji. Nie możemy jednak użyć średniej z tych odchyleń jako miara dyspersji, ponieważ odchylenia dodatnie kompensują odchylenia ujemne (ich suma wynosi zero). Aby rozwiązać ten problem, podnosimy do kwadratu każde odchylenie i znajdujemy średnią z kwadratów odchyleń; ta wielkość nazywana jest zmiennością lub rozproszeniem. Zrób n obserwacji x 1, x 2, x 3, ..., x n, średnia co równa się. Obliczamy dyspersję ten, zwykle określany jakos2,te obserwacje:

Wariancja próbki tego wskaźnika wynosi s 2 = 3,2.

Odchylenie standardowe

Odchylenie standardowe (średnia kwadratowa) to dodatni pierwiastek kwadratowy z wariancji. Na przykład przy n obserwacji wygląda to tak:

Możemy myśleć o odchyleniu standardowym jako o rodzaju średniego odchylenia obserwacji od średniej. Jest obliczany w tych samych jednostkach (wymiarach), co oryginalne dane.

s = sqrt (s 2) = sqrt (3,2) = 1,79 .

Współczynnik zmienności

Jeśli podzielisz odchylenie standardowe przez średnią arytmetyczną i wyrazisz wynik w procentach, otrzymasz współczynnik zmienności.

CV = (1,79 / 13,1) * 100% = 13,7

Błąd średniej próbki

1,79/kwadrat(10) = 0,57;

Współczynnik Studenta t (test t dla jednej próby)

Służy do testowania hipotezy o różnicy między wartością średnią a pewną znaną wartością m

Liczba stopni swobody jest obliczana jako f=n-1.

W tym przypadku przedział ufności dla średniej mieści się w granicach 11,87 i 14,39.

Dla 95% poziomu ufności m=11,87 lub m=14,39, tj. = |13,1-11,82| = |13,1-14,38| = 1,28

Odpowiednio w tym przypadku dla liczby stopni swobody f = 10 - 1 = 9 i poziomu ufności 95% t=2,26.

Podstawowe statystyki i tabele okna dialogowego

W module Podstawowe statystyki i tabele wybierać Opisowe statystyki.

Otworzy się okno dialogowe Opisowe statystyki.

W terenie Zmienne wybierać Grupa 1.

Pilny OK otrzymujemy tabele wyników ze statystykami opisowymi wybranych zmiennych.

Otworzy się okno dialogowe Test t dla jednej próbki.

Załóżmy, że wiemy, że średnia zawartość substancji B w tkance C wynosi 11.

Tabela wyników ze statystykami opisowymi i testem t-Studenta wygląda następująco:

Musieliśmy odrzucić hipotezę, że średnia zawartość substancji B w tkance C wynosi 11.

Ponieważ obliczona wartość kryterium jest większa od wartości tabelarycznej (2.26), hipoteza zerowa jest odrzucana na wybranym poziomie istotności, a różnice między próbą a znaną wartością uznawane są za statystycznie istotne. Tym samym wniosek o istnieniu różnic, dokonany za pomocą kryterium Studenta, jest potwierdzany tą metodą.

KATEGORIE

POPULARNE ARTYKUŁY

2022 „kingad.ru” - badanie ultrasonograficzne narządów ludzkich