Tabuľková hodnota študentského t testu. Základné štatistiky a Studentov t-test

Kedy je možné použiť Studentov t-test?

Pre aplikáciu Studentovho t-testu je potrebné, aby mali pôvodné dáta normálne rozdelenie. V prípade aplikácie dvojvýberového testu pre nezávislé vzorky je potrebné splniť aj podmienku rovnosť (homoskedasticita) rozptylov.

Ak tieto podmienky nie sú splnené, pri porovnávaní priemerov vzoriek by sa mali použiť podobné metódy. neparametrické štatistiky, medzi ktorými sú najznámejšie Mann-Whitney U-test(ako dvojvýberový test pre nezávislé vzorky), a znakové kritérium A Wilcoxonov test(používa sa v prípadoch závislých vzoriek).

Na porovnanie priemerov sa Studentov t-test vypočíta pomocou nasledujúceho vzorca:

Kde M 1- aritmetický priemer prvej porovnávanej populácie (skupiny), M 2- aritmetický priemer druhej porovnávanej populácie (skupiny), m 1- priemerná chyba prvého aritmetického priemeru, m2- priemerná chyba druhého aritmetického priemeru.

Ako interpretovať hodnotu Studentovho t-testu?

Výslednú hodnotu Studentovho t-testu je potrebné správne interpretovať. Na to potrebujeme poznať počet subjektov v každej skupine (n 1 a n 2). Zistenie počtu stupňov voľnosti f podľa nasledujúceho vzorca:

f \u003d (n 1 + n 2) - 2

Potom určíme kritickú hodnotu Studentovho t-testu pre požadovanú hladinu významnosti (napríklad p=0,05) a pre daný počet stupňov voľnosti. f podľa tabuľky ( Pozri nižšie).

Porovnávame kritické a vypočítané hodnoty kritéria:

Ak vypočítaná hodnota Studentovho t-testu rovnaké alebo väčšie kritické, nájdené v tabuľke, sme dospeli k záveru, že rozdiely medzi porovnávanými hodnotami sú štatisticky významné.

Ak je hodnota vypočítaného Studentovho t-testu menej tabuľkové, čo znamená, že rozdiely medzi porovnávanými hodnotami nie sú štatisticky významné.

Študentov príklad t-testu

Na štúdium účinnosti nového preparátu železa boli vybrané dve skupiny pacientov s anémiou. V prvej skupine dostávali pacienti nový liek dva týždne a v druhej skupine dostávali placebo. Potom sa merala hladina hemoglobínu v periférnej krvi. V prvej skupine bola priemerná hladina hemoglobínu 115,4±1,2 g/l a v druhej skupine - 103,7±2,3 g/l (údaje sú uvedené vo formáte M±m), porovnávané populácie majú normálne rozdelenie. Počet prvej skupiny bol 34 a druhej - 40 pacientov. Je potrebné vyvodiť záver o štatistickej významnosti získaných rozdielov a účinnosti nového prípravku železa.

Riešenie: Na posúdenie významnosti rozdielov používame Studentov t-test vypočítaný ako rozdiel medzi priemermi delený súčtom štvorcových chýb:

Po vykonaní výpočtov bola hodnota t-testu rovná 4,51. Počet stupňov voľnosti zistíme ako (34 + 40) - 2 = 72. Získanú hodnotu Studentovho t-testu 4,51 porovnáme s kritickou hodnotou pri p=0,05 uvedenou v tabuľke: 1,993. Keďže vypočítaná hodnota kritéria je väčšia ako kritická hodnota, konštatujeme, že pozorované rozdiely sú štatisticky významné (hladina významnosti p<0,05).

Fisherovo rozdelenie je rozdelenie náhodnej premennej

kde náhodné premenné X 1 A X 2 sú nezávislé a majú distribúciu chi - druhú mocninu s počtom stupňov voľnosti k 1 A k2 resp. Zároveň pár (k 1, k 2) je dvojica "počtov stupňov voľnosti" Fisherovho rozdelenia, konkrétne k 1 je počet stupňov voľnosti čitateľa a k2 je počet stupňov voľnosti menovateľa. Rozdelenie náhodnej premennej F pomenované po veľkom anglickom štatistikovi R. Fisherovi (1890-1962), ktorý ho aktívne využíval vo svojej práci.

Fisherovo rozdelenie sa používa na testovanie hypotéz o primeranosti modelu v regresnej analýze, o rovnosti rozptylov av iných problémoch aplikovanej štatistiky.

Študentská tabuľka kritických hodnôt.

Začiatok formulára

Počet stupňov voľnosti, f Hodnota Studentovho t-testu pri p=0,05
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.040
2.037
2.035
2.032
2.030
2.028
2.026
2.024
40-41 2.021
42-43 2.018
44-45 2.015
46-47 2.013
48-49 2.011
50-51 2.009
52-53 2.007
54-55 2.005
56-57 2.003
58-59 2.002
60-61 2.000
62-63 1.999
64-65 1.998
66-67 1.997
68-69 1.995
70-71 1.994
72-73 1.993
74-75 1.993
76-77 1.992
78-79 1.991
80-89 1.990
90-99 1.987
100-119 1.984
120-139 1.980
140-159 1.977
160-179 1.975
180-199 1.973
1.972
1.960

​ Studentov t-test je všeobecný názov pre triedu metód na štatistické testovanie hypotéz (štatistické testy) na základe Studentovho rozdelenia. Najčastejšie prípady aplikácie t-testu súvisia s kontrolou rovnosti priemerov v dvoch vzorkách.

1. História vývoja t-testu

Toto kritérium bolo vyvinuté William Gosset na posúdenie kvality piva v Guinness. V súvislosti so záväzkami voči spoločnosti nezverejňovať obchodné tajomstvá bol Gossetov článok publikovaný v roku 1908 v časopise Biometrics pod pseudonymom „Student“ (Študent).

2. Na čo slúži Studentov t-test?

Na stanovenie štatistickej významnosti priemerných rozdielov sa používa Studentov t-test. Dá sa použiť ako v prípade porovnávania nezávislých vzoriek ( napríklad skupiny pacientov s diabetes mellitus a skupiny zdravých) a pri porovnávaní súvisiacich súborov ( priemerná srdcová frekvencia u tých istých pacientov pred a po užití antiarytmika).

3. Kedy je možné použiť Studentov t-test?

Pre aplikáciu Studentovho t-testu je potrebné, aby mali pôvodné dáta normálne rozdelenie. V prípade aplikácie dvojvýberového testu pre nezávislé vzorky je potrebné splniť aj podmienku rovnosť (homoskedasticita) rozptylov.

Ak tieto podmienky nie sú splnené, pri porovnávaní priemerov vzoriek by sa mali použiť podobné metódy. neparametrické štatistiky, medzi ktorými sú najznámejšie Mann-Whitney U-test(ako dvojvýberový test pre nezávislé vzorky), a znakové kritérium A Wilcoxonov test(používa sa v prípadoch závislých vzoriek).

4. Ako vypočítať Studentov t-test?

Na porovnanie priemerov sa Studentov t-test vypočíta pomocou nasledujúceho vzorca:

Kde M 1- aritmetický priemer prvej porovnávanej populácie (skupiny), M 2- aritmetický priemer druhej porovnávanej populácie (skupiny), m 1- priemerná chyba prvého aritmetického priemeru, m2- priemerná chyba druhého aritmetického priemeru.

5. Ako interpretovať hodnotu Studentovho t-testu?

Výslednú hodnotu Studentovho t-testu je potrebné správne interpretovať. Na to potrebujeme poznať počet subjektov v každej skupine (n 1 a n 2). Zistenie počtu stupňov voľnosti f podľa nasledujúceho vzorca:

f \u003d (n 1 + n 2) - 2

Potom určíme kritickú hodnotu Studentovho t-testu pre požadovanú hladinu významnosti (napríklad p=0,05) a pre daný počet stupňov voľnosti. f podľa tabuľky ( Pozri nižšie).

Porovnávame kritické a vypočítané hodnoty kritéria:

  • Ak vypočítaná hodnota Studentovho t-testu rovnaké alebo väčšie kritické, nájdené v tabuľke, sme dospeli k záveru, že rozdiely medzi porovnávanými hodnotami sú štatisticky významné.
  • Ak je hodnota vypočítaného Studentovho t-testu menej tabuľkové, čo znamená, že rozdiely medzi porovnávanými hodnotami nie sú štatisticky významné.

6. Príklad výpočtu Studentovho t-testu

Na štúdium účinnosti nového preparátu železa boli vybrané dve skupiny pacientov s anémiou. V prvej skupine dostávali pacienti nový liek dva týždne a v druhej skupine dostávali placebo. Potom sa merala hladina hemoglobínu v periférnej krvi. V prvej skupine bola priemerná hladina hemoglobínu 115,4±1,2 g/l a v druhej skupine - 103,7±2,3 g/l (údaje sú uvedené vo formáte M±m), porovnávané populácie majú normálne rozdelenie. Počet prvej skupiny bol 34 a druhej - 40 pacientov. Je potrebné vyvodiť záver o štatistickej významnosti získaných rozdielov a účinnosti nového prípravku železa.

Riešenie: Na posúdenie významnosti rozdielov používame Studentov t-test vypočítaný ako rozdiel medzi priemermi delený súčtom štvorcových chýb:

Po vykonaní výpočtov bola hodnota t-testu rovná 4,51. Počet stupňov voľnosti zistíme ako (34 + 40) - 2 = 72. Získanú hodnotu Studentovho t-testu 4,51 porovnáme s kritickou hodnotou pri p=0,05 uvedenou v tabuľke: 1,993. Keďže vypočítaná hodnota kritéria je väčšia ako kritická hodnota, konštatujeme, že pozorované rozdiely sú štatisticky významné (hladina významnosti p<0,05).

Testovanie štatistickej hypotézy vám umožňuje urobiť rigorózny záver o charakteristikách všeobecnej populácie na základe údajov vzorky. Hypotézy sú rôzne. Jednou z nich je hypotéza o priemere (matematické očakávanie). Jeho podstatou je urobiť správny záver o tom, kde môže alebo nemusí byť všeobecný priemer založený len na dostupnej vzorke (presnú pravdu sa nikdy nedozvieme, ale môžeme zúžiť okruh vyhľadávania).

Je opísaný všeobecný prístup k testovaniu hypotéz, takže priamo k veci. Predpokladajme najprv, že vzorka je získaná z normálneho súboru náhodných premenných X so všeobecným priemerom μ a rozptyl σ2(Viem, viem, že sa to nedeje, ale nemusíte ma prerušovať!). Aritmetický priemer tejto vzorky je samozrejme náhodná premenná. Ak extrahujeme veľa takýchto vzoriek a vypočítame pre ne priemery, potom budú mať aj matematické očakávania μ A

Potom náhodná premenná

Vzniká otázka: bude všeobecný priemer s pravdepodobnosťou 95 % v rozmedzí ±1,96 s x̅. Inými slovami, sú distribúcie náhodných premenných

ekvivalent.

Prvýkrát túto otázku položil (a vyriešil) chemik, ktorý pracoval v továrni na pivo Guinness v Dubline (Írsko). Ten chemik sa volal William Seeley Gosset a odoberal vzorky piva na chemickú analýzu. V určitom okamihu zrejme William začal mať nejasné pochybnosti o rozdelení priemerov. Ukázalo sa, že je to trochu viac rozložené, ako by normálne rozdelenie malo byť.

Po zhromaždení matematického zdôvodnenia a vypočítaní hodnôt distribučnej funkcie, ktorú objavil, dublinský chemik William Gosset napísal poznámku, ktorá bola publikovaná v marci 1908 v časopise Biometria (šéfredaktor - Karl Pearson). . Pretože Guinness prísne zakázal vydávať tajomstvá pivovarníctva, Gosset sa podpísal pod pseudonym Student.

Napriek tomu, že K. Pearson už vynašiel distribúciu, stále dominovala všeobecná myšlienka normálnosti. Nikto si nemyslel, že rozdelenie odhadov vzorky nemusí byť normálne. Preto zostal článok W. Gosseta prakticky nepovšimnutý a zabudnutý. A Gossetov objav ocenil iba Ronald Fisher. Fischer vo svojej práci použil novú distribúciu a dal jej názov Študentovo t-rozdelenie. Kritériom testovania hypotéz sa stalo, resp Študentov t-test. Nastala teda „revolúcia“ v štatistike, ktorá vstúpila do éry analýzy vzorových údajov. Bola to krátka odbočka do histórie.

Pozrime sa, čo mohol vidieť W. Gosset. Vygenerujme 20 tisíc normálnych vzoriek zo 6 pozorovaní s priemerom ( X) 50 a štandardná odchýlka ( σ ) 10. Potom pomocou vzorkovacích prostriedkov normalizujeme všeobecný rozptyl:

Výsledných 20 tisíc priemerov zoskupíme do intervalov dĺžky 0,1 a vypočítame frekvencie. Nakreslite skutočné (Norm) a teoretické (ENNorm) frekvenčné distribúcie priemerov vzorky do diagramu.

Body (pozorované frekvencie) sa takmer zhodujú s priamkou (teoretické frekvencie). Je to pochopiteľné, pretože údaje sú prevzaté z rovnakej všeobecnej populácie a rozdiely sú len výberové chyby.

Urobme nový experiment. Priemery normalizujeme pomocou rozptyl vzorky.

Opäť spočítajme frekvencie a vynesme ich do diagramu ako bodky, pričom čiaru štandardného normálneho rozdelenia necháme na porovnanie. Označme empirickú frekvenciu priemerov, povedzme, cez písmeno t.

Je vidieť, že distribúcie si tentoraz nie sú veľmi podobné. Blízko, áno, ale nie to isté. Chvosty sa stali "ťažšími".

Gosset-Student nemal najnovšiu verziu MS Excel, ale presne tento efekt si všimol. prečo je to tak? Vysvetlenie je, že náhodná premenná

závisí nielen od výberovej chyby (čitateľa), ale aj od smerodajnej chyby priemeru (menovateľa), ktorý je tiež náhodnou veličinou.

Poďme si trochu zistiť, aké rozdelenie by mala mať takáto náhodná premenná. Najprv si musíte zapamätať (alebo sa naučiť) niečo z matematickej štatistiky. Existuje taká Fisherova veta, ktorá hovorí, že vo vzorke z normálneho rozdelenia:

1. stredná X a rozptyl vzorky s2 sú nezávislé veličiny;

2. Pomer výberového a všeobecného rozptylu, vynásobený počtom stupňov voľnosti, má rozdelenie χ 2(chí-kvadrát) s rovnakým počtom stupňov voľnosti, t.j.

Kde k- počet stupňov voľnosti (v angličtine stupne voľnosti (d.f.))

Mnohé ďalšie výsledky v štatistikách normálnych modelov sú založené na tomto zákone.

Vráťme sa k rozdeleniu priemeru. Rozdeľte čitateľa a menovateľa výrazu

na σX̅. Získajte

Čitateľ je štandardná normálna náhodná premenná (označujeme ξ (xi)). Menovateľ môže byť vyjadrený z Fisherovej vety.

Potom bude mať pôvodný výraz formu

Toto je vo všeobecnosti (pomer študentov). Jeho distribučnú funkciu je už možné odvodiť priamo, pretože distribúcie oboch náhodných premenných v tomto výraze sú známe. Toto potešenie prenechajme matematikom.

Študentova funkcia t-distribúcie má vzorec, ktorý je dosť ťažké pochopiť, takže nemá zmysel ho analyzovať. Každopádne to nikto nepoužíva, lebo. pravdepodobnosti sú uvedené v špeciálnych tabuľkách Studentovho rozdelenia (niekedy nazývaných aj tabuľky Studentových koeficientov), ​​alebo sú zatĺkané do vzorcov PC.

Takže vyzbrojení novými poznatkami budete schopní pochopiť oficiálnu definíciu distribúcie Student.
Náhodná premenná, ktorá sa riadi Študentovým rozdelením s k stupňa voľnosti je pomer nezávislých náhodných premenných

Kde ξ distribuované podľa štandardného normálneho zákona a χ 2 k predmetom distribúcie χ 2 c k stupne slobody.

Teda vzorec pre študentské kritérium pre aritmetický priemer

Existuje špeciálny prípad študentského vzťahu

Zo vzorca a definície vyplýva, že rozdelenie Studentovho t-testu závisí len od počtu stupňov voľnosti.

O k> 30 t-test sa prakticky nelíši od štandardného normálneho rozdelenia.

Na rozdiel od chí-kvadrát môže byť t-test jedno- alebo dvojstranný. Zvyčajne sa používa obojstranné za predpokladu, že odchýlka môže nastať v oboch smeroch od priemeru. Ak však stav problému umožňuje odchýlku iba v jednom smere, potom je rozumné použiť jednostranné kritérium. To mierne zvyšuje výkon, tk. na pevnej hladine významnosti sa kritická hodnota mierne blíži k nule.

Podmienky na uplatnenie Studentovho t-testu

Napriek tomu, že Studentov objav svojho času urobil revolúciu v štatistike, t-test je stále dosť obmedzený vo svojej použiteľnosti, pretože vychádza z predpokladu normálneho rozdelenia pôvodných údajov. Ak údaje nie sú normálne (čo je zvyčajne prípad), potom t-test už nebude mať Studentovo rozdelenie. Vďaka fungovaniu centrálnej limitnej vety však priemer, dokonca aj pre nenormálne údaje, rýchlo nadobudne zvonovité rozdelenie.

Zoberme si napríklad údaje, ktoré majú výrazné zošikmenie doprava, napríklad rozdelenie chí-kvadrát s 5 stupňami voľnosti.

Teraz vytvorme 20 tisíc vzoriek a pozorujme, ako sa rozloženie prostriedkov mení v závislosti od ich veľkosti.

Rozdiel je dosť viditeľný v malých vzorkách do 15–20 pozorovaní. Ale potom to rýchlo zmizne. Abnormalita distribúcie teda, samozrejme, nie je dobrá, ale nie kritická.

T-kritérium sa predovšetkým „bojí“ odľahlých hodnôt, t.j. abnormálne odchýlky. Zoberme si 20 tisíc normálnych vzoriek z 15 pozorovaní a k niektorým z nich pridajme jednu náhodnú odľahlú hodnotu.

Obrázok je nešťastný. Skutočné frekvencie priemerov sú veľmi odlišné od teoretických. Použitie t-distribúcie v takejto situácii sa stáva veľmi riskantným podnikom.

Takže v nie veľmi malých vzorkách (z 15 pozorovaní) je t-test relatívne odolný voči nenormálnemu rozdeleniu počiatočných údajov. Odľahlé hodnoty v údajoch však silne skresľujú distribúciu t-testu, čo zase môže viesť k chybám štatistickej inferencie, takže anomálne pozorovania by sa mali eliminovať. Často sú zo vzorky odstránené všetky hodnoty, ktoré spadajú mimo ± 2 štandardné odchýlky od priemeru.

Príklad testovania hypotézy matematického očakávania pomocou Studentovho t-testu v MS Excel

Excel má niekoľko funkcií súvisiacich s t-distribúciou. Zvážme ich.

STUDENT.DIST - "klasické" ľavostranné Studentovo t-rozdelenie. Vstupom je hodnota t-kritéria, počet stupňov voľnosti a možnosť (0 alebo 1), ktorá určuje, čo je potrebné vypočítať: hustotu alebo hodnotu funkcie. Na výstupe dostaneme hustotu, resp. pravdepodobnosť, že náhodná premenná bude menšia ako t-kritérium špecifikované v argumente.

STUDENT.DIST.2X - obojsmerná distribúcia. Ako argument sa uvádza absolútna hodnota (modulo) t-kritéria a počet stupňov voľnosti. Na výstupe dostaneme pravdepodobnosť získania tejto alebo aj väčšej hodnoty t-kritéria, t.j. skutočná hladina významnosti (p-hladina).

STUDENT.DIST.RH - pravotočivé t-rozdelenie. Takže 1-ŠTUDENT.VZD.(2;5;1) = STUDENT.VZD.PX(2;5) = 0,05097. Ak je t-test pozitívny, potom je výsledná pravdepodobnosť p-úroveň.

STUDENT.INV – používa sa na výpočet ľavostrannej prevrátenej hodnoty t-rozdelenia. Argumentom je pravdepodobnosť a počet stupňov voľnosti. Na výstupe dostaneme hodnotu t-kritéria zodpovedajúcu tejto pravdepodobnosti. Pravdepodobnosť sa počíta vľavo. Preto je pre ľavý chvost potrebná samotná hladina významnosti α a za pravú 1 - α .

STUDENT.ORD.2X je recipročná dvojstranná Studentova distribúcia, t.j. hodnota t-testu (modulo). Ako vstup sa uvádza aj hladina významnosti. α . Len tentoraz je odpočítavanie z oboch strán súčasne, takže pravdepodobnosť je rozdelená na dva chvosty. Takže STUDENT.OBR (1-0,025; 5) \u003d STUDENT. OBR. 2X (0,05; 5) \u003d 2,57058

STUDENT.TEST je funkcia na testovanie hypotézy o rovnosti matematických očakávaní na dvoch vzorkách. Nahrádza kopu výpočtov, pretože. stačí zadať len dva rozsahy s údajmi a pár ďalších parametrov. Výstup je na úrovni p.

ŠTUDENTSKÁ DÔVERA - výpočet intervalu spoľahlivosti priemeru s prihliadnutím na t-distribúciu.

Zoberme si takýto príklad školenia. Spoločnosť balí cement do vriec po 50 kg. Kvôli náhode je v jednom vreci povolená určitá odchýlka od očakávanej hmotnosti, ale všeobecný priemer by mal zostať 50 kg. Oddelenie kontroly kvality náhodne odvážilo 9 vriec a získalo tieto výsledky: priemerná hmotnosť ( X) predstavovala 50,3 kg, štandardná odchýlka ( s) - 0,5 kg.

Je výsledok v súlade s nulovou hypotézou, že všeobecný priemer je 50 kg? Inými slovami, je možné dosiahnuť takýto výsledok čistou náhodou, ak zariadenie funguje správne a produkuje priemernú náplň 50 kg? Ak hypotéza nie je zamietnutá, výsledný rozdiel zapadá do rozsahu náhodných výkyvov, ale ak je hypotéza zamietnutá, potom s najväčšou pravdepodobnosťou došlo k zlyhaniu v nastaveniach prístroja, ktorý plní vrecia. Treba to skontrolovať a upraviť.

Stručná podmienka vo všeobecne akceptovanom zápise vyzerá takto.

H0: μ = 50 kg

H1: μ ≠ 50 kg

Existujú dôvody domnievať sa, že rozdelenie obsadenosti vriec sleduje normálne rozdelenie (alebo sa od neho príliš nelíši). Takže na testovanie hypotézy matematického očakávania môžete použiť Studentov t-test. Náhodné odchýlky sa môžu vyskytnúť v oboch smeroch, takže je potrebný obojstranný t-test.

Najprv použijeme predpotopné prostriedky: manuálny výpočet t-testu a jeho porovnanie s kritickou tabuľkovou hodnotou. Odhadovaný t-test:

Teraz zistime, či výsledné číslo presahuje kritickú úroveň na úrovni významnosti α = 0,05. Využime Študentovu tabuľku t-rozdelenia (dostupnú v ktorejkoľvek učebnici štatistiky).

Stĺpce zobrazujú pravdepodobnosť pravej strany rozdelenia, riadky počet stupňov voľnosti. Zaujíma nás obojstranný t-test s hladinou významnosti 0,05, čo zodpovedá t-hodnote pre polovicu hladiny významnosti vpravo: 1 - 0,05 / 2 = 0,975. Počet stupňov voľnosti je veľkosť vzorky mínus 1, t.j. 9 - 1 = 8. Na priesečníku nájdeme tabuľkovú hodnotu t-testu - 2,306. Ak by sme použili štandardné normálne rozdelenie, potom by kritický bod bol 1,96, ale tu je to viac, pretože t-distribúcia na malých vzorkách má viac sploštenú formu.

Porovnávame skutočnú (1,8) a tabuľkovú hodnotu (2,306). Ukázalo sa, že vypočítané kritérium bolo nižšie ako tabuľkové. Dostupné údaje preto nie sú v rozpore s hypotézou H 0, že všeobecný priemer je 50 kg (ale ani to nedokazujú). To je všetko, čo môžeme zistiť pomocou tabuliek. Stále sa môžete, samozrejme, pokúsiť nájsť úroveň p, ale bude približná. A spravidla sa na testovanie hypotéz používa úroveň p. Prejdime teda k Excelu.

Na výpočet t-testu v Exceli nie je pripravená žiadna funkcia. To však nie je strašidelné, pretože vzorec Študentovho t-testu je pomerne jednoduchý a dá sa ľahko vytvoriť priamo v bunke Excelu.

Mám to isté 1.8. Najprv nájdime kritickú hodnotu. Berieme alfa 0,05, kritérium je obojstranné. Pre dvojstrannú hypotézu ŠTUDENT.OBR.2X potrebujeme funkciu prevrátenej hodnoty t-distribúcie.

Výsledná hodnota odreže kritickú oblasť. Pozorovaný t-test do nej nespadá, takže hypotéza nie je zamietnutá.

Ide však o rovnaký spôsob testovania hypotézy s tabuľkovou hodnotou. Informatívnejší bude výpočet p-levelu, t.j. pravdepodobnosť získania pozorovanej alebo ešte väčšej odchýlky od priemeru 50 kg, ak je táto hypotéza správna. Pre dvojstrannú hypotézu STUDENT.DIST.2X budete potrebovať Študentovu distribučnú funkciu.

P-hladina sa rovná 0,1096, čo je viac ako prípustná hladina významnosti 0,05 – hypotézu nezamietame. Teraz však môžeme posúdiť mieru dôkazov. Ukázalo sa, že úroveň P je celkom blízko k úrovni, keď je hypotéza zamietnutá, čo vedie k rôznym myšlienkam. Napríklad, že vzorka bola príliš malá na zistenie výraznej odchýlky.

Predpokladajme, že po chvíli sa kontrolné oddelenie opäť rozhodlo skontrolovať, ako bol dodržaný štandard plnenia vrecka. Tentoraz sa pre väčšiu spoľahlivosť vybralo nie 9, ale 25 vriec. Je intuitívne jasné, že rozptyl priemeru sa bude zmenšovať, a preto sa zvyšuje šanca na nájdenie zlyhania v systéme.

Povedzme, že boli získané rovnaké hodnoty priemeru a smerodajnej odchýlky pre vzorku ako prvýkrát (50,3 a 0,5). Vypočítajme t-test.


Kritická hodnota pre 24 stupňov voľnosti a α = 0,05 je 2,064. Obrázok nižšie ukazuje, že t-test spadá do oblasti odmietnutia hypotézy.

Možno konštatovať, že s pravdepodobnosťou spoľahlivosti vyššou ako 95% sa všeobecný priemer líši od 50 kg. Aby sme boli presvedčivejší, pozrime sa na úroveň p (posledný riadok v tabuľke). Pravdepodobnosť získania priemeru s touto alebo ešte väčšou odchýlkou ​​od 50, ak je hypotéza správna, je 0,0062 alebo 0,62 %, čo je pri jedinom meraní takmer nemožné. Vo všeobecnosti hypotézu zamietame ako nepravdepodobnú.

Výpočet intervalu spoľahlivosti pomocou Studentovho t-distribúcie

Ďalšou štatistickou metódou úzko súvisiacou s testovaním hypotéz je výpočet intervalov spoľahlivosti. Ak hodnota zodpovedajúca nulovej hypotéze spadá do získaného intervalu, potom je to ekvivalentné skutočnosti, že nulová hypotéza nie je zamietnutá. V opačnom prípade sa hypotéza zamietne s príslušnou úrovňou spoľahlivosti. V niektorých prípadoch analytici vôbec netestujú hypotézy v klasickej forme, ale počítajú iba intervaly spoľahlivosti. Tento prístup vám umožňuje získať ešte užitočnejšie informácie.

Vypočítajme intervaly spoľahlivosti pre priemer pri 9 a 25 pozorovaniach. Na to nám poslúži excelovská funkcia TRUST.STUDENT. Tu je napodiv všetko celkom jednoduché. V argumentoch funkcie musíte zadať iba úroveň významnosti α , štandardná odchýlka vzorky a veľkosť vzorky. Na výstupe dostaneme polovičnú šírku intervalu spoľahlivosti, teda hodnotu, ktorú je potrebné odložiť na obe strany priemeru. Po vykonaní výpočtov a nakreslení vizuálneho diagramu dostaneme nasledovné.

Ako vidno, pri vzorke 9 pozorovaní hodnota 50 spadá do intervalu spoľahlivosti (hypotéza nie je zamietnutá) a pri 25 pozorovaniach nespadá (hypotéza je zamietnutá). Zároveň pri experimente s 25 vrecami možno tvrdiť, že s pravdepodobnosťou 97,5 % všeobecný priemer presahuje 50,1 kg (dolná hranica intervalu spoľahlivosti je 50,094 kg). A to sú dosť cenné informácie.

Rovnaký problém sme teda vyriešili tromi spôsobmi:

1. Starodávny prístup, porovnávajúci vypočítanú a tabuľkovú hodnotu t-kritéria
2. Modernejšie, výpočtom p-úrovne, pridaním istej miery istoty pri odmietnutí hypotézy.
3. Ešte viac informatívne pri výpočte intervalu spoľahlivosti a získaní minimálnej hodnoty všeobecného priemeru.

Je dôležité mať na pamäti, že t-test sa týka parametrických metód, pretože na základe normálneho rozdelenia (má dva parametre: priemer a rozptyl). Preto je pre jeho úspešnú aplikáciu dôležitá aspoň približná normalita počiatočných údajov a absencia odľahlých hodnôt.

Nakoniec navrhujem pozrieť si video o tom, ako vykonávať výpočty súvisiace so Studentovým t-testom v Exceli.

Tabuľka rozdelenia študentov

Integrálne tabuľky pravdepodobnosti sa používajú pre veľké vzorky z nekonečne veľkej populácie. Ale už v (n)< 100 получается Несоответствие между

tabuľkové údaje a limitná pravdepodobnosť; v (n)< 30 погрешность становится значительной. Несоответствие вызывается главным образом характером распределения единиц генеральной совокупности. При большом объеме выборки особенность распределения в гене-

Pre všeobecnú populáciu to nie je dôležité, pretože rozdelenie odchýlok výberového ukazovateľa od všeobecnej charakteristiky pri veľkej vzorke sa vždy ukáže ako normálne.

nym. Vo vzorkách malej veľkosti (n)< 30 характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибки выборки при небольшом объеме наблюдения (уже менее 100 единиц) отбор должен проводиться из со-

populácie, ktorá má normálne rozdelenie. Teóriu malých vzoriek rozpracoval anglický štatistik W. Gosset (písal pod pseudonymom Student) začiatkom 20. storočia. IN

V roku 1908 skonštruoval špeciálne rozdelenie, ktoré aj pri malých vzorkách umožňuje korelovať (t) a pravdepodobnosť F(t). Pre (n) > 100 poskytujú študentské distribučné tabuľky rovnaké výsledky ako Laplaceove pravdepodobnostné integrálne tabuľky pre 30< (n ) <

100 rozdielov je nepatrných. Preto v praxi medzi malé vzorky patria vzorky s objemom menším ako 30 jednotiek (za veľkú sa samozrejme považuje vzorka s objemom nad 100 jednotiek).

Použitie malých vzoriek je v niektorých prípadoch spôsobené povahou skúmanej populácie. Pri šľachtiteľskej práci je teda ľahšie dosiahnuť "čistú" skúsenosť na malom počte

pozemky. Výrobný a ekonomický experiment spojený s ekonomickými nákladmi sa tiež uskutočňuje na malom počte pokusov. Ako už bolo uvedené, v prípade malej vzorky len pre normálne rozdelenú všeobecnú populáciu možno vypočítať pravdepodobnosti spoľahlivosti aj hranice spoľahlivosti všeobecného priemeru.

Hustota pravdepodobnosti Studentovho rozdelenia je opísaná funkciou.

1 + t2

f(t,n) := Bn

n - 1

t - aktuálna premenná n - veľkosť vzorky;

B je hodnota, ktorá závisí len od (n).

Študentovo rozdelenie má iba jeden parameter: (d.f. ) - počet stupňov voľnosti (niekedy označovaný (k)). Toto rozdelenie je rovnako ako normálne symetrické vzhľadom na bod (t) = 0, je však plochejšie. S nárastom veľkosti vzorky a následne aj počtu stupňov voľnosti sa Studentovo rozdelenie rýchlo približuje k normálu. Počet stupňov voľnosti sa rovná počtu týchto individuálnych hodnôt funkcií, ktoré musia byť

predpokladajme, že určíte požadovanú charakteristiku. Takže na výpočet rozptylu musí byť známa priemerná hodnota. Preto sa pri výpočte disperzie používa (d.f.) = n - 1.

Tabuľky rozdelenia študentov sú publikované v dvoch verziách:

1. podobne ako v tabuľkách pravdepodobnostného integrálu, hodnoty ( t) a

kumulatívne pravdepodobnosti F(t) pre rôzne počty stupňov voľnosti;

2. hodnoty (t) sú uvedené pre najbežnejšie používané pravdepodobnosti spoľahlivosti

0,70; 0,75; 0,80; 0,85; 0,90; 0,95 a 0,99 alebo pre 1 - 0,70 = 0,3; 1 - 0,80 = 0,2; …… 1 – 0,99 = 0,01.

3. s rôznym počtom stupňov voľnosti. Takáto tabuľka je uvedená v prílohe.

(Tabuľka 1 - 20), ako aj hodnotu (t) - Študentov test na hladine významnosti 0,7

V priebehu príkladu použijeme fiktívne informácie, aby si čitateľ mohol sám vykonať potrebné transformácie.

Tak sme napríklad v rámci výskumu skúmali vplyv liečiva A na obsah látky B (v mmol/g) v tkanive C a koncentráciu látky D v krvi (v mmol/l) u pacientov rozdelené podľa nejakého kritéria E do 3 skupín rovnakého objemu (n = 10). Výsledky tejto fiktívnej štúdie sú uvedené v tabuľke:

Obsah látky B, mmol/g

Látka D, mmol/l

zvýšenie koncentrácie


Chceme Vás upozorniť, že vzorky veľkosti 10 zvažujeme pre jednoduchosť prezentácie údajov a výpočtov, v praxi takáto veľkosť vzorky väčšinou nestačí na vytvorenie štatistického záveru.

Ako príklad uvažujme údaje v 1. stĺpci tabuľky.

Deskriptívna štatistika

vzorový priemer

Aritmetický priemer, ktorý sa veľmi často označuje jednoducho ako „priemer“, sa získa sčítaním všetkých hodnôt a vydelením tohto súčtu počtom hodnôt v súbore. Dá sa to ukázať pomocou algebraického vzorca. Množina n pozorovaní premennej x môže byť reprezentovaná ako x 1 , x 2 , x 3 , ..., x n

Vzorec na určenie aritmetického priemeru pozorovaní (vyslovuje sa „X s pomlčkou“):

\u003d (X 1 + X 2 + ... + X n) / n

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

Ukážkový rozptyl

Jedným zo spôsobov merania rozptylu údajov je určiť, ako ďaleko sa každé pozorovanie odchyľuje od aritmetického priemeru. Je zrejmé, že čím väčšia odchýlka, tým väčšia variabilita, variabilita pozorovaní. Nemôžeme však použiť priemer týchto odchýlok ako miera rozptylu, pretože kladné odchýlky kompenzujú negatívne odchýlky (ich súčet je nula). Na vyriešenie tohto problému urobíme druhú mocninu každej odchýlky a nájdeme priemer druhej mocniny odchýlok; toto množstvo sa nazýva variácia alebo disperzia. Urobte n pozorovaní x 1, x 2, x 3, ..., x n, priemer ktorý sa rovná. Vypočítame rozptyl tento, zvyčajne označovaný akos2,tieto postrehy:

Výberový rozptyl tohto ukazovateľa je s 2 = 3,2.

Smerodajná odchýlka

Štandardná (odmocnina) odchýlka je kladná druhá odmocnina rozptylu. Napríklad n pozorovaní vyzerá takto:

Štandardnú odchýlku môžeme považovať za akúsi strednú odchýlku pozorovaní od priemeru. Počíta sa v rovnakých jednotkách (rozmeroch) ako pôvodné údaje.

s = sqrt (s2) = sqrt (3,2) = 1,79.

Variačný koeficient

Ak štandardnú odchýlku vydelíte aritmetickým priemerom a výsledok vyjadríte v percentách, dostanete variačný koeficient.

CV = (1,79 / 13,1) * 100 % = 13,7

Ukážka strednej chyby

1,79/sqrt(10) = 0,57;

Študentov koeficient t (jednovýberový t-test)

Používa sa na testovanie hypotézy o rozdiele medzi strednou hodnotou a nejakou známou hodnotou m

Počet stupňov voľnosti sa vypočíta ako f=n-1.

V tomto prípade je interval spoľahlivosti pre priemer medzi limitmi 11,87 a 14,39.

Pre 95 % úroveň spoľahlivosti m=11,87 alebo m=14,39, t.j. = |13,1-11,82| = |13,1-14,38| = 1,28

V tomto prípade je teda pre počet stupňov voľnosti f = 10 - 1 = 9 a úroveň spoľahlivosti 95 % t = 2,26.

Dialóg Základné štatistiky a tabuľky

V module Základné štatistiky a tabuľky vyberte si Deskriptívna štatistika.

Otvorí sa dialógové okno Deskriptívna štatistika.

V teréne Premenné vyberte si Skupina 1.

Lisovanie OK, získame tabuľky výsledkov s popisnou štatistikou vybraných premenných.

Otvorí sa dialógové okno Jednovzorkový t-test.

Predpokladajme, že vieme, že priemerný obsah látky B v tkanive C je 11.

Tabuľka výsledkov s popisnou štatistikou a Studentovým t-testom je nasledovná:

Museli sme zamietnuť hypotézu, že priemerný obsah látky B v tkanive C je 11.

Keďže vypočítaná hodnota kritéria je väčšia ako tabuľková (2.26), nulová hypotéza sa na zvolenej hladine významnosti zamietne a rozdiely medzi vzorkou a známou hodnotou sa považujú za štatisticky významné. Záver o existencii rozdielov vytvorený pomocou študentského kritéria je teda potvrdený pomocou tejto metódy.

KATEGÓRIE

POPULÁRNE ČLÁNKY

2023 "kingad.ru" - ultrazvukové vyšetrenie ľudských orgánov