Tabuľková hodnota študentského t testu. Základné štatistiky a Studentov t-test

V akých prípadoch je možné použiť Studentov t-test?

Pre aplikáciu Studentovho t-testu je potrebné, aby mali pôvodné dáta normálne rozdelenie. V prípade uplatnenia dvojvýberového kritéria pre nezávislé výbery je tiež potrebné splniť podmienku rovnosť (homoskedasticita) rozptylov.

Ak tieto podmienky nie sú splnené, pri porovnávaní priemerov vzoriek by sa mali použiť podobné metódy. neparametrické štatistiky, medzi ktorými sú najznámejšie Mann-Whitney U test(ako dvojvýberový test pre nezávislé vzorky), a znakové kritérium A Wilcoxonov test(používa sa v prípadoch závislých vzoriek).

Na porovnanie priemerných hodnôt sa Studentov t-test vypočíta pomocou nasledujúceho vzorca:

Kde M 1- aritmetický priemer prvej porovnávanej populácie (skupiny), M 2- aritmetický priemer druhej porovnávanej populácie (skupiny), m 1- priemerná chyba prvého aritmetického priemeru, m 2- priemerná chyba druhého aritmetického priemeru.

Ako interpretovať hodnotu Studentovho t-testu?

Výsledná hodnota Studentovho t-testu musí byť správne interpretovaná. Na to potrebujeme poznať počet subjektov v každej skupine (n 1 a n 2). Zistenie počtu stupňov voľnosti f podľa nasledujúceho vzorca:

f = (n1 + n2) - 2

Potom určíme kritickú hodnotu Studentovho t-testu pre požadovanú hladinu významnosti (napríklad p = 0,05) a pre daný počet stupňov voľnosti. f podľa tabuľky ( Pozri nižšie).

Porovnávame kritické a vypočítané hodnoty kritéria:

· Ak vypočítaná hodnota Studentovho t-testu rovnaké alebo väčšie kritické, zistené z tabuľky, sme dospeli k záveru, že rozdiely medzi porovnávanými hodnotami sú štatisticky významné.

· Ak je hodnota vypočítaného Studentovho t-testu menej tabuľkové, čo znamená, že rozdiely medzi porovnávanými hodnotami nie sú štatisticky významné.

Príklad výpočtu Studentovho t-testu

Na štúdium účinnosti nového preparátu železa boli vybrané dve skupiny pacientov s anémiou. V prvej skupine dostávali pacienti nový liek dva týždne a v druhej skupine dostávali placebo. Potom sa merali hladiny hemoglobínu v periférnej krvi. V prvej skupine bola priemerná hladina hemoglobínu 115,4±1,2 g/l a v druhej skupine - 103,7±2,3 g/l (údaje sú uvedené vo formáte M±m), porovnávané populácie majú normálne rozdelenie. Počet prvej skupiny bol 34 a druhej - 40 pacientov. Je potrebné vyvodiť záver o štatistickej významnosti získaných rozdielov a účinnosti nového prípravku železa.

Riešenie: Na posúdenie významnosti rozdielov používame Studentov t-test, vypočítaný ako rozdiel stredných hodnôt delený súčtom štvorcových chýb:

Po vykonaní výpočtov sa ukázalo, že hodnota t-testu je 4,51. Počet stupňov voľnosti zistíme ako (34 + 40) - 2 = 72. Výslednú hodnotu Studentovho t-testu 4,51 porovnáme s kritickou hodnotou pri p = 0,05 uvedenou v tabuľke: 1,993. Keďže vypočítaná hodnota kritéria je väčšia ako kritická hodnota, konštatujeme, že pozorované rozdiely sú štatisticky významné (hladina významnosti p<0,05).

Fisherovo rozdelenie je rozdelenie náhodnej premennej

kde sú náhodné premenné X 1 A X 2 sú nezávislé a majú chí-kvadrát distribúcie s počtom stupňov voľnosti k 1 A k 2 resp. V rovnakom čase manželia (k 1, k 2)– pár „stupňov voľnosti“ Fisherovej distribúcie, a to k 1 je počet stupňov voľnosti čitateľa a k 2– počet stupňov voľnosti menovateľa. Rozdelenie náhodnej premennej F pomenované po veľkom anglickom štatistikovi R. Fisherovi (1890-1962), ktorý ho aktívne využíval vo svojich dielach.

Fisherovo rozdelenie sa používa pri testovaní hypotéz o primeranosti modelu v regresnej analýze, rovnosti rozptylov a v iných problémoch aplikovanej štatistiky.

Tabuľka kritických hodnôt študentov.

Začiatok formulára

Počet stupňov voľnosti, f Hodnota Studentovho t-testu pri p=0,05
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.040
2.037
2.035
2.032
2.030
2.028
2.026
2.024
40-41 2.021
42-43 2.018
44-45 2.015
46-47 2.013
48-49 2.011
50-51 2.009
52-53 2.007
54-55 2.005
56-57 2.003
58-59 2.002
60-61 2.000
62-63 1.999
64-65 1.998
66-67 1.997
68-69 1.995
70-71 1.994
72-73 1.993
74-75 1.993
76-77 1.992
78-79 1.991
80-89 1.990
90-99 1.987
100-119 1.984
120-139 1.980
140-159 1.977
160-179 1.975
180-199 1.973
1.972
1.960

​ Studentov t-test je všeobecný názov pre triedu metód na štatistické testovanie hypotéz (štatistické testy) na základe Studentovho rozdelenia. Najbežnejšie použitie t-testu zahŕňa testovanie rovnosti priemerov v dvoch vzorkách.

1. História vývoja t-testu

Toto kritérium bolo vyvinuté William Gossett posudzovať kvalitu piva v spoločnosti Guinness. Kvôli povinnostiam voči spoločnosti ohľadom nezverejnenia obchodných tajomstiev bol Gossetov článok publikovaný v roku 1908 v časopise Biometria pod pseudonymom „Student“.

2. Na čo slúži Studentov t-test?

Študentov t test sa používa na stanovenie štatistickej významnosti rozdielov v priemeroch. Možno použiť v prípade porovnávania nezávislých vzoriek ( napríklad skupiny diabetikov a zdravé skupiny) a pri porovnávaní súvisiacich populácií ( napríklad priemerná srdcová frekvencia u tých istých pacientov pred a po užití antiarytmika).

3. V akých prípadoch je možné použiť Studentov t-test?

Pre aplikáciu Studentovho t-testu je potrebné, aby mali pôvodné dáta normálne rozdelenie. V prípade uplatnenia dvojvýberového kritéria pre nezávislé výbery je tiež potrebné splniť podmienku rovnosť (homoskedasticita) rozptylov.

Ak tieto podmienky nie sú splnené, pri porovnávaní priemerov vzoriek by sa mali použiť podobné metódy. neparametrické štatistiky, medzi ktorými sú najznámejšie Mann-Whitney U test(ako dvojvýberový test pre nezávislé vzorky), a znakové kritérium A Wilcoxonov test(používa sa v prípadoch závislých vzoriek).

4. Ako vypočítať Studentov t-test?

Na porovnanie priemerných hodnôt sa Studentov t-test vypočíta pomocou nasledujúceho vzorca:

Kde M 1- aritmetický priemer prvej porovnávanej populácie (skupiny), M 2- aritmetický priemer druhej porovnávanej populácie (skupiny), m 1- priemerná chyba prvého aritmetického priemeru, m 2- priemerná chyba druhého aritmetického priemeru.

5. Ako interpretovať hodnotu Studentovho t-testu?

Výsledná hodnota Studentovho t-testu musí byť správne interpretovaná. Na to potrebujeme poznať počet subjektov v každej skupine (n 1 a n 2). Zistenie počtu stupňov voľnosti f podľa nasledujúceho vzorca:

f = (n1 + n2) - 2

Potom určíme kritickú hodnotu Studentovho t-testu pre požadovanú hladinu významnosti (napríklad p = 0,05) a pre daný počet stupňov voľnosti. f podľa tabuľky ( Pozri nižšie).

Porovnávame kritické a vypočítané hodnoty kritéria:

  • Ak vypočítaná hodnota Studentovho t-testu rovnaké alebo väčšie kritické, zistené z tabuľky, sme dospeli k záveru, že rozdiely medzi porovnávanými hodnotami sú štatisticky významné.
  • Ak hodnota vypočítaného Studentovho t-testu menej tabuľkové, čo znamená, že rozdiely medzi porovnávanými hodnotami nie sú štatisticky významné.

6. Príklad výpočtu Studentovho t-testu

Na štúdium účinnosti nového preparátu železa boli vybrané dve skupiny pacientov s anémiou. V prvej skupine dostávali pacienti nový liek dva týždne a v druhej skupine dostávali placebo. Potom sa merali hladiny hemoglobínu v periférnej krvi. V prvej skupine bola priemerná hladina hemoglobínu 115,4±1,2 g/l a v druhej skupine - 103,7±2,3 g/l (údaje sú uvedené vo formáte M±m), porovnávané populácie majú normálne rozdelenie. Počet prvej skupiny bol 34 a druhej - 40 pacientov. Je potrebné vyvodiť záver o štatistickej významnosti získaných rozdielov a účinnosti nového prípravku železa.

Riešenie: Na posúdenie významnosti rozdielov používame Studentov t-test, vypočítaný ako rozdiel stredných hodnôt delený súčtom štvorcových chýb:

Po vykonaní výpočtov sa ukázalo, že hodnota t-testu je 4,51. Počet stupňov voľnosti zistíme ako (34 + 40) - 2 = 72. Výslednú hodnotu Studentovho t-testu 4,51 porovnáme s kritickou hodnotou pri p = 0,05 uvedenou v tabuľke: 1,993. Keďže vypočítaná hodnota kritéria je väčšia ako kritická hodnota, konštatujeme, že pozorované rozdiely sú štatisticky významné (hladina významnosti p<0,05).

Štatistické testovanie hypotéz nám umožňuje robiť silné závery o charakteristikách populácie na základe údajov vzorky. Existujú rôzne hypotézy. Jednou z nich je hypotéza o priemere (matematické očakávanie). Jeho podstatou je vyvodiť správny záver len na základe dostupnej vzorky o tom, kde sa môže alebo nemusí nachádzať všeobecný priemer (presnú pravdu sa nikdy nedozvieme, ale vyhľadávanie môžeme zúžiť).

Všeobecný prístup k testovaniu hypotéz bol popísaný, takže poďme rovno k veci. Predpokladajme najprv, že vzorka je vybratá z normálnej populácie náhodných premenných X so všeobecným priemerom μ a rozptyl σ 2(Viem, viem, že sa to nedeje, ale neprerušujte ma!). Aritmetický priemer tejto vzorky je samozrejme náhodná premenná. Ak extrahujete veľa takýchto vzoriek a vypočítate ich priemery, potom budú mať aj matematické očakávania μ A

Potom náhodná premenná

Vzniká otázka: bude všeobecný priemer s 95% pravdepodobnosťou v rozmedzí ±1,96? s x̅. Inými slovami, sú distribúcie náhodných premenných

ekvivalent.

Túto otázku prvýkrát položil (a vyriešil) chemik, ktorý pracoval v továrni na pivo Guinness v Dubline (Írsko). Chemik sa volal William Seely Gossett a odoberal vzorky piva na chemickú analýzu. V istom momente zrejme Williama začali trápiť nejasné pochybnosti o rozdelení priemerov. Ukázalo sa, že je trochu viac rozmazaný, ako by normálne rozdelenie malo byť.

Po zhromaždení matematického základu a vypočítaní hodnôt distribučnej funkcie, ktorú objavil, napísal dublinský chemik William Gosset poznámku, ktorá bola uverejnená v marci 1908 v časopise Biometrics (šéfredaktor - Karl Pearson). Pretože Guinness prísne zakázal prezrádzať tajomstvá pivovarníctva, Gossett sa podpísal pseudonymom Student.

Napriek tomu, že distribúciu už vynašiel K. Pearson, stále dominovala všeobecná myšlienka normálnosti. Nikto si nemyslel, že rozdelenie skóre vzorky nemusí byť normálne. Preto zostal článok W. Gosseta prakticky nepovšimnutý a zabudnutý. A Gossetov objav ocenil iba Ronald Fisher. Fischer vo svojej práci použil novú distribúciu a dal jej názov Študentovo t-rozdelenie. Kritériom na testovanie hypotéz sa preto stalo Študentov t-test. Takto došlo k „revolúcii“ v štatistike, ktorá vstúpila do éry analýzy vzorových údajov. Bol to krátky exkurz do histórie.

Pozrime sa, čo mohol vidieť W. Gosset. Vygenerujme 20 tisíc normálnych vzoriek zo 6 pozorovaní s priemerom ( X) 50 a štandardná odchýlka ( σ ) 10. Potom pomocou vzorkovacích prostriedkov normalizujeme všeobecný rozptyl:

Výsledných 20 tisíc priemerov zoskupíme do intervalov dĺžky 0,1 a vypočítame frekvencie. Znázornime na diagrame skutočné (Norm) a teoretické (ENNorm) frekvenčné rozdelenie priemeru vzorky.

Body (pozorované frekvencie) sa prakticky zhodujú s priamkou (teoretické frekvencie). Je to pochopiteľné, pretože údaje sú prevzaté z rovnakej všeobecnej populácie a rozdiely predstavujú iba výberové chyby.

Urobme nový experiment. Priemery normalizujeme pomocou rozptyl vzorky.

Opäť spočítajme frekvencie a vynesme ich do diagramu vo forme bodov, pričom na porovnanie ponecháme štandardnú normálnu distribučnú čiaru. Označme empirickú frekvenciu priemerov, povedzme, písmenom t.

Je vidieť, že distribúcie sa tentokrát veľmi nezhodujú. Blízko, áno, ale nie to isté. Chvosty sa stali „ťažšími“.

Gosset-Student nemal najnovšiu verziu MS Excel, ale presne tento efekt si všimol. Prečo sa to deje? Vysvetlenie je, že náhodná premenná

závisí nielen od výberovej chyby (čitateľa), ale aj od smerodajnej chyby priemeru (menovateľa), ktorý je tiež náhodnou veličinou.

Poďme sa trochu pozrieť na to, aké rozdelenie by mala mať takáto náhodná veličina. Najprv si budete musieť zapamätať (alebo sa naučiť) niečo z matematickej štatistiky. Existuje Fisherova veta, ktorá hovorí, že vo vzorke z normálneho rozdelenia:

1. stredná X a rozptyl vzorky s 2 sú nezávislé veličiny;

2. pomer rozptylu vzorky a populácie, vynásobený počtom stupňov voľnosti, má rozdelenie χ 2(chí-kvadrát) s rovnakým počtom stupňov voľnosti, t.j.

Kde k– počet stupňov voľnosti (v angličtine stupne voľnosti (d.f.))

Mnohé ďalšie výsledky v štatistikách normálnych modelov sú založené na tomto zákone.

Vráťme sa k rozdeleniu priemeru. Rozdeľte čitateľa a menovateľa výrazu

na σ X̅. Dostaneme

Čitateľ je štandardná normálna náhodná premenná (označujeme ξ (xi)). Vyjadrime menovateľa z Fisherovej vety.

Potom bude mať pôvodný výraz formu

Toto je to, čo je vo všeobecnej forme (vzťah študenta). Jeho distribučnú funkciu môžete odvodiť priamo, pretože distribúcie oboch náhodných premenných v tomto výraze sú známe. Toto potešenie nechajme na matematikov.

Študentova funkcia t-distribúcie má vzorec, ktorý je dosť ťažké pochopiť, takže nemá zmysel ho analyzovať. Aj tak to nikto nepoužíva, pretože... pravdepodobnosti sú uvedené v špeciálnych tabuľkách Studentových rozdelení (niekedy nazývaných aj tabuľky Studentových koeficientov), ​​alebo sú zahrnuté v PC vzorcoch.

Takže, vyzbrojení týmito novými poznatkami, môžete pochopiť oficiálnu definíciu študentskej distribúcie.
Náhodná premenná, ktorá podlieha študentskému rozdeleniu s k stupňa voľnosti je pomer nezávislých náhodných premenných

Kde ξ distribuované podľa štandardného normálneho zákona a χ 2 k poslúcha distribúciu χ 2 c k stupne slobody.

Vzorec Studentovho t testu pre aritmetický priemer

Existuje špeciálny prípad študentského vzťahu

Zo vzorca a definície vyplýva, že rozdelenie Studentovho t-testu závisí len od počtu stupňov voľnosti.

O k> 30 t-test sa prakticky nelíši od štandardného normálneho rozdelenia.

Na rozdiel od chí-kvadrát môže byť t-test jednostranný alebo dvojstranný. Zvyčajne používajú obojstranné, za predpokladu, že odchýlka môže nastať v oboch smeroch od priemeru. Ale ak problémový stav umožňuje odchýlku iba v jednom smere, potom je rozumné použiť jednostranné kritérium. To mierne zvyšuje výkon, pretože... na pevnej hladine významnosti sa kritická hodnota mierne blíži k nule.

Podmienky použitia Studentovho t-testu

Napriek tomu, že Studentov objav svojho času spôsobil revolúciu v štatistike, t-test je stále dosť obmedzený v možnostiach jeho aplikácie, pretože vychádza z predpokladu normálneho rozdelenia pôvodných údajov. Ak údaje nie sú normálne (čo je zvyčajne tento prípad), t-test už nebude mať študentské rozdelenie. Avšak v dôsledku pôsobenia centrálnej limitnej vety priemer aj pre abnormálne dáta rýchlo nadobudne zvonovité rozdelenie.

Zoberme si napríklad údaje, ktoré sú jasne zošikmené doprava, ako je rozdelenie chí-kvadrát s 5 stupňami voľnosti.

Teraz vytvorte 20 tisíc vzoriek a sledujte, ako sa distribúcia priemerov mení v závislosti od ich objemu.

Rozdiel je dosť viditeľný v malých vzorkách do 15-20 pozorovaní. Ale potom to rýchlo zmizne. Nenormálnosť distribúcie teda, samozrejme, nie je dobrá, ale nie kritická.

Najviac zo všetkého sa t-test „bojí“ odľahlých hodnôt, t.j. abnormálne odchýlky. Zoberme si 20 tisíc normálnych vzoriek po 15 pozorovaní a k niektorým z nich pridajme jednu náhodnú odľahlú hodnotu.

Obraz sa ukáže byť pochmúrny. Skutočné frekvencie priemerov sú veľmi odlišné od teoretických. Použitie t-distribúcie v takejto situácii sa stáva veľmi riskantným podnikom.

Takže v nie veľmi malých vzorkách (z 15 pozorovaní) je t-test relatívne odolný voči nenormálnej distribúcii pôvodných údajov. Odľahlé hodnoty v údajoch však značne skresľujú distribúciu t-testu, čo zase môže viesť k chybám v štatistickej inferencii, takže anomálne pozorovania by sa mali eliminovať. Často sú zo vzorky odstránené všetky hodnoty, ktoré spadajú do ± 2 štandardné odchýlky od priemeru.

Príklad testovania hypotézy o matematickom očakávaní pomocou Studentovho t-testu v MS Excel

Excel má niekoľko funkcií súvisiacich s t-distribúciou. Pozrime sa na ne.

STUDENT.DIST – „klasické“ ľavostranné Študentské t-rozdelenie. Vstupom je hodnota t-kritéria, počet stupňov voľnosti a možnosť (0 alebo 1), ktorá určuje, čo je potrebné vypočítať: hodnotu hustoty alebo funkcie. Na výstupe dostaneme hustotu, resp. pravdepodobnosť, že náhodná premenná bude menšia ako t-kritérium špecifikované v argumente.

STUDENT.DIST.2X – obojsmerná distribúcia. Argumentom je absolútna hodnota (modulo) t-testu a počet stupňov voľnosti. Výsledkom je, že získame pravdepodobnosť získania rovnakej alebo dokonca väčšej hodnoty t-kritéria, t.j. skutočná hladina významnosti (p-hladina).

STUDENT.DIST.PH – pravostranné t-rozdelenie. Takže 1-ŠTUDENT.VZDIAL.(2;5;1) = ŠTUDENT.VZD.PH(2;5) = 0,05097. Ak je t-test pozitívny, potom je výsledná pravdepodobnosť p-úroveň.

STUDENT.INR – používa sa na výpočet ľavostrannej inverznej hodnoty t-rozdelenia. Argumentom je pravdepodobnosť a počet stupňov voľnosti. Na výstupe dostaneme hodnotu t-kritéria zodpovedajúcu tejto pravdepodobnosti. Počet pravdepodobnosti je vľavo. Preto ľavý chvost vyžaduje samotnú hladinu významnosti α a pre toho pravého 1 - α .

STUDENT.OBR.2X – prevrátená hodnota pre obojstranné Studentovo rozdelenie, t.j. hodnota t-testu (modulo). Do vstupu sa dodáva aj hladina významnosti α . Iba tentoraz sa počítanie vykonáva z oboch strán súčasne, takže pravdepodobnosť je rozdelená na dva chvosty. Takže STUDENT.ARV(1-0,025;5) = STUDENT.ARV.2X(0,05;5) = 2,57058

STUDENT.TEST je funkcia na testovanie hypotézy o rovnosti matematických očakávaní na dvoch vzorkách. Nahrádza kopu výpočtov, pretože Stačí zadať iba dva rozsahy s údajmi a pár ďalších parametrov. Výstup je na úrovni p.

CONFIDENCE.STUDENT – výpočet intervalu spoľahlivosti priemeru s prihliadnutím na t-rozdelenie.

Zoberme si tento príklad školenia. Cement sa v podniku balí do 50 kg vriec. Kvôli náhodnosti je povolená určitá odchýlka od očakávanej hmotnosti v jednom vreci, ale všeobecný priemer by mal zostať 50 kg. Oddelenie kontroly kvality náhodne odvážilo 9 vriec a získalo tieto výsledky: priemerná hmotnosť ( X) bola 50,3 kg, štandardná odchýlka ( s) - 0,5 kg.

Je tento výsledok v súlade s nulovou hypotézou, že všeobecný priemer je 50 kg? Inými slovami, je možné dosiahnuť takýto výsledok čistou náhodou, ak zariadenie funguje správne a produkuje priemernú náplň 50 kg? Ak hypotéza nie je zamietnutá, výsledný rozdiel zapadá do rozsahu náhodných výkyvov, ale ak je hypotéza zamietnutá, potom s najväčšou pravdepodobnosťou došlo k poruche v nastaveniach stroja, ktorý plní vrecia. Je potrebné skontrolovať a nakonfigurovať.

Krátka podmienka vo všeobecne akceptovanom zápise vyzerá takto.

H0: μ = 50 kg

H1: μ ≠ 50 kg

Existuje dôvod predpokladať, že rozdelenie naplnenia vriec sleduje normálne rozdelenie (alebo sa od neho príliš nelíši). To znamená, že na testovanie hypotézy o matematickom očakávaní môžete použiť Studentov t-test. Náhodné odchýlky sa môžu vyskytnúť v akomkoľvek smere, čo znamená, že je potrebný obojstranný t-test.

Najprv použijeme predpotopné prostriedky: manuálne vypočítame t-kritérium a porovnáme ho s kritickou tabuľkovou hodnotou. Vypočítaný t-test:

Teraz zistime, či výsledné číslo presahuje kritickú úroveň na úrovni významnosti α = 0,05. Využime Študentovu tabuľku t-rozdelenia (dostupnú v ktorejkoľvek učebnici štatistiky).

Stĺpce zobrazujú pravdepodobnosť pravej strany rozdelenia a riadky zobrazujú počet stupňov voľnosti. Zaujíma nás obojstranný t-test s hladinou významnosti 0,05, čo je ekvivalent t-hodnoty pre polovicu hladiny významnosti vpravo: 1 - 0,05/2 = 0,975. Počet stupňov voľnosti je veľkosť vzorky mínus 1, t.j. 9 - 1 = 8. Na priesečníku nájdeme tabuľkovú hodnotu t-testu - 2,306. Ak by sme použili štandardné normálne rozdelenie, potom by kritický bod bol 1,96, ale tu je väčší, pretože T-distribúcia v malých vzorkách má viac sploštený vzhľad.

Porovnajme skutočnú (1,8) a tabuľkovú hodnotu (2,306). Ukázalo sa, že vypočítané kritérium bolo nižšie ako to tabuľkové. V dôsledku toho dostupné údaje nie sú v rozpore s hypotézou H 0, že všeobecný priemer je 50 kg (ale ani to nedokazujú). To je všetko, čo sa môžeme naučiť pomocou tabuliek. Môžete sa, samozrejme, pokúsiť nájsť aj úroveň p, ale bude približná. A spravidla je to p-úroveň, ktorá sa používa na testovanie hypotéz. Preto sa ďalej presunieme do Excelu.

Na výpočet t-testu v Exceli nie je pripravená žiadna funkcia. To však nie je strašidelné, pretože vzorec Študentovho t-testu je pomerne jednoduchý a dá sa ľahko vytvoriť priamo v bunke Excelu.

Dostali sme to isté 1.8. Najprv nájdime kritickú hodnotu. Berieme alfa 0,05, kritérium je obojstranné. Pre obojstrannú hypotézu STUDENT.OBR.2X potrebujeme inverznú t-distribučnú funkciu.

Výsledná hodnota odreže kritickú oblasť. Pozorovaný t-test do nej nespadá, takže hypotéza nie je zamietnutá.

Ide však o rovnaký spôsob testovania hypotézy pomocou tabuľkovej hodnoty. Informatívnejší by bol výpočet p-level, t.j. pravdepodobnosť získania pozorovanej alebo ešte väčšej odchýlky od priemeru 50 kg, ak je táto hypotéza správna. Pre obojstrannú hypotézu STUDENT.DIST.2X budete potrebovať funkciu Studentovo rozdelenie.

P-hladina je 0,1096, čo je viac ako prijateľná hladina významnosti 0,05 – hypotézu nezamietame. Teraz však môžeme posúdiť mieru dôkazu. Ukázalo sa, že úroveň P je celkom blízka úrovni, keď je hypotéza zamietnutá, a to vedie k rôznym myšlienkam. Napríklad, že vzorka bola príliš malá na zistenie výraznej odchýlky.

Po určitom čase sa kontrolné oddelenie opäť rozhodlo skontrolovať, ako bol dodržaný štandard plnenia vriec. Tentoraz sa pre väčšiu spoľahlivosť vybralo nie 9, ale 25 vriec. Je intuitívne jasné, že rozptyl priemeru sa bude zmenšovať, a preto sa zvyšuje šanca na nájdenie zlyhania v systéme.

Povedzme, že boli získané rovnaké hodnoty priemeru a štandardnej odchýlky pre vzorku ako prvýkrát (50,3 a 0,5). Vypočítajme t-test.


Kritická hodnota pre 24 stupňov voľnosti a α = 0,05 je 2,064. Obrázok nižšie ukazuje, že t-test spadá do rozsahu odmietnutia hypotézy.

Môžeme konštatovať, že s pravdepodobnosťou spoľahlivosti vyššou ako 95% sa všeobecný priemer líši od 50 kg. Aby sme boli presvedčivejší, pozrime sa na úroveň p (posledný riadok v tabuľke). Pravdepodobnosť získania priemeru s rovnakou alebo ešte väčšou odchýlkou ​​od 50, ak je hypotéza správna, je 0,0062, alebo 0,62 %, čo je pri jedinom meraní prakticky nemožné. Vo všeobecnosti hypotézu zamietame ako nepravdepodobnú.

Výpočet intervalu spoľahlivosti pomocou študentského t-rozdelenia

Ďalšia štatistická metóda úzko súvisí s testovaním hypotéz - výpočet intervalov spoľahlivosti. Ak výsledný interval obsahuje hodnotu zodpovedajúcu nulovej hypotéze, potom je to ekvivalentné skutočnosti, že nulová hypotéza nie je zamietnutá. V opačnom prípade sa hypotéza zamietne so zodpovedajúcou úrovňou spoľahlivosti. V niektorých prípadoch analytici vôbec netestujú hypotézy v klasickej forme, ale počítajú iba intervaly spoľahlivosti. Tento prístup vám umožňuje získať ešte užitočnejšie informácie.

Vypočítajme intervaly spoľahlivosti pre priemer pre 9 a 25 pozorovaní. Na to nám poslúži excelovská funkcia CONFIDENT.STUDENT. Tu je napodiv všetko celkom jednoduché. Argumenty funkcie musia indikovať iba úroveň významnosti α , štandardná odchýlka vzorky a veľkosť vzorky. Na výstupe dostaneme polovičnú šírku intervalu spoľahlivosti, teda hodnotu, ktorú je potrebné umiestniť na obe strany priemeru. Po vykonaní výpočtov a nakreslení vizuálneho diagramu dostaneme nasledovné.

Ako vidíte, pri vzorke 9 pozorovaní hodnota 50 spadá do intervalu spoľahlivosti (hypotéza nie je zamietnutá) a pri 25 pozorovaniach nespadá do intervalu spoľahlivosti (hypotéza je zamietnutá). Navyše pri experimente s 25 vrecami možno konštatovať, že s pravdepodobnosťou 97,5 % všeobecný priemer presahuje 50,1 kg (dolná hranica intervalu spoľahlivosti je 50,094 kg). A to je celkom cenná informácia.

Rovnaký problém sme teda vyriešili tromi spôsobmi:

1. Použitím starovekého prístupu, porovnaním vypočítaných a tabuľkových hodnôt t-testu
2. Modernejšie, výpočtom p-úrovne, pridaním stupňa spoľahlivosti pri odmietnutí hypotézy.
3. Ešte viac informatívne pri výpočte intervalu spoľahlivosti a získaní minimálnej hodnoty všeobecného priemeru.

Je dôležité si uvedomiť, že t-test sa týka parametrických metód, pretože je založená na normálnom rozdelení (má dva parametre: priemer a rozptyl). Preto je pre jeho úspešnú aplikáciu dôležitá aspoň približná normalita počiatočných údajov a absencia odľahlých hodnôt.

Nakoniec navrhujem pozrieť si video o tom, ako vykonávať výpočty súvisiace so Studentským t-testom v Exceli.

Tabuľka rozdelenia študentov

Integrálne tabuľky pravdepodobnosti sa používajú pre veľké vzorky z nekonečne veľkej populácie. Ale už v (n)< 100 получается Несоответствие между

tabuľkové údaje a limitná pravdepodobnosť; v (n)< 30 погрешность становится значительной. Несоответствие вызывается главным образом характером распределения единиц генеральной совокупности. При большом объеме выборки особенность распределения в гене-

na všeobecnej populácii nezáleží, keďže rozdelenie odchýlok výberového ukazovateľa od všeobecnej charakteristiky pri veľkej vzorke sa vždy ukáže ako normálne.

žiadne M. V malých vzorkách (n)< 30 характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибки выборки при небольшом объеме наблюдения (уже менее 100 единиц) отбор должен проводиться из со-

populácie s normálnym rozložením. Teóriu malých vzoriek rozpracoval anglický štatistik W. Gosset (písal pod pseudonymom Student) začiatkom 20. storočia. IN

V roku 1908 skonštruoval špeciálne rozdelenie, ktoré aj pri malých vzorkách umožňuje korelovať (t) a pravdepodobnosť F(t). Pre (n) > 100 poskytujú študentské distribučné tabuľky rovnaké výsledky ako Laplaceove pravdepodobnostné integrálne tabuľky pre 30< (n ) <

100 rozdielov je zanedbatelnych. Preto medzi prakticky malé vzorky patria vzorky s objemom menším ako 30 jednotiek (za veľkú sa samozrejme považuje vzorka s objemom nad 100 jednotiek).

Použitie malých vzoriek je v niektorých prípadoch spôsobené povahou skúmanej populácie. Pri šľachtiteľskej práci je teda ľahšie dosiahnuť „čistú“ skúsenosť s malým počtom

pozemky. Výrobný a ekonomický experiment súvisiaci s ekonomickými nákladmi sa tiež uskutočňuje na malom počte pokusov. Ako už bolo uvedené, v prípade malej vzorky možno pravdepodobnosti spoľahlivosti aj limity spoľahlivosti všeobecného priemeru vypočítať len pre normálne rozloženú populáciu.

Hustotu pravdepodobnosti Studentovho rozdelenia popisuje funkcia.

1 + t2

f(t,n) := Bn

n - 1

t - aktuálna premenná n - veľkosť vzorky;

B je veličina, ktorá závisí len od (n).

Študentovo rozdelenie má len jeden parameter: (d.f.) - počet stupňov voľnosti (niekedy označovaný (k)). Toto rozdelenie je, rovnako ako normálne, symetrické okolo bodu (t) = 0, ale je plochejšie. Ako sa veľkosť vzorky zväčšuje a následne aj počet stupňov voľnosti, študentské rozdelenie sa rýchlo približuje k normálu. Počet stupňov voľnosti sa rovná počtu tých jednotlivých hodnôt vlastností, ktoré je potrebné rozdeliť

predpokladať na určenie požadovanej charakteristiky. Preto na výpočet rozptylu musí byť známa priemerná hodnota. Preto pri výpočte rozptylu použite (d.f.) = n - 1.

Tabuľky rozdelenia študentov sú publikované v dvoch verziách:

1. podobne ako v pravdepodobnostných integrálnych tabuľkách, hodnoty ( t) a zodpovedajúce

aktuálne pravdepodobnosti F(t) pre rôzne počty stupňov voľnosti;

2. hodnoty (t) sú uvedené pre najbežnejšie používané pravdepodobnosti spoľahlivosti

0,70; 0,75; 0,80; 0,85; 0,90; 0,95 a 0,99 alebo pre 1 - 0,70 = 0,3; 1 - 0,80 = 0,2; …… 1 – 0,99 = 0,01.

3. pri rôznom počte stupňov voľnosti. Tento typ tabuľky je uvedený v prílohe

(Tabuľka 1 - 20), ako aj hodnotu (t) - Študentov test na hladine významnosti 0,7

V celom príklade budeme používať fiktívne informácie, aby si čitateľ mohol urobiť potrebné premeny sám.

Povedzme teda, že v rámci výskumu sme skúmali vplyv liečiva A na obsah látky B (v mmol/g) v tkanive C a koncentráciu látky D v krvi (v mmol/l) u pacientov. rozdelené podľa nejakého kritéria E do 3 skupín rovnakého objemu (n = 10). Výsledky takejto fiktívnej štúdie sú uvedené v tabuľke:

Obsah látky B, mmol/g

Látka D, mmol/l

zvýšenie koncentrácie


Dovoľujeme si Vás upozorniť, že vzorky veľkosti 10 berieme do úvahy pre jednoduchosť prezentácie údajov a výpočtov, v praxi takáto veľkosť vzorky zvyčajne nestačí na vytvorenie štatistického záveru.

Ako príklad uvažujme údaje v 1. stĺpci tabuľky.

Deskriptívna štatistika

Ukážkový priemer

Aritmetický priemer, často jednoducho nazývaný „priemer“, sa získa sčítaním všetkých hodnôt a vydelením tohto súčtu počtom hodnôt v množine. Dá sa to ukázať pomocou algebraického vzorca. Množina n pozorovaní premennej x môže byť reprezentovaná ako x 1 , x 2 , x 3 , ..., x n

Vzorec na určenie aritmetického priemeru pozorovaní (vyslovuje sa „X s čiarou“):

= (Xi + X2 + ... + Xn) / n

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

Ukážkový rozptyl

Jedným zo spôsobov merania rozptylu údajov je určiť mieru, do akej sa každé pozorovanie odchyľuje od aritmetického priemeru. Je zrejmé, že čím väčšia odchýlka, tým väčšia variabilita, variabilita pozorovaní. Nemôžeme však použiť priemer týchto odchýlok ako miera rozptylu, pretože kladné odchýlky kompenzujú negatívne odchýlky (ich súčet je nula). Na vyriešenie tohto problému urobíme druhú mocninu každej odchýlky a nájdeme priemer druhej mocniny odchýlok; toto množstvo sa nazýva variácia alebo disperzia. Urobme n pozorovaní x 1, x 2, x 3, ..., x n, priemer čo sa rovná. Výpočet rozptylu toto, zvyčajne označované akos2,tieto postrehy:

Výberový rozptyl tohto ukazovateľa je s 2 = 3,2.

Smerodajná odchýlka

Štandardná (priemerná štvorcová) odchýlka je kladná druhá odmocnina z rozptylu. Ak použijeme n pozorovaní ako príklad, vyzerá to takto:

Štandardnú odchýlku môžeme považovať za akúsi priemernú odchýlku pozorovaní od priemeru. Počíta sa v rovnakých jednotkách (rozmeroch) ako pôvodné údaje.

s = sqrt (s 2) = sqrt (3,2) = 1,79.

Variačný koeficient

Ak štandardnú odchýlku vydelíte aritmetickým priemerom a výsledok vyjadríte v percentách, dostanete variačný koeficient.

CV = (1,79 / 13,1) * 100 % = 13,7

Ukážka strednej chyby

1,79/sqrt(10) = 0,57;

Študentov t koeficient (jednovýberový t-test)

Používa sa na testovanie hypotézy o rozdiele medzi priemernou hodnotou a nejakou známou hodnotou m

Počet stupňov voľnosti sa vypočíta ako f=n-1.

V tomto prípade je interval spoľahlivosti pre priemer medzi hranicami 11,87 a 14,39.

Pre 95 % úroveň spoľahlivosti m=11,87 alebo m=14,39, to znamená = |13,1-11,82| = |13,1-14,38| = 1,28

Preto v tomto prípade pre počet stupňov voľnosti f = 10 - 1 = 9 a 95 % úroveň spoľahlivosti t = 2,26.

Dialóg Základné štatistiky a tabuľky

V module Základné štatistiky a tabuľky vyberme si Deskriptívna štatistika.

Otvorí sa dialógové okno Deskriptívna štatistika.

V teréne Premenné vyberme si Skupina 1.

Lisovanie OK, získame tabuľky výsledkov s popisnou štatistikou vybraných premenných.

Otvorí sa dialógové okno Jednovzorkový t-test.

Predpokladajme, že vieme, že priemerný obsah látky B v tkanive C je 11.

Tabuľka výsledkov s popisnou štatistikou a Studentovým t-testom je nasledovná:

Museli sme zamietnuť hypotézu, že priemerný obsah látky B v tkanive C je 11.

Keďže vypočítaná hodnota kritéria je väčšia ako tabuľková hodnota (2.26), nulová hypotéza sa na zvolenej hladine významnosti zamietne a rozdiely medzi vzorkou a známou hodnotou sa považujú za štatisticky významné. Záver o existencii rozdielov uskutočnený pomocou Studentovho testu je teda potvrdený pomocou tejto metódy.

KATEGÓRIE

POPULÁRNE ČLÁNKY

2023 „kingad.ru“ - ultrazvukové vyšetrenie ľudských orgánov