95 rozdiel intervalu spoľahlivosti od sd. Interval spoľahlivosti

Odhadca musí často analyzovať trh s nehnuteľnosťami v segmente, v ktorom sa nachádza predmet ocenenia. Ak je trh rozvinutý, môže byť ťažké analyzovať celý súbor prezentovaných objektov, preto sa na analýzu používa vzorka objektov. Táto vzorka nie je vždy homogénna, niekedy je potrebné ju očistiť od extrémov – príliš vysokých alebo príliš nízkych trhových ponúk. Na tento účel sa používa interval spoľahlivosti. Účelom tejto štúdie je vykonať porovnávaciu analýzu dvoch metód na výpočet intervalu spoľahlivosti a vybrať najlepšiu možnosť výpočtu pri práci s rôznymi vzorkami v systéme estimatica.pro.

Interval spoľahlivosti - vypočítaný na základe vzorky, interval hodnôt charakteristiky, ktorá so známou pravdepodobnosťou obsahuje odhadovaný parameter všeobecnej populácie.

Zmyslom výpočtu intervalu spoľahlivosti je zostaviť taký interval na základe vzorových údajov, aby bolo možné s danou pravdepodobnosťou tvrdiť, že hodnota odhadovaného parametra je v tomto intervale. Inými slovami, interval spoľahlivosti s určitou pravdepodobnosťou obsahuje neznámu hodnotu odhadovanej veličiny. Čím je interval širší, tým je nepresnosť vyššia.

Existujú rôzne metódy na určenie intervalu spoľahlivosti. V tomto článku zvážime 2 spôsoby:

  • prostredníctvom mediánu a štandardnej odchýlky;
  • cez kritickú hodnotu t-štatistiky (Studentov koeficient).

Etapy porovnávacej analýzy rôznych metód na výpočet CI:

1. vytvorte vzorku údajov;

2. spracujeme štatistickými metódami: vypočítame strednú hodnotu, medián, rozptyl a pod.;

3. interval spoľahlivosti vypočítame dvoma spôsobmi;

4. Analyzujte vyčistené vzorky a získané intervaly spoľahlivosti.

Fáza 1. Vzorkovanie údajov

Vzorka bola vytvorená pomocou systému estimatica.pro. Vzorka obsahovala 91 ponúk na predaj 1-izbových bytov v 3. cenovej zóne s typom plánovania "Chruščov".

Tabuľka 1. Počiatočná vzorka

Cena 1 m2, c.u.

Obr.1. Počiatočná vzorka



Etapa 2. Spracovanie počiatočnej vzorky

Spracovanie vzoriek štatistickými metódami si vyžaduje výpočet nasledujúcich hodnôt:

1. Aritmetický priemer

2. Medián - číslo, ktoré charakterizuje vzorku: presne polovica prvkov vzorky je väčšia ako medián, druhá polovica je menšia ako medián

(pre vzorku s nepárnym počtom hodnôt)

3. Rozsah - rozdiel medzi maximálnymi a minimálnymi hodnotami vo vzorke

4. Rozptyl – používa sa na presnejšie odhadnutie odchýlky v údajoch

5. Smerodajná odchýlka pre vzorku (ďalej len RMS) je najbežnejším ukazovateľom rozptylu hodnôt úpravy okolo aritmetického priemeru.

6. Variačný koeficient – ​​odráža stupeň rozptylu hodnôt úprav

7. koeficient oscilácie - odráža relatívne kolísanie extrémnych hodnôt cien vo vzorke okolo priemeru

Tabuľka 2. Štatistické ukazovatele pôvodnej vzorky

Variačný koeficient, ktorý charakterizuje homogenitu údajov, je 12,29 %, ale koeficient oscilácie je príliš veľký. Môžeme teda konštatovať, že pôvodná vzorka nie je homogénna, prejdime teda k výpočtu intervalu spoľahlivosti.

Fáza 3. Výpočet intervalu spoľahlivosti

Metóda 1. Výpočet prostredníctvom mediánu a štandardnej odchýlky.

Interval spoľahlivosti sa určí nasledovne: minimálna hodnota - štandardná odchýlka sa odpočíta od mediánu; maximálna hodnota - smerodajná odchýlka sa pripočítava k mediánu.

Interval spoľahlivosti (47179 CU; 60689 CU)

Ryža. 2. Hodnoty v rámci intervalu spoľahlivosti 1.



Metóda 2. Vytvorenie intervalu spoľahlivosti prostredníctvom kritickej hodnoty t-štatistiky (Studentov koeficient)

S.V. Gribovský v knihe „Matematické metódy hodnotenia hodnoty majetku“ popisuje metódu výpočtu intervalu spoľahlivosti prostredníctvom Studentovho koeficientu. Pri výpočte touto metódou musí odhadca sám nastaviť hladinu významnosti ∝, ktorá určuje pravdepodobnosť, s akou bude interval spoľahlivosti zostavený. Bežne sa používajú úrovne významnosti 0,1; 0,05 a 0,01. Zodpovedajú pravdepodobnostiam spoľahlivosti 0,9; 0,95 a 0,99. Pri tejto metóde sa skutočné hodnoty matematického očakávania a rozptylu považujú za prakticky neznáme (čo platí takmer vždy pri riešení praktických úloh hodnotenia).

Vzorec intervalu spoľahlivosti:

n - veľkosť vzorky;

Kritická hodnota t-štatistiky (Studentove rozdelenia) s hladinou významnosti ∝, počet stupňov voľnosti n-1, ktorá je určená špeciálnymi štatistickými tabuľkami alebo pomocou MS Excel (→"Štatistické"→ STUDRASPOBR);

∝ - hladina významnosti, berieme ∝=0,01.

Ryža. 2. Hodnoty v rámci intervalu spoľahlivosti 2.

Krok 4. Analýza rôznych spôsobov výpočtu intervalu spoľahlivosti

Dve metódy výpočtu intervalu spoľahlivosti - prostredníctvom mediánu a Studentovho koeficientu - viedli k rôznym hodnotám intervalov. V súlade s tým sa získali dve rôzne purifikované vzorky.

Tabuľka 3. Štatistické ukazovatele pre tri vzorky.

Index

Počiatočná vzorka

1 možnosť

Možnosť 2

Priemerná hodnota

Disperzia

Coef. variácie

Coef. oscilácie

Počet vyradených predmetov, ks.

Na základe vykonaných výpočtov môžeme povedať, že hodnoty intervalov spoľahlivosti získané rôznymi metódami sa prelínajú, takže podľa uváženia odhadcu môžete použiť ktorúkoľvek z metód výpočtu.

Domnievame sa však, že pri práci v systéme estimatica.pro je vhodné zvoliť metódu výpočtu intervalu spoľahlivosti v závislosti od stupňa vývoja trhu:

  • ak trh nie je rozvinutý, použite metódu výpočtu prostredníctvom mediánu a štandardnej odchýlky, pretože počet vyradených objektov je v tomto prípade malý;
  • ak je trh rozvinutý, aplikujte výpočet cez kritickú hodnotu t-štatistiky (Studentov koeficient), keďže je možné vytvoriť veľkú počiatočnú vzorku.

Pri príprave článku boli použité:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matematické metódy hodnotenia hodnoty majetku. Moskva, 2014

2. Údaje zo systému estimatica.pro

Intervaly spoľahlivosti ( Angličtina Intervaly spoľahlivosti) jeden z typov intervalových odhadov používaných v štatistike, ktoré sú vypočítané pre danú hladinu významnosti. Umožňujú nám konštatovať, že skutočná hodnota neznámeho štatistického parametra bežnej populácie je v získanom rozsahu hodnôt s pravdepodobnosťou, ktorá je daná zvolenou hladinou štatistickej významnosti.

Normálne rozdelenie

Keď je známy rozptyl (σ 2 ) populácie údajov, z-skóre sa môže použiť na výpočet limitov spoľahlivosti (hraničné body intervalu spoľahlivosti). V porovnaní s použitím t-distribúcie, použitie z-skóre poskytne nielen užší interval spoľahlivosti, ale poskytne aj spoľahlivejšie odhady priemeru a štandardnej odchýlky (σ), keďže Z-skóre je založené na normálnom rozdelení.

Vzorec

Na určenie hraničných bodov intervalu spoľahlivosti za predpokladu, že je známa štandardná odchýlka súboru údajov, sa používa nasledujúci vzorec

L = X - Za/2 σ
√n

Príklad

Predpokladajme, že veľkosť vzorky je 25 pozorovaní, priemer vzorky je 15 a štandardná odchýlka populácie je 8. Pre hladinu významnosti α=5% je Z-skóre Zα/2=1,96. V tomto prípade bude dolná a horná hranica intervalu spoľahlivosti

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Môžeme teda konštatovať, že s pravdepodobnosťou 95 % bude matematické očakávanie bežnej populácie spadať do intervalu od 11,864 do 18,136.

Metódy na zúženie intervalu spoľahlivosti

Povedzme, že rozsah je príliš široký na účely našej štúdie. Existujú dva spôsoby, ako znížiť rozsah intervalu spoľahlivosti.

  1. Znížte hladinu štatistickej významnosti α.
  2. Zväčšite veľkosť vzorky.

Znížením hladiny štatistickej významnosti na α=10% dostaneme Z-skóre rovné Z α/2 =1,64. V tomto prípade bude dolná a horná hranica intervalu

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

A samotný interval spoľahlivosti možno zapísať ako

V tomto prípade môžeme predpokladať, že s pravdepodobnosťou 90 % budú matematické očakávania všeobecnej populácie spadať do tohto rozsahu.

Ak chceme zachovať hladinu štatistickej významnosti α, tak jedinou alternatívou je zväčšiť veľkosť vzorky. Zvýšením na 144 pozorovaní získame nasledujúce hodnoty hraníc spoľahlivosti

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Samotný interval spoľahlivosti bude vyzerať takto:

Zúženie intervalu spoľahlivosti bez zníženia úrovne štatistickej významnosti je teda možné len zväčšením veľkosti vzorky. Ak nie je možné zväčšiť veľkosť vzorky, tak zúženie intervalu spoľahlivosti možno dosiahnuť výlučne znížením hladiny štatistickej významnosti.

Vytvorenie intervalu spoľahlivosti pre nenormálne rozdelenie

Ak štandardná odchýlka populácie nie je známa alebo distribúcia nie je normálna, použije sa t-distribúcia na vytvorenie intervalu spoľahlivosti. Táto technika je konzervatívnejšia, čo je vyjadrené v širších intervaloch spoľahlivosti v porovnaní s technikou založenou na Z-skóre.

Vzorec

Na výpočet dolnej a hornej hranice intervalu spoľahlivosti na základe t-distribúcie sa používajú nasledujúce vzorce

L = X - ta σ
√n

Študentovo rozdelenie alebo t-rozdelenie závisí iba od jedného parametra - počtu stupňov voľnosti, ktorý sa rovná počtu hodnôt jednotlivých znakov (počet pozorovaní vo vzorke). Hodnotu Studentovho t-testu pre daný počet stupňov voľnosti (n) a hladinu štatistickej významnosti α možno nájsť vo vyhľadávacích tabuľkách.

Príklad

Predpokladajme, že veľkosť vzorky je 25 individuálnych hodnôt, priemerná hodnota vzorky je 50 a štandardná odchýlka vzorky je 28. Musíte zostrojiť interval spoľahlivosti pre hladinu štatistickej významnosti α=5 %.

V našom prípade je počet stupňov voľnosti 24 (25-1), preto zodpovedajúca tabuľková hodnota Studentovho t-testu pre hladinu štatistickej významnosti α=5 % je 2,064. Preto budú dolné a horné hranice intervalu spoľahlivosti

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

A samotný interval možno zapísať ako

Môžeme teda konštatovať, že s pravdepodobnosťou 95 % bude matematické očakávanie bežnej populácie v rozmedzí.

Použitie t-distribúcie vám umožňuje zúžiť interval spoľahlivosti buď znížením štatistickej významnosti alebo zvýšením veľkosti vzorky.

Znížením štatistickej významnosti z 95 % na 90 % v podmienkach nášho príkladu dostaneme zodpovedajúcu tabuľkovú hodnotu Studentovho t-testu 1,711.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

V tomto prípade môžeme povedať, že s pravdepodobnosťou 90 % budú matematické očakávania bežnej populácie v rozmedzí.

Ak nechceme znížiť štatistickú významnosť, tak jedinou alternatívou je zväčšiť veľkosť vzorky. Povedzme, že ide o 64 jednotlivých pozorovaní a nie 25 ako v počiatočnej podmienke príkladu. Tabuľková hodnota Studentovho t-testu pre 63 stupňov voľnosti (64-1) a hladina štatistickej významnosti α=5 % je 1,998.

L = 50 - 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

To nám dáva príležitosť tvrdiť, že s pravdepodobnosťou 95 % budú matematické očakávania všeobecnej populácie v rozmedzí.

Veľké vzorky

Veľké vzorky sú vzorky z populácie údajov s viac ako 100 individuálnymi pozorovaniami. Štatistické štúdie ukázali, že väčšie vzorky majú tendenciu byť normálne rozdelené, aj keď rozdelenie populácie nie je normálne. Okrem toho pri takýchto vzorkách poskytuje použitie z-skóre a t-distribúcie približne rovnaké výsledky pri konštrukcii intervalov spoľahlivosti. Pre veľké vzorky je teda prijateľné použiť z-skóre pre normálnu distribúciu namiesto t-distribúcie.

Zhrnutie

Intervaly spoľahlivosti.

Výpočet intervalu spoľahlivosti je založený na priemernej chybe zodpovedajúceho parametra. Interval spoľahlivosti ukazuje, v akých medziach s pravdepodobnosťou (1-a) je skutočná hodnota odhadovaného parametra. Tu a je hladina významnosti, (1-a) sa tiež nazýva hladina spoľahlivosti.

V prvej kapitole sme ukázali, že napríklad pre aritmetický priemer leží skutočný priemer populácie v rámci 2 stredných chýb od priemeru asi 95 % času. Hranice 95 % intervalu spoľahlivosti pre priemer teda budú od priemeru vzorky o dvojnásobok strednej chyby priemeru, t.j. vynásobíme strednú chybu priemeru nejakým faktorom, ktorý závisí od úrovne spoľahlivosti. Pre priemer a rozdiel priemerov sa berie študentský koeficient (kritická hodnota študentského kritéria), pre podiel a rozdiel podielov kritická hodnota z kritéria. Súčin koeficientu a priemernej chyby môžeme nazvať hraničnou chybou tohto parametra, t.j. maximum, ktoré môžeme pri jej hodnotení získať.

Interval spoľahlivosti pre aritmetický priemer : .

Tu je vzorový priemer;

Priemerná chyba aritmetického priemeru;

s- vzorová smerodajná odchýlka;

n

f = n-1 (koeficient študenta).

Interval spoľahlivosti pre rozdiel aritmetických priemerov :

Tu je rozdiel medzi vzorovými prostriedkami;

- priemerná chyba rozdielu aritmetických priemerov;

s 1, s 2 - vzorové štandardné odchýlky;

n1, n2

Kritická hodnota študentského kritéria pre danú hladinu významnosti a a počet stupňov voľnosti f=n1 + n2-2 (koeficient študenta).

Interval spoľahlivosti pre akcií :

.

Tu d je podiel vzorky;

– priemerná chyba podielu;

n– veľkosť vzorky (veľkosť skupiny);

Interval spoľahlivosti pre zdieľať rozdiely :

Tu je rozdiel medzi podielmi vzorky;

je stredná chyba rozdielu medzi aritmetickými priemermi;

n1, n2– veľkosti vzoriek (počet skupín);

Kritická hodnota kritéria z na danej hladine významnosti a ( , , ).

Výpočtom intervalov spoľahlivosti pre rozdiel v ukazovateľoch, po prvé, priamo vidíme možné hodnoty efektu, a nielen jeho bodový odhad. Po druhé, môžeme vyvodiť záver o prijatí alebo vyvrátení nulovej hypotézy a po tretie, môžeme urobiť záver o sile kritéria.

Pri testovaní hypotéz pomocou intervalov spoľahlivosti by sa malo dodržiavať nasledujúce pravidlo:

Ak 100(1-a)-percentný interval spoľahlivosti stredného rozdielu neobsahuje nulu, potom sú rozdiely štatisticky významné na hladine významnosti a; naopak, ak tento interval obsahuje nulu, potom rozdiely nie sú štatisticky významné.

Ak totiž tento interval obsahuje nulu, znamená to, že porovnávaný ukazovateľ môže byť viac alebo menej v jednej zo skupín v porovnaní s druhou, t.j. pozorované rozdiely sú náhodné.

Podľa miesta, kde sa v intervale spoľahlivosti nachádza nula, je možné posúdiť silu kritéria. Ak sa nula blíži k dolnej alebo hornej hranici intervalu, potom by možno pri väčšom počte porovnávaných skupín dosahovali rozdiely štatistickú významnosť. Ak je nula blízko stredu intervalu, znamená to, že zvýšenie aj zníženie ukazovateľa v experimentálnej skupine sú rovnako pravdepodobné a pravdepodobne naozaj neexistujú žiadne rozdiely.

Príklady:

Pre porovnanie chirurgickej úmrtnosti pri použití dvoch rôznych typov anestézie: 61 ľudí bolo operovaných pomocou prvého typu anestézie, 8 zomrelo, pri použití druhého - 67 ľudí, 10 zomrelo.

d 1 \u003d 8/61 \u003d 0,131; d 2 \u003d 10/67 \u003d 0,149; d1-d2 = -0,018.

Rozdiel v letalite porovnávaných metód bude v rozmedzí (-0,018 - 0,122; -0,018 + 0,122) alebo (-0,14; 0,104) s pravdepodobnosťou 100(1-a) = 95 %. Interval obsahuje nulu, t.j. hypotézu rovnakej letality pri dvoch rôznych typoch anestézie nemožno zamietnuť.

Úmrtnosť teda môže a bude klesať na 14 % a zvyšovať na 10,4 % s pravdepodobnosťou 95 %, t.j. nula je približne v strede intervalu, takže možno tvrdiť, že s najväčšou pravdepodobnosťou sa tieto dve metódy skutočne nelíšia v letalite.

V príklade, ktorý sme uvažovali vyššie, sa porovnával priemerný čas poklepania v štyroch skupinách študentov, ktoré sa líšili v skóre zo skúšky. Vypočítajme intervaly spoľahlivosti priemerného času lisovania pre študentov, ktorí absolvovali skúšku na 2 a 5 a interval spoľahlivosti pre rozdiel medzi týmito priemermi.

Študentove koeficienty zistíme z tabuliek Studentovho rozdelenia (pozri prílohu): pre prvú skupinu: = t(0,05;48) = 2,011; pre druhú skupinu: = t(0,05;61) = 2,000. Intervaly spoľahlivosti pre prvú skupinu sú teda: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), pre druhú skupinu (156,55- 2,000*1,85) = 156,85*156,0. (152,8; 160,3). Takže pre tých, ktorí zložili skúšku na 2, sa priemerný čas lisovania pohybuje od 157,8 ms do 166,6 ms s pravdepodobnosťou 95%, pre tých, ktorí zložili skúšku na 5 - od 152,8 ms do 160,3 ms s pravdepodobnosťou 95% .

Môžete tiež testovať nulovú hypotézu pomocou intervalov spoľahlivosti pre priemery, nielen pre rozdiel v priemeroch. Napríklad, ako v našom prípade, ak sa intervaly spoľahlivosti pre priemery prekrývajú, nulovú hypotézu nemožno zamietnuť. Aby bolo možné zamietnuť hypotézu na zvolenej hladine významnosti, príslušné intervaly spoľahlivosti sa nesmú prekrývať.

Nájdite interval spoľahlivosti pre rozdiel v priemernom čase lisovania v skupinách, ktoré absolvovali skúšku za 2 a 5. Rozdiel medzi priemermi: 162,19 - 156,55 = 5,64. Študentov koeficient: \u003d t (0,05; 49 + 62-2) \u003d t (0,05; 109) \u003d 1,982. Skupinové štandardné odchýlky sa budú rovnať: ; . Vypočítame priemernú chybu rozdielu medzi priemermi:. Interval spoľahlivosti: \u003d (5,64-1,982 * 2,87; 5,64 + 1,982 * 2,87) \u003d (-0,044; 11,33).

Takže rozdiel v priemernom čase lisovania v skupinách, ktoré zložili skúšku v 2 a 5, bude v rozsahu od -0,044 ms do 11,33 ms. Tento interval zahŕňa nulu, t.j. priemerný čas lisovania u tých, ktorí zvládli skúšku s výborným výsledkom, sa môže v porovnaní s tými, ktorí skúšku zložili neuspokojivo, zvýšiť aj znížiť, t.j. nulovú hypotézu nemožno zamietnuť. Ale nula je veľmi blízko spodnej hranice, čas stláčania sa u výborných rozohrávačov skráti oveľa skôr. Môžeme teda konštatovať, že stále existujú rozdiely v priemernom čase kliknutia medzi tými, ktorí prešli o 2 a o 5, len sme ich nedokázali zistiť pre danú zmenu priemerného času, rozptylu priemerného času a veľkosti vzoriek.



Sila testu je pravdepodobnosť zamietnutia nesprávnej nulovej hypotézy, t.j. nájsť rozdiely tam, kde skutočne sú.

Sila testu sa určuje na základe úrovne významnosti, veľkosti rozdielov medzi skupinami, rozptylu hodnôt v skupinách a veľkosti vzorky.

Pre Studentov test a analýzu rozptylu môžete použiť grafy citlivosti.

Sila kritéria môže byť použitá pri predbežnom stanovení požadovaného počtu skupín.

Interval spoľahlivosti ukazuje, v ktorých medziach leží skutočná hodnota odhadovaného parametra s danou pravdepodobnosťou.

Pomocou intervalov spoľahlivosti môžete testovať štatistické hypotézy a vyvodzovať závery o citlivosti kritérií.

LITERATÚRA.

Glantz S. - Kapitola 6.7.

Rebrová O.Yu. - s.112-114, s.171-173, s.234-238.

Sidorenko E. V. - s. 32-33.

Otázky na samoskúšanie žiakov.

1. Aká je sila kritéria?

2. V akých prípadoch je potrebné vyhodnotiť silu kritérií?

3. Metódy výpočtu výkonu.

6. Ako testovať štatistickú hypotézu pomocou intervalu spoľahlivosti?

7. Čo možno povedať o sile kritéria pri výpočte intervalu spoľahlivosti?

Úlohy.

Interval spoľahlivosti pre matematické očakávania - ide o taký interval vypočítaný z údajov, ktorý so známou pravdepodobnosťou obsahuje matematické očakávanie bežnej populácie. Prirodzeným odhadom matematického očakávania je aritmetický priemer jeho pozorovaných hodnôt. Preto budeme ďalej počas hodiny používať pojmy „priemer“, „priemerná hodnota“. V úlohách výpočtu intervalu spoľahlivosti sa najčastejšie vyžaduje odpoveď „Interval spoľahlivosti priemerného čísla [hodnota v konkrétnom probléme] je od [nižšia hodnota] po [vyššia hodnota]“. Pomocou intervalu spoľahlivosti je možné vyhodnotiť nielen priemerné hodnoty, ale aj podiel jedného alebo druhého znaku všeobecnej populácie. V lekcii sú analyzované stredné hodnoty, rozptyl, smerodajná odchýlka a chyba, cez ktoré sa dostaneme k novým definíciám a vzorcom. Charakteristika vzorky a populácie .

Bodové a intervalové odhady priemeru

Ak sa stredná hodnota všeobecnej populácie odhaduje číslom (bodom), potom sa za odhad neznámeho priemeru všeobecnej populácie berie špecifický priemer vypočítaný zo vzorky pozorovaní. V tomto prípade sa hodnota výberového priemeru – náhodná premenná – nezhoduje so strednou hodnotou všeobecnej populácie. Preto pri uvádzaní strednej hodnoty vzorky je potrebné súčasne uviesť aj výberovú chybu. Štandardná chyba sa používa ako miera vzorkovacej chyby, ktorá je vyjadrená v rovnakých jednotkách ako priemer. Preto sa často používa tento zápis: .

Ak sa vyžaduje, aby bol odhad priemeru spojený s určitou pravdepodobnosťou, potom sa parameter všeobecnej záujmovej populácie musí odhadnúť nie jedným číslom, ale intervalom. Interval spoľahlivosti je interval, v ktorom s určitou pravdepodobnosťou P zistí sa hodnota odhadovaného ukazovateľa bežnej populácie. Interval spoľahlivosti, v ktorom s pravdepodobnosťou P = 1 - α je náhodná premenná, vypočíta sa takto:

,

α = 1 - P, ktorý nájdete v prílohe takmer každej knihy o štatistike.

V praxi nie je známy priemer a rozptyl populácie, takže rozptyl populácie je nahradený rozptylom vzorky a priemer populácie priemerom vzorky. Interval spoľahlivosti sa teda vo väčšine prípadov vypočíta takto:

.

Vzorec intervalu spoľahlivosti možno použiť na odhad priemernej hodnoty populácie, ak

  • štandardná odchýlka všeobecnej populácie je známa;
  • alebo štandardná odchýlka populácie nie je známa, ale veľkosť vzorky je väčšia ako 30.

Priemer vzorky je nezaujatý odhad priemeru populácie. Na druhej strane, rozptyl vzorky nie je nezaujatým odhadom rozptylu populácie . Na získanie nestranného odhadu rozptylu populácie vo vzorci rozptylu vzorky je veľkosť vzorky n by mal byť nahradený n-1.

Príklad 1 Zo 100 náhodne vybraných kaviarní v určitom meste sa zbierajú informácie, že priemerný počet zamestnancov v nich je 10,5 so štandardnou odchýlkou ​​4,6. Určte interval spoľahlivosti 95 % počtu zamestnancov kaviarne.

kde je kritická hodnota štandardného normálneho rozdelenia pre hladinu významnosti α = 0,05 .

95 % interval spoľahlivosti pre priemerný počet zamestnancov kaviarní bol teda medzi 9,6 a 11,4.

Príklad 2 Pre náhodnú vzorku zo všeobecnej populácie 64 pozorovaní boli vypočítané tieto celkové hodnoty:

súčet hodnôt v pozorovaniach,

súčet štvorcových odchýlok hodnôt od priemeru .

Vypočítajte 95 % interval spoľahlivosti pre očakávanú hodnotu.

vypočítajte štandardnú odchýlku:

,

vypočítajte priemernú hodnotu:

.

Interval spoľahlivosti nahraďte hodnotami vo výraze:

kde je kritická hodnota štandardného normálneho rozdelenia pre hladinu významnosti α = 0,05 .

Dostaneme:

95 % interval spoľahlivosti pre matematické očakávanie tejto vzorky sa teda pohyboval od 7,484 do 11,266.

Príklad 3 Pre náhodnú vzorku zo všeobecnej populácie 100 pozorovaní bola vypočítaná stredná hodnota 15,2 a štandardná odchýlka 3,2. Vypočítajte 95 % interval spoľahlivosti pre očakávanú hodnotu a potom 99 % interval spoľahlivosti. Ak výkon vzorky a jej variácie zostanú rovnaké, ale faktor spoľahlivosti sa zvýši, bude sa interval spoľahlivosti zužovať alebo rozširovať?

Tieto hodnoty dosadíme do výrazu pre interval spoľahlivosti:

kde je kritická hodnota štandardného normálneho rozdelenia pre hladinu významnosti α = 0,05 .

Dostaneme:

.

95 % interval spoľahlivosti pre priemer tejto vzorky bol teda od 14,57 do 15,82.

Opäť dosadíme tieto hodnoty do výrazu pre interval spoľahlivosti:

kde je kritická hodnota štandardného normálneho rozdelenia pre hladinu významnosti α = 0,01 .

Dostaneme:

.

99 % interval spoľahlivosti pre priemer tejto vzorky bol teda od 14,37 do 16,02.

Ako vidíte, so zvyšujúcim sa faktorom spoľahlivosti sa zvyšuje aj kritická hodnota štandardného normálneho rozdelenia, a preto sú začiatočné a koncové body intervalu umiestnené ďalej od priemeru, a teda intervalu spoľahlivosti pre matematické očakávania. zvyšuje.

Bodové a intervalové odhady špecifickej hmotnosti

Podiel niektorého znaku vzorky možno interpretovať ako bodový odhad podielu p rovnaká vlastnosť v bežnej populácii. Ak je potrebné túto hodnotu spájať s pravdepodobnosťou, potom by sa mal vypočítať interval spoľahlivosti špecifickej hmotnosti p v bežnej populácii s pravdepodobnosťou P = 1 - α :

.

Príklad 4 V určitom meste sú dvaja kandidáti A A B kandidovať na primátora. Náhodne opýtaných bolo 200 obyvateľov mesta, z ktorých 46 % odpovedalo, že by volili kandidáta A, 26 % - pre kandidáta B a 28 % nevie, koho budú voliť. Určte 95% interval spoľahlivosti pre podiel obyvateľov mesta, ktorí podporujú kandidáta A.

Akákoľvek vzorka poskytuje iba približnú predstavu o všeobecnej populácii a všetky štatistické charakteristiky vzorky (priemer, režim, rozptyl ...) sú aproximáciou alebo odhadom všeobecných parametrov, ktoré sa vo väčšine prípadov nedajú vypočítať z dôvodu neprístupnosť bežnej populácie (obrázok 20) ​​.

Obrázok 20. Chyba pri odbere vzoriek

Môžete však určiť interval, v ktorom s určitou mierou pravdepodobnosti leží skutočná (všeobecná) hodnota štatistickej charakteristiky. Tento interval sa nazýva d interval spoľahlivosti (CI).

Takže všeobecný priemer s pravdepodobnosťou 95 % leží v rámci

od do, (20)

Kde t - tabuľková hodnota študentského kritéria pre α = 0,05 a f= n-1

V tomto prípade možno nájsť 99% CI t vybraný pre α =0,01.

Aký je praktický význam intervalu spoľahlivosti?

    Široký interval spoľahlivosti naznačuje, že priemer vzorky presne neodráža priemer populácie. Je to zvyčajne spôsobené nedostatočnou veľkosťou vzorky, prípadne jej heterogenitou, t.j. veľký rozptyl. Obidve poskytujú veľkú chybu v priemere, a teda aj širší CI. A to je dôvod vrátiť sa do fázy plánovania výskumu.

    Horná a dolná hranica CI hodnotia, či budú výsledky klinicky významné

Zastavme sa podrobnejšie pri otázke štatistickej a klinickej významnosti výsledkov štúdia skupinových vlastností. Pripomeňme, že úlohou štatistiky je na základe vzorových údajov odhaliť aspoň nejaké rozdiely vo všeobecných populáciách. Je úlohou lekára nájsť také (nie žiadne) rozdiely, ktoré pomôžu diagnostike alebo liečbe. A nie vždy štatistické závery sú základom pre klinické závery. Štatisticky významný pokles hemoglobínu o 3 g/l teda nie je dôvodom na obavy. A naopak, ak nejaký problém v ľudskom tele nemá masový charakter na úrovni celej populácie, nie je to dôvod, aby sme sa týmto problémom nezaoberali.

Túto pozíciu zvážime v príklad.

Vedcov zaujímalo, či chlapci, ktorí mali nejaké infekčné ochorenie, nezaostávajú v raste za svojimi rovesníkmi. Za týmto účelom bola vykonaná selektívna štúdia, ktorej sa zúčastnilo 10 chlapcov, ktorí mali toto ochorenie. Výsledky sú uvedené v tabuľke 23.

Tabuľka 23. Štatistické výsledky

nižší limit

Horná hranica

Špecifikácie (cm)

stred

Z týchto výpočtov vyplýva, že selektívna priemerná výška 10-ročných chlapcov, ktorí prekonali nejaký druh infekčného ochorenia, sa blíži k normálu (132,5 cm). Spodná hranica intervalu spoľahlivosti (126,6 cm) však naznačuje, že existuje 95 % pravdepodobnosť, že skutočná priemerná výška týchto detí zodpovedá pojmu „nízky vzrast“, t.j. tieto deti sú zakrpatené.

V tomto príklade sú výsledky výpočtov intervalu spoľahlivosti klinicky významné.

KATEGÓRIE

POPULÁRNE ČLÁNKY

2023 "kingad.ru" - ultrazvukové vyšetrenie ľudských orgánov