Interval spoľahlivosti. Interval spoľahlivosti pre matematické očakávanie normálneho rozdelenia so známym rozptylom

Interval spoľahlivosti sú hraničné hodnoty štatistickej veličiny, ktoré sa pri danej spoľahlivosti γ budú nachádzať v tomto intervale pri väčšej veľkosti vzorky. Označuje sa ako P(θ - ε . V praxi sa pravdepodobnosť spoľahlivosti γ vyberá z hodnôt γ = 0,9 , γ = 0,95 , γ = 0,99 dostatočne blízkych jednotke.

Pridelenie služby. Táto služba definuje:

  • interval spoľahlivosti pre všeobecný priemer, interval spoľahlivosti pre rozptyl;
  • interval spoľahlivosti pre štandardnú odchýlku, interval spoľahlivosti pre všeobecný zlomok;
Výsledné riešenie sa uloží do súboru programu Word (pozri príklad). Nižšie je video návod, ako vyplniť počiatočné údaje.

Príklad #1. Na JZD bolo z celkového stáda 1000 oviec 100 oviec podrobených selektívnemu kontrolnému strihaniu. V dôsledku toho sa stanovilo priemerné strihanie vlny 4,2 kg na ovcu. Určte s pravdepodobnosťou 0,99 smerodajnú chybu vzorky pri určovaní priemerného strihu vlny na ovcu a hranice, v ktorých leží hodnota strihu, ak je rozptyl 2,5. Vzorka sa neopakuje.
Príklad č. 2. Zo šarže dovezených výrobkov na pošte Moskovskej severnej colnice bolo odobratých 20 vzoriek produktu „A“ v poradí náhodného prevzorkovania. Výsledkom kontroly bol stanovený priemerný obsah vlhkosti produktu „A“ vo vzorke, ktorý sa ukázal ako 6 % so štandardnou odchýlkou ​​1 %.
Určte s pravdepodobnosťou 0,683 limity priemerného obsahu vlhkosti výrobku v celej šarži dovážaných výrobkov.
Príklad č. 3. Prieskum medzi 36 študentmi ukázal, že priemerný počet nimi prečítaných učebníc za akademický rok vyšiel na 6. Za predpokladu, že počet prečítaných učebníc študentom za semester má zákon normálneho rozdelenia so štandardnou odchýlkou ​​rovnajúcou sa 6, nájdite : A) so spoľahlivosťou 0,99 intervalového odhadu pre matematické očakávanie tejto náhodnej premennej; B) s akou pravdepodobnosťou možno tvrdiť, že priemerný počet prečítaných učebníc študentom za semester, vypočítaný pre túto vzorku, sa v absolútnej hodnote odchyľuje od matematického očakávania najviac o 2.

Klasifikácia intervalov spoľahlivosti

Podľa typu hodnoteného parametra:

Podľa typu vzorky:

  1. Interval spoľahlivosti pre nekonečné vzorkovanie;
  2. Interval spoľahlivosti pre konečnú vzorku;
Odber vzoriek sa nazýva re-sampling, ak sa vybraný objekt vráti bežnej populácii pred výberom ďalšieho. Vzorka sa nazýva neopakovateľná. ak sa vybraný objekt nevráti bežnej populácii. V praxi sa zvyčajne jedná o neopakujúce sa vzorky.

Výpočet strednej výberovej chyby pre náhodný výber

Nesúlad medzi hodnotami ukazovateľov získanými zo vzorky a zodpovedajúcimi parametrami všeobecnej populácie sa nazýva chyba reprezentatívnosti.
Označenia hlavných parametrov všeobecnej a výberovej populácie.
Vzorce vzorcov pre priemernú chybu
opätovný výberneopakovateľný výber
pre stredna zdieľaniepre stredna zdieľanie
Pomer medzi hranicou vzorkovacej chyby (Δ) zaručený s určitou pravdepodobnosťou P(t), a priemerná výberová chyba má tvar: alebo Δ = t μ, kde t– koeficient spoľahlivosti, určený v závislosti od úrovne pravdepodobnosti P(t) podľa tabuľky integrálnej Laplaceovej funkcie.

Vzorce na výpočet veľkosti vzorky pomocou vhodnej metódy náhodného výberu

Nech je náhodná premenná (môžeme hovoriť o všeobecnej populácii) rozdelená podľa normálneho zákona, pre ktorý je známy rozptyl D = 2 (> 0). Zo všeobecnej populácie (na množine objektov, z ktorých sa určuje náhodná veličina) sa vytvorí vzorka veľkosti n. Vzorku x 1 , x 2 ,..., x n považujeme za súbor n nezávislých náhodných premenných rozdelených rovnakým spôsobom ako (prístup vysvetlený vyššie v texte).

Predtým sa tiež diskutovalo a dokázalo nasledujúce rovnosti:

Mx1 = Mx2 = ... = Mxn = M;

Dx 1 = Dx 2 = ... = Dx n = D;

Stačí jednoducho dokázať (dôkaz vynecháme), že aj náhodná veličina je v tomto prípade rozdelená podľa normálneho zákona.

Označme neznámu hodnotu M a a zvolíme číslo d > 0 podľa danej spoľahlivosti tak, aby bola splnená nasledujúca podmienka:

P(- a< d) = (1)

Keďže náhodná premenná je rozdelená podľa normálneho zákona s matematickým očakávaním M = M = a a rozptylom D = D /n = 2 /n, dostaneme:

P(- a< d) =P(a - d < < a + d) =

Zostáva zvoliť d také, aby bola rovnosť

Pre každého možno nájsť také číslo t z tabuľky, že (t) \u003d / 2. Toto číslo t sa niekedy nazýva kvantil.

Teraz od rovnosti

definujte hodnotu d:

Konečný výsledok získame uvedením vzorca (1) v tvare:

Význam posledného vzorca je nasledovný: so spoľahlivosťou, interval spoľahlivosti

pokrýva neznámy parameter a = M populácie. Dá sa to povedať inak: bodový odhad určuje hodnotu parametra M s presnosťou d= t / a spoľahlivosťou.

Úloha. Nech existuje všeobecná populácia s nejakou charakteristikou rozloženou podľa normálneho zákona s rozptylom rovným 6,25. Urobila sa vzorka s objemom n = 27 a získala sa priemerná vzorková hodnota charakteristiky = 12. Nájdite interval spoľahlivosti pokrývajúci neznáme matematické očakávanie študovanej charakteristiky všeobecnej populácie so spoľahlivosťou = 0,99.

Riešenie. Najprv pomocou tabuľky pre Laplaceovu funkciu nájdeme hodnotu t z rovnice (t) \u003d / 2 \u003d 0,495. Na základe získanej hodnoty t = 2,58 určíme presnosť odhadu (resp. polovičnú dĺžku intervalu spoľahlivosti) d: d = 2,52,58 / 1,24. Odtiaľ dostaneme požadovaný interval spoľahlivosti: (10,76; 13,24).

štatistická hypotéza všeobecná variačná

Interval spoľahlivosti pre očakávanie normálneho rozdelenia s neznámym rozptylom

Nech je náhodná premenná rozdelená podľa normálneho zákona s neznámym matematickým očakávaním M, ktorú označíme písmenom a . Urobme si vzorku veľkosti n. Určme priemernú vzorku a korigovaný rozptyl vzorky s 2 pomocou známych vzorcov.

Náhodná hodnota

rozdelené podľa Studentovho zákona s n - 1 stupňami voľnosti.

Úlohou je nájsť také číslo t podľa danej spoľahlivosti a počtu stupňov voľnosti n - 1, aby bola rovnosť

alebo ekvivalentná rovnosť

Tu je v zátvorke napísaná podmienka, že hodnota neznámeho parametra a patrí do určitého intervalu, ktorým je interval spoľahlivosti. Jeho hranice závisia od spoľahlivosti, ako aj od parametrov vzorkovania a s.

Aby sme určili hodnotu t podľa veľkosti, transformujeme rovnosť (2) do tvaru:

Teraz podľa tabuľky pre náhodnú premennú t, rozloženú podľa Studentovho zákona, podľa pravdepodobnosti 1 - a počtu stupňov voľnosti n - 1, zistíme t. Vzorec (3) dáva odpoveď na problém.

Úloha. Pri kontrolných testoch 20 elektrických lámp bola priemerná doba ich prevádzky 2000 hodín so štandardnou odchýlkou ​​(vypočítanou ako druhá odmocnina korigovaného rozptylu vzorky) 11 hodinami. Je známe, že trvanie prevádzky lampy je normálne rozložená náhodná veličina. Určte so spoľahlivosťou 0,95 interval spoľahlivosti pre matematické očakávanie tejto náhodnej premennej.

Riešenie. Hodnota 1 - v tomto prípade sa rovná 0,05. Podľa Študentovej distribučnej tabuľky pri počte stupňov voľnosti rovným 19 zistíme: t = 2,093. Vypočítajme teraz presnosť odhadu: 2,093121/ = 56,6. Odtiaľ dostaneme požadovaný interval spoľahlivosti: (1943,4; 2056,6).

Interval spoľahlivosti pre matematické očakávania - ide o taký interval vypočítaný z údajov, ktorý so známou pravdepodobnosťou obsahuje matematické očakávanie bežnej populácie. Prirodzeným odhadom matematického očakávania je aritmetický priemer jeho pozorovaných hodnôt. Preto budeme ďalej počas hodiny používať pojmy „priemer“, „priemerná hodnota“. V úlohách výpočtu intervalu spoľahlivosti sa najčastejšie vyžaduje odpoveď „Interval spoľahlivosti priemerného čísla [hodnota v konkrétnom probléme] je od [nižšia hodnota] po [vyššia hodnota]“. Pomocou intervalu spoľahlivosti je možné vyhodnotiť nielen priemerné hodnoty, ale aj podiel jedného alebo druhého znaku všeobecnej populácie. V lekcii sú analyzované stredné hodnoty, rozptyl, smerodajná odchýlka a chyba, cez ktoré sa dostaneme k novým definíciám a vzorcom. Charakteristika vzorky a populácie .

Bodové a intervalové odhady priemeru

Ak sa stredná hodnota všeobecnej populácie odhaduje číslom (bodom), potom sa za odhad neznámeho priemeru všeobecnej populácie berie špecifický priemer vypočítaný zo vzorky pozorovaní. V tomto prípade sa hodnota výberového priemeru – náhodná premenná – nezhoduje so strednou hodnotou všeobecnej populácie. Preto pri uvádzaní strednej hodnoty vzorky je potrebné súčasne uviesť aj výberovú chybu. Štandardná chyba sa používa ako miera vzorkovacej chyby, ktorá je vyjadrená v rovnakých jednotkách ako priemer. Preto sa často používa tento zápis: .

Ak sa vyžaduje, aby bol odhad priemeru spojený s určitou pravdepodobnosťou, potom sa parameter všeobecnej záujmovej populácie musí odhadnúť nie jedným číslom, ale intervalom. Interval spoľahlivosti je interval, v ktorom s určitou pravdepodobnosťou P zistí sa hodnota odhadovaného ukazovateľa bežnej populácie. Interval spoľahlivosti, v ktorom s pravdepodobnosťou P = 1 - α je náhodná premenná, vypočíta sa takto:

,

α = 1 - P, ktorý nájdete v prílohe takmer každej knihy o štatistike.

V praxi nie je známy priemer a rozptyl populácie, takže rozptyl populácie je nahradený rozptylom vzorky a priemer populácie priemerom vzorky. Interval spoľahlivosti sa teda vo väčšine prípadov vypočíta takto:

.

Vzorec intervalu spoľahlivosti možno použiť na odhad priemernej hodnoty populácie, ak

  • štandardná odchýlka všeobecnej populácie je známa;
  • alebo štandardná odchýlka populácie nie je známa, ale veľkosť vzorky je väčšia ako 30.

Priemer vzorky je nezaujatý odhad priemeru populácie. Na druhej strane, rozptyl vzorky nie je nezaujatým odhadom rozptylu populácie . Na získanie nestranného odhadu rozptylu populácie vo vzorci rozptylu vzorky je veľkosť vzorky n by mal byť nahradený n-1.

Príklad 1 Zo 100 náhodne vybraných kaviarní v určitom meste sa zbierajú informácie, že priemerný počet zamestnancov v nich je 10,5 so štandardnou odchýlkou ​​4,6. Určte interval spoľahlivosti 95 % počtu zamestnancov kaviarne.

kde je kritická hodnota štandardného normálneho rozdelenia pre hladinu významnosti α = 0,05 .

95 % interval spoľahlivosti pre priemerný počet zamestnancov kaviarní bol teda medzi 9,6 a 11,4.

Príklad 2 Pre náhodnú vzorku zo všeobecnej populácie 64 pozorovaní boli vypočítané tieto celkové hodnoty:

súčet hodnôt v pozorovaniach,

súčet štvorcových odchýlok hodnôt od priemeru .

Vypočítajte 95 % interval spoľahlivosti pre očakávanú hodnotu.

vypočítajte štandardnú odchýlku:

,

vypočítajte priemernú hodnotu:

.

Interval spoľahlivosti nahraďte hodnotami vo výraze:

kde je kritická hodnota štandardného normálneho rozdelenia pre hladinu významnosti α = 0,05 .

Dostaneme:

95 % interval spoľahlivosti pre matematické očakávanie tejto vzorky sa teda pohyboval od 7,484 do 11,266.

Príklad 3 Pre náhodnú vzorku zo všeobecnej populácie 100 pozorovaní bola vypočítaná stredná hodnota 15,2 a štandardná odchýlka 3,2. Vypočítajte 95 % interval spoľahlivosti pre očakávanú hodnotu a potom 99 % interval spoľahlivosti. Ak výkon vzorky a jej variácie zostanú rovnaké, ale faktor spoľahlivosti sa zvýši, bude sa interval spoľahlivosti zužovať alebo rozširovať?

Tieto hodnoty dosadíme do výrazu pre interval spoľahlivosti:

kde je kritická hodnota štandardného normálneho rozdelenia pre hladinu významnosti α = 0,05 .

Dostaneme:

.

95 % interval spoľahlivosti pre priemer tejto vzorky bol teda od 14,57 do 15,82.

Opäť dosadíme tieto hodnoty do výrazu pre interval spoľahlivosti:

kde je kritická hodnota štandardného normálneho rozdelenia pre hladinu významnosti α = 0,01 .

Dostaneme:

.

99 % interval spoľahlivosti pre priemer tejto vzorky bol teda od 14,37 do 16,02.

Ako vidíte, so zvyšujúcim sa faktorom spoľahlivosti sa zvyšuje aj kritická hodnota štandardného normálneho rozdelenia, a preto sú začiatočné a koncové body intervalu umiestnené ďalej od priemeru, a teda intervalu spoľahlivosti pre matematické očakávania. zvyšuje.

Bodové a intervalové odhady špecifickej hmotnosti

Podiel niektorého znaku vzorky možno interpretovať ako bodový odhad podielu p rovnaká vlastnosť v bežnej populácii. Ak je potrebné túto hodnotu spájať s pravdepodobnosťou, potom by sa mal vypočítať interval spoľahlivosti špecifickej hmotnosti p v bežnej populácii s pravdepodobnosťou P = 1 - α :

.

Príklad 4 V určitom meste sú dvaja kandidáti A A B kandidovať na primátora. Náhodne opýtaných bolo 200 obyvateľov mesta, z ktorých 46 % odpovedalo, že by volili kandidáta A, 26 % - pre kandidáta B a 28 % nevie, koho budú voliť. Určte 95 % interval spoľahlivosti pre podiel obyvateľov mesta, ktorí podporujú kandidáta A.

Na nájdenie správnej úlohy môžete použiť tento vyhľadávací formulár. Zadajte slovo, frázu z úlohy alebo jej číslo, ak ho poznáte.


Hľadať iba v tejto sekcii


Intervaly spoľahlivosti: Zoznam riešení problémov

Intervaly spoľahlivosti: teória a problémy

Pochopenie intervalov spoľahlivosti

Stručne predstavme pojem interval spoľahlivosti, ktorý
1) odhaduje niektorý parameter numerickej vzorky priamo z údajov samotnej vzorky,
2) pokrýva hodnotu tohto parametra s pravdepodobnosťou γ.

Interval spoľahlivosti pre parameter X(s pravdepodobnosťou γ) sa nazýva interval tvaru , taký, že a hodnoty sa nejakým spôsobom vypočítajú zo vzorky.

Zvyčajne sa v aplikovaných problémoch pravdepodobnosť spoľahlivosti rovná γ ​​= 0,9; 0,95; 0,99.

Uvažujme o vzorke veľkosti n, vyrobenej zo všeobecnej populácie, rozloženej pravdepodobne podľa zákona o normálnom rozdelení. Ukážme si, aké vzorce nájdeme intervaly spoľahlivosti pre distribučné parametre- matematické očakávanie a rozptyl (štandardná odchýlka).

Interval spoľahlivosti pre matematické očakávania

Prípad 1 Distribúcia rozptylu je známa a rovná sa . Potom interval spoľahlivosti pre parameter a vyzerá ako:
t sa určí z Laplaceovej tabuľky rozdelenia pomerom

Prípad 2 Distribúcia rozptylu nie je známa, zo vzorky bol vypočítaný bodový odhad rozptylu. Potom interval spoľahlivosti pre parameter a vyzerá ako:
, kde je výberový priemer vypočítaný z výberového, parametra t určené zo Študentovej distribučnej tabuľky

Príklad. Na základe údajov zo 7 meraní určitej hodnoty bol zistený priemer výsledkov merania rovný 30 a rozptyl vzorky rovný 36. Nájdite hranice, v ktorých je obsiahnutá skutočná hodnota nameranej hodnoty so spoľahlivosťou 0,99 .

Riešenie. Poďme nájsť . Potom medze spoľahlivosti pre interval obsahujúci skutočnú hodnotu nameranej hodnoty možno nájsť podľa vzorca:
, kde je výberový priemer, je výberový rozptyl. Zapojením všetkých hodnôt dostaneme:

Interval spoľahlivosti pre rozptyl

Domnievame sa, že všeobecne povedané, matematické očakávanie je neznáme a je známy len bodový nezaujatý odhad rozptylu. Potom interval spoľahlivosti vyzerá takto:
, Kde - distribučné kvantily určené z tabuliek.

Príklad. Na základe údajov zo 7 pokusov bola zistená hodnota odhadu pre smerodajnú odchýlku s=12. Nájdite s pravdepodobnosťou 0,9 šírku intervalu spoľahlivosti vytvoreného na odhad rozptylu.

Riešenie. Interval spoľahlivosti pre neznámy rozptyl populácie možno nájsť pomocou vzorca:

Nahraďte a získajte:


Potom je šírka intervalu spoľahlivosti 465,589-71,708=393,881.

Interval spoľahlivosti pre pravdepodobnosť (v percentách)

Prípad 1 Nech je v úlohe známa veľkosť vzorky a frakcia vzorky (relatívna frekvencia). Potom je interval spoľahlivosti pre všeobecný zlomok (skutočná pravdepodobnosť):
, kde je parameter t sa určí z Laplaceovej tabuľky rozdelenia pomerom .

Prípad 2 Ak problém navyše pozná celkovú veľkosť populácie, z ktorej bola vzorka odobratá, interval spoľahlivosti pre všeobecný zlomok (skutočná pravdepodobnosť) možno nájsť pomocou upraveného vzorca:
.

Príklad. Je známe, že Nájdite hranice, v ktorých sa s pravdepodobnosťou uzatvára všeobecný podiel.

Riešenie. Používame vzorec:

Nájdite parameter z podmienky , dostaneme Substitute vo vzorci:


Ďalšie príklady úloh v matematických štatistikách nájdete na stránke

Nech CB X tvorí všeobecnú populáciu a β je neznámy parameter CB X. Ak je štatistický odhad v * konzistentný, potom čím väčšia je veľkosť vzorky, tým presnejšia je hodnota β. V praxi však nemáme príliš veľké vzorky, takže nemôžeme zaručiť väčšiu presnosť.

Nech s* je štatistický odhad pre s. Množstvo |v* - v| sa nazýva presnosť odhadu. Je jasné, že presnosť je CB, pretože s* je náhodná premenná. Nastavíme malé kladné číslo 8 a vyžadujeme presnosť odhadu |in* - in| bolo menej ako 8, t.j. | v* - v |< 8.

Spoľahlivosť g alebo pravdepodobnosť spoľahlivosti odhadu v by in * je pravdepodobnosť g, s ktorou nerovnosť |in * - in|< 8, т. е.

Spoľahlivosť g je zvyčajne nastavená vopred a pre g má číslo blízke 1 (0,9; 0,95; 0,99; ...).

Pretože nerovnosť |v * - v|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Interval (v * - 8, v * + 5) sa nazýva interval spoľahlivosti, t. j. interval spoľahlivosti pokrýva neznámy parameter s pravdepodobnosťou y. Všimnite si, že konce intervalu spoľahlivosti sú náhodné a líšia sa od vzorky k vzorke, takže je presnejšie povedať, že interval (pri * - 8, pri * + 8) pokrýva neznámy parameter β a nie β patrí do tohto intervalu. .

Nech je všeobecná populácia daná náhodnou premennou X, rozdelenou podľa normálneho zákona, navyše je známa smerodajná odchýlka a. Matematické očakávanie a = M (X) nie je známe. Je potrebné nájsť interval spoľahlivosti pre a pre danú spoľahlivosť y.

Ukážkový priemer

je štatistický odhad pre xr = a.

Veta. Náhodná premenná xB má normálne rozdelenie, ak X má normálne rozdelenie a M(XB) = a,

A (XB) \u003d a, kde a \u003d y / B (X), a \u003d M (X). l/i

Interval spoľahlivosti pre a má tvar:

Nájdeme 8.

Použitie vzťahu

kde Ф(г) je Laplaceova funkcia, máme:

P ( | XB - a |<8} = 2Ф

nájdeme hodnotu t v tabuľke hodnôt Laplaceovej funkcie.

Označenie

T, dostaneme F(t) = g

Z rovnosti Nájsť - presnosť odhadu.

Interval spoľahlivosti pre a má teda tvar:

Ak je poskytnutá vzorka zo všeobecnej populácie X

ng do" X2 xm
n. n1 n2 nm

n = U1 + ... + nm, potom bude interval spoľahlivosti:

Príklad 6.35. Nájdite interval spoľahlivosti pre odhad očakávania a normálneho rozdelenia so spoľahlivosťou 0,95, pričom poznáte priemer vzorky Xb = 10,43, veľkosť vzorky n = 100 a štandardnú odchýlku s = 5.

Použime vzorec

KATEGÓRIE

POPULÁRNE ČLÁNKY

2023 "kingad.ru" - ultrazvukové vyšetrenie ľudských orgánov