Interval spoľahlivosti. Interval spoľahlivosti pre matematické očakávanie normálneho rozdelenia so známym rozptylom

Interval spoľahlivosti– hraničné hodnoty štatistickej veličiny, ktorá s danou pravdepodobnosťou spoľahlivosti γ bude v tomto intervale pri odbere väčšieho objemu. Označuje sa ako P(θ - ε. V praxi sa pravdepodobnosť spoľahlivosti γ vyberá z hodnôt celkom blízkych jednotke: γ = 0,9, γ = 0,95, γ = 0,99.

Účel služby. Pomocou tejto služby môžete určiť:

  • interval spoľahlivosti pre všeobecný priemer, interval spoľahlivosti pre rozptyl;
  • interval spoľahlivosti pre štandardnú odchýlku, interval spoľahlivosti pre všeobecný podiel;
Výsledné riešenie sa uloží do súboru programu Word (pozri príklad). Nižšie je video návod, ako vyplniť počiatočné údaje.

Príklad č.1. Na JZD bolo z celkového stáda 1000 oviec 100 oviec podrobených selektívnemu kontrolnému strihaniu. V dôsledku toho sa stanovil priemerný odstrih vlny 4,2 kg na ovcu. Určte s pravdepodobnosťou 0,99 strednú štvorcovú chybu vzorky pri určovaní priemerného strihu vlny na ovcu a limity, v ktorých sa nachádza hodnota strihu, ak je rozptyl 2,5. Vzorka sa neopakuje.
Príklad č.2. Zo šarže dovezených produktov na pošte Moskovskej severnej colnice bolo náhodným opakovaným odberom vzoriek odobratých 20 vzoriek produktu „A“. Ako výsledok testu bol stanovený priemerný obsah vlhkosti produktu „A“ vo vzorke, ktorý sa ukázal byť rovný 6 % so štandardnou odchýlkou ​​1 %.
Určte s pravdepodobnosťou 0,683 limity priemerného obsahu vlhkosti výrobku v celej šarži dovážaných výrobkov.
Príklad č.3. Prieskum medzi 36 študentmi ukázal, že priemerný počet prečítaných učebníc počas akademického roka sa rovnal 6. Za predpokladu, že počet prečítaných učebníc študentom za semester má zákon normálneho rozdelenia so smerodajnou odchýlkou ​​6, nájdite : A) so spoľahlivosťou 0,99 intervalového odhadu pre matematické očakávanie tejto náhodnej premennej; B) s akou pravdepodobnosťou môžeme povedať, že priemerný počet prečítaných učebníc študentom za semester, vypočítaný z tejto vzorky, sa v absolútnej hodnote odchýli od matematického očakávania najviac o 2.

Klasifikácia intervalov spoľahlivosti

Podľa typu hodnoteného parametra:

Podľa typu vzorky:

  1. Interval spoľahlivosti pre nekonečnú vzorku;
  2. Interval spoľahlivosti pre konečnú vzorku;
Vzorka sa nazýva prevzorkovanie, ak sa vybraný objekt vráti do populácie pred výberom ďalšieho. Vzorka sa nazýva neopakovateľná, ak sa vybraný objekt nevráti obyvateľom. V praxi sa väčšinou stretávame s neopakovateľnými vzorkami.

Výpočet priemernej výberovej chyby pre náhodný výber

Nesúlad medzi hodnotami ukazovateľov získanými zo vzorky a zodpovedajúcimi parametrami všeobecnej populácie sa nazýva chyba reprezentatívnosti.
Označenia hlavných parametrov všeobecnej a výberovej populácie.
Vzorce pre priemerné chyby vzorkovania
opätovný výberopakovať výber
za priemerna zdieľanieza priemerna zdieľanie
Vzťah medzi hranicou vzorkovacej chyby (Δ) zaručený s určitou pravdepodobnosťou Р(t), a priemerná výberová chyba má tvar: alebo Δ = t·μ, kde t– koeficient spoľahlivosti, určený v závislosti od úrovne pravdepodobnosti P(t) podľa tabuľky Laplaceovej integrálnej funkcie.

Vzorce na výpočet veľkosti vzorky pomocou metódy čisto náhodného výberu

Nech je náhodná premenná (môžeme hovoriť o všeobecnej populácii) rozdelená podľa normálneho zákona, pre ktorý je známy rozptyl D = 2 (> 0). Zo všeobecnej populácie (na množine objektov, z ktorých sa určuje náhodná veličina) sa vytvorí vzorka veľkosti n. Vzorku x 1 , x 2 ,..., x n považujeme za súbor n nezávislých náhodných premenných rozdelených rovnakým spôsobom ako (prístup vysvetlený vyššie v texte).

Nasledujúce rovnosti boli tiež prediskutované a preukázané skôr:

Mx1 = Mx2 = ... = Mxn = M;

Dx 1 = Dx 2 = ... = Dx n = D;

Stačí jednoducho dokázať (dôkaz vynecháme), že aj náhodná veličina je v tomto prípade rozdelená podľa normálneho zákona.

Označme neznámu veličinu M a a na základe danej spoľahlivosti vyberieme číslo d > 0 tak, aby bola splnená podmienka:

P(- a< d) = (1)

Keďže náhodná premenná je rozdelená podľa normálneho zákona s matematickým očakávaním M = M = a a rozptylom D = D /n = 2 /n, dostaneme:

P(- a< d) =P(a - d < < a + d) =

Zostáva zvoliť d také, aby platila rovnosť

Pre ktorýkoľvek z nich môžete pomocou tabuľky nájsť číslo t také, že (t)= / 2. Toto číslo t sa niekedy nazýva kvantil.

Teraz od rovnosti

určme hodnotu d:

Konečný výsledok získame uvedením vzorca (1) v tvare:

Význam posledného vzorca je nasledovný: so spoľahlivosťou, interval spoľahlivosti

pokrýva neznámy parameter a = M populácie. Môžeme to povedať inak: bodový odhad určuje hodnotu parametra M s presnosťou d= t / a spoľahlivosťou.

Úloha. Nech existuje všeobecná populácia s určitou charakteristikou rozdelená podľa normálneho zákona s rozptylom rovným 6,25. Bola vybratá veľkosť vzorky n = 27 a priemerná vzorková hodnota charakteristiky bola získaná = 12. Nájdite interval spoľahlivosti pokrývajúci neznáme matematické očakávanie študovanej charakteristiky všeobecnej populácie so spoľahlivosťou = 0,99.

Riešenie. Najprv pomocou tabuľky pre Laplaceovu funkciu zistíme hodnotu t z rovnosti (t) = / 2 = 0,495. Na základe získanej hodnoty t = 2,58 určíme presnosť odhadu (resp. polovičnú dĺžku intervalu spoľahlivosti) d: d = 2,52,58 / 1,24. Odtiaľ získame požadovaný interval spoľahlivosti: (10,76; 13,24).

štatistická hypotéza všeobecná variačná

Interval spoľahlivosti pre matematické očakávanie normálneho rozdelenia s neznámym rozptylom

Nech je náhodná premenná rozdelená podľa normálneho zákona s neznámym matematickým očakávaním M, ktorú označíme písmenom a. Urobme si vzorku objemu n. Určme priemernú vzorku a korigovaný rozptyl vzorky s 2 pomocou známych vzorcov.

Náhodná hodnota

rozdelené podľa Studentovho zákona s n - 1 stupňami voľnosti.

Úlohou je nájsť číslo t pre danú spoľahlivosť a počet stupňov voľnosti n - 1 také, aby bola rovnosť

alebo ekvivalentná rovnosť

Tu je v zátvorke napísaná podmienka, že hodnota neznámeho parametra a patrí do určitého intervalu, ktorým je interval spoľahlivosti. Jeho hranice závisia od spoľahlivosti, ako aj od parametrov vzorkovania a s.

Aby sme určili hodnotu t podľa veľkosti, transformujeme rovnosť (2) do tvaru:

Teraz pomocou tabuľky pre náhodnú premennú t rozloženú podľa Studentovho zákona, s použitím pravdepodobnosti 1 - a počtu stupňov voľnosti n - 1, nájdeme t. Vzorec (3) dáva odpoveď na nastolený problém.

Úloha. Pri kontrolných testoch 20 elektrických lámp bola priemerná doba ich prevádzky 2000 hodín so štandardnou odchýlkou ​​(vypočítanou ako druhá odmocnina korigovaného rozptylu vzorky) 11 hodinami. Je známe, že prevádzkový čas lampy je normálne rozložená náhodná veličina. Určte so spoľahlivosťou 0,95 interval spoľahlivosti pre matematické očakávanie tejto náhodnej premennej.

Riešenie. Hodnota 1 – v tomto prípade sa rovná 0,05. Podľa Študentovej distribučnej tabuľky pri počte stupňov voľnosti rovným 19 zistíme: t = 2,093. Vypočítajme teraz presnosť odhadu: 2,093121/ = 56,6. Odtiaľto získame požadovaný interval spoľahlivosti: (1943,4; 2056,6).

Interval spoľahlivosti pre matematické očakávania - ide o interval vypočítaný z údajov, ktoré so známou pravdepodobnosťou obsahujú matematické očakávanie bežnej populácie. Prirodzeným odhadom matematického očakávania je aritmetický priemer jeho pozorovaných hodnôt. Preto v celej lekcii budeme používať pojmy „priemer“ a „priemerná hodnota“. Pri problémoch s výpočtom intervalu spoľahlivosti sa najčastejšie vyžaduje odpoveď niečo ako „Interval spoľahlivosti priemerného čísla [hodnota v konkrétnom probléme] je od [menšej hodnoty] po [väčšiu hodnotu].“ Pomocou intervalu spoľahlivosti môžete vyhodnotiť nielen priemerné hodnoty, ale aj podiel konkrétnej charakteristiky vo všeobecnej populácii. Priemerné hodnoty, rozptyl, smerodajná odchýlka a chyba, pomocou ktorých dospejeme k novým definíciám a vzorcom, sú diskutované v lekcii Charakteristika vzorky a populácie .

Bodové a intervalové odhady priemeru

Ak sa priemerná hodnota populácie odhaduje číslom (bodom), potom sa ako odhad neznámej priemernej hodnoty populácie berie konkrétny priemer, ktorý sa vypočíta zo vzorky pozorovaní. V tomto prípade sa hodnota výberového priemeru – náhodná premenná – nezhoduje so strednou hodnotou všeobecnej populácie. Preto pri uvádzaní priemernej hodnoty vzorky musíte súčasne uviesť chybu výberu vzorky. Mierou výberovej chyby je štandardná chyba, ktorá je vyjadrená v rovnakých jednotkách ako priemer. Preto sa často používa tento zápis: .

Ak je potrebné odhad priemeru spájať s určitou pravdepodobnosťou, potom treba parameter záujmu v populácii posudzovať nie jedným číslom, ale intervalom. Interval spoľahlivosti je interval, v ktorom s určitou pravdepodobnosťou P zistí sa hodnota odhadovaného ukazovateľa populácie. Interval spoľahlivosti, v ktorom je pravdepodobný P = 1 - α náhodná premenná sa nájde, vypočíta sa takto:

,

α = 1 - P, ktorý nájdete v prílohe takmer každej knihy o štatistike.

V praxi nie je známy priemer a rozptyl populácie, takže rozptyl populácie je nahradený rozptylom vzorky a priemer populácie priemerom vzorky. Interval spoľahlivosti sa teda vo väčšine prípadov vypočíta takto:

.

Vzorec intervalu spoľahlivosti možno použiť na odhad priemernej hodnoty populácie, ak

  • je známa štandardná odchýlka populácie;
  • alebo štandardná odchýlka populácie nie je známa, ale veľkosť vzorky je väčšia ako 30.

Priemer vzorky je nezaujatý odhad priemeru populácie. Na druhej strane, rozptyl vzorky nie je nestranný odhad rozptylu populácie. Na získanie nestranného odhadu rozptylu populácie vo vzorci rozptylu vzorky, veľkosť vzorky n by mal byť nahradený n-1.

Príklad 1 Zo 100 náhodne vybraných kaviarní v určitom meste bola zozbieraná informácia, že priemerný počet zamestnancov v nich je 10,5 so štandardnou odchýlkou ​​4,6. Určte 95% interval spoľahlivosti pre počet zamestnancov kaviarne.

kde je kritická hodnota štandardného normálneho rozdelenia pre hladinu významnosti α = 0,05 .

95 % interval spoľahlivosti pre priemerný počet zamestnancov kaviarní sa teda pohyboval od 9,6 do 11,4.

Príklad 2 Pre náhodnú vzorku z populácie 64 pozorovaní boli vypočítané tieto celkové hodnoty:

súčet hodnôt v pozorovaniach,

súčet štvorcových odchýlok hodnôt od priemeru .

Vypočítajte 95 % interval spoľahlivosti pre matematické očakávanie.

Vypočítajme štandardnú odchýlku:

,

Vypočítajme priemernú hodnotu:

.

Hodnoty dosadíme do výrazu pre interval spoľahlivosti:

kde je kritická hodnota štandardného normálneho rozdelenia pre hladinu významnosti α = 0,05 .

Dostaneme:

95 % interval spoľahlivosti pre matematické očakávanie tejto vzorky sa teda pohyboval od 7,484 do 11,266.

Príklad 3 Pre náhodnú vzorku populácie 100 pozorovaní je vypočítaný priemer 15,2 a štandardná odchýlka je 3,2. Vypočítajte 95 % interval spoľahlivosti pre očakávanú hodnotu a potom 99 % interval spoľahlivosti. Ak výkon vzorky a jej variácie zostanú nezmenené a koeficient spoľahlivosti sa zvýši, bude sa interval spoľahlivosti zužovať alebo rozširovať?

Tieto hodnoty dosadíme do výrazu pre interval spoľahlivosti:

kde je kritická hodnota štandardného normálneho rozdelenia pre hladinu významnosti α = 0,05 .

Dostaneme:

.

95 % interval spoľahlivosti pre priemer tejto vzorky sa teda pohyboval od 14,57 do 15,82.

Tieto hodnoty opäť dosadíme do výrazu pre interval spoľahlivosti:

kde je kritická hodnota štandardného normálneho rozdelenia pre hladinu významnosti α = 0,01 .

Dostaneme:

.

99 % interval spoľahlivosti pre priemer tejto vzorky sa teda pohyboval od 14,37 do 16,02.

Ako vidíme, so zvyšujúcim sa koeficientom spoľahlivosti sa zvyšuje aj kritická hodnota štandardného normálneho rozdelenia a následne sa začiatočné a koncové body intervalu nachádzajú ďalej od priemeru, a preto sa interval spoľahlivosti pre matematické očakávanie zvyšuje. .

Bodové a intervalové odhady špecifickej hmotnosti

Podiel niektorého atribútu vzorky možno interpretovať ako bodový odhad podielu p rovnakej charakteristiky v bežnej populácii. Ak je potrebné túto hodnotu spájať s pravdepodobnosťou, potom by sa mal vypočítať interval spoľahlivosti špecifickej hmotnosti p charakteristika v populácii s pravdepodobnosťou P = 1 - α :

.

Príklad 4. V niektorom meste sú dvaja kandidáti A A B kandidujú na primátora. Náhodným prieskumom bolo 200 obyvateľov mesta, z ktorých 46 % odpovedalo, že by volili kandidáta A, 26 % - pre kandidáta B a 28 % nevie, koho budú voliť. Určte 95 % interval spoľahlivosti pre podiel obyvateľov mesta, ktorí kandidáta podporujú A.

Pomocou tohto vyhľadávacieho formulára môžete nájsť úlohu, ktorú potrebujete. Zadajte slovo, frázu z úlohy alebo jej číslo, ak ho poznáte.


Hľadať iba v tejto sekcii


Intervaly spoľahlivosti: zoznam riešení problémov

Intervaly spoľahlivosti: teória a problémy

Pochopenie intervalov spoľahlivosti

Stručne predstavme pojem interval spoľahlivosti, ktorý
1) odhaduje niektorý parameter numerickej vzorky priamo z údajov samotnej vzorky,
2) pokrýva hodnotu tohto parametra s pravdepodobnosťou γ.

Interval spoľahlivosti pre parameter X(s pravdepodobnosťou γ) sa nazýva interval tvaru , taký, že a hodnoty sa nejakým spôsobom vypočítajú zo vzorky.

Zvyčajne sa v aplikovaných úlohách berie pravdepodobnosť spoľahlivosti rovnajúca sa γ ​​= 0,9; 0,95; 0,99.

Uvažujme nejakú vzorku veľkosti n, vyrobenú zo všeobecnej populácie, rozloženú pravdepodobne podľa zákona o normálnom rozdelení. Ukážme si, aké vzorce sa používajú na nájdenie intervaly spoľahlivosti pre distribučné parametre- matematické očakávanie a rozptyl (štandardná odchýlka).

Interval spoľahlivosti pre matematické očakávania

Prípad 1. Rozptyl rozdelenia je známy a rovný . Potom interval spoľahlivosti pre parameter a má tvar:
t určená z Laplaceovej tabuľky rozdelenia podľa vzťahu

Prípad 2 Rozptyl rozdelenia nie je známy, zo vzorky sa vypočíta bodový odhad rozptylu. Potom interval spoľahlivosti pre parameter a má tvar:
, kde je výberový priemer vypočítaný z výberového, parametra t určená z tabuľky rozdelenia študentov

Príklad. Na základe 7 meraní určitej veličiny bol zistený priemer výsledkov merania 30 a rozptyl vzorky 36. Nájdite hranice, v ktorých sa nachádza skutočná hodnota meranej veličiny so spoľahlivosťou 0,99.

Riešenie. nájdeme . Potom sa medze spoľahlivosti pre interval obsahujúci skutočnú hodnotu nameranej hodnoty dajú nájsť pomocou vzorca:
, kde je výberový priemer, je výberový rozptyl. Nahradíme všetky hodnoty a získame:

Interval spoľahlivosti pre rozptyl

Domnievame sa, že všeobecne povedané, matematické očakávanie je neznáme a známy je len bodový nezaujatý odhad rozptylu. Potom má interval spoľahlivosti tvar:
, Kde - distribučné kvantily určené z tabuliek.

Príklad. Na základe údajov zo 7 testov bola zistená hodnotiaca hodnota pre smerodajnú odchýlku s=12. Nájdite s pravdepodobnosťou 0,9 šírku intervalu spoľahlivosti skonštruovaného na odhad rozptylu.

Riešenie. Interval spoľahlivosti pre neznámy rozptyl populácie možno nájsť pomocou vzorca:

Nahradíme a získame:


Potom je šírka intervalu spoľahlivosti 465,589-71,708=393,881.

Interval spoľahlivosti pre pravdepodobnosť (proporcia)

Prípad 1. Nech je v úlohe známa veľkosť vzorky a frakcia vzorky (relatívna frekvencia). Potom má interval spoľahlivosti pre všeobecný podiel (skutočná pravdepodobnosť) tvar:
, kde je parameter t sa určí z Laplaceovej distribučnej tabuľky pomocou vzťahu.

Prípad 2 Ak je v úlohe dodatočne známa celková veľkosť populácie, z ktorej bola vzorka odobratá, interval spoľahlivosti pre všeobecný podiel (skutočnú pravdepodobnosť) možno nájsť pomocou upraveného vzorca:
.

Príklad. Je známe, že Nájdite hranice, v rámci ktorých je pravdepodobné, že bude obsiahnutý všeobecný podiel.

Riešenie. Používame vzorec:

Nájdite parameter z podmienky , dostaneme Substitute do vzorca:


Ďalšie príklady úloh v matematickej štatistike nájdete na stránke

Nech CB X tvorí všeobecnú populáciu a nech β je neznámy parameter CB X. Ak je štatistický odhad v * konzistentný, potom čím väčšia je veľkosť vzorky, tým presnejšie dostaneme hodnotu β. V praxi však nemáme veľmi veľké vzorky, takže nemôžeme zaručiť väčšiu presnosť.

Nech b* je štatistický odhad pre c. Hodnota |in* - in| sa nazýva presnosť odhadu. Je jasné, že presnosť je CB, pretože β* je náhodná veličina. Zadajte malé kladné číslo 8 a požadujte presnosť odhadu |в* - в| bolo menej ako 8, t.j. | v* - v |< 8.

Spoľahlivosť g alebo pravdepodobnosť spoľahlivosti odhadu v v * je pravdepodobnosť g, s ktorou nerovnosť |in * - in|< 8, т. е.

Spoľahlivosť g je zvyčajne špecifikovaná vopred a g sa považuje za číslo blízke 1 (0,9; 0,95; 0,99; ...).

Pretože nerovnosť |v * - v|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Interval (v * - 8, v * + 5) sa nazýva interval spoľahlivosti, t. j. interval spoľahlivosti pokrýva neznámy parameter s pravdepodobnosťou y. Všimnite si, že konce intervalu spoľahlivosti sú náhodné a líšia sa od vzorky k vzorke, takže je presnejšie povedať, že interval (v * - 8, v * + 8) pokrýva neznámy parameter skôr ako v patrí do tohto intervalu. interval.

Nech je populácia definovaná náhodnou premennou X, rozdelenou podľa normálneho zákona a štandardná odchýlka a je známa. Neznáma je matematické očakávanie a = M (X). Je potrebné nájsť interval spoľahlivosti pre a pre danú spoľahlivosť y.

Ukážkový priemer

je štatistický odhad pre xr = a.

Veta. Náhodná premenná xB má normálne rozdelenie, ak X má normálne rozdelenie a M (XB) = a,

A (XB) = a, kde a = y/B (X), a = M (X). l/i

Interval spoľahlivosti pre a má tvar:

Nájdeme 8.

Pomocou pomeru

kde Ф(r) je Laplaceova funkcia, máme:

P ( | XB - a |<8} = 2Ф

v tabuľke hodnôt Laplaceovej funkcie nájdeme hodnotu t.

Po určení

T, dostaneme F(t) = g Keďže g je dané, potom by

Z rovnosti zistíme, že odhad je presný.

To znamená, že interval spoľahlivosti pre a má tvar:

Vzhľadom na vzorku populácie X

ng do" X2 Xm
n. n1 n2 nm

n = U1 + ... + nm, potom bude interval spoľahlivosti:

Príklad 6.35. Nájdite interval spoľahlivosti pre odhad matematického očakávania a normálneho rozdelenia so spoľahlivosťou 0,95, ak poznáte priemer vzorky Xb = 10,43, veľkosť vzorky n = 100 a smerodajnú odchýlku s = 5.

Použime vzorec

KATEGÓRIE

POPULÁRNE ČLÁNKY

2023 „kingad.ru“ - ultrazvukové vyšetrenie ľudských orgánov