Odhad matematického očakávania náhodnej premennej. Bodové odhady matematického očakávania

Nech existuje náhodná premenná X s matematickým očakávaním m a rozptyl D, pričom oba tieto parametre nie sú známe. Nad magnitúdou X vyrobené N nezávislých experimentov, ktorých výsledkom bol súbor Nčíselné výsledky x 1 , x 2 , ..., x N. Ako odhad matematického očakávania je prirodzené navrhnúť aritmetický priemer pozorovaných hodnôt

(1)

Tu ako x i konkrétne hodnoty (čísla) získané ako výsledok N experimenty. Ak vezmeme iných (nezávisle od predchádzajúcich) N experimenty, potom, samozrejme, dostaneme inú hodnotu. Ak si vezmete viac N experimentov, získame ešte jednu novú hodnotu . Označiť podľa X i náhodná premenná vyplývajúca z i experiment, potom realizácie X i budú čísla získané ako výsledok týchto experimentov. Je zrejmé, že náhodná premenná X i bude mať rovnakú hustotu rozdelenia pravdepodobnosti ako pôvodná náhodná premenná X. Tiež predpokladáme, že náhodné premenné X i a Xj sú nezávislé na i, nerovná sa j(rôzne navzájom nezávislé experimenty). Preto vzorec (1) prepíšeme do inej (štatistickej) formy:

(2)

Ukážme, že odhad je nezaujatý:

Matematické očakávanie priemeru vzorky sa teda rovná skutočnému matematickému očakávaniu náhodnej premennej m. To je pomerne predvídateľný a pochopiteľný fakt. Preto možno výberový priemer (2) brať ako odhad matematického očakávania náhodnej premennej. Teraz vyvstáva otázka: čo sa stane s rozptylom odhadu očakávania, keď sa počet experimentov zvýši? Ukazujú to analytické výpočty

kde je rozptyl odhadu matematického očakávania (2), a D- skutočný rozptyl náhodnej premennej X.

Z uvedeného vyplýva, že so zväčš N(počet experimentov) klesá rozptyl odhadu, t.j. čím viac zosumarizujeme nezávislé implementácie, tým bližšie k očakávanej hodnote sa dostaneme k odhadu.


Matematické odhady rozptylu

Na prvý pohľad sa zdá byť najprirodzenejší odhad

(3)

kde sa vypočíta podľa vzorca (2). Skontrolujte, či je odhad nezaujatý. Vzorec (3) možno napísať takto:

Do tohto vzorca dosadíme výraz (2):

Poďme nájsť matematické očakávanie odhadu rozptylu:

(4)

Keďže rozptyl náhodnej premennej nezávisí od toho, aké je matematické očakávanie náhodnej premennej, vezmeme matematické očakávanie rovné 0, t.j. m = 0.

(5)
v .(6)

Nech existuje náhodná premenná X a jej parametre sú matematické očakávanie a a rozptyl nie sú známe. Nad hodnotou X sa uskutočnili nezávislé experimenty, ktoré poskytli výsledky x 1, x 2, x n.

Bez toho, aby sme znížili všeobecnosť uvažovania, budeme tieto hodnoty náhodnej premennej považovať za odlišné. Hodnoty x 1, x 2, x n budeme považovať za nezávislé, identicky rozdelené náhodné premenné X 1, X 2, X n .

Najjednoduchšia metóda štatistického odhadu - metóda substitúcie a analógie - spočíva v tom, že ako odhad jednej alebo druhej numerickej charakteristiky (priemer, rozptyl atď.) všeobecnej populácie berú zodpovedajúcu charakteristiku rozdelenia vzorky. - charakteristika vzorky.

Substitučnou metódou ako odhad matematického očakávania a je potrebné vziať matematické očakávanie rozdelenia vzorky - výberový priemer. Tak dostaneme

Testovať nezaujatosť a konzistentnosť priemernej vzorky ako odhadov a, považujte túto štatistiku za funkciu zvoleného vektora (X 1, X 2, X n). Ak vezmeme do úvahy, že každá z veličín X 1, X 2, X n má rovnaký distribučný zákon ako veličina X, dospejeme k záveru, že číselné charakteristiky týchto veličín a veličiny X sú rovnaké: M(X i) = M(X) = a, D(X i) = D(X) = , i = 1, 2, č , kde X i sú kolektívne nezávislé náhodné premenné.

v dôsledku toho

Z definície teda získame, že ide o nezaujatý odhad a, a keďže D()®0 ako n®¥, potom na základe vety z predchádzajúceho odseku je konzistentný odhad očakávania a všeobecná populácia.

Účinnosť alebo neefektívnosť odhadu závisí od tvaru distribučného zákona náhodnej premennej X. Dá sa dokázať, že ak je hodnota X rozdelená podľa normálneho zákona, potom je odhad efektívny. V prípade iných distribučných zákonov to tak nemusí byť.

Nezaujatý odhad všeobecného rozptylu je korigovaný rozptyl vzorky

,

Pretože , kde je všeobecný rozptyl. naozaj,

Odhad s -- 2 pre všeobecný rozptyl je tiež konzistentný, ale nie efektívny. V prípade normálneho rozdelenia je však „asymptoticky efektívny“, to znamená, že ako n rastie, pomer jeho rozptylu k minimálnemu možnému sa blíži neurčito.

Takže ak vezmeme vzorku z distribúcie F( X) náhodná premenná X s neznámym matematickým očakávaním a a disperzie, potom na výpočet hodnôt týchto parametrov máme právo použiť nasledujúce približné vzorce:

a ,

.

Tu x-i- - možnosti vzorkovania, n-i - - frekvenčné možnosti x i , - - veľkosť vzorky.
Na výpočet korigovaného rozptylu vzorky je vhodnejší vzorec


.

Pre zjednodušenie výpočtu je vhodné prejsť na podmienené možnosti (za c) je výhodné brať počiatočný variant nachádzajúci sa v strede intervalového variačného radu. Potom

, .

intervalový odhad

Vyššie sme uvažovali o otázke odhadu neznámeho parametra a jedno číslo. Takéto odhady sme nazvali bodové odhady. Majú tú nevýhodu, že pri malej veľkosti vzorky sa môžu výrazne líšiť od odhadovaných parametrov. Preto, aby sme získali predstavu o blízkosti medzi parametrom a jeho odhadom, sú v matematickej štatistike zavedené takzvané intervalové odhady.

Nech sa vo vzorke nájde bodový odhad q * pre parameter q. Zvyčajne sú výskumníci vopred daných nejakou dostatočne veľkou pravdepodobnosťou g (napríklad 0,95; 0,99 alebo 0,999) tak, že udalosť s pravdepodobnosťou g možno považovať za prakticky istú, a nastoľujú otázku nájdenia takejto hodnoty e > 0 pre ktoré

.

Úpravou tejto rovnosti dostaneme:

av tomto prípade povieme, že interval ]q * - e; q * + e[ pokrýva odhadnutý parameter q s pravdepodobnosťou g.

interval ]q * -e; q * +e [ sa nazýva interval spoľahlivosti .

Pravdepodobnosť g sa nazýva spoľahlivosť (pravdepodobnosť spoľahlivosti) odhad intervalu.

Konce intervalu spoľahlivosti, t.j. sa nazývajú body q * -e a q * +e hranice dôvery .

Volá sa číslo e presnosť hodnotenia .

Ako príklad problému určenia hraníc spoľahlivosti zvážte otázku odhadu matematického očakávania náhodnej premennej X, ktorá má zákon normálneho rozdelenia s parametrami a a s, t.j. X = N( a, s). Matematické očakávanie sa v tomto prípade rovná a. Podľa pozorovaní X1, X2, Xn vypočítajte priemer a hodnotenie disperzia s 2 .

Ukazuje sa, že podľa vzorových údajov je možné skonštruovať náhodnú premennú

ktorý má Studentovo rozdelenie (alebo t-rozdelenie) s n = n -1 stupňami voľnosti.

Využime tabuľku A.1.3 a nájdime pre danú pravdepodobnosť g a číslo n číslo t g také, že pravdepodobnosť

P(|t(n)|< t g) = g,

.

Po vykonaní zrejmých transformácií dostaneme

Postup na uplatnenie kritéria F je nasledujúci:

1. Predpokladá sa normálne rozloženie populácií. Na danej hladine významnosti a je formulovaná nulová hypotéza H 0: s x 2 = s y 2 o rovnosti všeobecných rozptylov normálnych populácií podľa konkurenčnej hypotézy H 1: s x 2 > s y 2 .

2. Z populácií X a Y n x a n y sa získajú dve nezávislé vzorky.

3. Vypočítajte hodnoty korigovaných výberových rozptylov s x 2 a s y 2 (metódy výpočtu sú uvedené v §13.4). Väčšia z disperzií (s x 2 alebo sy 2) je označená s 1 2, menšia - s 2 2.

4. Hodnota F-kritéria sa vypočíta podľa vzorca F obs = s 1 2 / s 2 2 .

5. Podľa tabuľky kritických bodov distribúcie Fisher - Snedecor pre danú hladinu významnosti a a počet stupňov voľnosti n 1 \u003d n 1 - 1, n 2 \u003d n 2 - 1 (n 1 je počet stupňov voľnosti väčšieho korigovaného rozptylu), kritický bod sa zistí F cr (a, n 1, n 2).

Všimnite si, že tabuľka A.1.7 zobrazuje kritické hodnoty jednostranného F-kritéria. Ak sa teda použije obojstranné kritérium (H 1: s x 2 ¹ s y 2), potom sa pravý kritický bod F cr (a / 2, n 1, n 2) hľadá podľa hladiny významnosti a / 2 (polovica zadanej hodnoty) a počet stupňov voľnosti n 1 a n 2 (n 1 - počet stupňov voľnosti väčšieho rozptylu). Kritický bod pre ľavú ruku sa nemusí nájsť.

6. Dospelo sa k záveru, že ak je vypočítaná hodnota F-kritéria väčšia alebo rovná kritickej (F obs ³ F cr), potom sa rozptyly na danej hladine významnosti výrazne líšia. V opačnom prípade (F obs< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Úloha 15.1. Spotreba surovín na jednotku výroby podľa starej technológie bola:

Nová technológia:

Za predpokladu, že zodpovedajúce všeobecné populácie X a Y majú normálne rozdelenie, skontrolujte, či sa spotreba surovín pre nové a staré technológie nelíši vo variabilite, ak vezmeme hladinu významnosti a = 0,1.

Riešenie. Konáme vo vyššie uvedenom poradí.

1. Budeme posudzovať variabilitu spotreby surovín pre nové a staré technológie z hľadiska rozptylových hodnôt. Nulová hypotéza má teda tvar H 0: s x 2 = s y 2 . Ako konkurenčnú hypotézu akceptujeme hypotézu H 1: s x 2 ¹ s y 2, pretože si vopred nie sme istí, že niektorý zo všeobecných rozptylov je väčší ako druhý.

2-3. Nájdite vzorové odchýlky. Na zjednodušenie výpočtov prejdime na podmienené možnosti:

u i = x i - 307, v i = y i - 304.

Všetky výpočty usporiadame vo forme nasledujúcich tabuliek:

u i m i m i u i ja u i 2 m i (u i +1) 2 v i n i n i v i n i v i 2 n i (v i +1) 2
-3 -3 -1 -2
å -
å -

Kontrola: å m i u i 2 + 2å m i u i + m i = Kontrola: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Nájdite opravené odchýlky vzorky:

4. Porovnajte odchýlky. Nájdite pomer väčšieho korigovaného rozptylu k menšiemu:

.

5. Konkurenčná hypotéza má podľa podmienky tvar s x 2 ¹ s y 2, teda kritická oblasť je obojstranná a pri hľadaní kritického bodu treba brať hladiny významnosti polovičné oproti danej.

Podľa tabuľky A.1.7 pri hladine významnosti a/2 = 0,1/2 = 0,05 a počte stupňov voľnosti n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8 zistíme kritický bod Fcr ( 0,05; 12; 8) = 3,28.

6. Keďže F obl.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.

Vyššie, pri testovaní hypotéz sa predpokladalo, že distribúcia študovaných náhodných premenných bola normálna. Špeciálne štúdie však ukázali, že navrhované algoritmy sú veľmi stabilné (najmä pri veľkých veľkostiach vzoriek) vzhľadom na odchýlku od normálneho rozdelenia.

Distribučné parametre a štatistiky

Akékoľvek parametre distribúcie náhodnej premennej, ako je napríklad matematické očakávanie alebo rozptyl, sú teoretické hodnoty, ktoré nie sú priamo merateľné, hoci ich možno odhadnúť. Sú kvantitatívne populácia a môžu byť stanovené samy osebe iba v priebehu teoretického modelovania ako hypotetické hodnoty, pretože opisujú vlastnosti distribúcie náhodnej premennej v samotnej všeobecnej populácii. Aby ich bolo možné v praxi určiť, výskumník vykonávajúci experiment vykonáva ich selektívne vyhodnotenie. Takéto hodnotenie zahŕňa štatistický výpočet.

Štatistiky predstavuje kvantitatívnu charakteristiku študovaných parametrov charakterizujúcich rozdelenie náhodnej premennej, získanú na základe štúdia hodnôt vzorky. Štatistika sa používa buď na opis samotnej vzorky, alebo, čo má prvoradý význam v základnom experimentálnom výskume, na odhadovanie distribučných parametrov náhodnej premennej vo všeobecnej študovanej populácii.

Separácia pojmov "parameter" a "štatistiky" je veľmi dôležité, pretože umožňuje vyhnúť sa množstvu chýb spojených s nesprávnou interpretáciou údajov získaných v experimente. Faktom je, že keď odhadneme parametre rozdelenia pomocou štatistických údajov, dostaneme hodnoty, ktoré sa len do určitej miery približujú odhadovaným parametrom. Medzi parametrami a štatistikami je takmer vždy nejaký rozdiel a zvyčajne nevieme povedať, aký veľký je tento rozdiel. Teoreticky, čím väčšia vzorka, tým bližšie sú odhadované parametre k ich vzorovým charakteristikám. To však neznamená, že zvýšením veľkosti vzorky sa nevyhnutne priblížime k odhadovanému parametru, znížime rozdiel medzi ním a vypočítanou štatistikou. V praxi sa veci môžu ukázať oveľa komplikovanejšie.

Ak sa teoreticky očakávaná hodnota štatistiky zhoduje s odhadovaným parametrom, potom sa takýto odhad nazýva nezaujatý. Volá sa odhad, v ktorom sa očakávaná hodnota odhadovaného parametra líši od samotného parametra o nejakú hodnotu vysídlený.

Taktiež je potrebné rozlišovať medzi bodovými a intervalovými odhadmi distribučných parametrov. bodkovaný volal odhad pomocou nejakého čísla. Ak napríklad uvedieme, že hodnota priestorového prahu hmatovej citlivosti pre daný subjekt za daných podmienok a na danej ploche pokožky je 21,8 mm, potom bude takéto hodnotenie bodovým odhadom. Podobne bodový odhad nastáva, keď nám meteorologická správa hovorí, že vonku je 25°C. Odhad intervalu zahŕňa použitie množiny alebo rozsahu čísel pri hodnotení. Pri hodnotení priestorového prahu hmatovej citlivosti môžeme povedať, že sa ukázal byť v rozsahu od 20 do 25 mm. Podobne môžu meteorológovia hlásiť, že podľa ich predpovedí teplota vzduchu v najbližších 24 hodinách dosiahne 22-24°C. Intervalový odhad náhodnej premennej nám umožňuje nielen určiť požadovanú hodnotu tejto premennej, ale aj nastaviť možnú presnosť pre takýto odhad.

Matematické očakávanie a jeho vyhodnotenie

Vráťme sa k našej skúsenosti s hádzaním mincí.

Skúsme si odpovedať na otázku: koľkokrát by mal „orol“ vypadnúť, ak si desaťkrát hodíme mincou? Zdá sa, že odpoveď je zrejmá. Ak sú pravdepodobnosti každého z týchto dvoch výsledkov rovnaké, potom samotné výsledky musia byť rovnomerne rozdelené. Inými slovami, keď sa obyčajnou mincou hodí desaťkrát, máme právo očakávať, že jedna z jej strán, napríklad „hlavy“, vypadne presne päťkrát. Podobne, keď je mincou hodená 100-krát, hlavy by mali vypadnúť presne 50-krát, a ak je minca hodená 4236-krát, potom by sa strana, ktorá nás zaujíma, mala objaviť 2118-krát, nie viac a nie menej.

Zvyčajne sa teda nazýva teoretická hodnota náhodnej udalosti matematické očakávanie. Matematické očakávanie možno nájsť vynásobením teoretickej pravdepodobnosti náhodnej premennej počtom pokusov. Formálnejšie je však definovaný ako ústredný moment prvého rádu. Matematické očakávanie je teda hodnota náhodnej premennej, ku ktorej teoreticky inklinuje počas opakovaných testov, voči ktorej sa mení.

Je zrejmé, že teoretická hodnota matematického očakávania ako distribučného parametra sa nie vždy rovná empirickej hodnote pre nás zaujímavej náhodnej premennej, vyjadrenej v štatistike. Ak experiment urobíme hodom mincou, je dosť pravdepodobné, že z desiatich výsledkov padnú hlavy len štyri-trikrát, alebo možno, naopak, osemkrát, alebo možno nikdy. . Je jasné, že niektoré z týchto výsledkov sú pravdepodobnejšie, iné menej pravdepodobné. Ak použijeme zákon normálneho rozdelenia, môžeme dospieť k záveru, že čím viac sa výsledok odchyľuje od teoreticky očakávaného, ​​daného hodnotou matematického očakávania, tým je v praxi menej pravdepodobný.

Predpokladajme ďalej, že sme tento postup vykonali niekoľkokrát a nikdy sme nedodržali teoreticky očakávanú hodnotu. Potom môžeme mať pochybnosti o pravosti mince. Môžeme predpokladať, že naša minca v skutočnosti nemá 50% šancu, že sa dostane do popredia. V tomto prípade môže byť potrebné odhadnúť pravdepodobnosť tejto udalosti a podľa toho aj hodnotu matematického očakávania. Takáto potreba vzniká vždy, keď v experimente skúmame rozdelenie spojitej náhodnej premennej, ako je reakčný čas, bez toho, aby sme vopred mali nejaký teoretický model. Spravidla ide o prvý povinný krok v priebehu kvantitatívneho spracovania výsledkov experimentu.

Matematické očakávanie možno odhadnúť tromi spôsobmi, ktoré v praxi môžu dávať mierne odlišné výsledky, ale teoreticky by nás určite mali priviesť k hodnote matematického očakávania.

Logika takéhoto hodnotenia je znázornená na obr. 1.2. Matematické očakávanie možno považovať za ústrednú tendenciu v rozdelení náhodnej premennej X, ako jeho najpravdepodobnejšiu a teda najčastejšiu hodnotu a ako bod rozdeľujúci rozdelenie na dve rovnaké časti.

Ryža. 1.2.

Pokračujme v našich imaginárnych pokusoch s mincou a vykonajte tri pokusy s desaťnásobným hodom mincou. Predpokladajme, že v prvom experimente „orol“ vypadol štyrikrát, to isté sa stalo v druhom experimente, v treťom experimente „orol“ vypadol viac ako jedenapolkrát častejšie – sedemkrát. Je logické predpokladať, že matematické očakávanie udalosti, ktorá nás zaujíma, v skutočnosti leží niekde medzi týmito hodnotami.

Prvý, prvok metóda posudzovania matematické očakávanie bude spočívať v nájdení aritmetický priemer. Potom bude odhad očakávanej hodnoty na základe vyššie uvedených troch meraní (4 + 4 + 7) / 3 = 5. Podobne v experimentoch s reakčným časom možno očakávanú hodnotu odhadnúť výpočtom aritmetického priemeru všetkých získaných hodnôt. X. Ak sme teda strávili P merania reakčného času X, potom môžeme na výpočet aritmetického priemeru použiť nasledujúci vzorec, ktorý nám to ukazuje X je potrebné sčítať všetky empiricky získané hodnoty a rozdeliť ich počtom pozorovaní:

Vo vzorci (1.2) sa miera matematického očakávania zvyčajne označuje ako ̅ X (čítaj ako "x s čiarou"), hoci niekedy to môže byť označené ako M (z angličtiny. priemerný - priemer).

Aritmetický priemer je najčastejšie používaný odhad matematického očakávania. V takýchto prípadoch sa predpokladá, že meranie náhodnej premennej sa vykonáva v metrický stupnica. Je jasné, že získaný výsledok sa môže, ale nemusí zhodovať so skutočnou hodnotou matematického očakávania, ktoré nikdy nepoznáme. Je však dôležité, aby táto metóda bola nezaujatý odhad matematického očakávania. To znamená, že očakávaná hodnota odhadovanej hodnoty sa rovná jej matematickému očakávaniu: .

Druhý spôsob hodnotenia Matematické očakávanie spočíva v tom, že za svoju hodnotu vezmeme najčastejšie sa vyskytujúcu hodnotu premennej, ktorá nás zaujíma. Táto hodnota sa nazýva distribučná móda. Napríklad v práve uvažovanom prípade hodu mincou možno hodnotu „štyri“ považovať za hodnotu matematického očakávania, pretože v troch uskutočnených pokusoch sa táto hodnota objavila dvakrát; preto sa režim distribúcie v tomto prípade ukázal ako rovný štyrom. Odhad režimu sa používa hlavne vtedy, keď sa experimentátor zaoberá premennými, ktoré nadobúdajú diskrétne hodnoty dané v nemetrické stupnica.

Napríklad popisom rozloženia známok študentov na skúške je možné zostaviť rozdelenie frekvencií známok študentov. Toto rozdelenie frekvencií sa nazýva histogram. V tomto prípade možno najbežnejší odhad brať ako hodnotu centrálneho trendu (matematické očakávanie). Pri štúdiu premenných charakterizovaných spojitými hodnotami sa toto meradlo prakticky nepoužíva alebo len zriedkavo. Ak je frekvenčné rozdelenie získaných výsledkov napriek tomu skonštruované, potom sa to spravidla netýka hodnôt študovaného znaku získaných v experimente, ale niektorých intervalov jeho prejavu. Napríklad pri skúmaní výšky ľudí môžete vidieť, koľko ľudí spadá do intervalu do 150 cm výšky, koľko spadá do intervalu od 150 do 155 cm atď. V tomto prípade bude režim súvisieť s intervalovými hodnotami študovaného znaku, v tomto prípade s rastom.

Je jasné, že modus, podobne ako aritmetický priemer, sa môže, ale nemusí zhodovať so skutočnou hodnotou matematického očakávania. Ale rovnako ako aritmetický priemer, aj režim je nezaujatým odhadom matematického očakávania.

Dodávame, že ak sa dve hodnoty vo vzorke vyskytujú rovnako často, potom sa takéto rozdelenie nazýva bimodálne. Ak sa tri alebo viac hodnôt vo vzorke vyskytuje rovnako často, potom sa o takejto vzorke hovorí, že nemá žiadny režim. Takéto prípady s dostatočne veľkým počtom pozorovaní spravidla naznačujú, že údaje sú extrahované zo všeobecnej populácie, pričom povaha distribúcie sa líši od normálneho.

nakoniec tretí spôsob hodnotenia Matematické očakávanie je rozdeliť vzorku predmetov podľa parametra, ktorý nás zaujíma, presne na polovicu. Hodnota charakterizujúca túto hranicu je tzv medián distribúcia.

Predpokladajme, že sme prítomní na lyžiarskych pretekoch a po ich skončení chceme vyhodnotiť, ktorý zo športovcov vykázal nadpriemerný výsledok a ktorý pod. Ak je zloženie účastníkov viac-menej rovnomerné, potom pri hodnotení priemerného výsledku je logické vypočítať aritmetický priemer. Predpokladajme však, že medzi profesionálnymi účastníkmi je niekoľko amatérov. Nie je ich veľa, ale vykazujú výsledky, ktoré sú výrazne horšie ako ostatné. V tomto prípade sa môže ukázať, že napríklad zo 100 účastníkov súťaže vykázalo nadpriemerný výsledok 87. Je jasné, že takéto hodnotenie priemerného trendu nám nemôže vždy vyhovovať. V tomto prípade je logické predpokladať, že priemerný výsledok vykázali účastníci, ktorí sa umiestnili niekde na 50. alebo 51. mieste. Toto bude stredná hodnota distribúcie. Pred 50. finalistom skončilo 49 účastníkov, po 51. 49. Samozrejme, môže sa ukázať, že skončili s rovnakým časom. Potom nie je problém. Problém nie je ani vtedy, keď je počet pozorovaní nepárny. V ostatných prípadoch však môžete použiť spriemerovanie výsledkov dvoch účastníkov.

Medián je špeciálny prípad kvantilu rozdelenia. kvantil je súčasťou distribúcie. Formálne ho možno definovať ako integrálnu hodnotu rozdelenia medzi dvoma hodnotami premennej X. Teda hodnota X bude mediánom rozdelenia, ak integrálna hodnota rozdelenia (hustota pravdepodobnosti) je od -∞ do X sa rovná integrálnej hodnote rozdelenia z X až do +∞. Podobne sa dá distribúcia rozdeliť na štyri, desať alebo 100 častí. Takéto kvantily sa resp kvartily, decily a percentily. Existujú aj iné typy kvantilov.

Rovnako ako dve predchádzajúce metódy na odhad matematického očakávania, medián je nezaujatý odhad matematického očakávania.

Teoreticky sa predpokladá, že ak skutočne máme do činenia s normálnym rozdelením náhodnej premennej, potom by všetky tri odhady matematického očakávania mali dať rovnaký výsledok, pretože všetky predstavujú variant nezaujatý odhady rovnakého distribučného parametra odhadovanej náhodnej premennej (pozri obr. 1.2). V praxi sa to však stáva len zriedka. Môže to byť spôsobené najmä tým, že analyzované rozdelenie sa líši od normálneho. Ale hlavným dôvodom takýchto nezrovnalostí je spravidla to, že odhadom hodnoty matematického očakávania možno získať hodnotu, ktorá sa veľmi výrazne líši od jeho skutočnej hodnoty. Ako je však uvedené vyššie, v matematickej štatistike sa dokázalo, že čím viac nezávislých testov posudzovanej premennej sa vykoná, tým bližšie by sa odhadovaná hodnota mala priblížiť skutočnej hodnote.

V praxi teda výber metódy na odhad matematického očakávania nie je určený túžbou získať presnejší a spoľahlivejší odhad tohto parametra, ale iba úvahami o vhodnosti. Určitú úlohu pri výbere metódy odhadu matematického očakávania zohráva aj meracia stupnica, ktorá odráža pozorovania odhadovanej náhodnej veličiny.

Nechajte náhodnú premennú s neznámym matematickým očakávaním a rozptylom podrobiť nezávislým experimentom, ktoré priniesli výsledky - . Vypočítajme konzistentné a nestranné odhady parametrov a .

Ako odhad matematického očakávania berieme aritmetický priemer experimentálnych hodnôt

. (2.9.1)

Podľa zákona veľkých čísel je tento odhad bohatý , s veľkosťou v pravdepodobnosti. Rovnaký odhad je nezaujatý , pretože

. (2.9.2)

Rozptyl tohto odhadu je

. (2.9.3)

Dá sa ukázať, že pre normálne rozdelenie je tento odhad efektívne . V prípade iných zákonov to tak nemusí byť.

Poďme teraz odhadnúť rozptyl. Najprv si vyberieme vzorec na odhad štatistický rozptyl

. (2.9.4)

Skontrolujme konzistenciu odhadu rozptylu. Otvorme zátvorky vo vzorci (2.9.4)

.

Pre , prvý člen konverguje v pravdepodobnosti k kvantite , v druhom - až . Náš odhad teda konverguje v pravdepodobnosti k rozptylu

,

teda ona je bohatý .

Skontrolujme to nezaujatosť odhady pre množstvo. Aby sme to dosiahli, dosadíme výraz (2.9.1) do vzorca (2.9.4) a vezmeme do úvahy, že náhodné premenné nezávislý

,

. (2.9.5)

Prejdime vo vzorci (2.9.5) k fluktuáciám náhodných veličín

Rozšírením zátvoriek dostaneme

,

. (2.9.6)

Vypočítajme matematické očakávanie hodnoty (2.9.6), pričom to vezmeme do úvahy

. (2.9.7)

Vzťah (2.9.7) ukazuje, že hodnota vypočítaná podľa vzorca (2.9.4) nie je nezaujatým odhadom na rozptýlenie. Jeho matematické očakávania nie sú rovnaké, ale o niečo menšie. Takýto odhad vedie k zostupnej systematickej chybe. Na odstránenie takéhoto skreslenia je potrebné zaviesť korekciu vynásobením nie hodnoty . Potom takýto korigovaný štatistický rozptyl môže slúžiť ako nezaujatý odhad rozptylu

. (2.9.8)

Tento odhad je rovnako konzistentný ako odhad , pretože pre .

V praxi je niekedy vhodnejšie použiť namiesto odhadu (2.9.8) ekvivalentný odhad týkajúci sa druhého počiatočného štatistického momentu

. (2.9.9)

Odhady (2.9.8), (2.9.9) nie sú efektívne. Dá sa ukázať, že v prípade normálneho rozdelenia budú asymptoticky účinné (kedy bude smerovať k minimálnej možnej hodnote).

Je teda možné sformulovať nasledujúce pravidlá spracovania obmedzeného štatistického materiálu. Ak v nezávislých experimentoch náhodná premenná nadobúda hodnoty s neznámym matematickým očakávaním a rozptylom , potom na určenie týchto parametrov treba použiť približné odhady

(2.9.10)

Koniec práce -

Táto téma patrí:

Poznámky z prednášok z matematiky, teórie pravdepodobnosti, matematickej štatistiky

Katedra vyššej matematiky a informatiky.. prednášky.. z matematiky..

Ak potrebujete ďalší materiál k tejto téme, alebo ste nenašli to, čo ste hľadali, odporúčame použiť vyhľadávanie v našej databáze diel:

Čo urobíme s prijatým materiálom:

Ak sa tento materiál ukázal byť pre vás užitočný, môžete si ho uložiť na svoju stránku v sociálnych sieťach:

Všetky témy v tejto sekcii:

Teória pravdepodobnosti
Teória pravdepodobnosti je oblasť matematiky, ktorá študuje vzorce náhodných hromadných javov. Náhodnosť je fenomén, ktorý

Štatistická definícia pravdepodobnosti
Udalosť je náhodný jav, ktorý sa v dôsledku skúsenosti môže alebo nemusí objaviť (dvojhodnotový jav). Označte udalosti veľkými latinskými písmenami

Priestor elementárnych udalostí
Nech je súbor udalostí spojený s nejakou skúsenosťou a: 1) ako výsledok skúsenosti jedna a jediná

Akcie na udalostiach
Súčet dvoch udalostí a

Permutácie
Označuje sa počet rôznych permutácií prvkov

Ubytovanie
Umiestnenie prvkov podľa

Kombinácie
Kombinácia prvkov

Vzorec na pridanie pravdepodobností pre nekompatibilné udalosti
Veta. Pravdepodobnosť súčtu dvoch nezlučiteľných udalostí sa rovná súčtu pravdepodobností týchto udalostí. (jeden

Vzorec sčítania pravdepodobnosti pre ľubovoľné udalosti
Veta. Pravdepodobnosť súčtu dvoch udalostí sa rovná súčtu pravdepodobností týchto udalostí bez pravdepodobnosti ich súčinu.

Vzorec násobenia pravdepodobnosti
Nech sú dané dve udalosti. Zvážte udalosť

Vzorec úplnej pravdepodobnosti
Nech je to úplná skupina nezlučiteľných udalostí, nazývajú sa hypotézy. Zvážte nejakú udalosť

Vzorec pravdepodobnosti hypotéz (Bayes)
Zvážte znova - kompletnú skupinu nezlučiteľných hypotéz a udalosti

Asymptotický Poissonov vzorec
V prípadoch, keď je počet pokusov veľký a pravdepodobnosť výskytu udalosti

Náhodné diskrétne premenné
Náhodná hodnota je veličina, ktorá pri opakovaní experimentu môže nadobudnúť nerovnaké číselné hodnoty. Náhodná premenná sa nazýva diskrétna,

Náhodné spojité premenné
Ak náhodná premenná môže v dôsledku experimentu nadobudnúť akúkoľvek hodnotu z určitého segmentu alebo celej reálnej osi, potom sa nazýva spojitá. zákona

Funkcia hustoty pravdepodobnosti náhodnej spojitej premennej
Nechaj. Zvážte bod a dajte mu prírastok

Numerické charakteristiky náhodných premenných
Náhodné diskrétne alebo spojité premenné sa považujú za úplne špecifikované, ak sú známe ich distribučné zákony. S poznaním zákonov distribúcie je možné vždy vypočítať pravdepodobnosť zásahu

Kvantily náhodných premenných
Kvantil rádu náhodnej spojitej premennej

Matematické očakávanie náhodných premenných
Matematické očakávanie náhodnej premennej charakterizuje jej priemernú hodnotu. Všetky hodnoty náhodnej premennej sú zoskupené okolo tejto hodnoty. Najprv zvážte náhodnú diskrétnu premennú

Smerodajná odchýlka a rozptyl náhodných veličín
Najprv zvážte náhodnú diskrétnu premennú. Numerické charakteristiky modu, mediánu, kvantilov a matematického očakávania

Momenty náhodných premenných
Teória pravdepodobnosti využíva okrem matematického očakávania a rozptylu aj číselné charakteristiky vyšších rádov, ktoré sa nazývajú momenty náhodných premenných.

Vety o numerických charakteristikách náhodných premenných
Veta 1. Matematické očakávanie nenáhodnej premennej sa rovná tejto hodnote samotnej. Dôkaz: Nechaj

Zákon binomického rozdelenia

Poissonov zákon o rozdelení
Nech náhodná diskrétna premenná naberá hodnoty

Zákon o jednotnej distribúcii
Rovnomerný zákon rozdelenia náhodnej spojitej premennej je zákonom funkcie hustoty pravdepodobnosti, ktorá

Zákon normálneho rozdelenia
Normálny zákon rozdelenia náhodnej spojitej premennej je zákon funkcie hustoty

Zákon exponenciálneho rozdelenia
Exponenciálne alebo exponenciálne rozdelenie náhodnej premennej sa používa v takých aplikáciách teórie pravdepodobnosti, ako je teória radenia, teória spoľahlivosti

Systémy náhodných premenných
V praxi sa pri aplikáciách teórie pravdepodobnosti často musíme potýkať s problémami, v ktorých sú výsledky experimentu popísané nie jednou náhodnou veličinou, ale niekoľkými náhodnými veličinami naraz.

Systém dvoch náhodných diskrétnych premenných
Nech dve náhodné diskrétne premenné tvoria systém. Náhodná hodnota

Systém dvoch náhodných spojitých premenných
Teraz nech je systém tvorený dvoma náhodnými spojitými premennými. Distribučný zákon tohto systému sa nazýva pravdepodobne

Podmienené zákony distribúcie
Nech a závislé náhodné spojité premenné

Numerické charakteristiky systému dvoch náhodných veličín
Počiatočný moment poriadku sústavy náhodných veličín

Systém viacerých náhodných premenných
Výsledky získané pre systém dvoch náhodných premenných možno zovšeobecniť na prípad systémov pozostávajúcich z ľubovoľného počtu náhodných premenných. Nech je systém tvorený množinou

Normálne rozdelenie systému dvoch náhodných veličín
Uvažujme systém dvoch náhodných spojitých premenných. Zákon rozdelenia tohto systému je zákon normálneho rozdelenia

Limitné vety teórie pravdepodobnosti
Hlavným cieľom disciplíny teórie pravdepodobnosti je štúdium zákonitostí náhodných hromadných javov. Prax ukazuje, že pozorovanie množstva homogénnych náhodných javov odhaľuje

Čebyševova nerovnosť
Zvážte náhodnú premennú s matematickým očakávaním

Čebyševova veta
Ak sú náhodné premenné párovo nezávislé a majú v populácii ohraničené konečné rozptyly

Bernoulliho veta
Pri neobmedzenom zvyšovaní počtu experimentov frekvencia výskytu udalosti konverguje v pravdepodobnosti k pravdepodobnosti udalosti

Centrálna limitná veta
Pri pridávaní náhodných premenných s akýmikoľvek distribučnými zákonmi, ale s rozptylmi obmedzenými v súhrne, distribučný zákon

Hlavné úlohy matematickej štatistiky
Vyššie diskutované zákony teórie pravdepodobnosti sú matematickým vyjadrením skutočných vzorcov, ktoré skutočne existujú v rôznych náhodných hromadných javoch. študovať

Jednoduchá štatistika. Štatistická distribučná funkcia
Uvažujme o náhodnej premennej, ktorej distribučný zákon nie je známy. Vyžaduje sa na základe skúseností

Štatistická čiara. stĺpcový graf
Pri veľkom počte pozorovaní (rádovo v stovkách) sa všeobecná populácia stáva nepohodlnou a ťažkopádnou pri zaznamenávaní štatistického materiálu. Pre prehľadnosť a kompaktnosť štatistický materiál

Číselné charakteristiky štatistického rozdelenia
V teórii pravdepodobnosti boli uvažované rôzne číselné charakteristiky náhodných premenných: matematické očakávanie, disperzia, počiatočné a centrálne momenty rôznych rádov. Podobné čísla

Voľba teoretického rozdelenia metódou momentov
V každom štatistickom rozložení sú nevyhnutne prvky náhodnosti spojené s obmedzeným počtom pozorovaní. S veľkým počtom pozorovaní sú tieto prvky náhodnosti vyhladené,

Testovanie vierohodnosti hypotézy o podobe distribučného zákona
Dané štatistické rozdelenie nech aproximujeme nejakou teoretickou krivkou resp

Kritériá súhlasu
Zvážte jeden z najčastejšie používaných testov dobrej zhody, takzvaný Pearsonov test. Predpokladajme

Bodové odhady pre neznáme distribučné parametre
V p.p. 2.1. - 2.7 sme podrobne zvážili spôsoby riešenia prvého a druhého hlavného problému matematickej štatistiky. Ide o úlohy určovania zákonov rozdelenia náhodných veličín podľa experimentálnych údajov

Interval spoľahlivosti. Pravdepodobnosť spoľahlivosti
V praxi pri malom počte experimentov na náhodnej premennej približné nahradenie neznámeho parametra

Nech je náhodná vzorka generovaná pozorovanou náhodnou premennou ξ, matematickým očakávaním a rozptylom ktoré sú neznáme. Ako odhady týchto charakteristík bolo navrhnuté použiť výberový priemer

a rozptyl vzorky

. (3.14)

Uvažujme o niektorých vlastnostiach odhadov matematického očakávania a rozptylu.

1. Vypočítajte matematické očakávanie priemeru vzorky:

Preto je výberový priemer nestranným odhadom pre .

2. Pripomeňme, že výsledky pozorovania sú nezávislé náhodné premenné, z ktorých každá má rovnaký distribučný zákon ako hodnota , čo znamená, že , , . Budeme predpokladať, že rozptyl je konečný. Potom, podľa Čebyševovej vety o zákone veľkých čísel, pre každé ε > 0 máme rovnosť ,

čo sa dá napísať takto: . (3.16) Porovnaním (3.16) s definíciou vlastnosti konzistencie (3.11) vidíme, že odhad je konzistentným odhadom očakávania.

3. Nájdite rozptyl priemeru vzorky:

. (3.17)

Rozptyl odhadu očakávaní teda klesá nepriamo úmerne s veľkosťou vzorky.

Dá sa dokázať, že ak je náhodná premenná ξ normálne rozdelená, potom výberový priemer je efektívnym odhadom očakávanej hodnoty, t. j. rozptyl nadobudne najmenšiu hodnotu v porovnaní s akýmkoľvek iným odhadom očakávanej hodnoty. Pre iné distribučné zákony ξ to nemusí platiť.

Výberový rozptyl je skreslený odhad rozptylu, od r . (3.18)

V skutočnosti pomocou vlastností matematického očakávania a vzorca (3.17) nájdeme

.

Na získanie nezaujatého odhadu rozptylu je potrebné odhad (3.14) opraviť, teda vynásobiť . Potom dostaneme nezaujatý výberový rozptyl

. (3.19)

Všimli sme si, že vzorce (3.14) a (3.19) sa líšia iba v menovateli a pre veľké hodnoty sa výberové a nezaujaté odchýlky líšia len málo. Pre malú veľkosť vzorky by sa však mal použiť vzťah (3.19).

Na odhad štandardnej odchýlky náhodnej premennej sa používa takzvaná „opravená“ štandardná odchýlka, ktorá sa rovná druhej odmocnine nezaujatého rozptylu: .

Odhady intervalov

V štatistike existujú dva prístupy k odhadu neznámych parametrov rozdelenia: bodový a intervalový. V súlade s bodovým odhadom, o ktorom sme hovorili v predchádzajúcej časti, je označený len bod, v blízkosti ktorého sa odhadovaný parameter nachádza. Je však žiaduce vedieť, ako ďaleko môže tento parameter skutočne stáť od možnej implementácie odhadov v rôznych sériách pozorovaní.

Odpoveď na túto otázku – aj približná – dáva iný spôsob odhadu parametrov – interval. V súlade s touto metódou odhadu sa zistí interval, ktorý s pravdepodobnosťou blízkou jednej pokrýva neznámu číselnú hodnotu parametra.

Pojem intervalového odhadu

Bodový odhad je náhodná premenná a pre možné implementácie vzorky naberá hodnoty len približne rovné skutočnej hodnote parametra. Čím je rozdiel menší, tým je odhad presnejší. Teda kladné číslo, pre ktoré , charakterizuje presnosť odhadu a je tzv chyba odhadu (alebo marginálna chyba).

Pravdepodobnosť spoľahlivosti(alebo spoľahlivosť) sa nazýva pravdepodobnosť β , s ktorým je nerovnosť , t.j.

. (3.20)

Nahradenie nerovnosti jeho ekvivalentná dvojitá nerovnosť , alebo , dostaneme

Interval krytie s pravdepodobnosťou β , , neznámy parameter , sa volá interval spoľahlivosti (alebo intervalový odhad), zodpovedajúcu úrovni spoľahlivosti β .

Náhodná premenná nie je len odhad, ale aj chyba: jej hodnota závisí od pravdepodobnosti β a spravidla zo vzorky. Preto je interval spoľahlivosti náhodný a výraz (3.21) by sa mal čítať takto: „Interval pokryje parameter s pravdepodobnosťou β “, a nie takto: „Parameter s pravdepodobnosťou spadne do intervalu β ”.

Význam intervalu spoľahlivosti je, že pri opakovanom opakovaní objemu vzorky v relatívnom pomere prípadov rovný β , interval spoľahlivosti zodpovedajúci úrovni spoľahlivosti β , pokrýva skutočnú hodnotu odhadovaného parametra. Takže úroveň dôvery β charakterizuje spoľahlivosť hodnotenie dôvery: čím viac β tým je pravdepodobnejšie, že implementácia intervalu spoľahlivosti obsahuje neznámy parameter.

KATEGÓRIE

POPULÁRNE ČLÁNKY

2022 "kingad.ru" - ultrazvukové vyšetrenie ľudských orgánov