Odhad matematického očakávania náhodnej premennej. Bodové odhady matematického očakávania

Nech existuje náhodná premenná X s matematickým očakávaním m a rozptyl D, pričom oba tieto parametre nie sú známe. Nad hodnotou X vyrobené N nezávislých experimentov, výsledkom ktorých je súbor Nčíselné výsledky x 1 , x 2 , ..., x N. Ako odhad matematického očakávania je prirodzené navrhnúť aritmetický priemer pozorovaných hodnôt

(1)

Tu ako x i zohľadňujú sa špecifické hodnoty (čísla) získané ako výsledok N experimenty. Ak vezmeme iných (nezávisle od predchádzajúcich) N experimenty, potom samozrejme dostaneme inú hodnotu. Ak si vezmete viac N experimenty, potom získame ďalšiu novú hodnotu. Označme podľa X i náhodná premenná vyplývajúca z i experiment, potom implementácie X i budú čísla získané z týchto experimentov. Je zrejmé, že náhodná premenná X i bude mať rovnakú funkciu hustoty pravdepodobnosti ako pôvodná náhodná premenná X. Tiež veríme, že náhodné premenné X i A Xj sú nezávislé kedy i, nerovná sa j(rôzne na sebe nezávislé experimenty). Preto vzorec (1) prepíšeme do inej (štatistickej) formy:

(2)

Ukážme, že odhad je nezaujatý:

Matematické očakávanie priemeru vzorky sa teda rovná skutočnému matematickému očakávaniu náhodnej premennej m. To je pomerne predvídateľný a pochopiteľný fakt. V dôsledku toho sa môže výberový priemer (2) brať ako odhad matematického očakávania náhodnej premennej. Teraz vyvstáva otázka: čo sa stane s rozptylom matematického odhadu očakávania, keď sa počet experimentov zvýši? Ukazujú to analytické výpočty

kde je rozptyl matematického odhadu očakávania (2), a D- skutočný rozptyl náhodnej premennej X.

Z uvedeného vyplýva, že so zväčš N(počet experimentov) klesá rozptyl odhadu, t.j. Čím viac zhrnieme nezávislé realizácie, tým bližšie k matematickému očakávaniu dostaneme odhad.


Odhady matematického rozptylu

Na prvý pohľad sa zdá najprirodzenejšie hodnotenie

(3)

kde sa vypočíta pomocou vzorca (2). Skontrolujte, či je odhad nezaujatý. Vzorec (3) možno napísať takto:

Dosadíme výraz (2) do tohto vzorca:

Poďme nájsť matematické očakávanie odhadu rozptylu:

(4)

Keďže rozptyl náhodnej premennej nezávisí od toho, aké je matematické očakávanie náhodnej premennej, zoberme si matematické očakávanie rovné 0, t.j. m = 0.

(5)
v .(6)

Nech existuje náhodná premenná X a jej parametre sú matematické očakávanie A a rozptyl nie sú známe. Na hodnote X sa uskutočnilo N nezávislých experimentov, ktoré poskytli výsledky x 1, x 2, x n.

Bez toho, aby sme znížili všeobecnosť uvažovania, budeme tieto hodnoty náhodnej premennej považovať za odlišné. Hodnoty x 1, x 2, x n budeme považovať za nezávislé, identicky rozdelené náhodné premenné X 1, X 2, X n.

Najjednoduchšia metóda štatistického odhadu - metóda substitúcie a analógie - spočíva v tom, že sa zodpovedajúca charakteristika rozdelenia vzorky - charakteristika vzorky - vezme ako odhad jednej alebo druhej numerickej charakteristiky (priemer, rozptyl atď.) všeobecnej populácie. .

Použitie substitučnej metódy ako odhadu matematického očakávania A musíme vziať matematické očakávanie distribúcie vzorky - výberový priemer. Tak dostaneme

Na kontrolu nezaujatosti a konzistentnosti priemernej vzorky ako odhadu A, považujte túto štatistiku za funkciu zvoleného vektora (X 1, X 2, X n). Ak vezmeme do úvahy, že každá z veličín X 1, X 2, X n má rovnaký distribučný zákon ako hodnota X, dospejeme k záveru, že číselné charakteristiky týchto veličín a hodnoty X sú rovnaké: M(X i) = M(X) = a, D(X i) = D(X) = , i = 1, 2, č , kde X i sú kolektívne nezávislé náhodné premenné.

teda

Odtiaľ, podľa definície, dostávame, že ide o nezaujatý odhad A, a keďže D()®0 pre n®¥, potom podľa vety z predchádzajúceho odseku je konzistentný odhad matematického očakávania A všeobecná populácia.

Účinnosť alebo neefektívnosť odhadu závisí od typu distribučného zákona náhodnej premennej X. Dá sa dokázať, že ak je hodnota X rozdelená podľa normálneho zákona, potom je odhad efektívny. V prípade iných distribučných zákonov to tak nemusí byť.

Nestranný odhad všeobecného rozptylu slúži ako korigovaný rozptyl vzorky

,

Pretože , kde je všeobecný rozptyl. naozaj,

Odhad s -- 2 pre všeobecný rozptyl je tiež platný, ale nie je efektívny. V prípade normálneho rozdelenia je však „asymptoticky efektívne“, to znamená, že ako n rastie, pomer jeho rozptylu k minimálnemu možnému sa neobmedzene blíži k jednotke.

Ak teda dostaneme vzorku z distribúcie F( X) náhodná premenná X s neznámym matematickým očakávaním A a disperzie, potom na výpočet hodnôt týchto parametrov máme právo použiť nasledujúce približné vzorce:

a ,

.

Tu x-i- - možnosť vzorkovania, n-i - - frekvenčné možnosti x i, - - veľkosť vzorky.
Na výpočet korigovaného rozptylu vzorky je vhodnejší vzorec


.

Pre zjednodušenie výpočtu je vhodné prejsť na podmienené možnosti (rovnako ako u je výhodné brať pôvodnú verziu, umiestnenú v strede intervalového variačného radu). Potom

, .

Intervalový odhad

Vyššie sme zvážili otázku odhadu neznámeho parametra A jedno číslo. Takéto odhady nazývame bodové odhady. Majú nevýhodu, že pri malej veľkosti vzorky sa môžu výrazne líšiť od odhadovaných parametrov. Preto, aby sme získali predstavu o blízkosti medzi parametrom a jeho odhadom, sú v matematickej štatistike zavedené takzvané intervalové odhady.

Nech sa vo vzorke nájde bodový odhad q * pre parameter q. Obyčajne je výskumníkom vopred daná nejaká dostatočne veľká pravdepodobnosť g (napríklad 0,95, 0,99 alebo 0,999), takže udalosť s pravdepodobnosťou g možno považovať za prakticky spoľahlivú a nastoľujú otázku nájdenia takej hodnoty e > 0, pre ktorú

.

Úpravou tejto rovnosti dostaneme:

av tomto prípade povieme, že interval ]q * - e; q * + e[ pokrýva odhadnutý parameter q s pravdepodobnosťou g.

interval ]q * -e; q * +e [ sa nazýva interval spoľahlivosti .

Pravdepodobnosť g sa nazýva spoľahlivosť (pravdepodobnosť spoľahlivosti) intervalového odhadu.

Konce intervalu spoľahlivosti, t.j. nazývajú sa body q * -e a q * +e hranice dôvery .

Volá sa číslo e presnosť hodnotenia .

Ako príklad problému určenia hraníc spoľahlivosti zvážte otázku odhadu matematického očakávania náhodnej premennej X, ktorá má zákon normálneho rozdelenia s parametrami A a s, t.j. X = N( a, s). Matematické očakávanie sa v tomto prípade rovná A. Na základe pozorovaní X 1, X 2, X n vypočítame priemer a hodnotenie disperzia s 2.

Ukazuje sa, že zo vzorových údajov je možné zostaviť náhodnú premennú

ktorý má Studentovo rozdelenie (alebo t-rozdelenie) s n = n -1 stupňami voľnosti.

Využime tabuľku A.1.3 a nájdime pre danú pravdepodobnosť g a číslo n číslo t g také, že pravdepodobnosť

P(|t(n)|< t g) = g,

.

Po vykonaní zrejmých transformácií dostaneme,

Postup pri aplikácii F-testu je nasledujúci:

1. Predpokladá sa, že rozloženie obyvateľstva je normálne. Na danej hladine významnosti a je formulovaná nulová hypotéza H 0: s x 2 = s y 2 o rovnosti všeobecných rozptylov normálnych populácií podľa konkurenčnej hypotézy H 1: s x 2 > s y 2.

2. Z populácií X a Y s objemom n x a n y sa získajú dve nezávislé vzorky.

3. Vypočítajte hodnoty korigovaných výberových rozptylov s x 2 a s y 2 (metódy výpočtu sú uvedené v §13.4). Väčší z rozptylov (s x 2 alebo s y 2) je označený s 1 2, menší - s 2 2.

4. Hodnota F-kritéria sa vypočíta pomocou vzorca F obs = s 1 2 / s 2 2.

5. Pomocou tabuľky kritických bodov Fisher-Snedecorovho rozdelenia pri danej hladine významnosti a a počte stupňov voľnosti n 1 = n 1 - 1, n 2 = n 2 - 1 (n 1 je počet stupňa voľnosti väčšieho korigovaného rozptylu), kritický bod sa zistí F cr (a, n 1, n 2).

Všimnite si, že v tabuľke A.1.7 sú uvedené kritické hodnoty jednostranného F-testu. Ak sa teda použije obojstranné kritérium (H 1: s x 2 ¹ s y 2), potom sa pravostranný kritický bod F cr (a/2, n 1, n 2) hľadá hladinou významnosti a/ 2 (polovica špecifikovanej hodnoty) a počet mocnin voľnosti n 1 an 2 (n 1 je počet stupňov voľnosti väčšieho rozptylu). Kritický bod na ľavej strane sa nemusí nájsť.

6. Vyvodzuje sa záver: ak je vypočítaná hodnota F-kritéria väčšia alebo rovná kritickej hodnote (F obs ³ F cr), potom sa rozptyly na danej hladine významnosti výrazne líšia. V opačnom prípade (F obs.< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Problém 15.1. Spotreba surovín na jednotku výroby pri použití starej technológie bola:

Použitie novej technológie:

Za predpokladu, že zodpovedajúce všeobecné populácie X a Y majú normálne distribúcie, skontrolujte, či sa z hľadiska variability spotreba surovín pre nové a staré technológie nelíši, ak vezmeme hladinu významnosti a = 0,1.

Riešenie. Postupujeme vo vyššie uvedenom poradí.

1. Na základe rozptylových hodnôt budeme posudzovať variabilitu spotreby surovín novými a starými technológiami. Nulová hypotéza má teda tvar H 0: s x 2 = s y 2. Ako konkurenčnú hypotézu akceptujeme hypotézu H 1: s x 2 ¹ s y 2, pretože si vopred nie sme istí, že niektorý zo všeobecných rozptylov je väčší ako druhý.

2-3. Poďme nájsť vzorové odchýlky. Na zjednodušenie výpočtov prejdime na podmienené možnosti:

u i = x i - 307, v i = y i - 304.

Všetky výpočty usporiadame vo forme nasledujúcich tabuliek:

u i m i m i u i ja u i 2 m i (u i +1) 2 v i n i n i v i n i v i 2 n i (v i +1) 2
-3 -3 -1 -2
å -
å -

Kontrola: å m i u i 2 + 2å m i u i + m i = Kontrola: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Poďme nájsť opravené odchýlky vzoriek:

4. Porovnajme rozptyly. Nájdite pomer väčšieho korigovaného rozptylu k menšiemu:

.

5. Konkurenčná hypotéza má podľa podmienky tvar s x 2 ¹ s y 2, preto je kritická oblasť obojstranná a pri hľadaní kritického bodu treba brať hladiny významnosti polovičné oproti zadanej hodnote.

Podľa tabuľky A.1.7 pomocou hladiny významnosti a/2 = 0,1/2 = 0,05 a počtu stupňov voľnosti n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8 zistíme, kritický bod Fcr ( 0,05; 12; 8) = 3,28.

6. Keďže F obs.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.

Vyššie, pri testovaní hypotéz sme predpokladali normálne rozdelenie skúmaných náhodných premenných. Špeciálne štúdie však ukázali, že navrhované algoritmy sú veľmi stabilné (najmä pri veľkých veľkostiach vzoriek) s ohľadom na odchýlky od normálneho rozdelenia.

Distribučné parametre a štatistiky

Akékoľvek parametre rozdelenia náhodnej premennej, napríklad matematické očakávanie alebo rozptyl, sú teoretické veličiny, ktoré sa nedajú priamo merať, hoci sa dajú odhadnúť. Predstavujú kvantitatívnu charakteristiku populácia a samy osebe môžu byť určené iba počas teoretického modelovania ako hypotetické hodnoty, pretože opisujú vlastnosti rozloženia náhodnej premennej v samotnej všeobecnej populácii. Aby ich bolo možné v praxi určiť, výskumník vykonávajúci experiment ich selektívne hodnotí. Toto hodnotenie zahŕňa štatistický výpočet.

Štatistiky je kvantitatívna charakteristika študovaných parametrov charakterizujúcich rozdelenie náhodnej premennej získaná na základe štúdia hodnôt vzorky. Štatistika sa používa buď na popis samotnej vzorky, alebo, čo má v základnom experimentálnom výskume prvoradý význam, na odhad parametrov distribúcie náhodnej premennej v skúmanej populácii.

Separácia pojmov "parameter" A "štatistiky" je veľmi dôležité, pretože umožňuje vyhnúť sa množstvu chýb spojených s nesprávnou interpretáciou údajov získaných v experimente. Faktom je, že keď odhadujeme distribučné parametre pomocou štatistických údajov, získame hodnoty, ktoré sú len do určitej miery blízke odhadovaným parametrom. Medzi parametrami a štatistikami je takmer vždy nejaký rozdiel a zvyčajne nevieme povedať, aký veľký je tento rozdiel. Teoreticky, čím väčšia vzorka, tým bližšie sú odhadované parametre k ich vzorovým charakteristikám. To však neznamená, že zväčšením veľkosti vzorky sa nevyhnutne priblížime k odhadovanému parametru a znížime rozdiel medzi ním a vypočítanou štatistikou. V praxi môže byť všetko oveľa komplikovanejšie.

Ak sa teoreticky očakávaná hodnota štatistiky zhoduje s odhadovaným parametrom, potom sa takýto odhad nazýva nevysídlený. Volá sa odhad, v ktorom sa očakávaná hodnota odhadovaného parametra líši od samotného parametra o určitú hodnotu vysídlený.

Taktiež je potrebné rozlišovať medzi bodovými a intervalovými odhadmi distribučných parametrov. Spot zavolal hodnotenie pomocou čísla. Ak napríklad povieme, že hodnota priestorového prahu hmatovej citlivosti pre daný subjekt za daných podmienok a na danej ploche kože je 21,8 mm, potom bude takýto odhad bodový. Rovnako bodový odhad nastane, keď nám meteorologická správa povie, že za oknom je 25°C. Intervalový odhad zahŕňa použitie množiny alebo rozsahu čísel v hodnotení. Pri hodnotení priestorového prahu hmatovej citlivosti môžeme povedať, že sa pohyboval v rozmedzí od 20 do 25 mm. Podobne môžu meteorológovia hlásiť, že podľa ich predpovedí teplota vzduchu v najbližších 24 hodinách dosiahne 22–24 °C. Intervalový odhad náhodnej veličiny nám umožňuje nielen určiť požadovanú hodnotu tejto veličiny, ale aj nastaviť možnú presnosť pre takýto odhad.

Matematické očakávanie a jeho vyhodnotenie

Vráťme sa k nášmu experimentu s hodom mincou.

Skúsme si odpovedať na otázku: koľkokrát by sa mali objaviť „hlavy“, ak desaťkrát hodíme mincou? Odpoveď sa zdá byť jasná. Ak sú pravdepodobnosti každého z dvoch výsledkov rovnaké, potom samotné výsledky musia byť rovnomerne rozdelené. Inými slovami, pri desiatom hode obyčajnej mince môžeme očakávať, že jedna z jej strán, napríklad „hlavy“, dopadne presne päťkrát. Podobne pri 100 hodení mincou by sa „hlavy“ mali objaviť presne 50-krát, a ak je minca hodená 4236-krát, potom by sa strana, ktorá nás zaujíma, mala objaviť 2118-krát, nie viac a nie menej.

Teoretický význam náhodnej udalosti sa teda zvyčajne nazýva matematické očakávanie. Očakávanú hodnotu možno nájsť vynásobením teoretickej pravdepodobnosti náhodnej premennej počtom pokusov. Formálnejšie je však definovaný ako centrálny moment prvého rádu. Matematické očakávanie je teda hodnota náhodnej premennej, ku ktorej sa teoreticky pri opakovaných testoch prikláňa, okolo ktorej kolíše.

Je zrejmé, že teoretická hodnota matematického očakávania ako distribučného parametra sa nie vždy rovná empirickej hodnote pre nás zaujímavej náhodnej premennej, vyjadrenej v štatistike. Ak urobíme experiment s hodením mincou, potom je dosť pravdepodobné, že z desiatich výsledkov sa „hlavy“ objavia iba štyri alebo trikrát, alebo možno naopak, osemkrát, alebo možno áno. vôbec nepríde. Je jasné, že niektoré z týchto výsledkov sú viac, niektoré menej pravdepodobné. Ak použijeme zákon normálneho rozdelenia, môžeme dospieť k záveru, že čím viac sa výsledok odchyľuje od teoreticky očakávaného, ​​špecifikovaného hodnotou matematického očakávania, tým je v praxi menej pravdepodobný.

Ďalej predpokladajme, že sme podobný postup vykonali už niekoľkokrát a nikdy sme nedodržali teoreticky očakávanú hodnotu. Potom môžeme mať pochybnosti o pravosti mince. Môžeme predpokladať, že pre našu mincu pravdepodobnosť získania hláv nie je v skutočnosti 50%. V tomto prípade môže byť potrebné odhadnúť pravdepodobnosť tejto udalosti a podľa toho aj hodnotu matematického očakávania. Táto potreba vzniká vždy, keď v experimente študujeme rozdelenie spojitej náhodnej premennej, ako je reakčný čas, bez toho, aby sme mali vopred akýkoľvek teoretický model. Spravidla ide o prvý povinný krok pri kvantitatívnom spracovaní výsledkov experimentov.

Matematické očakávanie možno odhadnúť tromi spôsobmi, ktoré v praxi môžu dávať mierne odlišné výsledky, ale teoreticky by nás určite mali priviesť k hodnote matematického očakávania.

Logika takéhoto hodnotenia je znázornená na obr. 1.2. Očakávanú hodnotu možno považovať za centrálnu tendenciu v rozdelení náhodnej premennej X, ako jeho najpravdepodobnejšiu a teda najčastejšie sa vyskytujúcu hodnotu a ako bod rozdeľujúci rozdelenie na dve rovnaké časti.

Ryža. 1.2.

Pokračujme v našich imaginárnych pokusoch s mincou a urobme tri pokusy s desiatimi hodmi. Predpokladajme, že v prvom experimente sa „hlavy“ objavili štyrikrát, to isté sa stalo v druhom experimente, v treťom experimente sa „hlavy“ objavili viac ako jeden a polkrát častejšie – sedemkrát. Je logické predpokladať, že matematické očakávanie udalosti, ktorá nás zaujíma, v skutočnosti leží niekde medzi týmito hodnotami.

najprv, najjednoduchšie metóda posudzovania matematické očakávanie bude nájsť aritmetický priemer. Potom bude odhad očakávanej hodnoty na základe vyššie uvedených troch meraní (4 + 4 + 7)/3 = 5. Podobne v experimentoch s reakčným časom možno očakávanú hodnotu odhadnúť tak, že sa vezme aritmetický priemer všetkých získaných hodnôt. X. Takže, ak sme strávili P merania reakčného času X, potom môžeme na výpočet aritmetického priemeru použiť nasledujúci vzorec, ktorý nám to ukazuje X je potrebné sčítať všetky empiricky získané hodnoty a rozdeliť ich počtom pozorovaní:

Vo vzorci (1.2) sa miera matematického očakávania zvyčajne označuje ako ̅ X (čítaj ako "X s čiarou"), hoci niekedy to môže byť napísané ako M (z angličtiny priemerný - priemer).

Aritmetický priemer je najčastejšie používaným odhadom matematického očakávania. V takýchto prípadoch sa predpokladá, že náhodná premenná sa meria v metrický stupnica. Je jasné, že získaný výsledok sa môže, ale nemusí zhodovať so skutočnou hodnotou matematického očakávania, ktoré nikdy nepoznáme. Je však dôležité, aby táto metóda bola nezaujatý odhad matematického očakávania. To znamená, že očakávaná hodnota odhadovanej hodnoty sa rovná jej matematickému očakávaniu: .

Druhá metóda hodnotenia matematickým očakávaním je brať za svoju hodnotu najčastejšie sa vyskytujúcu hodnotu premennej, ktorá nás zaujíma. Táto hodnota sa nazýva distribučný režim. Napríklad v prípade práve uvažovaného hodu mincou možno hodnotu „štyri“ považovať za hodnotu matematického očakávania, pretože v troch vykonaných testoch sa táto hodnota objavila dvakrát; Preto sa režim distribúcie v tomto prípade ukázal ako rovný štyrom. Odhad režimu sa používa hlavne vtedy, keď sa experimentátor zaoberá premennými, ktoré nadobúdajú diskrétne hodnoty špecifikované v nemetrické stupnica.

Napríklad popisom rozloženia známok študentov na skúške je možné zostaviť frekvenčné rozdelenie známok, ktoré študenti dostali. Toto rozdelenie frekvencií sa nazýva histogram. V tomto prípade možno najbežnejší odhad brať ako hodnotu centrálnej tendencie (matematické očakávanie). Pri štúdiu premenných charakterizovaných spojitými hodnotami sa táto miera prakticky nepoužíva alebo sa používa zriedka. Ak je frekvenčné rozdelenie získaných výsledkov napriek tomu skonštruované, potom sa to spravidla netýka experimentálne získaných hodnôt študovanej charakteristiky, ale niektorých intervalov jej prejavu. Napríklad štúdiom výšky ľudí môžete zistiť, koľko ľudí spadá do rozsahu do 150 cm výšky, koľko spadá do rozsahu od 150 do 155 cm atď. V tomto prípade bude režim súvisieť s intervalovými hodnotami študovanej charakteristiky, v tomto prípade s výškou.

Je jasné, že modus, podobne ako aritmetický priemer, sa môže, ale nemusí zhodovať so skutočnou hodnotou matematického očakávania. Ale rovnako ako aritmetický priemer, aj režim je nezaujatým odhadom matematického očakávania.

Dodajme, že ak sa dve hodnoty vo vzorke vyskytujú rovnako často, potom sa takéto rozdelenie nazýva bimodálne. Ak sa tri alebo viac hodnôt vo vzorke vyskytuje rovnako často, potom sa o takejto vzorke hovorí, že nemá žiadny režim. Takéto prípady s dostatočne veľkým počtom pozorovaní spravidla naznačujú, že údaje sú extrahované zo všeobecnej populácie, ktorej povaha distribúcie sa líši od normálneho.

nakoniec tretia metóda hodnotenia matematickým očakávaním je rozdeliť vzorku predmetov podľa parametra, ktorý nás zaujíma, presne na polovicu. Veličina charakterizujúca túto hranicu je tzv medián distribúcie.

Predpokladajme, že sme prítomní na lyžiarskych pretekoch a po ich skončení chceme vyhodnotiť, ktorý zo športovcov mal nadpriemerné a kto podpriemerné výsledky. Ak je zloženie účastníkov viac-menej rovnomerné, potom pri hodnotení priemerného výsledku je logické vypočítať aritmetický priemer. Predpokladajme však, že medzi profesionálnymi účastníkmi je viacero amatérov. Je ich málo, ale vykazujú výsledky, ktoré sú výrazne horšie ako ostatné. V tomto prípade sa môže ukázať, že napríklad zo 100 účastníkov súťaže vykázalo nadpriemerné výsledky 87. Je jasné, že takéto hodnotenie priemernej tendencie nás nemôže vždy uspokojiť. V tomto prípade je logické predpokladať, že priemerný výsledok vykázali účastníci, ktorí sa umiestnili niekde na 50. alebo 51. mieste. Toto bude stredná hodnota distribúcie. Pred 50. finalistom skončilo 49 účastníkov, po 51. tiež 49. Nie je však jasné, koho výsledok z nich treba brať ako priemer. Samozrejme, môže sa ukázať, že skončili v rovnakom čase. Potom nie je problém. Problém nenastáva, keď je počet pozorovaní nepárny. V ostatných prípadoch však môžete použiť priemer výsledkov dvoch účastníkov.

Medián je špeciálny prípad kvantilu rozdelenia. Kvantil je súčasťou distribúcie. Formálne ho možno definovať ako integrálnu hodnotu rozdelenia medzi dvoma hodnotami premennej X. Teda hodnota X bude mediánom rozdelenia, ak integrálna hodnota rozdelenia (hustota pravdepodobnosti) je od -∞ do X rovná integrálnej hodnote rozdelenia z X na +∞. Podobne sa dá distribúcia rozdeliť na štyri, desať alebo 100 častí. Takéto kvantily sa nazývajú podľa toho kvartily, decily A percentily. Existujú aj iné typy kvantilov.

Rovnako ako dve predchádzajúce metódy na odhad matematického očakávania, medián je nezaujatý odhad matematického očakávania.

Teoreticky sa predpokladá, že ak skutočne máme do činenia s normálnym rozdelením náhodnej premennej, potom by všetky tri odhady matematického očakávania mali dať rovnaký výsledok, pretože všetky predstavujú variant nezaujatý odhady rovnakého distribučného parametra odhadovanej náhodnej premennej (pozri obr. 1.2). V praxi sa to však vyskytuje len zriedka. Dôvodom môže byť najmä skutočnosť, že analyzované rozdelenie sa líši od normálneho. Ale hlavným dôvodom takýchto nezrovnalostí je spravidla to, že odhadom hodnoty matematického očakávania možno získať hodnotu, ktorá sa veľmi výrazne líši od jeho skutočnej hodnoty. Ako je však uvedené vyššie, v matematickej štatistike sa dokázalo, že čím viac nezávislých testov posudzovanej premennej sa vykoná, tým bližšie by mala byť odhadovaná hodnota k skutočnej hodnote.

V praxi teda nie je výber metódy na odhad matematického očakávania určený túžbou získať presnejší a spoľahlivejší odhad tohto parametra, ale iba úvahami o vhodnosti. Určitú úlohu pri výbere metódy odhadu matematického očakávania zohráva aj meracia stupnica, ktorá odráža pozorovania vyhodnocovanej náhodnej premennej.

Nech sa uskutočnia nezávislé experimenty na náhodnej premennej s neznámym matematickým očakávaním a rozptylom, ktoré poskytli výsledky - . Vypočítajme konzistentné a nestranné odhady parametrov a .

Ako odhad matematického očakávania berieme aritmetický priemer experimentálnych hodnôt

. (2.9.1)

Podľa zákona veľkých čísel je tento odhad bohatý s hodnotou podľa pravdepodobnosti. Toto isté hodnotenie je tiež nezaujatý , pretože

. (2.9.2)

Rozptyl tohto odhadu je

. (2.9.3)

Dá sa ukázať, že pre zákon normálneho rozdelenia je tento odhad efektívne . V prípade iných zákonov to tak nemusí byť.

Poďme teraz odhadnúť rozptyl. Najprv zvolíme na odhad vzorec pre štatistický rozptyl

. (2.9.4)

Skontrolujme konzistenciu odhadu rozptylu. Otvorme zátvorky vo vzorci (2.9.4)

.

Keď prvý člen konverguje v pravdepodobnosti k hodnote , v druhom - až. Náš odhad teda konverguje v pravdepodobnosti k rozptylu

,

preto je bohatý .

Skontrolujme to nevysídlený odhady pre množstvo. Aby sme to dosiahli, dosadíme výraz (2.9.1) do vzorca (2.9.4) a vezmeme do úvahy, že náhodné premenné nezávislý

,

. (2.9.5)

Presuňme sa vo vzorci (2.9.5) k fluktuáciám náhodných veličín

Otvorením zátvoriek dostaneme

,

. (2.9.6)

Vypočítajme matematické očakávanie hodnoty (2.9.6), pričom to vezmeme do úvahy

. (2.9.7)

Vzťah (2.9.7) ukazuje, že hodnota vypočítaná pomocou vzorca (2.9.4) nie je nestranný odhad na rozptýlenie. Jeho matematické očakávania nie sú rovnaké, ale o niečo menšie. Takéto hodnotenie vedie k systematickej chybe smerom nadol. Aby ste odstránili takéto skreslenie, musíte zaviesť korekciu vynásobením hodnoty . Tento opravený štatistický rozptyl potom môže slúžiť ako nezaujatý odhad rozptylu

. (2.9.8)

Tento odhad je rovnako platný ako odhad, odkedy je hodnota .

V praxi je niekedy vhodnejšie použiť namiesto odhadu (2.9.8) ekvivalentný odhad spojený s druhým počiatočným štatistickým momentom

. (2.9.9)

Odhady (2.9.8), (2.9.9) nie sú účinné. Dá sa ukázať, že v prípade zákona o bežnom rozdeľovaní budú asymptoticky účinné (pri bude smerovať k minimálnej možnej hodnote).

Takto možno sformulovať nasledujúce pravidlá spracovania štatistického materiálu s obmedzeným objemom. Ak v nezávislých experimentoch náhodná premenná nadobúda hodnoty s neznámym matematickým očakávaním a rozptylom, potom na určenie týchto parametrov treba použiť približné odhady

(2.9.10)

Koniec práce -

Táto téma patrí do sekcie:

Poznámky z matematiky teória pravdepodobnosti matematická štatistika

Katedra vyššej matematiky a informatiky.. Poznámky k prednáške.. z matematiky..

Ak potrebujete ďalší materiál k tejto téme, alebo ste nenašli to, čo ste hľadali, odporúčame použiť vyhľadávanie v našej databáze diel:

Čo urobíme s prijatým materiálom:

Ak bol tento materiál pre vás užitočný, môžete si ho uložiť na svoju stránku v sociálnych sieťach:

Všetky témy v tejto sekcii:

Teória pravdepodobnosti
Teória pravdepodobnosti je odvetvie matematiky, v ktorom sa študujú vzorce náhodných hromadných javov. Náhodný jav sa nazýva tzv

Štatistická definícia pravdepodobnosti
Udalosť je náhodný jav, ktorý sa môže alebo nemusí objaviť ako výsledok skúsenosti (nejednoznačný jav). Udalosti uveďte veľkými latinskými písmenami

Priestor elementárnych udalostí
Nech je veľa udalostí spojených s nejakým zážitkom a: 1) ako výsledok zážitku sa objaví len jedna vec

Akcie na udalostiach
Súčet dvoch udalostí a

Preskupenia
Počet rôznych permutácií prvkov označujeme

Umiestnenia
Umiestnením prvkov podľa

Kombinácie
Kombinácia prvkov

Vzorec na pridanie pravdepodobností pre nekompatibilné udalosti
Veta. Pravdepodobnosť súčtu dvoch nezlučiteľných udalostí sa rovná súčtu pravdepodobností týchto udalostí. (1

Vzorec na pridávanie pravdepodobností pre ľubovoľné udalosti
Veta. Pravdepodobnosť súčtu dvoch udalostí sa rovná súčtu pravdepodobností týchto udalostí bez pravdepodobnosti ich súčinu.

Vzorec na násobenie pravdepodobnosti
Nechajte dve udalosti a budú dané. Zvážte udalosť

Vzorec úplnej pravdepodobnosti
Nech je to úplná skupina nezlučiteľných udalostí; nazývajú sa hypotézy. Zvážte nejakú udalosť

Vzorec pravdepodobnosti hypotézy (Bayes)
Uvažujme znova - kompletnú skupinu nezlučiteľných hypotéz a udalosti

Asymptotický Poissonov vzorec
V prípadoch, keď je počet testov veľký a pravdepodobnosť výskytu udalosti

Náhodné diskrétne množstvá
Náhodná veličina je veličina, ktorá pri opakovaní experimentu môže nadobudnúť nerovnaké číselné hodnoty. Náhodná premenná sa nazýva diskrétna,

Náhodné spojité premenné
Ak v dôsledku experimentu môže náhodná premenná nadobudnúť akúkoľvek hodnotu z určitého segmentu alebo celej reálnej osi, potom sa nazýva spojitá. zákon

Funkcia hustoty pravdepodobnosti náhodnej spojitej premennej
Nechať byť. Zoberme do úvahy bod a priraďme mu prírastky

Numerické charakteristiky náhodných premenných
Náhodné diskrétne alebo spojité premenné sa považujú za úplne špecifikované, ak sú známe ich distribučné zákony. V skutočnosti, keď poznáte distribučné zákony, môžete vždy vypočítať pravdepodobnosť zásahu

Kvantily náhodných premenných
Kvantil rádu náhodnej spojitej premennej

Matematické očakávanie náhodných premenných
Matematické očakávanie náhodnej premennej charakterizuje jej priemernú hodnotu. Všetky hodnoty náhodnej premennej sú zoskupené okolo tejto hodnoty. Zoberme si najprv náhodnú diskrétnu premennú

Smerodajná odchýlka a rozptyl náhodných veličín
Zoberme si najprv náhodnú diskrétnu premennú. Režim číselných charakteristík, medián, kvantily a matematické očakávanie

Momenty náhodných premenných
Teória pravdepodobnosti využíva okrem matematického očakávania a disperzie aj číselné charakteristiky vyšších rádov, ktoré sa nazývajú momenty náhodných premenných.

Vety o numerických charakteristikách náhodných premenných
Veta 1. Matematické očakávanie nenáhodnej hodnoty sa rovná tejto hodnote samotnej. Dôkaz: Nechaj

Zákon binomického rozdelenia

Poissonov zákon o rozdelení
Nech náhodná diskrétna premenná nadobudne hodnoty

Zákon o jednotnej distribúcii
Rovnomerný zákon rozdelenia náhodnej spojitej premennej je zákonom funkcie hustoty pravdepodobnosti, ktorá

Zákon normálneho rozdelenia
Zákon normálneho rozdelenia náhodnej spojitej premennej je zákon funkcie hustoty

Zákon exponenciálneho rozdelenia
Exponenciálne alebo exponenciálne rozdelenie náhodnej premennej sa používa v takých aplikáciách teórie pravdepodobnosti, ako je teória radenia, teória spoľahlivosti

Systémy náhodných premenných
V praxi sa pri aplikáciách teórie pravdepodobnosti často stretávame s problémami, v ktorých sú výsledky experimentu popísané nie jednou náhodnou veličinou, ale viacerými náhodnými veličinami naraz.

Systém dvoch náhodných diskrétnych premenných
Nech dve náhodné diskrétne premenné tvoria systém. Náhodná hodnota

Systém dvoch náhodných spojitých premenných
Nech je teraz systém tvorený dvoma náhodnými spojitými premennými. Distribučný zákon tohto systému sa nazýva pravdepodobne

Podmienené zákony distribúcie
Nech závislé náhodné spojité veličiny

Numerické charakteristiky systému dvoch náhodných veličín
Počiatočný moment poriadku sústavy náhodných veličín

Systém viacerých náhodných premenných
Výsledky získané pre systém dvoch náhodných premenných možno zovšeobecniť na prípad systémov pozostávajúcich z ľubovoľného počtu náhodných premenných. Nech je systém tvorený množinou

Zákon normálneho rozdelenia pre systém dvoch náhodných veličín
Uvažujme systém dvoch náhodných spojitých premenných. Zákon rozdelenia tohto systému je zákon normálneho rozdelenia

Limitné vety teórie pravdepodobnosti
Hlavným cieľom disciplíny teória pravdepodobnosti je študovať vzorce náhodných hromadných javov. Prax ukazuje, že pozorovanie množstva homogénnych náhodných javov odhaľuje

Čebyševova nerovnosť
Zvážte náhodnú premennú s matematickým očakávaním

Čebyševova veta
Ak sú náhodné premenné párovo nezávislé a majú konečné, kolektívne ohraničené rozptyly

Bernoulliho veta
Pri neobmedzenom zvyšovaní počtu experimentov frekvencia výskytu udalosti konverguje v pravdepodobnosti k pravdepodobnosti udalosti

Centrálna limitná veta
Pri pridávaní náhodných premenných s ľubovoľnými distribučnými zákonmi, ale so spoločne obmedzenými rozptylmi, distribučný zákon

Hlavné problémy matematickej štatistiky
Vyššie diskutované zákony teórie pravdepodobnosti predstavujú matematické vyjadrenie skutočných vzorcov, ktoré skutočne existujú v rôznych náhodných hromadných javoch. Študovať

Jednoduchá štatistická populácia. Štatistická distribučná funkcia
Uvažujme o náhodnej premennej, ktorej distribučný zákon nie je známy. Vyžaduje sa na základe skúseností

Štatistický rad. stĺpcový graf
Pri veľkom počte pozorovaní (rádovo v stovkách) sa populácia stáva nepohodlnou a ťažkopádnou na zaznamenávanie štatistického materiálu. Pre prehľadnosť a kompaktnosť štatistický materiál

Numerické charakteristiky štatistického rozdelenia
V teórii pravdepodobnosti boli uvažované rôzne číselné charakteristiky náhodných premenných: matematické očakávanie, disperzia, počiatočné a centrálne momenty rôznych rádov. Podobné čísla

Výber teoretického rozdelenia pomocou metódy momentov
Akékoľvek štatistické rozdelenie nevyhnutne obsahuje prvky náhodnosti spojené s obmedzeným počtom pozorovaní. S veľkým počtom pozorovaní sú tieto prvky náhodnosti vyhladené,

Overenie hodnovernosti hypotézy o podobe distribučného zákona
Nech je dané štatistické rozdelenie aproximované nejakou teoretickou krivkou resp

Kritériá súhlasu
Pozrime sa na jedno z najčastejšie používaných kritérií vhodnosti – takzvané Pearsonovo kritérium. Hádajte

Bodové odhady pre neznáme distribučné parametre
V pp. 2.1. – 2.7 sme podrobne skúmali, ako vyriešiť prvý a druhý hlavný problém matematickej štatistiky. Ide o problémy určovania zákonitostí rozdelenia náhodných veličín na základe experimentálnych údajov

Interval spoľahlivosti. Pravdepodobnosť spoľahlivosti
V praxi pri malom počte experimentov na náhodnej premennej približné nahradenie neznámeho parametra

Nech je náhodná vzorka generovaná pozorovanou náhodnou premennou ξ, matematickým očakávaním a rozptylom ktoré sú neznáme. Navrhlo sa použiť priemer vzorky ako odhad pre tieto charakteristiky

a rozptyl vzorky

. (3.14)

Uvažujme o niektorých vlastnostiach odhadov matematického očakávania a rozptylu.

1. Vypočítajte matematické očakávanie priemeru vzorky:

Preto je výberový priemer nestranným odhadom pre .

2. Pripomeňme, že výsledky pozorovania sú nezávislé náhodné premenné, z ktorých každá má rovnaký distribučný zákon ako hodnota, čo znamená , , . Budeme predpokladať, že rozptyl je konečný. Potom podľa Čebyševovej vety o zákone veľkých čísel pre každé ε > 0 platí rovnosť ,

čo sa dá napísať takto: . (3.16) Porovnaním (3.16) s definíciou vlastnosti konzistencie (3.11) vidíme, že odhad je konzistentným odhadom matematického očakávania.

3. Nájdite rozptyl priemeru vzorky:

. (3.17)

Rozptyl matematického odhadu očakávaní teda klesá nepriamo úmerne k veľkosti vzorky.

Dá sa dokázať, že ak je náhodná premenná ξ normálne rozdelená, potom výberový priemer je efektívnym odhadom matematického očakávania, to znamená, že rozptyl má najmenšiu hodnotu v porovnaní s akýmkoľvek iným odhadom matematického očakávania. Pre iné distribučné zákony ξ to tak nemusí byť.

Vzorový rozptyl je skreslený odhad rozptylu, pretože . (3.18)

V skutočnosti pomocou vlastností matematického očakávania a vzorca (3.17) nájdeme

.

Na získanie nezaujatého odhadu rozptylu je potrebné odhad (3.14) opraviť, teda vynásobiť . Potom dostaneme nezaujatý výberový rozptyl

. (3.19)

Všimnite si, že vzorce (3.14) a (3.19) sa líšia iba v menovateli a pre veľké hodnoty sa výberové a nezaujaté odchýlky líšia len málo. Pri malej veľkosti vzorky by sa však mal použiť vzťah (3.19).

Na odhad štandardnej odchýlky náhodnej premennej sa používa takzvaná „opravená“ štandardná odchýlka, ktorá sa rovná druhej odmocnine nezaujatého rozptylu: .

Intervalové odhady

V štatistike existujú dva prístupy k odhadu neznámych parametrov rozdelenia: bodový a intervalový. V súlade s bodovým odhadom, o ktorom sme hovorili v predchádzajúcej časti, je označený iba bod, okolo ktorého sa odhadovaný parameter nachádza. Je však žiaduce vedieť, ako ďaleko môže byť tento parameter v skutočnosti od možných realizácií odhadov v rôznych sériách pozorovaní.

Odpoveď na túto otázku – aj približnú – dáva iná metóda odhadu parametrov – interval. V súlade s touto metódou odhadu sa zistí interval, ktorý s pravdepodobnosťou blízkou jednej pokrýva neznámu číselnú hodnotu parametra.

Pojem intervalového odhadu

Bodový odhad je náhodná premenná a pre možné vzorové implementácie nadobúda hodnoty len približne rovné skutočnej hodnote parametra. Čím je rozdiel menší, tým je odhad presnejší. Teda kladné číslo, pre ktoré , charakterizuje presnosť odhadu a je tzv chyba odhadu (alebo marginálna chyba).

Pravdepodobnosť spoľahlivosti(alebo spoľahlivosť) nazývaná pravdepodobnosť β , s ktorou sa nerovnosť realizuje , t.j.

. (3.20)

Nahradenie nerovnosti ekvivalentná dvojitá nerovnosť , alebo , dostaneme

Interval , pokrývajúci s pravdepodobnosťou β , , neznámy parameter, sa volá interval spoľahlivosti (alebo intervalový odhad), zodpovedajúca pravdepodobnosť spoľahlivosti β .

Náhodná premenná nie je len odhad, ale aj chyba: jej hodnota závisí od pravdepodobnosti β a spravidla zo vzorky. Preto je interval spoľahlivosti náhodný a výraz (3.21) by sa mal čítať takto: „Interval pokryje parameter s pravdepodobnosťou β “, a nie takto: „Parameter pravdepodobne spadne do intervalu β ”.

Význam intervalu spoľahlivosti je ten, že pri opakovanom objeme vzorky mnohokrát v relatívnom pomere prípadov rovných β , interval spoľahlivosti zodpovedajúci pravdepodobnosti spoľahlivosti β , pokrýva skutočnú hodnotu odhadovaného parametra. Teda pravdepodobnosť spoľahlivosti β charakterizuje spoľahlivosť hodnotenie dôvery: čím viac β tým je pravdepodobnejšie, že implementácia intervalu spoľahlivosti obsahuje neznámy parameter.

KATEGÓRIE

POPULÁRNE ČLÁNKY

2023 „kingad.ru“ - ultrazvukové vyšetrenie ľudských orgánov