Estimarea așteptării matematice a unei variabile aleatoare. Estimări punctuale ale așteptărilor matematice

Să fie o variabilă aleatoare X cu așteptări matematice m si varianta D, în timp ce ambii acești parametri sunt necunoscuți. Peste valoarea X produs N experimente independente, în urma cărora un set de N rezultate numerice x 1 , x 2 , …, x N. Ca o estimare a așteptărilor matematice, este firesc să propunem media aritmetică a valorilor observate

(1)

Aici ca x i sunt luate în considerare valorile specifice (numerele) obținute ca rezultat N experimente. Daca luam altele (independente de cele anterioare) N experimente, atunci evident că vom obține o altă valoare. Dacă iei mai mult N experimente, atunci vom obține o altă valoare nouă. Să notăm prin X i variabilă aleatoare rezultată din i experimentul, apoi implementările X i vor fi numerele obţinute în urma acestor experimente. Evident, variabila aleatoare X i va avea aceeași funcție de densitate de probabilitate ca variabila aleatoare inițială X. De asemenea, credem că variabile aleatoare X iȘi X j sunt independente atunci când i, nu este egal j(diverse experimente independente unele de altele). Prin urmare, rescriem formula (1) într-o formă diferită (statistică):

(2)

Să arătăm că estimarea este imparțială:

Astfel, așteptarea matematică a mediei eșantionului este egală cu așteptarea matematică adevărată a variabilei aleatoare m. Acesta este un fapt destul de previzibil și de înțeles. În consecință, media eșantionului (2) poate fi luată ca o estimare a așteptării matematice a unei variabile aleatoare. Acum apare întrebarea: ce se întâmplă cu varianța estimării așteptărilor matematice pe măsură ce crește numărul de experimente? Calculele analitice arată că

unde este varianța estimării așteptărilor matematice (2) și D- varianţa adevărată a variabilei aleatoare X.

Din cele de mai sus rezultă că odată cu creșterea N(numărul de experimente) varianța estimării scade, i.e. Cu cât însumăm mai mult realizările independente, cu atât mai aproape de așteptările matematice obținem o estimare.


Estimări ale varianței matematice

La prima vedere, cea mai firească evaluare pare să fie

(3)

unde se calculează folosind formula (2). Să verificăm dacă estimarea este imparțială. Formula (3) poate fi scrisă după cum urmează:

Să înlocuim expresia (2) în această formulă:

Să găsim așteptările matematice ale estimării varianței:

(4)

Deoarece varianța unei variabile aleatoare nu depinde de ceea ce este așteptarea matematică a variabilei aleatoare, să luăm așteptarea matematică egală cu 0, i.e. m = 0.

(5)
la .(6)

Să existe o variabilă aleatoare X, iar parametrii ei sunt așteptările matematice Ași varianța sunt necunoscute. Au fost efectuate N experimente independente pe valoarea X, care au dat rezultatele x 1, x 2, x n.

Fără a reduce generalitatea raționamentului, vom considera că aceste valori ale variabilei aleatoare sunt diferite. Vom considera valorile x 1, x 2, x n ca variabile aleatoare independente, distribuite identic X 1, X 2, X n.

Cea mai simplă metodă de estimare statistică - metoda substituției și analogiei - constă în luarea caracteristicii corespunzătoare a distribuției eșantionului - caracteristica eșantionului - ca estimare a uneia sau alteia caracteristici numerice (media, varianța etc.) a populației generale. .

Utilizarea metodei substituției ca estimare a așteptărilor matematice A trebuie să luăm așteptările matematice ale distribuției eșantionului - media eșantionului. Astfel, primim

Pentru a verifica imparțialitatea și consistența mediei eșantionului ca estimare A, considerați această statistică ca o funcție a vectorului ales (X 1, X 2, X n). Ținând cont de faptul că fiecare dintre mărimile X 1, X 2, X n are aceeași lege de distribuție ca și valoarea X, concluzionăm că caracteristicile numerice ale acestor mărimi și valoarea X sunt aceleași: M(X i) = M(X) = A, D(X i) = D(X) = , i = 1, 2, n , unde X i sunt variabile aleatoare independente colectiv.

Prin urmare,

De aici, prin definiție, obținem că este o estimare imparțială A, iar din moment ce D()®0 pentru n®¥, apoi prin teorema paragrafului anterior este o estimare consistentă a așteptărilor matematice A populatie generala.

Eficacitatea sau ineficacitatea estimării depinde de tipul de lege de distribuție a variabilei aleatoare X. Se poate dovedi că dacă valoarea X este distribuită conform unei legi normale, atunci estimarea este eficientă. Pentru alte legi de distribuție, acesta poate să nu fie cazul.

O estimare imparțială a varianței generale servește ca varianță corectată a eșantionului

,

Deoarece , unde este varianța generală. Într-adevăr,

Estimarea s -- 2 pentru varianța generală este de asemenea valabilă, dar nu este eficientă. Totuși, în cazul unei distribuții normale, aceasta este „eficientă asimptotic”, adică, pe măsură ce n crește, raportul dintre varianța sa și cea minimă posibilă se apropie la infinit de unitate.

Deci, dacă este dat un eșantion din distribuția F( X) variabilă aleatoare X cu așteptare matematică necunoscută Ași dispersie, atunci pentru a calcula valorile acestor parametri avem dreptul de a folosi următoarele formule aproximative:

A ,

.

Aici x-i- - opțiunea de eșantionare, n- i - - opțiuni de frecvență x i, - - marime de mostra.
Pentru a calcula varianța eșantionului corectat, formula este mai convenabilă


.

Pentru a simplifica calculul, este recomandabil să treceți la opțiunile condiționate (ca și cu este avantajos să luați versiunea originală, situată la mijlocul seriei de variații de interval). Apoi

, .

Estimarea intervalului

Mai sus am luat în considerare problema estimării unui parametru necunoscut A un numar. Numim astfel de estimări estimări punctuale. Acestea au dezavantajul că la o dimensiune mică a eșantionului pot diferi semnificativ de parametrii estimați. Prin urmare, pentru a ne face o idee despre apropierea dintre un parametru și estimarea acestuia, în statistica matematică sunt introduse așa-numitele estimări de interval.

Fie o estimare punctuală q * să fie găsită în eșantionul pentru parametrul q. De obicei, cercetătorilor li se oferă în avans o probabilitate suficient de mare g (de exemplu, 0,95, 0,99 sau 0,999), astfel încât un eveniment cu probabilitatea g poate fi considerat practic de încredere și pun problema găsirii unei astfel de valori e > 0 pentru care

.

Modificând această egalitate, obținem:

iar în acest caz vom spune că intervalul ]q * - e; q * + e[ acoperă parametrul estimat q cu probabilitatea g.

Interval ]q * -e; q * +e [ se numește interval de încredere .

Probabilitatea g se numește fiabilitate (probabilitatea de încredere) a estimării intervalului.

Capetele intervalului de încredere, adică se numesc punctele q * -e si q * +e limitele de încredere .

Se numește numărul e acuratețea evaluării .

Ca exemplu al problemei determinării limitelor de încredere, luați în considerare problema estimării așteptării matematice a unei variabile aleatoare X, care are o lege de distribuție normală cu parametri. Ași s, adică X = N( A, s). Așteptările matematice în acest caz sunt egale cu A. Pe baza observațiilor X 1, X 2, X n, calculăm media și evaluare dispersie s 2.

Rezultă că din datele eșantionului este posibil să se construiască o variabilă aleatorie

care are o distribuție Student (sau distribuție t) cu n = n -1 grade de libertate.

Să folosim tabelul A.1.3 și să găsim pentru o probabilitate dată g și număr n numărul t g astfel încât probabilitatea

P(|t(n)|< t g) = g,

.

După ce am făcut transformări evidente, obținem,

Procedura de aplicare a testului F este următoarea:

1. Se presupune că distribuția populației este normală. La un nivel de semnificație dat a, se formulează ipoteza nulă H 0: s x 2 = s y 2 despre egalitatea varianțelor generale ale populațiilor normale sub ipoteza concurentă H 1: s x 2 > s y 2.

2. Două probe independente sunt obținute din populațiile X și Y de volum n x și respectiv n y.

3. Calculați valorile variațiilor eșantionului corectat s x 2 și s y 2 (metodele de calcul sunt discutate în §13.4). Cu cât varianțele sunt mai mari (s x 2 sau s y 2) este desemnată s 1 2, cu atât mai mică - s 2 2.

4. Valoarea criteriului F se calculează folosind formula F obs = s 1 2 / s 2 2.

5. Folosind tabelul punctelor critice ale distribuției Fisher-Snedecor, la un nivel de semnificație dat a și numărul de grade de libertate n 1 = n 1 - 1, n 2 = n 2 - 1 (n 1 este numărul de grade de libertate ale varianței mai mari corectate), punctul critic se găsește F cr (a, n 1, n 2).

Rețineți că Tabelul A.1.7 prezintă valorile critice ale testului F unilateral. Prin urmare, dacă se aplică un criteriu cu două laturi (H 1: s x 2 ¹ s y 2), atunci punctul critic din dreapta F cr (a/2, n 1, n 2) este căutat prin nivelul de semnificație a/ 2 (jumătate din valoarea specificată) și numărul de puteri libertate n 1 și n 2 (n 1 este numărul de grade de libertate de dispersie mai mare). Este posibil ca punctul critic din stânga să nu fie găsit.

6. Se trage concluzia: dacă valoarea calculată a criteriului F este mai mare sau egală cu valoarea critică (F obs ³ F cr), atunci varianțele diferă semnificativ la un anumit nivel de semnificație. În caz contrar (F obs.< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Problema 15.1. Consumul de materii prime pe unitatea de producție folosind vechea tehnologie a fost:

Folosind noi tehnologii:

Presupunând că populațiile generale corespunzătoare X și Y au distribuții normale, se verifică că din punct de vedere al variabilității, consumul de materii prime pentru tehnologiile noi și cele vechi nu diferă, dacă luăm nivelul de semnificație a = 0,1.

Soluţie. Procedăm în ordinea indicată mai sus.

1. Vom judeca variabilitatea consumului de materii prime prin tehnologii noi și vechi pe baza valorilor de dispersie. Astfel, ipoteza nulă are forma H 0: s x 2 = s y 2. Ca ipoteză concurentă, acceptăm ipoteza H 1: s x 2 ¹ s y 2, deoarece nu suntem siguri în prealabil că oricare dintre variațiile generale este mai mare decât cealaltă.

2-3. Să găsim variațiile eșantionului. Pentru a simplifica calculele, să trecem la opțiunile condiționate:

u i = x i - 307, v i = y i - 304.

Vom aranja toate calculele sub forma următoarelor tabele:

tu i m i m i u i m i u i 2 m i (u i +1) 2 v i n i n i v i n i v i 2 n i (v i +1) 2
-3 -3 -1 -2
å -
å -

Control: å m i u i 2 + 2å m i u i + m i = Control: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Să găsim variațiile eșantionului corectate:

4. Să comparăm varianțele. Să găsim raportul dintre varianța corectată mai mare și cea mai mică:

.

5. După condiție, ipoteza concurentă are forma s x 2 ¹ s y 2, prin urmare regiunea critică este bifață și la găsirea punctului critic trebuie luate niveluri de semnificație care sunt jumătate din valoarea specificată.

Conform tabelului A.1.7, folosind nivelul de semnificație a/2 = 0,1/2 = 0,05 și numărul de grade de libertate n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8, găsim punctul critic F cr ( 0,05; 12; 8) = 3,28.

6. Deoarece F obs.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.

Mai sus, la testarea ipotezelor, am presupus distribuția normală a variabilelor aleatoare studiate. Cu toate acestea, studii speciale au arătat că algoritmii propuși sunt foarte stabili (în special cu dimensiuni mari ale eșantionului) în ceea ce privește abaterile de la distribuția normală.

Parametri de distribuție și statistici

Orice parametri ai distribuției unei variabile aleatoare, de exemplu, cum ar fi așteptarea sau varianța matematică, sunt mărimi teoretice care nu pot fi măsurate direct, deși pot fi estimate. Ele reprezintă o caracteristică cantitativă populatie și ele însele pot fi determinate numai în timpul modelării teoretice ca valori ipotetice, deoarece descriu caracteristicile distribuției unei variabile aleatorii în populația generală în sine. Pentru a le determina în practică, cercetătorul care efectuează experimentul realizează o evaluare selectivă a acestora. Această evaluare implică calcul statistic.

Statistici este o caracteristică cantitativă a parametrilor studiați care caracterizează distribuția unei variabile aleatoare obținute pe baza unui studiu al valorilor eșantionului. Statisticile sunt folosite fie pentru a descrie eșantionul în sine, fie, ceea ce este de o importanță capitală în cercetarea experimentală fundamentală, pentru a estima parametrii distribuției unei variabile aleatorii în populația studiată.

Separarea conceptelor "parametru" Și "statistici" este foarte important, deoarece vă permite să evitați o serie de erori asociate cu interpretarea incorectă a datelor obținute în experiment. Cert este că atunci când estimăm parametrii de distribuție folosind date statistice, obținem valori care sunt doar într-o anumită măsură apropiate de parametrii estimați. Există aproape întotdeauna o diferență între parametri și statistici și, de obicei, nu putem spune cât de mare este această diferență. Teoretic, cu cât eșantionul este mai mare, cu atât parametrii estimați sunt mai aproape de caracteristicile eșantionului lor. Totuși, acest lucru nu înseamnă că prin creșterea dimensiunii eșantionului, ne vom apropia inevitabil de parametrul estimat și ne vom reduce diferența dintre acesta și statisticile calculate. În practică, totul se poate dovedi a fi mult mai complicat.

Dacă, în teorie, valoarea așteptată a statisticii coincide cu parametrul estimat, atunci o astfel de estimare se numește nedeplasate. Se numește o estimare în care valoarea așteptată a parametrului estimat diferă de parametrul în sine cu o anumită sumă deplasat.

De asemenea, este necesar să se facă distincția între estimările punctuale și pe intervale ale parametrilor de distribuție. Loc numită evaluare folosind un număr. De exemplu, dacă spunem că valoarea pragului spațial al sensibilității tactile pentru un subiect dat în condiții date și pe o anumită zonă a pielii este de 21,8 mm, atunci o astfel de estimare va fi punctuală. În același mod, o estimare punctuală apare atunci când buletinul meteo ne spune că în afara ferestrei sunt 25°C. Estimarea intervalului implică utilizarea unui set sau a unei game de numere într-o evaluare. Evaluând pragul spațial al sensibilității tactile, putem spune că acesta a fost în intervalul de la 20 la 25 mm. În mod similar, meteorologii pot raporta că, conform prognozelor lor, temperatura aerului în următoarele 24 de ore va ajunge la 22–24°C. Estimarea pe intervale a unei variabile aleatoare ne permite nu numai să determinăm valoarea dorită a acestei cantități, ci și să stabilim posibila acuratețe pentru o astfel de estimare.

Așteptările matematice și evaluarea acesteia

Să revenim la experimentul nostru de aruncare a monedelor.

Să încercăm să răspundem la întrebarea: de câte ori ar trebui să apară „capete” dacă aruncăm o monedă de zece ori? Răspunsul pare evident. Dacă probabilitățile fiecăruia dintre cele două rezultate sunt egale, atunci rezultatele în sine trebuie să fie distribuite în mod egal. Cu alte cuvinte, atunci când aruncăm o monedă obișnuită de zece ori, ne putem aștepta ca una dintre fețele sale, de exemplu „capete”, să aterizeze exact de cinci ori. În mod similar, atunci când aruncați o monedă de 100 de ori, „capete” ar trebui să apară exact de 50 de ori, iar dacă moneda este aruncată de 4236 de ori, atunci partea care ne interesează ar trebui să apară de 2118 ori, nici mai mult, nici mai puțin.

Deci, sensul teoretic al unui eveniment aleatoriu este de obicei numit așteptări matematice. Valoarea așteptată poate fi găsită prin înmulțirea probabilității teoretice a variabilei aleatoare cu numărul de încercări. Mai formal, însă, este definit ca un moment central de ordinul întâi. Astfel, așteptarea matematică este valoarea unei variabile aleatoare la care tinde teoretic în timpul testelor repetate, în jurul căreia variază.

Este clar că valoarea teoretică a așteptării matematice ca parametru de distribuție nu este întotdeauna egală cu valoarea empirică a variabilei aleatoare de interes pentru noi, exprimată în statistică. Dacă facem un experiment cu aruncarea unei monede, atunci este destul de probabil ca din zece rezultate, „capete” să apară doar de patru sau trei ori, sau poate, dimpotrivă, să apară de opt ori, sau poate că nu va apărea deloc. Este clar că unele dintre aceste rezultate se dovedesc a fi mai multe, altele mai puțin probabile. Dacă folosim legea distribuției normale, putem ajunge la concluzia că cu cât rezultatul se abate de la cel așteptat teoretic, specificat de valoarea așteptării matematice, cu atât este mai puțin probabil în practică.

Să presupunem în continuare că am efectuat o procedură similară de mai multe ori și nu am observat niciodată valoarea așteptată teoretic. Atunci s-ar putea să avem îndoieli cu privire la autenticitatea monedei. Putem presupune că pentru moneda noastră probabilitatea de a obține capete nu este de fapt de 50%. În acest caz, poate fi necesar să se estimeze probabilitatea acestui eveniment și, în consecință, valoarea așteptărilor matematice. Această nevoie apare ori de câte ori într-un experiment studiem distribuția unei variabile aleatoare continue, cum ar fi timpul de reacție, fără a avea în prealabil vreun model teoretic. De regulă, acesta este primul pas obligatoriu în prelucrarea cantitativă a rezultatelor experimentale.

Așteptările matematice pot fi estimate în trei moduri, care în practică pot da rezultate ușor diferite, dar în teorie ar trebui să ne conducă cu siguranță la valoarea așteptării matematice.

Logica unei astfel de evaluări este ilustrată în Fig. 1.2. Valoarea așteptată poate fi considerată ca tendința centrală în distribuția unei variabile aleatoare X, ca valoarea sa cea mai probabilă și, prin urmare, cea mai frecventă și ca un punct care împarte distribuția în două părți egale.

Orez. 1.2.

Să continuăm experimentele noastre imaginare cu o monedă și să efectuăm trei experimente cu aruncarea ei de zece ori. Să presupunem că în primul experiment „capete” au apărut de patru ori, același lucru s-a întâmplat în al doilea experiment, în al treilea experiment „capete” au apărut de mai mult de o dată și jumătate mai des - de șapte ori. Este logic să presupunem că așteptarea matematică a evenimentului de care ne interesează se află de fapt undeva între aceste valori.

Primul, cel mai simplu metoda de evaluare așteptarea matematică va fi de a găsi medie aritmetică. Apoi, estimarea valorii așteptate pe baza celor trei măsurători de mai sus va fi (4 + 4 + 7)/3 = 5. În mod similar, în experimentele cu timpul de reacție, valoarea așteptată poate fi estimată luând media aritmetică a tuturor valorilor obținute. X. Deci, dacă am cheltuit P măsurarea timpului de reacție X, atunci putem folosi următoarea formulă, care ne arată că pentru a calcula media aritmetică X este necesar să adunăm toate valorile obținute empiric și să le împărțim la numărul de observații:

În formula (1.2), măsura așteptărilor matematice este de obicei notată ca ̅ X (a se citi „X cu bară”), deși uneori poate fi scris ca M (din engleza Rău - in medie).

Media aritmetică este cea mai utilizată estimare a așteptărilor matematice. În astfel de cazuri, se presupune că variabila aleatoare este măsurată în metric scară. Este clar că rezultatul obținut poate coincide sau nu cu adevărata valoare a așteptării matematice, pe care nu o știm niciodată. Este important, totuși, că această metodă este imparțial estimarea așteptărilor matematice. Aceasta înseamnă că valoarea așteptată a valorii estimate este egală cu așteptarea sa matematică: .

A doua metodă de evaluare așteptarea matematică este de a lua ca valoare valoarea cea mai frecventă a variabilei care ne interesează. Această valoare este numită modul de distribuție. De exemplu, în cazul aruncării unei monede abia luate în considerare, „patru” poate fi luat ca valoare a așteptării matematice, întrucât în ​​cele trei teste efectuate această valoare a apărut de două ori; De aceea, modul de distribuție în acest caz s-a dovedit a fi egal cu patru. Estimarea modului este utilizată în principal atunci când experimentatorul are de-a face cu variabile care iau valori discrete specificate în nemetric scară.

De exemplu, prin descrierea distribuției notelor elevilor la un examen, se poate construi o distribuție de frecvență a notelor primite de studenți. Această distribuție de frecvență se numește histogramă. În acest caz, cea mai comună estimare poate fi luată ca valoare a tendinței centrale (așteptările matematice). Când se studiază variabile caracterizate prin valori continue, această măsură practic nu este utilizată sau este rar folosită. Dacă distribuția de frecvență a rezultatelor obținute este totuși construită, atunci, de regulă, aceasta se referă nu la valorile obținute experimental ale caracteristicii studiate, ci la unele intervale de manifestare a acesteia. De exemplu, studiind înălțimea oamenilor, puteți vedea câți oameni se încadrează în intervalul de până la 150 cm înălțime, câți cad în intervalul de la 150 la 155 cm etc. În acest caz, modul va fi legat de valorile de interval ale caracteristicii studiate, în acest caz, înălțimea.

Este clar că modul, la fel ca media aritmetică, poate coincide sau nu cu valoarea reală a așteptărilor matematice. Dar la fel ca media aritmetică, modul este o estimare imparțială a așteptărilor matematice.

Să adăugăm că, dacă două valori din eșantion apar la fel de des, atunci se numește o astfel de distribuție bimodal. Dacă trei sau mai multe valori dintr-o probă apar la fel de des, atunci se spune că o astfel de probă nu are mod. Astfel de cazuri, cu un număr suficient de mare de observații, de regulă, indică faptul că datele sunt extrase dintr-o populație generală, a cărei distribuție diferă de cea normală.

In cele din urma, a treia metodă de evaluare așteptarea matematică este de a împărți eșantionul de subiecți în funcție de parametrul care ne interesează exact în jumătate. Mărimea care caracterizează această limită se numește median distribuţiile.

Să presupunem că suntem prezenți la o competiție de schi și după ce se încheie vrem să evaluăm care dintre sportivi au avut rezultate peste medie și care sub. Dacă componența participanților este mai mult sau mai puțin uniformă, atunci când se evaluează rezultatul mediu, este logic să se calculeze media aritmetică. Să presupunem însă că printre participanții profesioniști se numără mai mulți amatori. Sunt puține dintre ele, dar arată rezultate semnificativ inferioare celorlalți. În acest caz, se poate dovedi că din 100 de participanți la competiție, de exemplu, 87 au avut rezultate peste medie. Este clar că o astfel de evaluare a tendinței medii nu ne poate satisface întotdeauna. În acest caz, este logic să presupunem că rezultatul mediu a fost afișat de participanții care au ocupat undeva pe locul 50 sau 51. Aceasta va fi mediana distribuției. Înainte de cel de-al 50-lea finalist, 49 de participanți au terminat, după cel de-al 51-lea – tot 49. Nu este clar, însă, al cui rezultat dintre ei ar trebui luat ca medie. Desigur, se poate dovedi că au terminat în același timp. Atunci nu este nicio problemă. Problema nu apare atunci când numărul de observații este impar. În alte cazuri, totuși, puteți utiliza media rezultatelor a doi participanți.

Mediana este un caz special al cuantilei unei distribuții. Quantile face parte din distribuție. Formal, poate fi definită ca valoarea integrală a distribuției dintre două valori ale unei variabile X. Astfel, valoarea X va fi mediana distribuției dacă valoarea integrală a distribuției (densitatea probabilității) este de la -∞ la X egală cu valoarea integrală a distribuţiei din X la +∞. În mod similar, distribuția poate fi împărțită în patru, zece sau 100 de părți. Astfel de cuantile sunt numite în consecință quartile, decile Și percentile. Există și alte tipuri de cuantile.

La fel ca cele două metode anterioare de estimare a așteptărilor matematice, mediana este o estimare imparțială a așteptărilor matematice.

Teoretic, se presupune că, dacă avem de-a face într-adevăr cu o distribuție normală a unei variabile aleatoare, atunci toate cele trei estimări ale așteptării matematice ar trebui să dea același rezultat, deoarece toate reprezintă o variantă. imparțial estimări ale aceluiași parametru de distribuție al variabilei aleatoare estimate (vezi Fig. 1.2). În practică, însă, acest lucru se întâmplă rar. Acest lucru se poate datora, în special, faptului că distribuția analizată diferă de cea normală. Dar principalul motiv pentru astfel de discrepanțe, de regulă, este că, prin estimarea valorii așteptării matematice, se poate obține o valoare care diferă foarte semnificativ de valoarea sa adevărată. Cu toate acestea, după cum sa menționat mai sus, s-a dovedit în statistica matematică că, cu cât sunt efectuate teste mai independente ale variabilei luate în considerare, cu atât valoarea estimată ar trebui să fie mai aproape de cea adevărată.

Astfel, în practică, alegerea metodei de estimare a așteptărilor matematice este determinată nu de dorința de a obține o estimare mai precisă și mai fiabilă a acestui parametru, ci doar de considerente de comoditate. De asemenea, un anumit rol în alegerea unei metode de estimare a așteptărilor matematice îl joacă scala de măsurare, care reflectă observațiile variabilei aleatoare evaluate.

Să fie efectuate experimente independente pe o variabilă aleatorie cu așteptări și varianță matematică necunoscute, care au dat rezultatele - . Să calculăm estimări consistente și nepărtinitoare pentru parametrii și .

Ca o estimare a așteptărilor matematice, luăm media aritmetică a valorilor experimentale

. (2.9.1)

Conform legii numerelor mari, această estimare este bogat , cu valoare după probabilitate. Aceeași evaluare este, de asemenea imparțial , deoarece

. (2.9.2)

Varianta acestei estimări este

. (2.9.3)

Se poate arăta că pentru legea distribuției normale această estimare este efectiv . Pentru alte legi, acest lucru poate să nu fie cazul.

Să estimăm acum varianța. Să alegem mai întâi formula pentru estimare varianta statistica

. (2.9.4)

Să verificăm consistența estimării varianței. Să deschidem parantezele din formula (2.9.4)

.

Când primul termen converge în probabilitate către valoare , în al doilea - la. Astfel, estimarea noastră converge în probabilitate către varianță

,

prin urmare ea este bogat .

Sa verificam nedeplasate estimări pentru cantitate. Pentru a face acest lucru, înlocuim expresia (2.9.1) în formula (2.9.4) și luăm în considerare că variabilele aleatoare independent

,

. (2.9.5)

Să trecem în formula (2.9.5) la fluctuațiile variabilelor aleatoare

Deschizând parantezele, obținem

,

. (2.9.6)

Să calculăm așteptarea matematică a valorii (2.9.6), ținând cont de faptul că

. (2.9.7)

Relația (2.9.7) arată că valoarea calculată folosind formula (2.9.4) nu este o estimare imparțială pentru dispersie. Așteptările sale matematice nu sunt egale, dar oarecum mai mici. O astfel de evaluare duce la o eroare sistematică în jos. Pentru a elimina o astfel de părtinire, trebuie să introduceți o corecție prin înmulțirea valorii . Această varianță statistică corectată poate servi apoi ca un estimator imparțial pentru varianță

. (2.9.8)

Această estimare este la fel de validă ca și estimarea, de când valoarea este .

În practică, în loc de estimare (2.9.8), uneori este mai convenabil să se utilizeze o estimare echivalentă asociată cu al doilea moment statistic inițial

. (2.9.9)

Estimările (2.9.8), (2.9.9) nu sunt eficiente. Se poate arăta că în cazul unei legi de distribuţie normală acestea vor fi eficient asimptotic (la dorință tinde spre valoarea minimă posibilă).

Astfel, pot fi formulate următoarele reguli de prelucrare a materialului statistic limitat în volum. Dacă în experimente independente variabila aleatoare ia valorile cu așteptări matematice și dispersie necunoscute, atunci pentru a determina acești parametri ar trebui să folosiți estimări aproximative

(2.9.10)

Sfârșitul lucrării -

Acest subiect aparține secțiunii:

Note de curs în matematică teoria probabilității statistică matematică

Departamentul de Matematică Superioară și Informatică.. Note de curs.. la Matematică..

Dacă aveți nevoie de material suplimentar pe această temă, sau nu ați găsit ceea ce căutați, vă recomandăm să utilizați căutarea în baza noastră de date de lucrări:

Ce vom face cu materialul primit:

Dacă acest material ți-a fost util, îl poți salva pe pagina ta de pe rețelele sociale:

Toate subiectele din această secțiune:

Teoria probabilității
Teoria probabilității este o ramură a matematicii în care sunt studiate modelele fenomenelor de masă aleatoare. Un fenomen care este aleatoriu se numește

Definiția statistică a probabilității
Un eveniment este un fenomen aleatoriu care poate sau nu să apară ca urmare a experienței (fenomen ambiguu). Indicați evenimentele cu majuscule latine

Spațiul evenimentelor elementare
Să fie multe evenimente asociate cu o anumită experiență și: 1) ca rezultat al experienței, apare un singur lucru

Acțiuni pe evenimente
Suma a două evenimente și

Rearanjamente
Numărul de permutări diferite ale elementelor este notat cu

Plasări
Prin plasarea elementelor conform

Combinații
O combinație de elemente

Formula pentru adăugarea probabilităților pentru evenimente incompatibile
Teorema. Probabilitatea sumei a două evenimente incompatibile este egală cu suma probabilităților acestor evenimente. (1

Formula pentru adăugarea probabilităților pentru evenimente arbitrare
Teorema. Probabilitatea sumei a două evenimente este egală cu suma probabilităților acestor evenimente fără probabilitatea produsului lor.

Formula de multiplicare a probabilității
Lăsați două evenimente și să fie date. Luați în considerare evenimentul

Formula probabilității totale
Fie un grup complet de evenimente incompatibile; ele se numesc ipoteze. Luați în considerare un eveniment

Formula probabilității ipotezei (Bayes)
Să luăm din nou în considerare - grupul complet de ipoteze incompatibile și evenimentul

Formula Poisson asimptotică
În cazurile în care numărul de teste este mare și probabilitatea apariției unui eveniment

Mărimi aleatorii discrete
O cantitate aleatoare este o cantitate care, atunci când experimentul este repetat, poate lua valori numerice inegale. Variabila aleatoare se numește discretă,

Variabile aleatorii continue
Dacă, în urma experimentului, o variabilă aleatoare poate lua orice valoare dintr-un anumit segment sau din întreaga axă reală, atunci se numește continuă. Lege

Funcția de densitate de probabilitate a unei variabile continue aleatoare
Lasa. Să luăm în considerare un punct și să-i dăm creșteri

Caracteristicile numerice ale variabilelor aleatoare
Variabilele aleatoare discrete sau continue sunt considerate complet specificate dacă legile lor de distribuție sunt cunoscute. De fapt, cunoscând legile distribuției, puteți calcula oricând probabilitatea de a lovi

Quantile de variabile aleatoare
Quantila de ordinul unei variabile continue aleatoare

Așteptările matematice ale variabilelor aleatoare
Așteptările matematice ale unei variabile aleatoare caracterizează valoarea medie a acesteia. Toate valorile variabilei aleatoare sunt grupate în jurul acestei valori. Să considerăm mai întâi variabila discretă aleatoare

Abaterea standard și dispersia variabilelor aleatoare
Să considerăm mai întâi o variabilă discretă aleatoare. Modul caracteristici numerice, mediană, cuantile și așteptări matematice

Momente de variabile aleatorii
Pe lângă așteptările și dispersia matematică, teoria probabilității folosește caracteristici numerice de ordine superioare, care sunt numite momente ale variabilelor aleatoare.

Teoreme privind caracteristicile numerice ale variabilelor aleatoare
Teorema 1. Aşteptarea matematică a unei valori non-aleatoare este egală cu această valoare însăşi. Dovada: lasa

Legea distribuției binomiale

Legea distribuției Poisson
Fie ca o variabilă discretă aleatoare să ia valorile

Legea distribuției uniforme
Legea uniformă de distribuție a unei variabile continue aleatoare este legea funcției de densitate de probabilitate, care

Legea distribuției normale
Legea distribuției normale a unei variabile continue aleatoare este legea funcției de densitate

Legea distribuției exponențiale
Distribuția exponențială sau exponențială a unei variabile aleatoare este utilizată în astfel de aplicații ale teoriei probabilităților, cum ar fi teoria cozilor, teoria fiabilității

Sisteme de variabile aleatorii
În practică, în aplicațiile teoriei probabilităților, se întâlnesc adesea probleme în care rezultatele unui experiment sunt descrise nu de o variabilă aleatoare, ci de mai multe variabile aleatorii deodată.

Sistem de două variabile aleatoare discrete
Fie două variabile discrete aleatoare să formeze un sistem. Valoare aleatoare

Sistem de două variabile aleatoare continue
Să fie acum sistemul format din două variabile aleatoare continue. Legea distribuției acestui sistem se numește probabil

Legile condiționale ale distribuției
Fie cantități continue aleatoare dependente

Caracteristicile numerice ale unui sistem de două variabile aleatoare
Momentul inițial de ordine al unui sistem de variabile aleatoare

Sistem de mai multe variabile aleatorii
Rezultatele obţinute pentru un sistem de două variabile aleatoare pot fi generalizate la cazul sistemelor formate dintr-un număr arbitrar de variabile aleatoare. Fie ca sistemul să fie format dintr-o mulțime

Legea distribuției normale a unui sistem de două variabile aleatoare
Să considerăm un sistem de două variabile aleatoare continue. Legea distribuției acestui sistem este legea distribuției normale

Teoreme limită ale teoriei probabilităților
Scopul principal al disciplinei teoria probabilității este de a studia tiparele fenomenelor de masă aleatoare. Practica arată că observarea unei mase de fenomene aleatorii omogene relevă

inegalitatea lui Cebyshev
Luați în considerare o variabilă aleatoare cu așteptări matematice

teorema lui Cebyshev
Dacă variabilele aleatoare sunt independente pe perechi și au varianțe finite, mărginite colectiv

teorema lui Bernoulli
Cu o creștere nelimitată a numărului de experimente, frecvența de apariție a unui eveniment converge în probabilitate cu probabilitatea evenimentului

Teorema limitei centrale
Când se adaugă variabile aleatoare cu orice lege de distribuție, dar cu variații limitate în comun, legea distribuției

Principalele probleme de statistică matematică
Legile teoriei probabilităților discutate mai sus reprezintă o expresie matematică a tiparelor reale care există de fapt în diferite fenomene de masă aleatoare. Studiu

O populație statistică simplă. Funcția de distribuție statistică
Să luăm în considerare o variabilă aleatoare a cărei lege de distribuție este necunoscută. Necesar pe baza experienței

Serii statistice. diagramă cu bare
Cu un număr mare de observații (de ordinul sutelor), populația devine incomodă și greoaie pentru înregistrarea materialului statistic. Pentru claritate și compactitate, material statistic

Caracteristicile numerice ale distribuţiei statistice
În teoria probabilităților au fost luate în considerare diverse caracteristici numerice ale variabilelor aleatoare: așteptarea matematică, dispersia, momentele inițiale și centrale de diverse ordine. Cifre similare

Selectarea distribuției teoretice folosind metoda momentelor
Orice distribuție statistică conține în mod inevitabil elemente de aleatorie asociate cu numărul limitat de observații. Cu un număr mare de observații, aceste elemente ale aleatoriei sunt netezite,

Verificarea plauzibilității ipotezei despre forma legii distribuției
Fie ca o distribuție statistică dată să fie aproximată printr-o curbă teoretică sau

Criterii de consimțământ
Să luăm în considerare unul dintre criteriile de bunătate de potrivire cele mai frecvent utilizate - așa-numitul criteriu Pearson. Ghici

Estimări punctuale pentru parametrii de distribuție necunoscuți
În pp. 2.1. – 2.7 am examinat în detaliu modul de rezolvare a primei și a doua probleme principale de statistică matematică. Acestea sunt problemele determinării legilor de distribuție a variabilelor aleatoare pe baza datelor experimentale

Interval de încredere. Probabilitatea de încredere
În practică, cu un număr mic de experimente pe o variabilă aleatorie, o înlocuire aproximativă a parametrului necunoscut

Să fie generat eșantionul aleator de variabila aleatoare observată ξ, așteptarea și varianța matematică care sunt necunoscute. S-a propus utilizarea mediei eșantionului ca estimări pentru aceste caracteristici

și varianța eșantionului

. (3.14)

Să luăm în considerare câteva proprietăți ale estimărilor de așteptare și dispersie matematică.

1. Calculați așteptarea matematică a mediei eșantionului:

Prin urmare, media eșantionului este un estimator imparțial pentru .

2. Amintiți-vă că rezultatele observațiile sunt variabile aleatoare independente, fiecare dintre ele având aceeași lege de distribuție ca și valoarea, ceea ce înseamnă , , . Vom presupune că varianța este finită. Apoi, conform teoremei lui Cebyshev asupra legii numerelor mari, pentru orice ε > 0 egalitatea este valabilă ,

care se poate scrie astfel: . (3.16) Comparând (3.16) cu definiția proprietății de consistență (3.11), vedem că estimarea este o estimare consistentă a așteptării matematice.

3. Aflați varianța mediei eșantionului:

. (3.17)

Astfel, varianța estimării așteptărilor matematice scade invers proporțional cu dimensiunea eșantionului.

Se poate dovedi că, dacă variabila aleatoare ξ este distribuită normal, atunci media eșantionului este o estimare efectivă a așteptărilor matematice, adică varianța ia cea mai mică valoare în comparație cu orice altă estimare a așteptării matematice. Pentru alte legi de distribuție ξ acesta poate să nu fie cazul.

Varianta eșantionului este o estimare părtinitoare a varianței deoarece . (3.18)

Într-adevăr, folosind proprietățile așteptării matematice și formulei (3.17), găsim

.

Pentru a obține o estimare imparțială a varianței, estimarea (3.14) trebuie corectată, adică înmulțită cu . Apoi obținem varianța eșantionului imparțial

. (3.19)

Rețineți că formulele (3.14) și (3.19) diferă doar la numitor, iar pentru valori mari, eșantionul și variațiile imparțial diferă puțin. Cu toate acestea, cu o dimensiune mică a eșantionului, ar trebui utilizată relația (3.19).

Pentru a estima abaterea standard a unei variabile aleatoare se folosește așa-numita abatere standard „corectată”, care este egală cu rădăcina pătrată a varianței nepărtinitoare: .

Estimări de interval

În statistică, există două abordări pentru estimarea parametrilor necunoscuți ai distribuțiilor: punct și interval. În conformitate cu estimarea punctuală, care a fost discutată în secțiunea anterioară, este indicat doar punctul în jurul căruia este situat parametrul estimat. Este de dorit, totuși, să știm cât de departe poate fi de fapt acest parametru de posibilele realizări ale estimărilor în diferite serii de observații.

Răspunsul la această întrebare – tot aproximativ – este dat de o altă metodă de estimare a parametrilor – intervalul. Conform acestei metode de estimare, se constată un interval care, cu o probabilitate apropiată de unu, acoperă valoarea numerică necunoscută a parametrului.

Conceptul de estimare a intervalului

Estimare punctuală este o variabilă aleatorie și pentru posibilele implementări de eșantion iau valori doar aproximativ egale cu valoarea reală a parametrului. Cu cât diferența este mai mică, cu atât estimarea este mai precisă. Astfel, un număr pozitiv pentru care , caracterizează acuratețea estimării și se numește eroare de estimare (sau eroare marginală).

Probabilitatea de încredere(sau fiabilitate) numită probabilitate β , cu care se realizează inegalitatea , adică

. (3.20)

Înlocuirea inegalității dublă inegalitate echivalentă , sau , primim

Interval , acoperind cu probabilitate β , , parametru necunoscut, este apelat interval de încredere (sau estimarea intervalului), probabilitatea de încredere corespunzătoare β .

O variabilă aleatoare nu este doar o estimare, ci și o eroare: valoarea ei depinde de probabilitate β și, de regulă, din eșantion. Prin urmare, intervalul de încredere este aleatoriu și expresia (3.21) trebuie citită după cum urmează: „Intervalul va acoperi parametrul cu probabilitate β ”, și nu așa: „Parametrul va cădea în intervalul cu probabilitate β ”.

Semnificația intervalului de încredere este că atunci când se repetă un volum de probă de mai multe ori într-o proporție relativă de cazuri egală cu β , interval de încredere corespunzător probabilității de încredere β , acoperă valoarea reală a parametrului estimat. Astfel, probabilitatea de încredere β caracterizează fiabilitate evaluarea încrederii: cu atât mai mult β , cu atât este mai probabil ca implementarea intervalului de încredere să conţină un parametru necunoscut.

CATEGORII

ARTICOLE POPULARE

2023 „kingad.ru” - examinarea cu ultrasunete a organelor umane