Estimarea așteptării matematice a unei variabile aleatoare. Estimări punctuale ale așteptărilor matematice

Să fie o variabilă aleatoare X cu așteptări matematice mși dispersie D, în timp ce ambii acești parametri sunt necunoscuți. Peste magnitudine X produs N experimente independente, care au dus la un set de N rezultate numerice x 1 , x 2 , …, x N. Ca o estimare a așteptărilor matematice, este firesc să propunem media aritmetică a valorilor observate

(1)

Aici ca x i valori specifice (numere) obținute ca urmare a N experimente. Daca luam altele (independente de cele anterioare) N experimente, atunci, evident, vom obține o altă valoare. Dacă iei mai mult N experimente, vom obține încă o valoare nouă. Notează prin X i variabilă aleatoare rezultată din i experimentul, apoi realizările X i vor fi numerele obţinute în urma acestor experimente. Este evident că variabila aleatoare X i va avea aceeași densitate de distribuție a probabilității ca variabila aleatoare inițială X. De asemenea, presupunem că variabilele aleatoare X iși Xj sunt independente la i, nu este egal j(diferite experimente independente unul față de celălalt). Prin urmare, rescriem formula (1) într-o formă diferită (statistică):

(2)

Să arătăm că estimarea este imparțială:

Astfel, așteptarea matematică a mediei eșantionului este egală cu așteptarea matematică adevărată a variabilei aleatoare m. Acesta este un fapt destul de previzibil și de înțeles. Prin urmare, media eșantionului (2) poate fi luată ca o estimare a așteptării matematice a unei variabile aleatoare. Acum apare întrebarea: ce se întâmplă cu variația estimării așteptărilor pe măsură ce numărul de experimente crește? Calculele analitice arată că

unde este varianța estimării așteptării matematice (2) și D- varianţa adevărată a variabilei aleatoare X.

Din cele de mai sus rezultă că odată cu creșterea N(numărul de experimente) varianța estimării scade, i.e. cu cât rezumăm mai mult implementările independente, cu atât obținem estimarea mai aproape de valoarea așteptată.


Estimări ale varianței matematice

La prima vedere, cea mai firească estimare pare să fie

(3)

unde se calculează prin formula (2). Să verificăm dacă estimarea este imparțială. Formula (3) poate fi scrisă după cum urmează:

Inlocuim expresia (2) in aceasta formula:

Să găsim așteptările matematice ale estimării varianței:

(4)

Deoarece varianța unei variabile aleatoare nu depinde de care este așteptarea matematică a variabilei aleatoare, vom lua așteptarea matematică egală cu 0, i.e. m = 0.

(5)
la .(6)

Să existe o variabilă aleatoare X, iar parametrii ei sunt așteptările matematice Ași varianța sunt necunoscute. Peste valoarea lui X, au fost efectuate experimente independente, care au dat rezultatele x 1, x 2, x n.

Fără a diminua generalitatea raționamentului, vom considera că aceste valori ale variabilei aleatoare sunt diferite. Vom considera valorile x 1, x 2, x n ca variabile aleatoare independente, distribuite identic X 1, X 2, X n .

Cea mai simplă metodă de estimare statistică - metoda substituției și analogiei - constă în faptul că, ca estimare a uneia sau alteia caracteristici numerice (medie, varianță etc.) a populației generale, acestea iau caracteristica corespunzătoare a distribuției eșantionului. - caracteristica probei.

Prin metoda substituției ca estimare a așteptării matematice A este necesar să se ia așteptarea matematică a distribuției eșantionului – media eșantionului. Astfel, primim

Pentru a testa imparțialitatea și consistența mediei eșantionului ca estimări A, considerați această statistică ca o funcție a vectorului ales (X 1, X 2, X n). Ținând cont că fiecare dintre mărimile X 1, X 2, X n are aceeași lege de distribuție ca și mărimea X, concluzionăm că caracteristicile numerice ale acestor mărimi și ale mărimii X sunt aceleași: M(X i) = M(X) = A, D(X i) = D(X) = , i = 1, 2, n , unde X i sunt variabile aleatoare independente colectiv.

Prin urmare,

Prin urmare, prin definiție, obținem că aceasta este estimarea imparțială A, și deoarece D()®0 ca n®¥, atunci în virtutea teoremei paragrafului anterior este o estimare consistentă a așteptărilor A populatia generala.

Eficiența sau ineficiența estimării depinde de forma legii de distribuție a variabilei aleatoare X. Se poate demonstra că dacă valoarea X este distribuită conform legii normale, atunci estimarea este eficientă. Pentru alte legi de distribuție, acesta poate să nu fie cazul.

Estimare imparțială a varianței generale este varianța eșantionului corectată

,

pentru că , unde este varianța generală. Într-adevăr,

Estimarea s -- 2 pentru varianța generală este de asemenea consecventă, dar nu eficientă. Totuși, în cazul unei distribuții normale, ea este „eficientă asimptotic”, adică pe măsură ce n crește, raportul dintre varianța ei și cel minim posibil se apropie la nesfârșit.

Deci, având în vedere un eșantion din distribuția F( X) variabilă aleatoare X cu așteptare matematică necunoscută Ași dispersie, apoi pentru a calcula valorile acestor parametri, avem dreptul de a folosi următoarele formule aproximative:

A ,

.

Aici x-i- - opțiuni de eșantionare, n- i - - opțiuni de frecvență x i , - - marime de mostra.
Pentru a calcula varianța eșantionului corectat, formula este mai convenabilă


.

Pentru a simplifica calculul, este recomandabil să treceți la opțiunile condiționate (este avantajos să luăm ca c varianta inițială situată la mijlocul seriei de variații de interval). Apoi

, .

estimarea intervalului

Mai sus, am luat în considerare problema estimării unui parametru necunoscut A un numar. Am numit astfel de estimări estimări punctuale. Au dezavantajul că, cu o dimensiune mică a eșantionului, pot diferi semnificativ de parametrii estimați. Prin urmare, pentru a ne face o idee despre apropierea dintre un parametru și estimarea acestuia, în statistica matematică sunt introduse așa-numitele estimări de interval.

Fie o estimare punctuală q * să fie găsită în eșantion pentru parametrul q. De obicei, cercetătorii sunt date în avans de o probabilitate suficient de mare g (de exemplu, 0,95; 0,99 sau 0,999), astfel încât un eveniment cu probabilitatea g poate fi considerat practic sigur și pun problema găsirii unei astfel de valori e > 0 pentru care

.

Modificând această egalitate, obținem:

iar în acest caz vom spune că intervalul ]q * - e; q * + e[ acoperă parametrul estimat q cu probabilitatea g.

Interval ]q * -e; q * +e [ se numește interval de încredere .

Probabilitatea g se numește fiabilitate (probabilitate de încredere) interval estimare.

Capetele intervalului de încredere, adică punctele q * -e și q * +e sunt numite limitele de încredere .

Se numește numărul e acuratețea evaluării .

Ca exemplu al problemei determinării limitelor de încredere, luați în considerare problema estimării așteptării matematice a unei variabile aleatoare X, care are o lege de distribuție normală cu parametri. Ași s, adică X = N( A, s). Așteptările matematice în acest caz sunt egale cu A. Conform observațiilor X 1 , X 2 , X n se calculează media și evaluare dispersia s 2 .

Se pare că, în funcție de datele eșantionului, este posibil să se construiască o variabilă aleatorie

care are o distribuție Student (sau t-distribuție) cu n = n -1 grade de libertate.

Să folosim tabelul A.1.3 și să găsim pentru probabilitatea dată g și numărul n numărul t g astfel încât probabilitatea

P(|t(n)|< t g) = g,

.

După ce facem transformări evidente, obținem

Procedura de aplicare a criteriului F este următoarea:

1. Se face o presupunere despre distribuția normală a populațiilor. La un nivel de semnificaţie dat a, se formulează ipoteza nulă H 0: s x 2 = s y 2 despre egalitatea varianţelor generale ale populaţiilor normale sub ipoteza concurentă H 1: s x 2 > s y 2 .

2. Două eșantioane independente sunt obținute din populațiile X și Y ale lui n x și respectiv n y.

3. Calculați valorile variațiilor eșantionului corectat s x 2 și s y 2 (metodele de calcul sunt discutate în §13.4). Cu cât mai mare dintre dispersii (s x 2 sau s y 2) este desemnată s 1 2, cu atât mai mică - s 2 2.

4. Valoarea criteriului F se calculează după formula F obs = s 1 2 / s 2 2 .

5. Conform tabelului punctelor critice ale distribuției Fisher - Snedecor, pentru un anumit nivel de semnificație a și numărul de grade de libertate n 1 \u003d n 1 - 1, n 2 \u003d n 2 - 1 (n 1 este numărul de grade de libertate al unei variații mai mari corectate), punctul critic se găsește F cr (a, n 1, n 2).

Rețineți că Tabelul A.1.7 arată valorile critice ale criteriului F cu o singură coadă. Prin urmare, dacă se aplică un criteriu cu două laturi (H 1: s x 2 ¹ s y 2), atunci punctul critic din dreapta F cr (a / 2, n 1, n 2) este căutat de nivelul de semnificație a / 2 (jumătate din cel specificat) și numărul de grade de libertate n 1 și n 2 (n 1 - numărul de grade de libertate de dispersie mai mare). Este posibil ca punctul critic pentru stânga să nu fie găsit.

6. Se concluzionează că dacă valoarea calculată a criteriului F este mai mare sau egală cu cea critică (F obs ³ F cr), atunci varianțele diferă semnificativ la un nivel de semnificație dat. În caz contrar (F obs< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Sarcina 15.1. Consumul de materii prime pe unitatea de producție conform tehnologiei vechi a fost:

Tehnologie nouă:

Presupunând că populațiile generale corespunzătoare X și Y au distribuții normale, verificați dacă consumul de materii prime pentru tehnologii noi și vechi nu diferă în variabilitate, dacă luăm nivelul de semnificație a = 0,1.

Soluţie. Acționăm în ordinea indicată mai sus.

1. Vom judeca variabilitatea consumului de materii prime pentru tehnologii noi si vechi din punct de vedere al valorilor de dispersie. Astfel, ipoteza nulă are forma H 0: s x 2 = s y 2 . Ca ipoteză concurentă, acceptăm ipoteza H 1: s x 2 ¹ s y 2, deoarece nu suntem siguri în prealabil că oricare dintre variațiile generale este mai mare decât cealaltă.

2-3. Găsiți variațiile eșantionului. Pentru a simplifica calculele, să trecem la opțiunile condiționate:

u i = x i - 307, v i = y i - 304.

Vom aranja toate calculele sub forma următoarelor tabele:

tu i m i m i u i m i u i 2 m i (u i +1) 2 v i n i n i v i n i v i 2 n i (v i +1) 2
-3 -3 -1 -2
å -
å -

Control: å m i u i 2 + 2å m i u i + m i = Control: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Găsiți variațiile eșantionului corectate:

4. Comparați variațiile. Găsiți raportul dintre varianța corectată mai mare și cea mai mică:

.

5. Prin condiție, ipoteza concurentă are forma s x 2 ¹ s y 2 , prin urmare, regiunea critică este bifață, iar la găsirea punctului critic trebuie luate niveluri de semnificație care sunt jumătate din cea dată.

Conform tabelului A.1.7, prin nivelul de semnificație a/2 = 0,1/2 = 0,05 și numărul de grade de libertate n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8, găsim punctul critic F cr ( 0,05; 12; 8) = 3,28.

6. Deoarece F obl.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.

Mai sus, la testarea ipotezelor, sa presupus că distribuția variabilelor aleatoare studiate a fost normală. Cu toate acestea, studii speciale au arătat că algoritmii propuși sunt foarte stabili (în special cu dimensiuni mari ale eșantionului) în ceea ce privește abaterea de la distribuția normală.

Parametri de distribuție și statistici

Orice parametri ai distribuției unei variabile aleatoare, cum ar fi așteptarea sau varianța matematică, de exemplu, sunt valori teoretice care nu sunt măsurabile direct, deși pot fi estimate. Sunt cantitative populatie și pot fi determinate de ele însele numai în cursul modelării teoretice ca valori ipotetice, deoarece descriu caracteristicile distribuției unei variabile aleatorii în populația generală în sine. Pentru a le determina în practică, cercetătorul care efectuează experimentul efectuează evaluarea selectivă a acestora. O astfel de evaluare presupune un calcul statistic.

Statistici reprezintă o caracteristică cantitativă a parametrilor studiați care caracterizează distribuția unei variabile aleatoare, obținută pe baza unui studiu al valorilor eșantionului. Statistica este folosită fie pentru a descrie eșantionul în sine, fie, ceea ce este de o importanță capitală în cercetarea experimentală fundamentală, pentru a estima parametrii de distribuție a unei variabile aleatoare în populația generală studiată.

Separarea conceptelor "parametru" și "statistici" este foarte important, deoarece permite evitarea unui număr de erori asociate cu interpretarea incorectă a datelor obținute în experiment. Cert este că atunci când estimăm parametrii distribuției folosind date statistice, obținem valori care sunt doar într-o anumită măsură apropiate de parametrii estimați. Există aproape întotdeauna o diferență între parametri și statistici și, de obicei, nu putem spune cât de mare este această diferență. Teoretic, cu cât eșantionul este mai mare, cu atât parametrii estimați sunt mai aproape de caracteristicile eșantionului lor. Totuși, acest lucru nu înseamnă că prin creșterea dimensiunii eșantionului, ne vom apropia inevitabil de parametrul estimat, vom reduce diferența dintre acesta și statisticile calculate. În practică, lucrurile se pot dovedi a fi mult mai complicate.

Dacă, teoretic, valoarea așteptată a statisticii coincide cu parametrul estimat, atunci o astfel de estimare se numește imparțial. Se numește o estimare în care valoarea așteptată a parametrului estimat diferă de parametrul în sine într-o anumită valoare deplasat.

De asemenea, este necesar să se facă distincția între estimările punctuale și pe intervale ale parametrilor de distribuție. punctat numită o estimare folosind un număr. De exemplu, dacă afirmăm că valoarea pragului spațial al sensibilității tactile pentru un subiect dat în condiții date și pe o zonă dată a pielii este de 21,8 mm, atunci o astfel de evaluare va fi o estimare punctuală. În mod similar, o estimare punctuală apare atunci când raportul meteorologic ne spune că afară sunt 25°C. Estimarea intervalului presupune utilizarea unui set sau a unei game de numere în evaluare. Evaluând pragul spațial al sensibilității tactile, putem spune că s-a dovedit a fi în intervalul de la 20 la 25 mm. În mod similar, meteorologii pot raporta că, conform prognozelor lor, temperatura aerului va ajunge la 22-24°C în următoarele 24 de ore. Estimarea pe intervale a unei variabile aleatoare ne permite nu numai să determinăm valoarea dorită a acestei variabile, ci și să stabilim posibila acuratețe pentru o astfel de estimare.

Așteptările matematice și evaluarea acesteia

Să ne întoarcem la experiența noastră de aruncare a monedelor.

Să încercăm să răspundem la întrebarea: de câte ori ar trebui să cadă „vulturul” dacă aruncăm o monedă de zece ori? Răspunsul pare a fi evident. Dacă probabilitățile fiecăruia dintre cele două rezultate sunt egale, atunci rezultatele în sine trebuie să fie distribuite în mod egal. Cu alte cuvinte, atunci când o monedă obișnuită este aruncată de zece ori, avem dreptul să ne așteptăm ca una dintre părțile sale, de exemplu, „capete”, să cadă exact de cinci ori. În mod similar, atunci când o monedă este aruncată de 100 de ori, capete ar trebui să cadă de exact 50 de ori, iar dacă o monedă este aruncată de 4236 de ori, atunci partea care ne interesează ar trebui să apară de 2118 ori, nici mai mult, nici mai puțin.

Deci, valoarea teoretică a unui eveniment aleatoriu este de obicei numită așteptări matematice. Așteptarea matematică poate fi găsită prin înmulțirea probabilității teoretice a unei variabile aleatoare cu numărul de încercări. Mai formal, însă, este definit ca un moment central de prim ordin. Astfel, așteptarea matematică este valoarea unei variabile aleatoare la care tinde teoretic în timpul testelor repetate, raportat la care variază.

Este clar că valoarea teoretică a așteptării matematice ca parametru de distribuție nu este întotdeauna egală cu valoarea empirică a variabilei aleatoare de interes pentru noi, exprimată în statistică. Dacă facem experimentul cu aruncarea unei monede, este destul de probabil ca, din zece rezultate, capetele să apară doar de patru sau trei ori, sau poate, dimpotrivă, să apară de opt ori, sau poate niciodată. . Este clar că unele dintre aceste rezultate sunt mai probabile, altele sunt mai puțin probabile. Dacă folosim legea distribuției normale, putem concluziona că, cu cât rezultatul se abate de la cel așteptat teoretic, dat de valoarea așteptării matematice, cu atât este mai puțin probabil în practică.

Să presupunem în continuare că am făcut această procedură de mai multe ori și nu am observat niciodată valoarea teoretic așteptată. Atunci s-ar putea să avem îndoieli cu privire la autenticitatea monedei. Putem presupune că moneda noastră nu are de fapt o șansă de 50% să iasă din cap. În acest caz, poate fi necesar să se estimeze probabilitatea acestui eveniment și, în consecință, valoarea așteptărilor matematice. O astfel de nevoie apare ori de câte ori, într-un experiment, investigăm distribuția unei variabile aleatoare continue, cum ar fi timpul de reacție, fără a avea în prealabil vreun model teoretic. De regulă, acesta este primul pas obligatoriu în cursul prelucrării cantitative a rezultatelor experimentului.

Așteptările matematice pot fi estimate în trei moduri, care în practică pot da rezultate ușor diferite, dar în teorie ar trebui să ne conducă cu siguranță la valoarea așteptării matematice.

Logica unei astfel de evaluări este ilustrată în Fig. 1.2. Așteptarea matematică poate fi considerată ca o tendință centrală în distribuția unei variabile aleatoare X, ca valoare cea mai probabilă și deci cea mai frecventă a acesteia și ca punct care împarte distribuția în două părți egale.

Orez. 1.2.

Să continuăm experimentele noastre imaginare cu o monedă și să efectuăm trei experimente cu aruncarea unei monede de zece ori. Să presupunem că în primul experiment „vulturul” a căzut de patru ori, același lucru s-a întâmplat în al doilea experiment, în al treilea experiment „vulturul” a căzut de mai mult de o dată și jumătate mai des - de șapte ori. Este logic să presupunem că așteptarea matematică a evenimentului care ne interesează se află de fapt undeva între aceste valori.

Primul, protozoar metoda de evaluare așteptarea matematică va consta în găsirea medie aritmetică. Apoi, estimarea valorii așteptate pe baza celor trei măsurători de mai sus va fi (4 + 4 + 7) / 3 = 5. În mod similar, în experimentele cu timpul de reacție, valoarea așteptată poate fi estimată prin calcularea mediei aritmetice a tuturor valorilor obținute. X. Deci dacă am cheltuit P măsurarea timpului de reacție X, atunci putem folosi următoarea formulă, care ne arată că pentru a calcula media aritmetică X este necesar să adunăm toate valorile obținute empiric și să le împărțiți la numărul de observații:

În formula (1.2), măsura așteptărilor matematice este de obicei notată ca ̅ X (se citește ca „x cu o linie”), deși uneori poate fi notat ca M (din engleza. Rău - in medie).

Media aritmetică este cea mai utilizată estimare a așteptărilor matematice. În astfel de cazuri, se presupune că măsurarea unei variabile aleatoare este efectuată în metric scară. Este clar că rezultatul obținut poate coincide sau nu cu adevărata valoare a așteptării matematice, pe care nu o știm niciodată. Este important, totuși, că această metodă este imparțial estimarea așteptărilor matematice. Aceasta înseamnă că valoarea așteptată a valorii estimate este egală cu așteptarea sa matematică: .

A doua metodă de evaluare Așteptarea matematică este de a lua ca valoare cea mai frecventă valoare a variabilei de interes pentru noi. Această valoare este numită moda distributiei. De exemplu, în cazul doar luat în considerare cu aruncarea unei monede, „patru” poate fi luat ca valoare a așteptării matematice, întrucât în ​​cele trei încercări efectuate această valoare a apărut de două ori; de aceea modul de distribuție în acest caz s-a dovedit a fi egal cu patru. Estimarea modului este utilizată în principal atunci când experimentatorul are de-a face cu variabile care iau valori discrete date în nemetric scară.

De exemplu, prin descrierea distribuției notelor elevilor într-un examen, se poate construi distribuția de frecvență a notelor elevilor. Această distribuție de frecvență se numește histogramă. În acest caz, cea mai comună estimare poate fi luată ca valoare a tendinței centrale (așteptările matematice). În studiul variabilelor caracterizate prin valori continue, această măsură practic nu este utilizată sau rar folosită. Dacă distribuția de frecvență a rezultatelor obținute este totuși construită, atunci, de regulă, aceasta se referă nu la valorile trăsăturii studiate obținute în experiment, ci la unele intervale de manifestare a acesteia. De exemplu, la examinarea înălțimii oamenilor, puteți vedea câți oameni cad în intervalul de până la 150 cm înălțime, câți cad în intervalul de la 150 la 155 cm și așa mai departe. În acest caz, modul va fi legat de valorile de interval ale trăsăturii studiate, în acest caz, creșterea.

Este clar că modul, la fel ca media aritmetică, poate coincide sau nu cu valoarea reală a așteptărilor matematice. Dar la fel ca media aritmetică, modul este o estimare imparțială a așteptărilor matematice.

Adăugăm că, dacă două valori din eșantion apar la fel de des, atunci se numește o astfel de distribuție bimodal. Dacă trei sau mai multe valori din eșantion apar la fel de des, atunci se spune că un astfel de eșantion nu are mod. Astfel de cazuri cu un număr suficient de mare de observații, de regulă, indică faptul că datele sunt extrase din populația generală, natura distribuției în care diferă de normal.

In cele din urma, a treia metodă de evaluare Așteptarea matematică este de a împărți eșantionul de subiecți în funcție de parametrul care ne interesează exact în jumătate. Se numește valoarea care caracterizează această limită median distributie.

Să presupunem că suntem prezenți la o competiție de schi și după finalizarea acestora dorim să evaluăm care dintre sportivi a arătat rezultatul peste medie și care - sub. Dacă compoziția participanților este mai mult sau mai puțin uniformă, atunci când se evaluează rezultatul mediu, este logic să se calculeze media aritmetică. Să presupunem, totuși, că printre participanții profesioniști sunt mai mulți amatori. Nu sunt multe, dar arată rezultate semnificativ inferioare celorlalte. În acest caz, se poate dovedi că din 100 de participanți la competiție, de exemplu, 87 au arătat un rezultat peste medie. Este clar că o astfel de evaluare a tendinței medii nu ne poate fi întotdeauna potrivită. În acest caz, este logic să presupunem că rezultatul mediu a fost afișat de participanții care au ocupat undeva pe locul 50 sau 51. Aceasta va fi mediana distribuției. 49 de participanți au terminat înaintea celui de-al 50-lea finalist și 49 după cel de-al 51-lea. Desigur, se poate dovedi că au terminat cu același timp. Atunci nu este nicio problemă. Nu există nicio problemă chiar și atunci când numărul de observații este impar. În alte cazuri, însă, puteți utiliza media rezultatelor celor doi participanți.

Mediana este un caz special al cuantilei unei distribuții. cuantilă face parte din distribuție. Formal, poate fi definită ca valoarea integrală a distribuției dintre două valori ale variabilei X. Astfel, valoarea X va fi mediana distribuției dacă valoarea integrală a distribuției (densitatea probabilității) este de la -∞ la X este egală cu valoarea integrală a distribuției din X până la +∞. În mod similar, distribuția poate fi împărțită în patru, zece sau 100 de părți. Astfel de cuantile se numesc respectiv quartile, decile și percentile. Există și alte tipuri de cuantile.

La fel ca cele două metode anterioare de estimare a așteptărilor matematice, mediana este o estimare imparțială a așteptărilor matematice.

Teoretic, se presupune că, dacă avem de-a face într-adevăr cu o distribuție normală a unei variabile aleatoare, atunci toate cele trei estimări ale așteptării matematice ar trebui să dea același rezultat, deoarece toate reprezintă o variantă. imparțial estimări ale aceluiași parametru de distribuție al variabilei aleatoare estimate (vezi Fig. 1.2). În practică, însă, acest lucru este rareori cazul. Acest lucru se poate datora, în special, faptului că distribuția analizată diferă de cea normală. Dar principalul motiv pentru astfel de discrepanțe, de regulă, este că, prin estimarea valorii așteptărilor matematice, se poate obține o valoare care este foarte semnificativ diferită de valoarea sa adevărată. Cu toate acestea, după cum sa menționat mai sus, s-a dovedit în statistica matematică că, cu cât sunt efectuate teste mai independente ale variabilei luate în considerare, cu atât valoarea estimată ar trebui să fie mai aproape de valoarea adevărată.

Astfel, în practică, alegerea unei metode de estimare a așteptărilor matematice este determinată nu de dorința de a obține o estimare mai precisă și mai fiabilă a acestui parametru, ci doar de considerente de comoditate. De asemenea, un anumit rol în alegerea metodei de estimare a așteptării matematice îl joacă scara de măsurare, care reflectă observațiile variabilei aleatoare estimate.

Să fie supusă o variabilă aleatorie cu așteptări matematice și varianță necunoscute unor experimente independente care au dat rezultate - . Să calculăm estimări consistente și nepărtinitoare pentru parametrii și .

Ca o estimare a așteptărilor matematice, luăm media aritmetică a valorilor experimentale

. (2.9.1)

Conform legii numerelor mari, această estimare este bogat , cu magnitudine în probabilitate. Aceeași estimare este imparțial , pentru că

. (2.9.2)

Varianta acestei estimări este

. (2.9.3)

Se poate demonstra că pentru o distribuție normală, această estimare este eficient . Pentru alte legi, acesta poate să nu fie cazul.

Să estimăm acum varianța. Să alegem mai întâi o formulă de estimare dispersie statistică

. (2.9.4)

Să verificăm consistența estimării varianței. Să deschidem parantezele din formula (2.9.4)

.

Pentru , primul termen converge în probabilitate către cantitate , în al doilea - la . Astfel, estimarea noastră converge în probabilitate către varianță

,

deci ea este bogat .

Sa verificam imparțialitatea estimări pentru cantitate. Pentru a face acest lucru, înlocuim expresia (2.9.1) în formula (2.9.4) și luăm în considerare că variabilele aleatoare independent

,

. (2.9.5)

Să trecem în formula (2.9.5) la fluctuațiile variabilelor aleatoare

Extindem parantezele, obținem

,

. (2.9.6)

Să calculăm așteptarea matematică a valorii (2.9.6), ținând cont de faptul că

. (2.9.7)

Relația (2.9.7) arată că valoarea calculată prin formula (2.9.4) nu este un estimator imparțial pentru dispersie. Așteptările sale matematice nu sunt egale, dar oarecum mai mici. O astfel de estimare duce la o eroare sistematică descendentă. Pentru a elimina o astfel de părtinire, este necesar să se introducă o corecție prin înmulțirea nu a valorii . Atunci o astfel de varianță statistică corectată poate servi ca o estimare imparțială a varianței

. (2.9.8)

Această estimare este la fel de consistentă ca și estimarea , deoarece pentru .

În practică, în loc de estimare (2.9.8), uneori este mai convenabil să se utilizeze o estimare echivalentă legată de al doilea moment statistic inițial

. (2.9.9)

Estimările (2.9.8), (2.9.9) nu sunt eficiente. Se poate arăta că în cazul unei distribuții normale acestea vor fi eficient asimptotic (când va tinde spre valoarea minimă posibilă).

Astfel, este posibil să se formuleze următoarele reguli pentru prelucrarea materialului statistic limitat. Dacă în experimente independente variabila aleatoare ia valorile cu așteptări și variații matematice necunoscute, atunci pentru a determina acești parametri, ar trebui să folosiți estimări aproximative

(2.9.10)

Sfârșitul lucrării -

Acest subiect aparține:

Note de curs despre matematică teoria probabilității statistică matematică

Departamentul Superior de Matematică și Informatică.. note de curs.. la matematică..

Dacă aveți nevoie de material suplimentar pe această temă, sau nu ați găsit ceea ce căutați, vă recomandăm să utilizați căutarea în baza noastră de date de lucrări:

Ce vom face cu materialul primit:

Dacă acest material s-a dovedit a fi util pentru dvs., îl puteți salva pe pagina dvs. de pe rețelele sociale:

Toate subiectele din această secțiune:

Teoria probabilității
Teoria probabilității este o ramură a matematicii care studiază tiparele fenomenelor de masă aleatoare. Aleatoriu este un fenomen care

Definiția statistică a probabilității
Un eveniment este un fenomen aleatoriu care, ca urmare a experienței, poate sau nu să apară (fenomen cu două valori). Desemnați evenimentele cu majuscule latine

Spațiul evenimentelor elementare
Să fie asociat un set de evenimente cu o anumită experiență și: 1) ca rezultat al experienței, unul și unul singur

Acțiuni pe evenimente
Suma a două evenimente și

Permutări
Se notează numărul de permutări diferite ale elementelor

Cazare
Amplasarea elementelor prin

Combinații
O combinație de elemente

Formula de adunare a probabilităților pentru evenimente incompatibile
Teorema. Probabilitatea sumei a două evenimente incompatibile este egală cu suma probabilităților acestor evenimente. (unu

Formula de adunare a probabilității pentru evenimente arbitrare
Teorema. Probabilitatea sumei a două evenimente este egală cu suma probabilităților acestor evenimente fără probabilitatea produsului lor.

Formula de înmulțire a probabilității
Să fie date două evenimente. Luați în considerare un eveniment

Formula probabilității totale
Fie un grup complet de evenimente incompatibile, ele se numesc ipoteze. Luați în considerare un eveniment

Formula probabilităților ipotezelor (Bayes)
Luați în considerare din nou - grupul complet de ipoteze incompatibile și evenimentul

Formula Poisson asimptotică
În cazurile în care numărul de încercări este mare și probabilitatea de apariție a unui eveniment

Variabile aleatorii discrete
O valoare aleatorie este o cantitate care, atunci când experimentul este repetat, poate lua valori numerice inegale. Variabila aleatoare se numește discretă,

Variabile aleatorii continue
Dacă, în urma unui experiment, o variabilă aleatoare poate lua orice valoare dintr-un anumit segment sau din întreaga axă reală, atunci se numește continuă. lege

Funcția de densitate de probabilitate a unei variabile continue aleatoare
Lăsa. Luați în considerare un punct și acordați-i o creștere

Caracteristicile numerice ale variabilelor aleatoare
Variabilele aleatoare discrete sau continue sunt considerate a fi complet specificate dacă legile lor de distribuție sunt cunoscute. Într-adevăr, cunoscând legile distribuției, se poate calcula întotdeauna probabilitatea de a lovi

Cuantile de variabile aleatoare
Quantila de ordinul unei variabile continue aleatoare

Așteptările matematice ale variabilelor aleatoare
Așteptările matematice ale unei variabile aleatoare caracterizează valoarea medie a acesteia. Toate valorile variabilei aleatoare sunt grupate în jurul acestei valori. Luați în considerare mai întâi o variabilă discretă aleatoare

Abaterea standard și varianța variabilelor aleatoare
Luați în considerare mai întâi o variabilă discretă aleatoare. Caracteristicile numerice ale modului, mediana, cuantilele și așteptările matematice

Momente de variabile aleatorii
Pe lângă așteptările și varianța matematică, teoria probabilității folosește caracteristici numerice de ordine superioare, care sunt numite momente ale variabilelor aleatoare.

Teoreme privind caracteristicile numerice ale variabilelor aleatoare
Teorema 1. Aşteptarea matematică a unei variabile nealeatoare este egală cu această valoare însăşi. Dovada: lasa

Legea distribuției binomiale

Legea distribuției Poisson
Fie o variabilă discretă aleatoare care ia valorile

Legea distribuției uniforme
Legea uniformă de distribuție a unei variabile continue aleatoare este legea funcției de densitate de probabilitate, care

Legea distribuției normale
Legea normală de distribuție a unei variabile continue aleatoare este legea funcției de densitate

Legea distribuției exponențiale
Distribuția exponențială sau exponențială a unei variabile aleatoare este utilizată în astfel de aplicații ale teoriei probabilităților, cum ar fi teoria cozilor, teoria fiabilității

Sisteme de variabile aleatorii
În practică, în aplicațiile teoriei probabilităților, de multe ori trebuie să se confrunte cu probleme în care rezultatele unui experiment sunt descrise nu de o variabilă aleatoare, ci de mai multe variabile aleatoare deodată.

Sistem de două variabile aleatoare discrete
Fie două variabile discrete aleatoare să formeze un sistem. Valoare aleatoare

Sistem de două variabile aleatoare continue
Acum lăsați sistemul să fie format din două variabile aleatorii continue. Legea distribuției acestui sistem se numește probabil

Legile condiționale ale distribuției
Fie și variabile aleatoare continue dependente

Caracteristicile numerice ale unui sistem de două variabile aleatoare
Momentul inițial al ordinii sistemului de variabile aleatoare

Sistem de mai multe variabile aleatorii
Rezultatele obţinute pentru un sistem de două variabile aleatoare pot fi generalizate la cazul sistemelor formate dintr-un număr arbitrar de variabile aleatoare. Lăsați sistemul să fie format din mulțime

Distribuția normală a unui sistem de două variabile aleatoare
Luați în considerare un sistem de două variabile aleatoare continue. Legea distribuției acestui sistem este legea distribuției normale

Teoreme limită ale teoriei probabilităților
Scopul principal al disciplinei teoriei probabilităților este de a studia tiparele fenomenelor de masă aleatoare. Practica arată că observarea unei mase de fenomene aleatorii omogene revelatoare

inegalitatea lui Cebyshev
Luați în considerare o variabilă aleatoare cu așteptări matematice

teorema lui Cebyshev
Dacă variabilele aleatoare sunt independente pe perechi și au varianțe finite mărginite în populație

teorema lui Bernoulli
Cu o creștere nelimitată a numărului de experimente, frecvența de apariție a unui eveniment converge în probabilitate cu probabilitatea unui eveniment

Teorema limitei centrale
Când se adaugă variabile aleatoare cu orice lege de distribuție, dar cu variații limitate în agregat, legea distribuției

Sarcinile principale ale statisticii matematice
Legile teoriei probabilităților discutate mai sus sunt o expresie matematică a tiparelor reale care există de fapt în diferite fenomene aleatorii de masă. studiu

O statistică simplă. Funcția de distribuție statistică
Luați în considerare o variabilă aleatoare a cărei lege de distribuție este necunoscută. Necesar pe baza experienței

Linie statistică. diagramă cu bare
Cu un număr mare de observații (de ordinul a sutelor), populația generală devine incomodă și greoaie pentru înregistrarea materialului statistic. Pentru claritate și compactitate, material statistic

Caracteristicile numerice ale distribuţiei statistice
În teoria probabilităților au fost luate în considerare diverse caracteristici numerice ale variabilelor aleatoare: așteptarea matematică, dispersia, momentele inițiale și centrale de diverse ordine. Cifre similare

Alegerea distribuției teoretice prin metoda momentelor
În orice distribuție statistică, există inevitabil elemente ale aleatoriei asociate cu numărul limitat de observații. Cu un număr mare de observații, aceste elemente ale aleatoriei sunt netezite,

Testarea plauzibilității ipotezei despre forma legii distribuției
Fie ca distribuția statistică dată să fie aproximată printr-o curbă teoretică sau

Criterii de consimțământ
Luați în considerare unul dintre cele mai frecvent utilizate teste de bună adaptare, așa-numitul test Pearson. Să presupunem

Estimări punctuale pentru parametrii de distribuție necunoscuți
În p.p. 2.1. - 2.7 am analizat în detaliu modalităţile de rezolvare a primei şi a doua probleme principale de statistică matematică. Acestea sunt sarcinile de determinare a legilor de distribuție a variabilelor aleatoare în funcție de datele experimentale

Interval de încredere. Probabilitatea de încredere
În practică, cu un număr mic de experimente pe o variabilă aleatorie, o înlocuire aproximativă a unui parametru necunoscut

Să fie generat eșantionul aleator de variabila aleatoare observată ξ, așteptarea și varianța matematică care sunt necunoscute. Ca estimări pentru aceste caracteristici, s-a propus utilizarea mediei eșantionului

și varianța eșantionului

. (3.14)

Să luăm în considerare câteva proprietăți ale estimărilor așteptărilor și varianței matematice.

1. Calculați așteptarea matematică a mediei eșantionului:

Prin urmare, media eșantionului este un estimator imparțial pentru .

2. Amintiți-vă că rezultatele observațiile sunt variabile aleatoare independente, fiecare dintre ele având aceeași lege de distribuție ca și valoarea , ceea ce înseamnă că , , . Vom presupune că varianța este finită. Apoi, conform teoremei Cebyshev asupra legii numerelor mari, pentru orice ε > 0 avem egalitatea ,

care se poate scrie astfel: . (3.16) Comparând (3.16) cu definiția proprietății de consistență (3.11), vedem că estimarea este o estimare consistentă a așteptării .

3. Aflați varianța mediei eșantionului:

. (3.17)

Astfel, varianța estimării așteptărilor scade invers cu dimensiunea eșantionului.

Se poate dovedi că, dacă variabila aleatoare ξ este distribuită în mod normal, atunci media eșantionului este o estimare efectivă a valorii așteptate, adică varianța ia cea mai mică valoare în comparație cu orice altă estimare a valorii așteptate. Pentru alte legi de distribuție a lui ξ, acesta poate să nu fie cazul.

Varianta eșantionului este o estimare părtinitoare a varianței, deoarece . (3.18)

Într-adevăr, folosind proprietățile așteptării matematice și formulei (3.17), găsim

.

Pentru a obține o estimare imparțială a varianței, estimarea (3.14) trebuie corectată, adică înmulțită cu . Apoi obținem varianța eșantionului imparțial

. (3.19)

Remarcăm că formulele (3.14) și (3.19) diferă doar la numitor, iar pentru valori mari, eșantionul și variațiile imparțial diferă puțin. Cu toate acestea, pentru o dimensiune mică a eșantionului, ar trebui utilizată relația (3.19).

Pentru a estima abaterea standard a unei variabile aleatoare se folosește așa-numita abatere standard „corectată”, care este egală cu rădăcina pătrată a varianței nepărtinitoare: .

Estimări de interval

În statistică, există două abordări pentru estimarea parametrilor necunoscuți ai distribuțiilor: punct și interval. În conformitate cu estimarea punctuală, care a fost discutată în secțiunea anterioară, este indicat doar punctul în apropierea căruia este situat parametrul estimat. Cu toate acestea, este de dorit să se știe cât de departe poate sta de fapt acest parametru față de posibila implementare a estimărilor în diferite serii de observații.

Răspunsul la această întrebare – tot aproximativ – oferă o altă modalitate de estimare a parametrilor – interval. În conformitate cu această metodă de estimare, se constată un interval care, cu o probabilitate apropiată de unu, acoperă o valoare numerică necunoscută a parametrului.

Conceptul de estimare a intervalului

Estimarea punctului este o variabilă aleatorie și pentru posibile implementări ale eșantionului ia valori doar aproximativ egale cu valoarea reală a parametrului. Cu cât diferența este mai mică, cu atât estimarea este mai precisă. Astfel, un număr pozitiv pentru care , caracterizează acuratețea estimării și se numește eroare de estimare (sau eroare marginală).

Probabilitate de încredere(sau fiabilitate) se numeste probabilitate β , cu care inegalitatea , adică

. (3.20)

Înlocuirea inegalității inegalitatea sa dublă echivalentă , sau , primim

Interval acoperind cu probabilitate β , , parametrul necunoscut , este apelat interval de încredere (sau estimarea intervalului), corespunzător nivelului de încredere β .

O variabilă aleatoare nu este doar o estimare, ci și o eroare: valoarea ei depinde de probabilitate β și, de regulă, din eșantion. Prin urmare, intervalul de încredere este aleatoriu și expresia (3.21) trebuie citită după cum urmează: „Intervalul va acoperi parametrul cu probabilitatea β ”, și nu așa: „Parametrul va intra în intervalul cu o probabilitate β ”.

Semnificația intervalului de încredere este aceea cu repetarea repetată a volumului eșantionului în proporția relativă de cazuri egală cu β , interval de încredere corespunzător nivelului de încredere β , acoperă valoarea reală a parametrului estimat. Deci nivelul de încredere β caracterizează fiabilitate evaluarea încrederii: cu atât mai mult β , cu atât este mai probabil ca implementarea intervalului de încredere să conţină un parametru necunoscut.

CATEGORII

ARTICOLE POPULARE

2022 "kingad.ru" - examinarea cu ultrasunete a organelor umane