Procjena matematičkog očekivanja slučajne varijable. Točkaste procjene matematičkog očekivanja

Neka postoji slučajna varijabla x s matematičkim očekivanjem m i varijanca D, dok su oba ova parametra nepoznata. Iznad vrijednosti x proizvedeno N nezavisni eksperimenti, kao rezultat skupa N numerički rezultati x 1, x 2, …, x N. Kao procjenu matematičkog očekivanja, prirodno je predložiti aritmetičku sredinu promatranih vrijednosti

(1)

Ovdje kao x i uzimaju se u obzir specifične vrijednosti (brojevi) dobivene kao rezultat N eksperimenti. Ako uzmemo druge (nezavisne od prethodnih) N eksperimentima, onda ćemo očito dobiti drugačiju vrijednost. Ako uzmete više N eksperimentima, tada ćemo dobiti još jednu novu vrijednost. Označimo sa X i slučajna varijabla koja proizlazi iz ja eksperiment, zatim implementacije X i bit će brojevi dobiveni ovim eksperimentima. Očito, slučajna varijabla X i imat će istu funkciju gustoće vjerojatnosti kao izvorna slučajna varijabla x. Također vjerujemo da slučajne varijable X i I Xj neovisni su kada ja, nejednak j(razni pokusi neovisni jedni o drugima). Stoga ćemo formulu (1) prepisati u drugom (statističkom) obliku:

(2)

Pokažimo da je procjena nepristrana:

Stoga je matematičko očekivanje uzorka srednje vrijednosti jednako pravom matematičkom očekivanju slučajne varijable m. To je prilično predvidljiva i razumljiva činjenica. Posljedično, srednja vrijednost uzorka (2) može se uzeti kao procjena matematičkog očekivanja slučajne varijable. Sada se postavlja pitanje: što se događa s varijancom procjene matematičkog očekivanja kako se broj eksperimenata povećava? To pokazuju analitički proračuni

gdje je varijanca procjene matematičkog očekivanja (2), i D- prava varijanca slučajne varijable x.

Iz navedenog proizlazi da s porastom N(broj eksperimenata) varijanca procjene se smanjuje, tj. Što više zbrajamo neovisne realizacije, dobivamo procjenu bližu matematičkom očekivanju.


Procjene matematičke varijance

Na prvi pogled čini se najprirodnija ocjena

(3)

gdje se izračunava pomoću formule (2). Provjerimo je li procjena nepristrana. Formula (3) može se napisati na sljedeći način:

Zamijenimo izraz (2) u ovu formulu:

Nađimo matematičko očekivanje procjene varijance:

(4)

Kako varijanca slučajne varijable ne ovisi o tome kakvo je matematičko očekivanje slučajne varijable, uzmimo da je matematičko očekivanje jednako 0, tj. m = 0.

(5)
u .(6)

Neka postoji slučajna varijabla X, a njeni parametri su matematičko očekivanje A i varijanca su nepoznati. Provedeno je N neovisnih eksperimenata na vrijednosti X, koji su dali rezultate x 1, x 2, x n.

Ne smanjujući općenitost obrazloženja, smatrat ćemo da su ove vrijednosti slučajne varijable različite. Vrijednosti x 1, x 2, x n smatrat ćemo neovisnim, identično raspodijeljenim slučajnim varijablama X 1, X 2, X n.

Najjednostavnija metoda statističke procjene - metoda supstitucije i analogije - sastoji se u tome da se odgovarajuća karakteristika distribucije uzorka - karakteristika uzorka - uzme kao procjena jedne ili druge numeričke karakteristike (srednja vrijednost, varijanca itd.) opće populacije. .

Korištenje metode supstitucije kao procjene matematičkog očekivanja A trebamo uzeti matematičko očekivanje distribucije uzorka - srednju vrijednost uzorka. Dakle, dobivamo

Provjeriti nepristranost i dosljednost uzorka kao procjene A, razmotrite ovu statistiku kao funkciju odabranog vektora (X 1, X 2, X n). Uzimajući u obzir da svaka od veličina X 1, X 2, X n ima isti zakon raspodjele kao i vrijednost X, zaključujemo da su numeričke karakteristike ovih veličina i vrijednosti X iste: M(X ja) = M(X) = a, D(X ja) = D(X) = , ja = 1, 2, n , gdje su X i kolektivno neovisne slučajne varijable.

Stoga,

Odavde, po definiciji, dobivamo da je to nepristrana procjena A, a budući da je D()®0 za n®¥, onda prema teoremu iz prethodnog paragrafa je dosljedna procjena matematičkog očekivanja A opća populacija.

Učinkovitost ili neučinkovitost procjene ovisi o vrsti zakona raspodjele slučajne varijable X. Može se dokazati da ako je vrijednost X raspodijeljena prema normalnom zakonu, tada je ocjena učinkovita. Za druge zakone raspodjele to možda nije slučaj.

Nepristrana procjena opće varijance služi kao ispravljena varijanca uzorka

,

Jer , gdje je opća varijanca. Stvarno,

Procjena s -- 2 za opću varijancu je također važeća, ali nije učinkovita. Međutim, u slučaju normalne distribucije, on je "asimptotski učinkovit", to jest, kako n raste, omjer njegove varijance prema najmanjoj mogućoj se neograničeno približava jedinici.

Dakle, ako je dan uzorak iz distribucije F( x) slučajna varijabla X s nepoznatim matematičkim očekivanjem A i disperzije, tada za izračunavanje vrijednosti ovih parametara imamo pravo koristiti sljedeće približne formule:

a ,

.

Ovdje x-i- - opcija uzorkovanja, n- i - - opcije frekvencije x i, - - veličina uzorka.
Za izračun ispravljene varijance uzorka prikladnija je formula


.

Da biste pojednostavili izračun, preporučljivo je prijeći na uvjetne opcije (kao što je kod toga korisno uzeti izvornu verziju, koja se nalazi u sredini niza intervalnih varijacija). Zatim

, .

Intervalna procjena

Gore smo razmotrili pitanje procjene nepoznatog parametra A jedan broj. Takve procjene nazivamo točkastim procjenama. Nedostatak im je što se uz malu veličinu uzorka mogu značajno razlikovati od procijenjenih parametara. Stoga, da bismo dobili predodžbu o blizini parametra i njegove procjene, u matematičku statistiku uvode se takozvane intervalne procjene.

Neka se u uzorku za parametar q nađe točkasta procjena q *. Obično se istraživačima unaprijed daje neka dovoljno velika vjerojatnost g (na primjer, 0,95, 0,99 ili 0,999) takva da se događaj s vjerojatnošću g može smatrati praktički pouzdanim, te postavljaju pitanje pronalaženja takve vrijednosti e > 0 za koju je

.

Modificirajući ovu jednakost, dobivamo:

i u ovom slučaju ćemo reći da je interval ]q * - e; q * + e[ pokriva procijenjeni parametar q s vjerojatnošću g.

Interval ]q * -e; q * +e [ zove se interval pouzdanosti .

Vjerojatnost g naziva se pouzdanost (vjerojatnost pouzdanosti) intervalne procjene.

Krajevi intervala pouzdanosti, tj. nazivaju se točke q * -e i q * +e granice povjerenja .

Broj e se zove točnost procjene .

Kao primjer problema određivanja granica pouzdanosti, razmotrimo pitanje procjene matematičkog očekivanja slučajne varijable X, koja ima normalni zakon distribucije s parametrima A i s, tj. X = N( a, s). Matematičko očekivanje u ovom slučaju je jednako A. Na temelju opažanja X 1, X 2, X n izračunavamo prosjek i procjena disperzija s 2.

Ispada da je iz uzorka podataka moguće konstruirati slučajnu varijablu

koji ima Studentovu distribuciju (ili t-distribuciju) s n = n -1 stupnjeva slobode.

Upotrijebimo tablicu A.1.3 i pronađimo za danu vjerojatnost g i broj n broj t g tako da je vjerojatnost

P(|t(n)|< t g) = g,

.

Nakon što smo napravili očite transformacije dobivamo,

Postupak primjene F-testa je sljedeći:

1. Pretpostavlja se da je raspored stanovništva normalan. Na danoj razini značajnosti a, formulirana je nulta hipoteza H 0: s x 2 = s y 2 o jednakosti općih varijanci normalnih populacija pod konkurentskom hipotezom H 1: s x 2 > s y 2.

2. Dva neovisna uzorka dobivena su iz populacija X i Y volumena n x odnosno n y.

3. Izračunajte vrijednosti ispravljenih varijanci uzorka s x 2 i s y 2 (metode izračuna se raspravljaju u §13.4). Veća varijanca (s x 2 ili s y 2) označena je s 1 2, manja - s 2 2.

4. Vrijednost F-kriterija izračunava se pomoću formule F obs = s 1 2 / s 2 2.

5. Koristeći tablicu kritičnih točaka Fisher-Snedecorove distribucije, pri zadanoj razini značajnosti a i broju stupnjeva slobode n 1 = n 1 - 1, n 2 = n 2 - 1 (n 1 je broj stupnjeva slobode). stupnjevi slobode veće korigirane varijance), kritična točka se nalazi F cr (a, n 1, n 2).

Imajte na umu da tablica A.1.7 prikazuje kritične vrijednosti jednostranog F-testa. Stoga, ako se primijeni dvostrani kriterij (H 1: s x 2 ¹ s y 2), tada se desnostrana kritična točka F cr (a/2, n 1, n 2) traži razinom značajnosti a/ 2 (polovica navedene vrijednosti) i broj stupnjeva slobode n 1 i n 2 (n 1 je broj stupnjeva slobode veće disperzije). Lijeva kritična točka možda neće biti pronađena.

6. Izvodi se zaključak: ako je izračunata vrijednost F-kriterija veća ili jednaka kritičnoj vrijednosti (F obs ³ F cr), tada se varijance značajno razlikuju na danoj razini značajnosti. Inače (F ops.< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Problem 15.1. Potrošnja sirovina po jedinici proizvodnje starom tehnologijom bila je:

Korištenje nove tehnologije:

Uz pretpostavku da odgovarajuće opće populacije X i Y imaju normalne distribucije, provjeriti da se u smislu varijabilnosti potrošnja sirovina za nove i stare tehnologije ne razlikuje, ako uzmemo razinu značajnosti a = 0,1.

Riješenje. Nastavljamo prema gore navedenom redoslijedu.

1. Na temelju disperzijskih vrijednosti procijenit ćemo varijabilnost potrošnje sirovina kod novih i starih tehnologija. Dakle, nulta hipoteza ima oblik H 0: s x 2 = s y 2. Kao konkurentsku hipotezu prihvaćamo hipotezu H 1: s x 2 ¹ s y 2, budući da nismo unaprijed sigurni da je bilo koja opća varijanca veća od druge.

2-3. Pronađimo varijance uzorka. Da bismo pojednostavili izračune, prijeđimo na uvjetne opcije:

u i = x i - 307, v i = y i - 304.

Sve izračune uredit ćemo u obliku sljedećih tablica:

u i m i m i u i m ja u i 2 m i (u i +1) 2 v i n i n i v i n i v i 2 n i (v i +1) 2
-3 -3 -1 -2
å -
å -

Kontrola: å m i u i 2 + 2å m i u i + m i = Kontrola: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Pronađimo ispravljene varijance uzorka:

4. Usporedimo varijance. Nađimo omjer veće ispravljene varijance prema manjoj:

.

5. Prema uvjetu, konkurentska hipoteza ima oblik s x 2 ¹ s y 2, stoga je kritično područje dvostrano i pri pronalaženju kritične točke treba uzeti razine značajnosti koje su polovice navedene vrijednosti.

Prema tablici A.1.7, korištenjem razine značajnosti a/2 = 0,1/2 = 0,05 i broja stupnjeva slobode n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8, nalazimo kritična točka F cr ( 0,05; 12; 8) = 3,28.

6. Budući da je F obs.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.

Gore, prilikom testiranja hipoteza, pretpostavili smo normalnu distribuciju slučajnih varijabli koje se proučavaju. Međutim, posebne studije su pokazale da su predloženi algoritmi vrlo stabilni (osobito s velikim veličinama uzorka) u odnosu na odstupanja od normalne distribucije.

Parametri distribucije i statistika

Svi parametri distribucije slučajne varijable, na primjer, kao što su matematičko očekivanje ili varijanca, teorijske su veličine koje se ne mogu izravno mjeriti, iako se mogu procijeniti. Predstavljaju kvantitativnu karakteristiku populacija a same se mogu odrediti samo tijekom teorijskog modeliranja kao hipotetske vrijednosti, budući da opisuju značajke distribucije slučajne varijable u samoj općoj populaciji. Kako bi se utvrdili u praksi, istraživač koji provodi eksperiment provodi njihovu selektivnu procjenu. Ova procjena uključuje statistički izračun.

Statistika je kvantitativna karakteristika proučavanih parametara koja karakterizira distribuciju slučajne varijable dobivena na temelju istraživanja vrijednosti uzorka. Statistika se koristi ili za opisivanje samog uzorka ili, što je od iznimne važnosti u temeljnim eksperimentalnim istraživanjima, za procjenu parametara distribucije slučajne varijable u populaciji koja se proučava.

Razdvajanje pojmova "parametar" I "statistika" je vrlo važno jer vam omogućuje izbjegavanje niza pogrešaka povezanih s netočnim tumačenjem podataka dobivenih u eksperimentu. Činjenica je da kada procjenjujemo parametre raspodjele pomoću statističkih podataka, dobivamo vrijednosti koje su samo u određenoj mjeri bliske procijenjenim parametrima. Gotovo uvijek postoji neka razlika između parametara i statistike, a obično ne možemo reći kolika je ta razlika. Teoretski, što je veći uzorak, to su procijenjeni parametri bliži njihovim karakteristikama uzorka. No, to ne znači da ćemo povećanjem veličine uzorka neizbježno doći bliže procijenjenom parametru i smanjiti razliku između njega i izračunate statistike. U praksi se sve može pokazati mnogo kompliciranijim.

Ako se teoretski očekivana vrijednost statistike podudara s procijenjenim parametrom, tada se takva procjena naziva neraseljena. Procjena u kojoj se očekivana vrijednost procijenjenog parametra razlikuje od samog parametra za određeni iznos naziva se raseljeni.

Također je potrebno razlikovati točkaste i intervalne procjene parametara distribucije. Mjesto zove se procjena pomoću broja. Na primjer, ako kažemo da je vrijednost prostornog praga taktilne osjetljivosti za određeni subjekt u danim uvjetima i na određenom području kože 21,8 mm, tada će takva procjena biti točka. Na isti način, točkasta procjena se događa kada nam vremenska prognoza kaže da je vani 25°C. Intervalna procjena uključuje korištenje skupa ili niza brojeva u procjeni. Procjenjujući prostorni prag taktilne osjetljivosti, možemo reći da je bio u rasponu od 20 do 25 mm. Isto tako, meteorolozi bi mogli izvijestiti da će prema njihovim prognozama temperatura zraka u iduća 24 sata doseći 22-24°C. Intervalna procjena slučajne varijable omogućuje nam ne samo određivanje željene vrijednosti te veličine, već i zadavanje moguće točnosti takve procjene.

Matematičko očekivanje i njegova ocjena

Vratimo se našem eksperimentu s bacanjem novčića.

Pokušajmo odgovoriti na pitanje: koliko puta bi se trebale pojaviti "glave" ako deset puta bacimo novčić? Čini se da je odgovor očit. Ako su vjerojatnosti svakog od dva ishoda jednake, tada i sami ishodi moraju biti jednako raspoređeni. Drugim riječima, kad običan novčić bacimo deset puta, možemo očekivati ​​da će jedna njegova strana, na primjer, "glava", pasti točno pet puta. Slično tome, kada se novčić baci 100 puta, "glave" bi se trebale pojaviti točno 50 puta, a ako se novčić baci 4236 puta, tada bi se strana koja nas zanima trebala pojaviti 2118 puta, ni više ni manje.

Tako se obično naziva teorijsko značenje slučajnog događaja matematičko očekivanje. Očekivana vrijednost može se pronaći množenjem teorijske vjerojatnosti slučajne varijable s brojem pokušaja. Međutim, formalnije se definira kao središnji moment prvog reda. Dakle, matematičko očekivanje je vrijednost slučajne varijable kojoj ono teorijski teži tijekom ponovljenih testova, oko koje varira.

Jasno je da teorijska vrijednost matematičkog očekivanja kao parametra distribucije nije uvijek jednaka empirijskoj vrijednosti slučajne varijable koja nas zanima, izraženoj u statistici. Ako napravimo eksperiment s bacanjem novčića, onda je vrlo vjerojatno da će se od deset ishoda “glava” pojaviti samo četiri ili tri puta, ili možda, naprotiv, osam puta, ili možda uopće nikada neće doći na red. Jasno je da se neki od tih ishoda pokazuju više, a neki manje vjerojatni. Ako koristimo zakon normalne distribucije, možemo doći do zaključka da što rezultat više odstupa od teorijski očekivanog, specificiranog vrijednošću matematičkog očekivanja, to je manje vjerojatan u praksi.

Nadalje pretpostavimo da smo izveli sličan postupak nekoliko puta i nikada nismo uočili teoretski očekivanu vrijednost. Tada možemo sumnjati u autentičnost novčića. Možemo pretpostaviti da za naš novčić vjerojatnost dobivanja glava zapravo nije 50%. U tom slučaju može biti potrebno procijeniti vjerojatnost tog događaja i, sukladno tome, vrijednost matematičkog očekivanja. Ova potreba javlja se kad god u eksperimentu proučavamo distribuciju kontinuirane slučajne varijable, kao što je vrijeme reakcije, a da unaprijed nemamo nikakav teorijski model. U pravilu je to prvi obvezni korak u kvantitativnoj obradi rezultata pokusa.

Matematičko očekivanje moguće je procijeniti na tri načina, koji u praksi mogu dati nešto drugačije rezultate, no u teoriji bi nas svakako trebali dovesti do vrijednosti matematičkog očekivanja.

Logika takve procjene ilustrirana je na sl. 1.2. Očekivana vrijednost može se smatrati središnjom tendencijom u distribuciji slučajne varijable X, kao njezina najvjerojatnija i stoga najčešće pojavljiva vrijednost i kao točka koja dijeli distribuciju na dva jednaka dijela.

Riža. 1.2.

Nastavimo naše zamišljene pokuse s novčićem i provedimo tri pokusa s bacanjem deset puta. Pretpostavimo da su se u prvom eksperimentu "glave" pojavile četiri puta, isto se dogodilo u drugom eksperimentu, u trećem eksperimentu "glave" su se pojavile više od jedan i pol puta češće - sedam puta. Logično je pretpostaviti da se matematičko očekivanje događaja koji nas zanima zapravo nalazi negdje između ovih vrijednosti.

Prvi, najjednostavniji metoda ocjenjivanja matematičko očekivanje bit će pronaći aritmetička sredina. Tada će procjena očekivane vrijednosti na temelju gornja tri mjerenja biti (4 + 4 + 7)/3 = 5. Slično, u eksperimentima s vremenom reakcije, očekivana vrijednost može se procijeniti uzimanjem aritmetičke sredine svih dobivenih vrijednosti X. Dakle, ako smo potrošili P mjerenja vremena reakcije X, tada možemo upotrijebiti sljedeću formulu, koja nam to pokazuje za izračunavanje aritmetičke sredine x potrebno je zbrojiti sve empirijski dobivene vrijednosti i podijeliti ih s brojem opažanja:

U formuli (1.2) mjera matematičkog očekivanja obično se označava sa ̅ x (čita se kao "X s crtom"), iako ponekad može biti napisano kao M (s engleskog značiti - prosjek).

Aritmetička sredina je najčešće korištena procjena matematičkog očekivanja. U takvim slučajevima pretpostavlja se da se slučajna varijabla mjeri u metrički mjerilo. Jasno je da se dobiveni rezultat može ali i ne mora podudarati s pravom vrijednošću matematičkog očekivanja, što nikad ne znamo. Važno je, međutim, da je ova metoda nepristran procjena matematičkog očekivanja. To znači da je očekivana vrijednost procijenjene vrijednosti jednaka njezinom matematičkom očekivanju: .

Druga metoda ocjenjivanja matematičko očekivanje je uzeti kao svoju vrijednost vrijednost varijable koja nas zanima koja se najčešće pojavljuje. Ova se vrijednost naziva način distribucije. Na primjer, u slučaju bacanja novčića koji smo upravo razmotrili, "četiri" se može uzeti kao vrijednost matematičkog očekivanja, budući da se u tri provedena testa ova vrijednost pojavila dva puta; Zato se način distribucije u ovom slučaju pokazao jednakim četiri. Procjena načina se koristi uglavnom kada eksperimentator radi s varijablama koje imaju diskretne vrijednosti navedene u nemetrički mjerilo.

Na primjer, opisujući distribuciju studentskih ocjena na ispitu, može se konstruirati učestalost distribucije ocjena koje su studenti dobili. Ova raspodjela frekvencija naziva se histogram. U ovom slučaju, najčešća procjena može se uzeti kao vrijednost središnje tendencije (matematičko očekivanje). Pri proučavanju varijabli koje karakteriziraju kontinuirane vrijednosti, ova mjera se praktički ne koristi ili se rijetko koristi. Ako je raspodjela frekvencija dobivenih rezultata ipak konstruirana, tada se u pravilu ne odnosi na eksperimentalno dobivene vrijednosti karakteristike koja se proučava, već na neke intervale njezine manifestacije. Na primjer, proučavajući visinu ljudi, možete vidjeti koliko ljudi spada u raspon visine do 150 cm, koliko ih spada u raspon od 150 do 155 cm, itd. U ovom slučaju, način će biti povezan s intervalnim vrijednostima karakteristike koja se proučava, u ovom slučaju visine.

Jasno je da se modus, kao i aritmetička sredina, može i ne mora podudarati sa stvarnom vrijednošću matematičkog očekivanja. No baš kao i aritmetička sredina, mod je nepristrana procjena matematičkog očekivanja.

Dodajmo da ako se dvije vrijednosti u uzorku pojavljuju jednako često, tada se takva distribucija naziva bimodalni. Ako se tri ili više vrijednosti u uzorku pojavljuju jednako često, tada se za takav uzorak kaže da nema modus. Takvi slučajevi, s dovoljno velikim brojem opažanja, u pravilu ukazuju na to da su podaci izvučeni iz opće populacije, čija se priroda distribucije razlikuje od normalne.

Konačno, treća metoda ocjenjivanja matematičko očekivanje je podijeliti uzorak ispitanika prema parametru koji nas zanima točno na pola. Veličina koja karakterizira ovu granicu naziva se medijan distribucije.

Pretpostavimo da smo prisutni na skijaškom natjecanju i nakon njegovog završetka želimo ocijeniti tko je od sportaša pokazao rezultate iznad prosjeka, a koji ispod prosjeka. Ako je sastav sudionika manje-više ujednačen, tada je pri ocjeni prosječnog rezultata logično izračunati aritmetičku sredinu. Pretpostavimo, međutim, da među profesionalnim sudionicima ima i nekoliko amatera. Malo ih je, ali pokazuju rezultate koji su znatno inferiorniji od drugih. U ovom slučaju može se pokazati da je od npr. 100 sudionika natjecanja natprosječno njih 87. Jasno je da nas takva ocjena prosječne tendencije ne može uvijek zadovoljiti. U ovom slučaju logično je pretpostaviti da su prosječan rezultat pokazali sudionici koji su zauzeli negdje 50. ili 51. mjesto. Ovo će biti medijan distribucije. Prije 50. finalista završilo je 49 sudionika, nakon 51. također 49. Nije, međutim, jasno čiji rezultat među njima treba uzeti kao prosjek. Naravno, može se ispostaviti da su završili u isto vrijeme. Onda nema problema. Problem ne nastaje kada je broj opažanja neparan. U drugim slučajevima, međutim, možete koristiti prosjek rezultata dva sudionika.

Medijan je poseban slučaj kvantila distribucije. Kvantil je dio distribucije. Formalno, može se definirati kao integralna vrijednost distribucije između dvije vrijednosti varijable X. Dakle, vrijednost x bit će medijan distribucije ako je integralna vrijednost distribucije (gustoća vjerojatnosti) od -∞ do x jednaka integralnoj vrijednosti distribucije iz x na +∞. Slično, distribucija se može podijeliti na četiri, deset ili 100 dijelova. Takvi kvantili se prema tome nazivaju kvartili, decili I percentili. Postoje i druge vrste kvantila.

Kao i prethodne dvije metode za procjenu matematičkog očekivanja, medijan je nepristrana procjena matematičkog očekivanja.

Teoretski, pretpostavlja se da ako stvarno imamo posla s normalnom distribucijom slučajne varijable, onda bi sve tri procjene matematičkog očekivanja trebale dati isti rezultat, budući da sve predstavljaju varijantu nepristran procjene istog parametra distribucije procijenjene slučajne varijable (vidi sliku 1.2). Međutim, u praksi se to rijetko događa. To može biti posebno zbog činjenice da se analizirana distribucija razlikuje od normalne. No, glavni razlog za takva odstupanja, u pravilu, jest taj što se procjenom vrijednosti matematičkog očekivanja može dobiti vrijednost koja se vrlo značajno razlikuje od njegove prave vrijednosti. Međutim, kao što je gore navedeno, u matematičkoj statistici je dokazano da što se više neovisnih testova varijable koja se razmatra, to bi procijenjena vrijednost trebala biti bliža stvarnoj.

Stoga u praksi izbor metode za procjenu matematičkog očekivanja nije određen željom da se dobije točnija i pouzdanija procjena ovog parametra, već samo razmatranjima pogodnosti. Također, određenu ulogu u odabiru metode za procjenu matematičkog očekivanja igra mjerna ljestvica, koja odražava opažanja slučajne varijable koja se vrednuje.

Neka se provedu neovisni eksperimenti na slučajnoj varijabli s nepoznatim matematičkim očekivanjem i varijancom, koji su dali rezultate - . Izračunajmo dosljedne i nepristrane procjene za parametre i .

Kao procjenu matematičkog očekivanja uzimamo aritmetičku sredinu eksperimentalnih vrijednosti

. (2.9.1)

Prema zakonu velikih brojeva, ova procjena je bogati , s vrijednošću prema vjerojatnosti. Ova ista ocjena je također nepristran , jer

. (2.9.2)

Varijanca ove procjene je

. (2.9.3)

Može se pokazati da je za normalni zakon distribucije ova procjena djelotvoran . Za druge zakone to možda nije slučaj.

Procijenimo sada varijancu. Odaberimo najprije za procjenu formulu za statistička varijanca

. (2.9.4)

Provjerimo dosljednost procjene varijance. Otvorimo zagrade u formuli (2.9.4)

.

Kada prvi član konvergira u vjerojatnosti prema vrijednosti , u drugom - do. Dakle, naša procjena konvergira u vjerojatnosti prema varijanci

,

dakle ona je bogati .

Provjerimo neraseljena procjene za količinu . Da bismo to učinili, zamijenimo izraz (2.9.1) u formulu (2.9.4) i uzmemo u obzir da su slučajne varijable nezavisna

,

. (2.9.5)

Prijeđimo u formuli (2.9.5) na fluktuacije slučajnih varijabli

Otvaranjem zagrada dobivamo

,

. (2.9.6)

Izračunajmo matematičko očekivanje vrijednosti (2.9.6), uzimajući u obzir da

. (2.9.7)

Odnos (2.9.7) pokazuje da vrijednost izračunata pomoću formule (2.9.4) nije nepristrana procjena za disperziju. Njegovo matematičko očekivanje nije jednako, već nešto manje. Takva procjena dovodi do sustavne pogreške prema dolje. Da biste uklonili takvu pristranost, trebate uvesti korekciju množenjem vrijednosti . Ova ispravljena statistička varijanca tada može poslužiti kao nepristrana procjena varijance

. (2.9.8)

Ova procjena vrijedi jednako kao i procjena , budući da je vrijednost .

U praksi, umjesto procjene (2.9.8), ponekad je prikladnije koristiti ekvivalentnu procjenu povezanu s drugim početnim statističkim trenutkom

. (2.9.9)

Procjene (2.9.8), (2.9.9) nisu učinkovite. Može se pokazati da će u slučaju normalnog zakona raspodjele biti asimptotski učinkovit (po želji teži minimalnoj mogućoj vrijednosti).

Tako se mogu formulirati sljedeća pravila za obradu statističkog materijala ograničenog volumena. Ako u neovisnim pokusima slučajna varijabla poprimi vrijednosti s nepoznatim matematičkim očekivanjem i disperzijom, tada za određivanje ovih parametara treba koristiti približne procjene

(2.9.10)

Kraj posla -

Ova tema pripada odjeljku:

Bilješke s predavanja iz matematike, teorije vjerojatnosti, matematičke statistike

Zavod za višu matematiku i računarstvo.. Bilješke s predavanja.. iz matematike..

Ako trebate dodatne materijale o ovoj temi ili niste pronašli ono što ste tražili, preporučamo pretraživanje naše baze radova:

Što ćemo učiniti s primljenim materijalom:

Ako vam je ovaj materijal bio koristan, možete ga spremiti na svoju stranicu na društvenim mrežama:

Sve teme u ovom odjeljku:

Teorija vjerojatnosti
Teorija vjerojatnosti je grana matematike u kojoj se proučavaju uzorci slučajnih masovnih pojava. Pojava koja je slučajna naziva se

Statistička definicija vjerojatnosti
Događaj je slučajna pojava koja se može, ali i ne mora pojaviti kao rezultat iskustva (dvosmislena pojava). Događaje navedite velikim latiničnim slovima

Prostor elementarnih događaja
Neka postoji mnogo događaja povezanih s nekim iskustvom, i: 1) kao rezultat iskustva pojavljuje se jedna i samo jedna stvar

Radnje na događajima
Zbroj dva događaja i

Preuređivanja
Broj različitih permutacija elemenata je označen sa

Plasmani
Postavljanjem elemenata prema

Kombinacije
Kombinacija elemenata

Formula za zbrajanje vjerojatnosti za nekompatibilne događaje
Teorema. Vjerojatnost zbroja dvaju nekompatibilnih događaja jednaka je zbroju vjerojatnosti tih događaja. (1

Formula za zbrajanje vjerojatnosti proizvoljnih događaja
Teorema. Vjerojatnost zbroja dvaju događaja jednaka je zbroju vjerojatnosti tih događaja bez vjerojatnosti njihova umnoška.

Formula množenja vjerojatnosti
Neka budu dana dva događaja i . Razmotrite događaj

Formula ukupne vjerojatnosti
Neka je potpuna skupina nekompatibilnih događaja; nazivaju se hipoteze. Razmotrite neki događaj

Formula vjerojatnosti hipoteze (Bayes)
Razmotrimo opet – kompletnu skupinu nekompatibilnih hipoteza i događaj

Asimptotska Poissonova formula
U slučajevima kada je broj testova velik i vjerojatnost da se događaj dogodi

Slučajne diskretne veličine
Slučajna veličina je veličina koja pri ponavljanju pokusa može poprimiti nejednake brojčane vrijednosti. Slučajna varijabla se naziva diskretna,

Slučajne kontinuirane varijable
Ako kao rezultat eksperimenta slučajna varijabla može poprimiti bilo koju vrijednost s određenog segmenta ili cijele realne osi, tada se naziva kontinuiranom. Zakon

Funkcija gustoće vjerojatnosti slučajne kontinuirane varijable
Neka bude. Razmotrimo točku i povećajmo je

Numeričke karakteristike slučajnih varijabli
Slučajne diskretne ili kontinuirane varijable smatraju se potpuno specificiranima ako su im poznati zakoni raspodjele. Zapravo, znajući zakone distribucije, uvijek možete izračunati vjerojatnost pogotka

Kvantili slučajnih varijabli
Kvantil reda slučajne kontinuirane varijable

Matematičko očekivanje slučajnih varijabli
Matematičko očekivanje slučajne varijable karakterizira njezinu prosječnu vrijednost. Sve vrijednosti slučajne varijable grupirane su oko ove vrijednosti. Razmotrimo najprije slučajnu diskretnu varijablu

Standardna devijacija i disperzija slučajnih varijabli
Razmotrimo najprije slučajnu diskretnu varijablu. Mod numeričkih karakteristika, medijan, kvantili i matematičko očekivanje

Momenti slučajnih varijabli
Uz matematičko očekivanje i disperziju, teorija vjerojatnosti koristi numeričke karakteristike viših redova, koje se nazivaju momenti slučajnih varijabli.

Teoremi o numeričkim karakteristikama slučajnih varijabli
Teorem 1. Matematičko očekivanje neslučajne vrijednosti jednako je samoj toj vrijednosti. Dokaz: Neka

Binomni zakon distribucije

Poissonov zakon distribucije
Neka slučajna diskretna varijabla poprima vrijednosti

Uniformni zakon raspodjele
Uniformni zakon raspodjele slučajne kontinuirane varijable je zakon funkcije gustoće vjerojatnosti koji

Zakon normalne distribucije
Zakon normalne distribucije slučajne kontinuirane varijable je zakon funkcije gustoće

Eksponencijalni zakon raspodjele
Eksponencijalna ili eksponencijalna distribucija slučajne varijable koristi se u takvim primjenama teorije vjerojatnosti kao što su teorija čekanja, teorija pouzdanosti

Sustavi slučajnih varijabli
U praksi, u primjenama teorije vjerojatnosti, često se susreću problemi u kojima se rezultati eksperimenta ne opisuju jednom slučajnom varijablom, već nekoliko slučajnih varijabli odjednom.

Sustav dviju slučajnih diskretnih varijabli
Neka dvije slučajne diskretne varijable tvore sustav. Slučajna vrijednost

Sustav dviju slučajnih kontinuiranih varijabli
Neka sada sustav čine dvije slučajne kontinuirane varijable. Zakon raspodjele ovog sustava naziva se vjerojatno

Uvjetni zakoni raspodjele
Neka su ovisne slučajne kontinuirane veličine

Numeričke karakteristike sustava dviju slučajnih varijabli
Početni trenutak uređenosti sustava slučajnih varijabli

Sustav nekoliko slučajnih varijabli
Rezultati dobiveni za sustav dviju slučajnih varijabli mogu se generalizirati na slučaj sustava koji se sastoje od proizvoljnog broja slučajnih varijabli. Neka sustav tvori skup

Zakon normalne distribucije za sustav dviju slučajnih varijabli
Razmotrimo sustav dviju slučajnih kontinuiranih varijabli. Zakon distribucije ovog sustava je zakon normalne distribucije

Granični teoremi teorije vjerojatnosti
Glavni cilj disciplinske teorije vjerojatnosti je proučavanje obrazaca slučajnih masovnih pojava. Praksa pokazuje da promatranje mase homogenih slučajnih pojava otkriva

Čebiševljeva nejednakost
Razmotrite slučajnu varijablu s matematičkim očekivanjem

Čebiševljev teorem
Ako su slučajne varijable upareno neovisne i imaju konačne, kolektivno ograničene varijance

Bernoullijev teorem
Neograničenim povećanjem broja eksperimenata učestalost pojavljivanja događaja konvergira u vjerojatnosti prema vjerojatnosti događaja

Centralni granični teorem
Kada se zbrajaju slučajne varijable s bilo kojim zakonima distribucije, ali sa zajednički ograničenim varijancama, zakon distribucije

Glavni problemi matematičke statistike
Gore razmotreni zakoni teorije vjerojatnosti predstavljaju matematički izraz stvarnih obrazaca koji stvarno postoje u različitim slučajnim masovnim fenomenima. studiranje

Jednostavna statistička populacija. Funkcija statističke distribucije
Razmotrimo neku slučajnu varijablu čiji je zakon raspodjele nepoznat. Potrebno na temelju iskustva

Statističke serije. Grafikon
S velikim brojem opažanja (reda stotine), populacija postaje nezgodna i glomazna za bilježenje statističkog materijala. Radi preglednosti i kompaktnosti, statistički materijal

Numeričke karakteristike statističke distribucije
U teoriji vjerojatnosti razmatrane su različite numeričke karakteristike slučajnih varijabli: matematičko očekivanje, disperzija, početni i središnji momenti različitih redova. Slični brojevi

Izbor teorijske raspodjele metodom momenata
Svaka statistička distribucija neizbježno sadrži elemente slučajnosti povezane s ograničenim brojem opažanja. S velikim brojem promatranja, ovi elementi slučajnosti su izglađeni,

Provjera vjerodostojnosti hipoteze o obliku zakona raspodjele
Neka je data statistička distribucija aproksimirana nekom teoretskom krivuljom ili

Kriteriji pristanka
Razmotrimo jedan od najčešće korištenih kriterija prilagodbe - takozvani Pearsonov kriterij. pogodi

Točkaste procjene za nepoznate parametre distribucije
U str. 2.1. – 2.7 detaljno smo ispitali kako riješiti prvi i drugi glavni problem matematičke statistike. To su problemi određivanja zakona raspodjele slučajnih varijabli na temelju eksperimentalnih podataka

Interval pouzdanosti. Vjerojatnost povjerenja
U praksi, s malim brojem eksperimenata na slučajnoj varijabli, aproksimativna zamjena nepoznatog parametra

Neka slučajni uzorak generira promatrana slučajna varijabla ξ, matematičko očekivanje i varijanca koji su nepoznati. Predloženo je korištenje prosjeka uzorka kao procjene za ove karakteristike

i varijanca uzorka

. (3.14)

Razmotrimo neka svojstva procjena matematičkog očekivanja i disperzije.

1. Izračunajte matematičko očekivanje prosjeka uzorka:

Stoga je srednja vrijednost uzorka nepristran procjenitelj za .

2. Podsjetimo da su rezultati opažanja su neovisne slučajne varijable od kojih svaka ima isti zakon distribucije kao i vrijednost, što znači , , . Pretpostavit ćemo da je varijanca konačna. Tada, prema Čebiševljevom teoremu o zakonu velikih brojeva, za svako ε > 0 vrijedi jednakost ,

što se može napisati ovako: . (3.16) Uspoređujući (3.16) s definicijom svojstva konzistentnosti (3.11), vidimo da je procjena konzistentna procjena matematičkog očekivanja.

3. Pronađite varijancu uzorka srednje vrijednosti:

. (3.17)

Stoga se varijanca procjene matematičkog očekivanja smanjuje obrnuto proporcionalno veličini uzorka.

Može se dokazati da ako je slučajna varijabla ξ normalno raspodijeljena, tada je sredina uzorka učinkovita procjena matematičkog očekivanja, odnosno varijanca ima najmanju vrijednost u usporedbi s bilo kojom drugom procjenom matematičkog očekivanja. Za druge zakone raspodjele ξ to ne mora biti slučaj.

Varijanca uzorka je pristrana procjena varijance jer . (3.18)

Doista, koristeći svojstva matematičkog očekivanja i formule (3.17), nalazimo

.

Da bi se dobila nepristrana procjena varijance, procjena (3.14) mora se korigirati, odnosno pomnožiti s . Tada dobivamo varijancu nepristranog uzorka

. (3.19)

Imajte na umu da se formule (3.14) i (3.19) razlikuju samo u nazivniku, a za velike vrijednosti uzorak i nepristrane varijance malo se razlikuju. Međutim, kod male veličine uzorka treba koristiti relaciju (3.19).

Za procjenu standardne devijacije slučajne varijable koristi se takozvana "korigirana" standardna devijacija, koja je jednaka kvadratnom korijenu nepristrane varijance: .

Intervalne procjene

U statistici postoje dva pristupa procjeni nepoznatih parametara distribucija: točkasti i intervalni. U skladu s procjenom točaka, o kojoj je bilo riječi u prethodnom odjeljku, naznačena je samo točka oko koje se nalazi procijenjeni parametar. Poželjno je, međutim, znati koliko taj parametar zapravo može biti daleko od mogućih realizacija procjena u različitim serijama promatranja.

Odgovor na ovo pitanje – također približan – daje druga metoda procjene parametara – intervalna. U skladu s ovom metodom procjene nalazi se interval koji s vjerojatnošću bliskom jedinici pokriva nepoznatu numeričku vrijednost parametra.

Pojam intervalne estimacije

Procjena bodova je slučajna varijabla i za moguće uzorke implementacije uzima vrijednosti samo približno jednake stvarnoj vrijednosti parametra. Što je razlika manja, to je procjena točnija. Dakle, pozitivan broj za koji , karakterizira točnost procjene i naziva se pogreška procjene (ili marginalna pogreška).

Vjerojatnost povjerenja(ili pouzdanost) naziva vjerojatnost β , čime se ostvaruje nejednakost , tj.

. (3.20)

Zamjena nejednakosti ekvivalentna dvostruka nejednakost , ili , dobivamo

Interval , pokrivajući s vjerojatnošću β , , nepoznati parametar, poziva se interval pouzdanosti (ili procjena intervala), odgovarajuća vjerojatnost povjerenja β .

Slučajna varijabla nije samo procjena, već i pogreška: njezina vrijednost ovisi o vjerojatnosti β i to u pravilu iz uzorka. Stoga je interval pouzdanosti slučajan i izraz (3.21) treba čitati na sljedeći način: „Interval će pokriti parametar s vjerojatnošću β “, a ne ovako: „Parametar će s vjerojatnošću pasti u interval β ”.

Značenje intervala pouzdanosti je da kada se volumen uzorka ponavlja mnogo puta u relativnom udjelu slučajeva jednak β , interval pouzdanosti koji odgovara vjerojatnosti pouzdanosti β , pokriva pravu vrijednost procijenjenog parametra. Dakle, vjerojatnost povjerenja β karakterizira pouzdanost procjena povjerenja: što više β , veća je vjerojatnost da implementacija intervala pouzdanosti sadrži nepoznati parametar.

KATEGORIJE

POPULARNI ČLANCI

2023 “kingad.ru” - ultrazvučni pregled ljudskih organa