Procjena matematičkog očekivanja slučajne varijable. Točkaste procjene matematičkog očekivanja

Neka postoji slučajna varijabla x s matematičkim očekivanjem m i disperzija D, dok su oba ova parametra nepoznata. Prekomjerna veličina x proizvedeno N nezavisni eksperimenti, koji su rezultirali nizom N numerički rezultati x 1, x 2, …, x N. Kao procjenu matematičkog očekivanja, prirodno je predložiti aritmetičku sredinu promatranih vrijednosti

(1)

Ovdje kao x i specifične vrijednosti (brojevi) dobivene kao rezultat N eksperimenti. Ako uzmemo druge (nezavisne od prethodnih) N eksperimentima, tada ćemo, očito, dobiti drugačiju vrijednost. Ako uzmete više N eksperimentima, dobit ćemo još jednu novu vrijednost. Označimo sa X i slučajna varijabla koja proizlazi iz ja eksperiment, zatim realizacije X i bit će brojevi dobiveni kao rezultat ovih eksperimenata. Očito je da slučajna varijabla X i imat će istu gustoću distribucije vjerojatnosti kao izvorna slučajna varijabla x. Također pretpostavljamo da slučajne varijable X i i Xj nezavisni su pri ja, nejednak j(razni međusobno neovisni eksperimenti). Stoga ćemo formulu (1) prepisati u drugom (statističkom) obliku:

(2)

Pokažimo da je procjena nepristrana:

Stoga je matematičko očekivanje uzorka srednje vrijednosti jednako pravom matematičkom očekivanju slučajne varijable m. To je prilično predvidljiva i razumljiva činjenica. Stoga se srednja vrijednost uzorka (2) može uzeti kao procjena matematičkog očekivanja slučajne varijable. Sada se postavlja pitanje: što se događa s varijancom procjene očekivanja kako se broj eksperimenata povećava? To pokazuju analitički proračuni

gdje je varijanca procjene matematičkog očekivanja (2), i D- prava varijanca slučajne varijable x.

Iz navedenog proizlazi da s povećanjem N(broj eksperimenata) varijanca procjene se smanjuje, tj. što više sažimamo neovisne implementacije, dobivamo procjenu bližu očekivanoj vrijednosti.


Matematičke procjene varijance

Na prvi pogled čini se najprirodnija procjena

(3)

gdje se izračunava formulom (2). Provjerimo je li procjena nepristrana. Formula (3) može se napisati na sljedeći način:

Zamijenimo izraz (2) u ovu formulu:

Nađimo matematičko očekivanje procjene varijance:

(4)

Kako varijanca slučajne varijable ne ovisi o tome kakvo je matematičko očekivanje slučajne varijable, uzet ćemo matematičko očekivanje jednako 0, tj. m = 0.

(5)
u .(6)

Neka postoji slučajna varijabla X, a njeni parametri su matematičko očekivanje a i varijanca su nepoznati. Nad vrijednošću X provedeni su neovisni eksperimenti koji su dali rezultate x 1, x 2, x n.

Ne umanjujući općenitost obrazloženja, smatrat ćemo da su ove vrijednosti slučajne varijable različite. Vrijednosti x 1, x 2, x n smatrat ćemo neovisnim, identično raspodijeljenim slučajnim varijablama X 1, X 2, X n.

Najjednostavnija metoda statističke procjene - metoda supstitucije i analogije - sastoji se u činjenici da se kao procjena jedne ili druge numeričke karakteristike (prosjeka, varijance itd.) Opće populacije uzima odgovarajuća karakteristika distribucije uzorka - karakteristika uzorka.

Metodom supstitucije kao procjena matematičkog očekivanja a potrebno je uzeti matematičko očekivanje distribucije uzorka – uzorkačka sredina. Dakle, dobivamo

Testirati nepristranost i dosljednost uzorka kao procjenu a, razmotrite ovu statistiku kao funkciju odabranog vektora (X 1, X 2, X n). Uzimajući u obzir da svaka od veličina X 1, X 2, X n ima isti zakon raspodjele kao i veličina X, zaključujemo da su numeričke karakteristike ovih veličina i veličine X iste: M(X ja) = M(X) = a, D(X ja) = D(X) = , ja = 1, 2, n , gdje su X i kolektivno neovisne slučajne varijable.

Posljedično,

Stoga, prema definiciji, dobivamo da je to nepristrana procjena a, a budući da je D()®0 kao n®¥, tada na temelju teorema iz prethodnog odlomka je dosljedna procjena očekivanja a općoj populaciji.

Učinkovitost ili neučinkovitost procjene ovisi o obliku zakona distribucije slučajne varijable X. Može se dokazati da ako je vrijednost X raspodijeljena prema normalnom zakonu, tada je ocjena učinkovita. Za druge zakone distribucije to možda nije slučaj.

Nepristrana procjena opće varijance je ispravljena varijanca uzorka

,

Jer , gdje je opća varijanca. Stvarno,

Procjena s -- 2 za opću varijancu također je dosljedna, ali nije učinkovita. Međutim, u slučaju normalne distribucije, on je “asimptotski učinkovit”, to jest, kako n raste, omjer njegove varijance minimalno mogućem približava se neograničeno.

Dakle, dat je uzorak iz distribucije F( x) slučajna varijabla X s nepoznatim matematičkim očekivanjem a i disperzija , tada za izračunavanje vrijednosti ovih parametara imamo pravo koristiti sljedeće približne formule:

a ,

.

Evo x-i- - opcije uzorkovanja, n- i - - opcije frekvencije x i, - - veličina uzorka.
Za izračun ispravljene varijance uzorka prikladnija je formula


.

Da biste pojednostavili izračun, preporučljivo je prijeći na uvjetne opcije (korisno je uzeti početnu varijantu koja se nalazi u sredini niza intervalnih varijacija kao c). Zatim

, .

intervalna procjena

Gore smo razmotrili pitanje procjene nepoznatog parametra a jedan broj. Takve smo procjene nazvali točkastim procjenama. Nedostatak im je što se uz malu veličinu uzorka mogu značajno razlikovati od procijenjenih parametara. Stoga, da bismo dobili predodžbu o blizini parametra i njegove procjene, u matematičku statistiku uvode se takozvane intervalne procjene.

Neka se u uzorku za parametar q nađe točkasta procjena q *. Obično je istraživačima unaprijed dana neka dovoljno velika vjerojatnost g (na primjer, 0,95; 0,99 ili 0,999) takva da se događaj s vjerojatnošću g može smatrati praktički izvjesnim, te postavljaju pitanje pronalaženja takve vrijednosti e > 0 za koji

.

Modificirajući ovu jednakost, dobivamo:

i u ovom slučaju ćemo reći da je interval ]q * - e; q * + e[ pokriva procijenjeni parametar q s vjerojatnošću g.

Interval ]q * -e; q * +e [ zove se interval pouzdanosti .

Vjerojatnost g naziva se pouzdanost (vjerojatnost povjerenja) interval procjena.

Krajevi intervala pouzdanosti, tj. nazivaju se točke q * -e i q * +e granice povjerenja .

Broj e se zove točnost procjene .

Kao primjer problema određivanja granica pouzdanosti, razmotrimo pitanje procjene matematičkog očekivanja slučajne varijable X, koja ima normalni zakon distribucije s parametrima a i s, tj. X = N( a, s). Matematičko očekivanje u ovom slučaju je jednako a. Prema opažanjima X 1 , X 2 , X n izračunajte prosjek i evaluacija disperzija s 2 .

Ispada da je prema uzorku podataka moguće konstruirati slučajnu varijablu

koji ima Studentovu distribuciju (ili t-distribuciju) s n = n -1 stupnjeva slobode.

Upotrijebimo tablicu A.1.3 i pronađimo za zadanu vjerojatnost g i broj n broj t g tako da je vjerojatnost

P(|t(n)|< t g) = g,

.

Nakon očitih transformacija, dobivamo

Postupak za primjenu F-kriterija je sljedeći:

1. Izrađena je pretpostavka o normalnoj distribuciji populacija. Na danoj razini značajnosti a, formulira se nulta hipoteza H 0: s x 2 = s y 2 o jednakosti općih varijanci normalnih populacija pod konkurentskom hipotezom H 1: s x 2 > s y 2 .

2. Dobivaju se dva neovisna uzorka iz X i Y populacije od n x odnosno n y.

3. Izračunajte vrijednosti ispravljenih varijanci uzorka s x 2 i s y 2 (metode izračuna se raspravljaju u §13.4). Veća od disperzija (s x 2 ili s y 2) označena je s 1 2, manja - s 2 2.

4. Vrijednost F-kriterija izračunava se prema formuli F obs = s 1 2 / s 2 2 .

5. Prema tablici kritičnih točaka Fisher-Snedecorove distribucije, za zadanu razinu značajnosti a i broj stupnjeva slobode n 1 \u003d n 1 - 1, n 2 \u003d n 2 - 1 (n 1 je broj stupnjeva slobode veće korigirane varijance), kritična točka se nalazi F cr (a, n 1, n 2).

Imajte na umu da tablica A.1.7 prikazuje kritične vrijednosti jednostranog F-kriterija. Stoga, ako se primijeni dvostrani kriterij (H 1: s x 2 ¹ s y 2), tada se desna kritična točka F cr (a / 2, n 1, n 2) traži razinom značajnosti a / 2 (polovica navedenog) i broj stupnjeva slobode n 1 i n 2 (n 1 - broj stupnjeva slobode veće disperzije). Lijeva kritična točka možda neće biti pronađena.

6. Zaključuje se da ako je izračunata vrijednost F-kriterija veća ili jednaka kritičnoj (F obs ³ F cr), tada se varijance značajno razlikuju na danoj razini značajnosti. Inače (F ops< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Zadatak 15.1. Utrošak sirovina po jedinici proizvodnje prema staroj tehnologiji bio je:

Nova tehnologija:

Uz pretpostavku da odgovarajuće opće populacije X i Y imaju normalne distribucije, provjeriti da se potrošnja sirovina za nove i stare tehnologije ne razlikuje u varijabilnosti, ako uzmemo razinu značajnosti a = 0,1.

Riješenje. Postupamo prema gore navedenom redoslijedu.

1. Varijabilnost utroška sirovina za nove i stare tehnologije prosuđivat ćemo prema vrijednostima disperzije. Dakle, nulta hipoteza ima oblik H 0: s x 2 = s y 2 . Kao konkurentsku hipotezu prihvaćamo hipotezu H 1: s x 2 ¹ s y 2, jer nismo unaprijed sigurni da je bilo koja od općih varijacija veća od druge.

2-3. Pronađite varijance uzorka. Da bismo pojednostavili izračune, prijeđimo na uvjetne opcije:

u i = x i - 307, v i = y i - 304.

Sve izračune uredit ćemo u obliku sljedećih tablica:

u i m i m i u i m ja u i 2 m i (u i +1) 2 v i n i n i v i n i v i 2 n i (v i +1) 2
-3 -3 -1 -2
å -
å -

Kontrola: å m i u i 2 + 2å m i u i + m i = Kontrola: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Pronađite ispravljene varijance uzorka:

4. Usporedite varijance. Pronađite omjer veće ispravljene varijance prema manjoj:

.

5. Po uvjetu, konkurentska hipoteza ima oblik s x 2 ¹ s y 2 , dakle, kritično područje je dvostrano, te pri pronalaženju kritične točke treba uzeti razine značajnosti koje su upola manje od zadane.

Prema tablici A.1.7, prema razini značajnosti a/2 = 0,1/2 = 0,05 i broju stupnjeva slobode n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8, nalazimo kritična točka F cr ( 0,05; 12; 8) = 3,28.

6. Budući da je F obl.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.

Gore, prilikom testiranja hipoteza, pretpostavljeno je da je distribucija slučajnih varijabli koje se proučavaju normalna. Međutim, posebne studije su pokazale da su predloženi algoritmi vrlo stabilni (osobito s velikim veličinama uzorka) s obzirom na odstupanje od normalne distribucije.

Parametri distribucije i statistika

Svi parametri distribucije slučajne varijable, poput matematičkog očekivanja ili varijance, na primjer, teorijske su vrijednosti koje nisu izravno mjerljive, iako se mogu procijeniti. One su kvantitativne populacija i mogu se sami odrediti samo tijekom teorijskog modeliranja kao hipotetske vrijednosti, budući da opisuju značajke distribucije slučajne varijable u samoj općoj populaciji. Kako bi se utvrdili u praksi, istraživač koji provodi eksperiment provodi njihovu selektivnu procjenu. Takva procjena uključuje statistički izračun.

Statistika predstavlja kvantitativnu karakteristiku proučavanih parametara koji karakteriziraju distribuciju slučajne varijable, dobivenu na temelju istraživanja vrijednosti uzorka. Statistika se koristi ili za opisivanje samog uzorka ili, što je od iznimne važnosti u fundamentalnom eksperimentalnom istraživanju, za procjenu parametara distribucije slučajne varijable u općoj populaciji koja se proučava.

Razdvajanje pojmova "parametar" i "statistika" vrlo je važno jer omogućuje izbjegavanje niza pogrešaka povezanih s netočnim tumačenjem podataka dobivenih u eksperimentu. Činjenica je da kada procjenjujemo parametre distribucije pomoću statističkih podataka, dobivamo vrijednosti koje su samo u određenoj mjeri bliske procijenjenim parametrima. Gotovo uvijek postoji neka razlika između parametara i statistike, a obično ne možemo reći kolika je ta razlika. Teoretski, što je veći uzorak, to su procijenjeni parametri bliži njihovim karakteristikama uzorka. No, to ne znači da ćemo povećanjem veličine uzorka neizbježno doći bliže procijenjenom parametru, smanjiti razliku između njega i izračunate statistike. U praksi se stvari mogu pokazati puno kompliciranijima.

Ako se u teoriji očekivana vrijednost statistike podudara s procijenjenim parametrom, tada se takva procjena naziva nepristran. Naziva se procjena u kojoj se očekivana vrijednost procijenjenog parametra razlikuje od samog parametra za neki iznos raseljeni.

Također je potrebno razlikovati točkaste i intervalne procjene parametara distribucije. točkasta zove se procjena pomoću nekog broja. Na primjer, ako kažemo da je vrijednost prostornog praga taktilne osjetljivosti za određeni subjekt u danim uvjetima i na određenom području kože 21,8 mm, tada će takva procjena biti procjena bodova. Slično, točkasta procjena se događa kada nam vremenska prognoza kaže da je vani 25°C. Intervalna procjena uključuje korištenje skupa ili raspona brojeva u evaluaciji. Procjenjujući prostorni prag taktilne osjetljivosti, možemo reći da se pokazao u rasponu od 20 do 25 mm. Isto tako, prognostičari bi mogli izvijestiti da će prema njihovim prognozama temperatura zraka u iduća 24 sata doseći 22-24°C. Intervalna procjena slučajne varijable omogućuje nam ne samo određivanje željene vrijednosti ove varijable, već i postavljanje moguće točnosti takve procjene.

Matematičko očekivanje i njegova ocjena

Vratimo se našem iskustvu bacanja novčića.

Pokušajmo odgovoriti na pitanje: koliko bi puta trebao ispasti "orao" ako deset puta bacimo novčić? Čini se da je odgovor očit. Ako su vjerojatnosti svakog od dva ishoda jednake, tada i sami ishodi moraju biti jednako raspoređeni. Drugim riječima, kada se običan novčić baci deset puta, imamo pravo očekivati ​​da će jedna njegova strana, primjerice, "glava", ispasti točno pet puta. Slično, kad se novčić baci 100 puta, glave bi trebale ispasti točno 50 puta, a ako se novčić baci 4236 puta, tada bi se strana koja nas zanima trebala pojaviti 2118 puta, ni više ni manje.

Dakle, obično se naziva teorijska vrijednost slučajnog događaja matematičko očekivanje. Matematičko očekivanje može se pronaći množenjem teorijske vjerojatnosti slučajne varijable s brojem pokušaja. Formalnije, međutim, definiran je kao središnji trenutak prvog reda. Dakle, matematičko očekivanje je vrijednost slučajne varijable kojoj teoretski teži tijekom ponovljenih testova, u odnosu na koju varira.

Jasno je da teorijska vrijednost matematičkog očekivanja kao parametra distribucije nije uvijek jednaka empirijskoj vrijednosti slučajne varijable koja nas zanima, izraženoj u statistici. Ako napravimo eksperiment s bacanjem novčića, vrlo je vjerojatno da će se od deset ishoda glava pojaviti samo četiri ili tri puta, ili možda, naprotiv, osam puta, ili možda nikada. . Jasno je da su neki od ovih ishoda vjerojatniji, a neki manje vjerojatni. Ako koristimo zakon normalne distribucije, možemo zaključiti da što rezultat više odstupa od teorijski očekivanog, zadanog vrijednošću matematičkog očekivanja, to je manje vjerojatan u praksi.

Pretpostavimo dalje da smo ovaj postupak proveli nekoliko puta i nikada nismo uočili teoretski očekivanu vrijednost. Tada možemo sumnjati u autentičnost novčića. Možemo pretpostaviti da naš novčić zapravo nema 50% šanse da dođe do golova. U tom slučaju može biti potrebno procijeniti vjerojatnost tog događaja i, sukladno tome, vrijednost matematičkog očekivanja. Takva potreba javlja se kad god u eksperimentu istražujemo distribuciju kontinuirane slučajne varijable, kao što je vrijeme reakcije, a da unaprijed nemamo nikakav teorijski model. U pravilu je to prvi obavezni korak u tijeku kvantitativne obrade rezultata pokusa.

Matematičko očekivanje moguće je procijeniti na tri načina, koji u praksi mogu dati nešto drugačije rezultate, no u teoriji bi nas svakako trebali dovesti do vrijednosti matematičkog očekivanja.

Logika takve procjene ilustrirana je na sl. 1.2. Matematičko očekivanje može se smatrati središnjom tendencijom u distribuciji slučajne varijable X, kao najvjerojatnija i stoga najčešća njegova vrijednost i kao točka koja dijeli distribuciju na dva jednaka dijela.

Riža. 1.2.

Nastavimo naše zamišljene pokuse s novčićem i izvedimo tri pokusa s deseterostrukim bacanjem novčića. Pretpostavimo da je u prvom pokusu "orao" ispadao četiri puta, isto se dogodilo u drugom pokusu, u trećem pokusu "orao" je ispadao više od jedan i pol puta češće - sedam puta. Logično je pretpostaviti da se matematičko očekivanje događaja koji nas zanima zapravo nalazi negdje između ovih vrijednosti.

Prvi, protozoa metoda ocjenjivanja matematičko očekivanje sastojat će se u pronalaženju aritmetička sredina. Tada će procjena očekivane vrijednosti na temelju gornja tri mjerenja biti (4 + 4 + 7) / 3 = 5. Slično, u eksperimentima s vremenom reakcije, očekivana vrijednost može se procijeniti izračunavanjem aritmetičke sredine svih dobivenih vrijednosti. X. Pa ako smo potrošili P mjerenja vremena reakcije X, tada možemo upotrijebiti sljedeću formulu, koja nam to pokazuje za izračunavanje aritmetičke sredine x potrebno je zbrojiti sve empirijski dobivene vrijednosti i podijeliti ih s brojem opažanja:

U formuli (1.2) mjera matematičkog očekivanja obično se označava sa ̅ x (čita se kao "x s crtom"), iako se ponekad može označiti kao M (s engleskog. značiti - prosjek).

Aritmetička sredina je najčešće korištena procjena matematičkog očekivanja. U takvim slučajevima pretpostavlja se da se mjerenje slučajne varijable provodi u metrički mjerilo. Jasno je da se dobiveni rezultat može ali i ne mora podudarati s pravom vrijednošću matematičkog očekivanja, što nikad ne znamo. Važno je, međutim, da je ova metoda nepristran procjena matematičkog očekivanja. To znači da je očekivana vrijednost procijenjene vrijednosti jednaka njezinom matematičkom očekivanju: .

Drugi način vrednovanja Matematičko očekivanje je da se kao vrijednost varijable koja nas zanima uzme vrijednost koja se najčešće pojavljuje. Ova se vrijednost naziva moda distribucije. Na primjer, u upravo razmatranom slučaju s bacanjem novčića, "četiri" se može uzeti kao vrijednost matematičkog očekivanja, budući da se u tri provedena pokusa ova vrijednost pojavila dvaput; zato je način distribucije u ovom slučaju ispao jednak četiri. Procjena načina se koristi uglavnom kada eksperimentator radi s varijablama koje poprimaju diskretne vrijednosti dane u nemetrički mjerilo.

Na primjer, opisujući distribuciju studentskih ocjena na ispitu, može se konstruirati učestalost distribucije studentskih ocjena. Ova raspodjela frekvencija naziva se histogram. U ovom slučaju, najčešća procjena može se uzeti kao vrijednost središnjeg trenda (matematičko očekivanje). U proučavanju varijabli koje karakteriziraju kontinuirane vrijednosti, ova mjera se praktički ne koristi ili se rijetko koristi. Ako je distribucija učestalosti dobivenih rezultata ipak konstruirana, tada se, u pravilu, ne odnosi na vrijednosti proučavane osobine dobivene u eksperimentu, već na neke intervale njezine manifestacije. Na primjer, kada se ispituje visina ljudi, možete vidjeti koliko ljudi spada u interval do 150 cm visine, koliko ih spada u interval od 150 do 155 cm i tako dalje. U ovom slučaju, mod će biti povezan s intervalnim vrijednostima svojstva koje se proučava, u ovom slučaju, rastom.

Jasno je da se modus, kao i aritmetička sredina, može i ne mora podudarati sa stvarnom vrijednošću matematičkog očekivanja. Ali baš kao i aritmetička sredina, mod je nepristrana procjena matematičkog očekivanja.

Dodamo da ako se dvije vrijednosti u uzorku pojavljuju jednako često, tada se takva distribucija naziva bimodalni. Ako se tri ili više vrijednosti u uzorku pojavljuju jednako često, tada se za takav uzorak kaže da nema modus. Takvi slučajevi s dovoljno velikim brojem opažanja, u pravilu, ukazuju na to da su podaci izvađeni iz opće populacije, čija se priroda distribucije razlikuje od normalne.

Konačno, treći način vrednovanja Matematičko očekivanje je podijeliti uzorak ispitanika prema parametru koji nas zanima točno na pola. Vrijednost koja karakterizira ovu granicu naziva se medijan distribucija.

Pretpostavimo da smo prisutni na skijaškom natjecanju i nakon njihovog završetka želimo procijeniti koji je od sportaša pokazao rezultat iznad prosjeka, a koji - ispod. Ako je sastav sudionika više ili manje ujednačen, tada je pri ocjenjivanju prosječnog rezultata logično izračunati aritmetičku sredinu. Pretpostavimo, međutim, da među profesionalnim sudionicima ima nekoliko amatera. Nema ih mnogo, ali pokazuju rezultate koji su znatno inferiorniji od ostalih. U ovom slučaju može se pokazati da je od npr. 100 sudionika natjecanja nadprosječni rezultat pokazalo njih 87. Jasno je da nam takva ocjena prosječnog trenda ne može uvijek odgovarati. U ovom slučaju logično je pretpostaviti da su prosječan rezultat pokazali sudionici koji su zauzeli negdje 50. ili 51. mjesto. Ovo će biti medijan distribucije. Prije 50. finalista završilo je 49 sudionika, a nakon 51. njih 49. Naravno, može se ispostaviti da su završili s istim vremenom. Onda nema problema. Nema problema ni kada je broj promatranja neparan. U drugim slučajevima, međutim, možete koristiti prosjek rezultata dva sudionika.

Medijan je poseban slučaj kvantila distribucije. kvantil je dio distribucije. Formalno, može se definirati kao integralna vrijednost distribucije između dvije vrijednosti varijable x. Dakle, vrijednost x bit će medijan distribucije ako je integralna vrijednost distribucije (gustoća vjerojatnosti) od -∞ do x jednaka je integralnoj vrijednosti distribucije iz x do +∞. Slično, distribucija se može podijeliti na četiri, deset ili 100 dijelova. Takvi se kvantili respektivno nazivaju kvartili, decili i percentili. Postoje i druge vrste kvantila.

Kao i prethodne dvije metode za procjenu matematičkog očekivanja, medijan je nepristrana procjena matematičkog očekivanja.

Teoretski, pretpostavlja se da ako stvarno imamo posla s normalnom distribucijom slučajne varijable, onda bi sve tri procjene matematičkog očekivanja trebale dati isti rezultat, budući da sve predstavljaju varijantu nepristran procjene istog parametra distribucije procijenjene slučajne varijable (vidi sliku 1.2). U praksi je to, međutim, rijetko slučaj. To može biti posebno zbog činjenice da se analizirana distribucija razlikuje od normalne. No, glavni razlog za takva odstupanja, u pravilu, jest taj što se procjenom vrijednosti matematičkog očekivanja može dobiti vrijednost koja se vrlo značajno razlikuje od njegove prave vrijednosti. Međutim, kao što je gore navedeno, u matematičkoj statistici je dokazano da što se više neovisnih testova varijable koja se razmatra, to bi procijenjena vrijednost trebala biti bliža stvarnoj.

Stoga, u praksi, izbor metode za procjenu matematičkog očekivanja nije određen željom da se dobije točnija i pouzdanija procjena ovog parametra, već samo razmatranjima pogodnosti. Također, određenu ulogu u izboru metode za procjenu matematičkog očekivanja ima i mjerna skala koja odražava opažanja procijenjene slučajne varijable.

Neka slučajna varijabla s nepoznatim matematičkim očekivanjem i varijancom bude podvrgnuta neovisnim eksperimentima koji su dali rezultate - . Izračunajmo dosljedne i nepristrane procjene za parametre i .

Kao procjenu matematičkog očekivanja uzimamo aritmetičku sredinu eksperimentalnih vrijednosti

. (2.9.1)

Prema zakonu velikih brojeva, ova procjena je bogati , s veličinom u vjerojatnosti. Ista procjena je nepristran , jer

. (2.9.2)

Varijanca ove procjene je

. (2.9.3)

Može se pokazati da je za normalnu distribuciju ova procjena djelotvoran . Za druge zakone to možda nije slučaj.

Procijenimo sada varijancu. Prvo izaberimo formulu za procjenu statistička disperzija

. (2.9.4)

Provjerimo dosljednost procjene varijance. Otvorimo zagrade u formuli (2.9.4)

.

Za , prvi član konvergira u vjerojatnosti prema količini , u drugom - do . Dakle, naša procjena konvergira u vjerojatnosti prema varijanci

,

dakle ona je bogati .

Provjerimo nepristranost procjene za količinu . Da bismo to učinili, zamijenimo izraz (2.9.1) u formulu (2.9.4) i uzmemo u obzir da slučajne varijable nezavisna

,

. (2.9.5)

Prijeđimo u formuli (2.9.5) na fluktuacije slučajnih varijabli

Proširujući zagrade, dobivamo

,

. (2.9.6)

Izračunajmo matematičko očekivanje vrijednosti (2.9.6), uzimajući u obzir da

. (2.9.7)

Relacija (2.9.7) pokazuje da vrijednost izračunata formulom (2.9.4) nije nepristran procjenitelj za disperziju. Njegovo matematičko očekivanje nije jednako, već nešto manje. Takva procjena dovodi do sustavne pogreške prema dolje. Da bi se uklonila takva pristranost, potrebno je uvesti korekciju množenjem ne vrijednosti . Tada takva ispravljena statistička varijanca može poslužiti kao nepristrana procjena varijance

. (2.9.8)

Ova je procjena jednako dosljedna kao i procjena jer za .

U praksi, umjesto procjene (2.9.8), ponekad je prikladnije koristiti ekvivalentnu procjenu koja se odnosi na drugi početni statistički trenutak

. (2.9.9)

Procjene (2.9.8), (2.9.9) nisu učinkovite. Može se pokazati da će u slučaju normalne distribucije biti asimptotski učinkovit (kada će težiti minimalnoj mogućoj vrijednosti).

Stoga je moguće formulirati sljedeća pravila za obradu ograničenog statističkog materijala. Ako u neovisnim pokusima slučajna varijabla poprimi vrijednosti s nepoznatim matematičkim očekivanjem i varijancom, tada za određivanje ovih parametara treba koristiti približne procjene

(2.9.10)

Kraj posla -

Ova tema pripada:

Bilješke s predavanja iz matematike, teorije vjerojatnosti, matematičke statistike

Odsjek za višu matematiku i informatiku.. bilješke s predavanja.. iz matematike..

Ako trebate dodatne materijale o ovoj temi ili niste pronašli ono što ste tražili, preporučamo pretraživanje naše baze radova:

Što ćemo učiniti s primljenim materijalom:

Ako se ovaj materijal pokazao korisnim za vas, možete ga spremiti na svoju stranicu na društvenim mrežama:

Sve teme u ovom odjeljku:

Teorija vjerojatnosti
Teorija vjerojatnosti je grana matematike koja proučava obrasce slučajnih masovnih pojava. Slučajnost je fenomen koji

Statistička definicija vjerojatnosti
Događaj je slučajna pojava koja se, kao rezultat iskustva, može ili ne mora pojaviti (dvovrijedna pojava). Događaje označite velikim latiničnim slovima

Prostor elementarnih događaja
Neka skup događaja bude povezan s nekim iskustvom, i: 1) kao rezultat iskustva, jedan i samo jedan

Radnje na događajima
Zbroj dva događaja i

Permutacije
Označava se broj različitih permutacija elemenata

Smještaj
Postavljanje elemenata po

Kombinacije
Kombinacija elemenata

Formula za zbrajanje vjerojatnosti za nekompatibilne događaje
Teorema. Vjerojatnost zbroja dvaju nekompatibilnih događaja jednaka je zbroju vjerojatnosti tih događaja. (jedan

Formula zbrajanja vjerojatnosti za proizvoljne događaje
Teorema. Vjerojatnost zbroja dvaju događaja jednaka je zbroju vjerojatnosti tih događaja bez vjerojatnosti njihova umnoška.

Formula množenja vjerojatnosti
Neka su dana dva događaja. Razmotrite događaj

Formula ukupne vjerojatnosti
Neka je potpuna skupina nekompatibilnih događaja, nazivaju se hipoteze. Razmotrite neki događaj

Formula vjerojatnosti hipoteza (Bayes)
Razmotrimo ponovno - kompletnu skupinu nekompatibilnih hipoteza i događaj

Asimptotska Poissonova formula
U slučajevima kada je broj pokusa velik i vjerojatnost nastanka događaja

Slučajne diskretne varijable
Slučajna vrijednost je veličina koja pri ponavljanju pokusa može poprimiti nejednake brojčane vrijednosti. Slučajna varijabla se naziva diskretna,

Slučajne kontinuirane varijable
Ako kao rezultat eksperimenta slučajna varijabla može poprimiti bilo koju vrijednost s određenog segmenta ili cijele realne osi, tada se naziva kontinuiranom. zakon

Funkcija gustoće vjerojatnosti slučajne kontinuirane varijable
Neka. Razmotrite točku i povećajte je

Numeričke karakteristike slučajnih varijabli
Slučajne diskretne ili kontinuirane varijable smatraju se potpuno određenim ako su im poznati zakoni raspodjele. Doista, poznavajući zakone raspodjele, uvijek se može izračunati vjerojatnost pogotka

Kvantili slučajnih varijabli
Kvantil reda slučajne kontinuirane varijable

Matematičko očekivanje slučajnih varijabli
Matematičko očekivanje slučajne varijable karakterizira njezinu prosječnu vrijednost. Sve vrijednosti slučajne varijable grupirane su oko ove vrijednosti. Razmotrimo prvo slučajnu diskretnu varijablu

Standardna devijacija i varijanca slučajnih varijabli
Razmotrimo prvo slučajnu diskretnu varijablu. Numeričke karakteristike modusa, medijana, kvantila i matematičkog očekivanja

Momenti slučajnih varijabli
Osim matematičkog očekivanja i varijance, teorija vjerojatnosti koristi numeričke karakteristike viših redova, koje se nazivaju momenti slučajnih varijabli.

Teoremi o numeričkim karakteristikama slučajnih varijabli
Teorem 1. Matematičko očekivanje neslučajne varijable jednako je samoj ovoj vrijednosti. Dokaz: Neka

Binomni zakon distribucije

Poissonov zakon distribucije
Neka slučajna diskretna varijabla uzima vrijednosti

Uniformni zakon raspodjele
Uniformni zakon raspodjele slučajne kontinuirane varijable je zakon funkcije gustoće vjerojatnosti koji

Zakon normalne distribucije
Normalni zakon raspodjele slučajne kontinuirane varijable je zakon funkcije gustoće

Eksponencijalni zakon raspodjele
Eksponencijalna ili eksponencijalna distribucija slučajne varijable koristi se u takvim primjenama teorije vjerojatnosti kao što su teorija čekanja, teorija pouzdanosti

Sustavi slučajnih varijabli
U praksi, u primjenama teorije vjerojatnosti, često se moramo suočiti s problemima u kojima se rezultati eksperimenta ne opisuju jednom slučajnom varijablom, već nekoliko slučajnih varijabli odjednom.

Sustav dviju slučajnih diskretnih varijabli
Neka dvije slučajne diskretne varijable tvore sustav. Slučajna vrijednost

Sustav dviju slučajnih kontinuiranih varijabli
Sada neka sustav čine dvije slučajne kontinuirane varijable. Zakon raspodjele ovog sustava naziva se vjerojatno

Uvjetni zakoni raspodjele
Neka i ovisne slučajne kontinuirane varijable

Numeričke karakteristike sustava dviju slučajnih varijabli
Početni trenutak uređenosti sustava slučajnih varijabli

Sustav nekoliko slučajnih varijabli
Rezultati dobiveni za sustav dviju slučajnih varijabli mogu se generalizirati na slučaj sustava koji se sastoje od proizvoljnog broja slučajnih varijabli. Neka sustav tvori skup

Normalna distribucija sustava dviju slučajnih varijabli
Razmotrimo sustav dviju slučajnih kontinuiranih varijabli. Zakon distribucije ovog sustava je zakon normalne distribucije

Granični teoremi teorije vjerojatnosti
Glavni cilj discipline teorije vjerojatnosti je proučavanje obrazaca slučajnih masovnih pojava. Praksa pokazuje da promatranje mase homogenih slučajnih pojava otkriva

Čebiševljeva nejednakost
Razmotrite slučajnu varijablu s matematičkim očekivanjem

Čebiševljev teorem
Ako su slučajne varijable upareno neovisne i imaju konačne varijance ograničene u populaciji

Bernoullijev teorem
Neograničenim povećanjem broja eksperimenata učestalost pojavljivanja događaja konvergira u vjerojatnosti prema vjerojatnosti događaja

Centralni granični teorem
Kada se zbrajaju slučajne varijable s bilo kojim zakonima distribucije, ali s varijancama ograničenim u agregatu, zakon distribucije

Glavni zadaci matematičke statistike
Gore razmotreni zakoni teorije vjerojatnosti matematički su izraz stvarnih obrazaca koji stvarno postoje u različitim slučajnim masovnim fenomenima. studiranje

Jednostavna statistika. Funkcija statističke distribucije
Promotrimo neku slučajnu varijablu čiji je zakon raspodjele nepoznat. Potrebno na temelju iskustva

Statistička linija. Grafikon
S velikim brojem opažanja (reda stotine), opća populacija postaje nezgodna i glomazna za bilježenje statističkog materijala. Radi preglednosti i kompaktnosti, statistički materijal

Numeričke karakteristike statističke distribucije
U teoriji vjerojatnosti razmatrane su različite numeričke karakteristike slučajnih varijabli: matematičko očekivanje, disperzija, početni i središnji momenti različitih redova. Slični brojevi

Izbor teorijske raspodjele metodom momenata
U svakoj statističkoj distribuciji neizbježno postoje elementi slučajnosti povezani s ograničenim brojem opažanja. S velikim brojem promatranja, ovi elementi slučajnosti su izglađeni,

Provjera vjerodostojnosti hipoteze o obliku zakona raspodjele
Neka je zadana statistička distribucija aproksimirana nekom teoretskom krivuljom ili

Kriteriji pristanka
Razmotrite jedan od najčešće korištenih testova prilagodbe, takozvani Pearsonov test. pretpostaviti

Točkaste procjene za nepoznate parametre distribucije
U p.p. 2.1. - 2.7 detaljno smo razmotrili načine rješavanja prvog i drugog glavnog problema matematičke statistike. To su zadaci određivanja zakona raspodjele slučajnih varijabli prema eksperimentalnim podacima

Interval pouzdanosti. Vjerojatnost povjerenja
U praksi, s malim brojem eksperimenata na slučajnoj varijabli, aproksimativna zamjena nepoznatog parametra

Neka slučajni uzorak generira promatrana slučajna varijabla ξ, matematičko očekivanje i varijanca koji su nepoznati. Kao procjene za ove karakteristike, predloženo je korištenje srednje vrijednosti uzorka

i varijanca uzorka

. (3.14)

Razmotrimo neka svojstva procjena matematičkog očekivanja i varijance.

1. Izračunajte matematičko očekivanje uzorka:

Stoga je srednja vrijednost uzorka nepristran procjenitelj za .

2. Podsjetimo da su rezultati opažanja su neovisne slučajne varijable, od kojih svaka ima isti zakon raspodjele kao vrijednost , što znači da , , . Pretpostavit ćemo da je varijanca konačna. Tada, prema Čebiševljevom teoremu o zakonu velikih brojeva, za svaki ε > 0 vrijedi jednakost ,

što se može napisati ovako: . (3.16) Uspoređujući (3.16) s definicijom svojstva konzistentnosti (3.11), vidimo da je procjena konzistentna procjena očekivanja.

3. Pronađite varijancu uzorka srednje vrijednosti:

. (3.17)

Stoga se varijanca procjene očekivanja smanjuje obrnuto s veličinom uzorka.

Može se dokazati da ako je slučajna varijabla ξ normalno raspodijeljena, tada je sredina uzorka učinkovita procjena očekivane vrijednosti, tj. varijanca poprima najmanju vrijednost u usporedbi s bilo kojom drugom procjenom očekivane vrijednosti. Za druge zakone raspodjele ξ to možda nije slučaj.

Varijanca uzorka je pristrana procjena varijance, jer . (3.18)

Doista, koristeći svojstva matematičkog očekivanja i formule (3.17), nalazimo

.

Da bi se dobila nepristrana procjena varijance, procjena (3.14) mora se korigirati, odnosno pomnožiti s . Tada dobivamo varijancu nepristranog uzorka

. (3.19)

Napominjemo da se formule (3.14) i (3.19) razlikuju samo u nazivniku, a za velike vrijednosti uzorak i nepristrane varijance malo se razlikuju. Međutim, za malu veličinu uzorka treba koristiti relaciju (3.19).

Za procjenu standardne devijacije slučajne varijable koristi se takozvana "korigirana" standardna devijacija, koja je jednaka kvadratnom korijenu nepristrane varijance: .

Intervalne procjene

U statistici postoje dva pristupa procjeni nepoznatih parametara distribucija: točkasti i intervalni. U skladu s procjenom točke, o kojoj je bilo riječi u prethodnom odjeljku, naznačena je samo točka blizu koje se procijenjeni parametar nalazi. Međutim, poželjno je znati koliko ovaj parametar zapravo može stajati od moguće implementacije procjena u različitim serijama promatranja.

Odgovor na ovo pitanje - također približan - daje drugi način procjene parametara - interval. U skladu s ovom metodom procjene nalazi se interval koji s vjerojatnošću bliskom jedinici pokriva nepoznatu numeričku vrijednost parametra.

Pojam intervalne estimacije

Procjena bodova je slučajna varijabla i za moguće implementacije uzorka uzima vrijednosti samo približno jednake stvarnoj vrijednosti parametra. Što je razlika manja, to je procjena točnija. Dakle, pozitivan broj za koji , karakterizira točnost procjene i naziva se pogreška procjene (ili marginalna pogreška).

Vjerojatnost povjerenja(ili pouzdanost) naziva se vjerojatnost β , s kojim je nejednakost , tj.

. (3.20)

Zamjena nejednakosti njegova ekvivalentna dvostruka nejednakost , ili , dobivamo

Interval covering s vjerojatnošću β , , nepoznati parametar , se poziva interval pouzdanosti (ili procjena intervala), koji odgovara razini povjerenja β .

Slučajna varijabla nije samo procjena, već i pogreška: njezina vrijednost ovisi o vjerojatnosti β i to u pravilu iz uzorka. Stoga je interval pouzdanosti slučajan i izraz (3.21) treba čitati na sljedeći način: „Interval će pokriti parametar s vjerojatnošću β “, a ne ovako: „Parametar će s vjerojatnošću pasti u interval β ”.

Značenje intervala pouzdanosti je da uz opetovano ponavljanje volumena uzorka u relativnom udjelu slučajeva jednak β , interval pouzdanosti koji odgovara razini pouzdanosti β , pokriva pravu vrijednost procijenjenog parametra. Dakle, razina povjerenja β karakterizira pouzdanost procjena povjerenja: što više β , veća je vjerojatnost da implementacija intervala pouzdanosti sadrži nepoznati parametar.

KATEGORIJE

POPULARNI ČLANCI

2022 "kingad.ru" - ultrazvučni pregled ljudskih organa