Uniformna slučajna distribucija. Pretvaranje jednoliko raspodijeljene slučajne varijable u normalno raspodijeljenu

Kao primjer kontinuirane slučajne varijable, razmotrite slučajnu varijablu X ravnomjerno raspoređenu u intervalu (a; b). Kažemo da je slučajna varijabla X ravnomjerno raspoređeno na intervalu (a; b), ako njegova gustoća raspodjele nije konstantna na tom intervalu:

Iz uvjeta normalizacije odredimo vrijednost konstante c . Površina ispod krivulje gustoće raspodjele trebala bi biti jednaka jedinici, ali u našem slučaju to je površina pravokutnika s bazom (b - α) i visinom c (slika 1).

Riža. 1 Uniformna gustoća distribucije
Odavde nalazimo vrijednost konstante c:

Dakle, gustoća jednoliko raspodijeljene slučajne varijable jednaka je

Nađimo sada funkciju raspodjele po formuli:
1) za
2) za
3) za 0+1+0=1.
Na ovaj način,

Funkcija raspodjele je kontinuirana i ne opada (slika 2).

Riža. 2 Funkcija distribucije jednoliko raspodijeljene slučajne varijable

Nađimo matematičko očekivanje jednoliko raspodijeljene slučajne varijable prema formuli:

Uniformna distribucijska varijanca izračunava se formulom i jednaka je

Primjer #1. Vrijednost podjeljka mjernog instrumenta je 0,2 . Očitanja instrumenta zaokružuju se na najbliži cijeli podjeli. Odredite vjerojatnost da će se tijekom očitanja napraviti pogreška: a) manja od 0,04; b) velika 0,02
Riješenje. Pogreška zaokruživanja je slučajna varijabla jednoliko raspoređena u intervalu između susjednih cjelobrojnih podjela. Razmotrimo interval (0; 0,2) kao takvu podjelu (slika a). Zaokruživanje se može izvesti i prema lijevoj granici - 0, i prema desnoj - 0,2, što znači da se dva puta može napraviti pogreška manja ili jednaka 0,04, što se mora uzeti u obzir pri izračunavanju vjerojatnosti:



P = 0,2 + 0,2 = 0,4

Za drugi slučaj, vrijednost pogreške također može premašiti 0,02 na obje granice podjele, odnosno može biti veća od 0,02 ili manja od 0,18.


Tada je vjerojatnost greške poput ove:

Primjer #2. Pretpostavlja se da se o stabilnosti ekonomske situacije u zemlji (odsutnost ratova, prirodnih katastrofa itd.) u posljednjih 50 godina može suditi prema prirodi raspodjele stanovništva prema dobi: u mirnoj situaciji, trebalo bi biti uniforma. Kao rezultat istraživanja dobiveni su sljedeći podaci za jednu od zemalja.

Ima li razloga vjerovati da je u zemlji vladala nestabilna situacija?

Odluku donosimo pomoću kalkulatora Testiranje hipoteza. Tablica za izračunavanje pokazatelja.

grupeSredina intervala, x iKoličina, fix i * f iKumulativna frekvencija, S|x - x cf |*f(x - x sr) 2 *fFrekvencija, f i /n
0 - 10 5 0.14 0.7 0.14 5.32 202.16 0.14
10 - 20 15 0.09 1.35 0.23 2.52 70.56 0.09
20 - 30 25 0.1 2.5 0.33 1.8 32.4 0.1
30 - 40 35 0.08 2.8 0.41 0.64 5.12 0.08
40 - 50 45 0.16 7.2 0.57 0.32 0.64 0.16
50 - 60 55 0.13 7.15 0.7 1.56 18.72 0.13
60 - 70 65 0.12 7.8 0.82 2.64 58.08 0.12
70 - 80 75 0.18 13.5 1 5.76 184.32 0.18
1 43 20.56 572 1
Mjerni podaci distribucijskog centra.
prosječne težine


Indikatori varijacije.
Apsolutne stope varijacije.
Raspon varijacije je razlika između maksimalne i minimalne vrijednosti atributa primarne serije.
R = X max - X min
R=70 - 0=70
Disperzija- karakterizira mjeru širenja oko svoje srednje vrijednosti (mjeru disperzije, tj. odstupanja od srednje vrijednosti).


Standardna devijacija.

Svaka vrijednost niza ne razlikuje se od prosječne vrijednosti 43 za najviše 23,92
Testiranje hipoteza o vrsti distribucije.
4. Testiranje hipoteze o jednolika raspodjela općoj populaciji.
Kako bi se testirala hipoteza o ravnomjernoj distribuciji X, tj. prema zakonu: f(x) = 1/(b-a) u intervalu (a,b)
potrebno:
1. Procijenite parametre a i b - krajeve intervala u kojem su promatrane moguće vrijednosti X, prema formulama (znak * označava procjene parametara):

2. Odredite gustoću vjerojatnosti procijenjene distribucije f(x) = 1/(b * - a *)
3. Pronađite teorijske frekvencije:
n 1 \u003d nP 1 \u003d n \u003d n * 1 / (b * - a *) * (x 1 - a *)
n 2 \u003d n 3 \u003d ... \u003d n s-1 \u003d n * 1 / (b * - a *) * (x i - x i-1)
n s = n*1/(b * - a *)*(b * - x s-1)
4. Usporedite empirijske i teorijske frekvencije pomoću Pearsonovog testa, uz pretpostavku broja stupnjeva slobode k = s-3, gdje je s broj početnih intervala uzorkovanja; ako je pak napravljena kombinacija malih frekvencija, a time i samih intervala, tada je s broj intervala preostalih nakon kombinacije.

Riješenje:
1. Pronađite procjene parametara a * i b * uniformne distribucije pomoću formula:


2. Odredite gustoću pretpostavljene jednolike raspodjele:
f(x) = 1/(b * - a *) = 1/(84,42 - 1,58) = 0,0121
3. Pronađite teorijske frekvencije:
n 1 \u003d n * f (x) (x 1 - a *) \u003d 1 * 0,0121 (10-1,58) \u003d 0,1
n 8 \u003d n * f (x) (b * - x 7) \u003d 1 * 0,0121 (84,42-70) \u003d 0,17
Preostali n s bit će jednaki:
n s = n*f(x)(x i - x i-1)

jan in*in i - n * i(n i - n* i) 2(n i - n * i) 2 /n * i
1 0.14 0.1 0.0383 0.00147 0.0144
2 0.09 0.12 -0.0307 0.000943 0.00781
3 0.1 0.12 -0.0207 0.000429 0.00355
4 0.08 0.12 -0.0407 0.00166 0.0137
5 0.16 0.12 0.0393 0.00154 0.0128
6 0.13 0.12 0.0093 8.6E-5 0.000716
7 0.12 0.12 -0.000701 0 4.0E-6
8 0.18 0.17 0.00589 3.5E-5 0.000199
Ukupno 1 0.0532
Definirajmo granicu kritičnog područja. Budući da Pearsonova statistika mjeri razliku između empirijske i teorijske distribucije, što je veća opažena vrijednost K obs, to je jači argument protiv glavne hipoteze.
Stoga je kritično područje za ovu statistiku uvijek desno: ako je njegova gustoća vjerojatnosti konstantna na ovom segmentu, a izvan njega je 0 (tj. slučajna varijabla x fokusiran na segment [ a, b], na kojoj ima konstantnu gustoću). Prema ovoj definiciji, gustoća jednoliko raspoređena na segmentu [ a, b] nasumična varijabla x izgleda kao:

gdje S postoji neki broj. Međutim, lako ga je pronaći korištenjem svojstva gustoće vjerojatnosti za r.v. koncentriranu na interval [ a, b]:
. Otuda slijedi da
, gdje
. Stoga je gustoća ravnomjerno raspoređena na segmentu [ a, b] nasumična varijabla x izgleda kao:

.

Za prosudbu ravnomjernosti raspodjele n.s.v. x moguće iz sljedećeg razmatranja. Kontinuirana slučajna varijabla ima jednoliku raspodjelu na intervalu [ a, b] ako uzima vrijednosti samo iz ovog segmenta, a bilo koji broj iz ovog segmenta nema prednost pred ostalim brojevima ovog segmenta u smislu da može biti vrijednost ove slučajne varijable.

Slučajne varijable s ravnomjernom raspodjelom uključuju varijable kao što su vrijeme čekanja prijevoza na zaustavljanju (pri konstantnom intervalu kretanja, vrijeme čekanja je ravnomjerno raspoređeno u tom intervalu), pogreška zaokruživanja broja na cijeli broj (ravnomjerno raspoređeno). na [−0.5 , 0.5 ]) i drugi.

Vrsta distribucijske funkcije F(x) a, b] nasumična varijabla x traži se poznatom gustoćom vjerojatnosti f(x) pomoću formule njihove veze
. Kao rezultat odgovarajućih izračuna dobivamo sljedeću formulu za funkciju distribucije F(x) ravnomjerno raspoređen segment [ a, b] nasumična varijabla x :

.

Slike prikazuju grafove gustoće vjerojatnosti f(x) i distribucijske funkcije f(x) ravnomjerno raspoređen segment [ a, b] nasumična varijabla x :


Matematičko očekivanje, varijanca, standardna devijacija, mod i medijan ravnomjerno raspodijeljenog segmenta [ a, b] nasumična varijabla x izračunato iz gustoće vjerojatnosti f(x) na uobičajeni način (i jednostavno zbog jednostavnog izgleda f(x) ). Rezultat su sljedeće formule:

ali moda d(x) je bilo koji broj intervala [ a, b].

Nađimo vjerojatnost pogađanja ravnomjerno raspoređenog segmenta [ a, b] nasumična varijabla x u intervalu
, potpuno leži unutra [ a, b]. Uzimajući u obzir poznati oblik funkcije distribucije, dobivamo:

Dakle, vjerojatnost pogađanja ravnomjerno raspoređenog segmenta [ a, b] nasumična varijabla x u intervalu
, potpuno leži unutra [ a, b], ne ovisi o položaju tog intervala, već ovisi samo o njegovoj duljini i upravno je proporcionalan ovoj duljini.

Primjer. Interval autobusa je 10 minuta. Kolika je vjerojatnost da će putnik koji dolazi na autobusnu stanicu čekati autobus manje od 3 minute? Koliko je prosječno vrijeme čekanja autobusa?

Normalna distribucija

Ova se raspodjela najčešće susreće u praksi i ima iznimnu ulogu u teoriji vjerojatnosti i matematičkoj statistici te njihovim primjenama, budući da takvu raspodjelu ima toliko mnogo slučajnih varijabli u prirodnim znanostima, ekonomiji, psihologiji, sociologiji, vojnim znanostima itd. Ova raspodjela je ograničavajući zakon, kojem se (pod određenim prirodnim uvjetima) približavaju mnogi drugi zakoni raspodjele. Uz pomoć normalnog zakona raspodjele opisuju se i pojave koje su podložne djelovanju mnogih neovisnih slučajnih čimbenika bilo koje prirode i bilo kojeg zakona njihove raspodjele. Prijeđimo na definicije.

Kontinuirana slučajna varijabla naziva se raspodijeljena normalni zakon (ili Gaussov zakon), ako njegova gustoća vjerojatnosti ima oblik:

,

gdje su brojke a i σ (σ>0 ) su parametri ove distribucije.

Kao što je već spomenuto, Gaussov zakon raspodjele slučajnih varijabli ima brojne primjene. Prema tom zakonu raspoređuju se pogreške mjerenja instrumenata, odstupanje od centra mete tijekom gađanja, dimenzije izrađenih dijelova, težina i visina ljudi, godišnja količina oborina, broj novorođenčadi i još mnogo toga.

Gornja formula za gustoću vjerojatnosti normalno distribuirane slučajne varijable sadrži, kao što je rečeno, dva parametra a i σ , te stoga definira obitelj funkcija koje variraju ovisno o vrijednostima ovih parametara. Ako primijenimo uobičajene metode matematičke analize proučavanja funkcija i crtanja na gustoću vjerojatnosti normalne distribucije, možemo izvući sljedeće zaključke.


su njegove točke infleksije.

Na temelju dobivenih informacija gradimo graf gustoće vjerojatnosti f(x) normalna raspodjela (naziva se Gaussova krivulja – slika).

Otkrijmo kako promjena parametara utječe a i σ o obliku Gaussove krivulje. Očito je (to se vidi iz formule za gustoću normalne distribucije) da promjena parametra a ne mijenja oblik krivulje, već samo dovodi do njenog pomaka udesno ili ulijevo duž osi x. Ovisnost σ teže. Iz gornje studije može se vidjeti kako vrijednost maksimuma i koordinate točaka infleksije ovise o parametru σ . Osim toga, treba uzeti u obzir da za bilo koje parametre a i σ površina ispod Gaussove krivulje ostaje jednaka 1 (ovo je opće svojstvo gustoće vjerojatnosti). Iz rečenog proizlazi da s povećanjem parametra σ krivulja postaje ravnija i rasteže se duž osi x. Slika prikazuje Gaussove krivulje za različite vrijednosti parametra σ (σ 1 < σ< σ 2 ) i istu vrijednost parametra a.

Saznati vjerojatnosno značenje parametara a i σ normalna distribucija. Već iz simetrije Gaussove krivulje u odnosu na okomitu liniju koja prolazi kroz broj a na osovini x jasno je da prosječna vrijednost (tj. matematičko očekivanje M(X)) normalno distribuirane slučajne varijable jednako je a. Iz istih razloga moda i medijan također moraju biti jednaki broju a. Točni izračuni prema odgovarajućim formulama to potvrđuju. Ako napišemo gornji izraz za f(x) zamjena u formuli za varijancu
, tada nakon (prilično teškog) izračuna integrala, u odgovoru dobivamo broj σ 2 . Dakle, za slučajnu varijablu x raspodijeljene prema normalnom zakonu, dobivene su sljedeće glavne numeričke karakteristike:

Stoga je vjerojatnosno značenje parametara normalne razdiobe a i σ Sljedeći. Ako je r.v. xa i σ a σ.

Nađimo sada funkciju distribucije F(x) za slučajnu varijablu x, raspodijeljen prema normalnom zakonu, koristeći gornji izraz za gustoću vjerojatnosti f(x) i formula
. Prilikom zamjene f(x) dobivamo "nepreuzet" integral. Sve što se može učiniti da se pojednostavi izraz za F(x), ovo je prikaz ove funkcije u obliku:

,

gdje F(x)- takozvani Laplaceova funkcija, što izgleda

.

Integral kojim se izražava Laplaceova funkcija također se ne uzima (ali za svaki x ovaj se integral može približno izračunati s bilo kojom unaprijed određenom točnošću). Međutim, nije ga potrebno izračunati, jer na kraju bilo kojeg udžbenika teorije vjerojatnosti postoji tablica za određivanje vrijednosti funkcije F(x) na zadanu vrijednost x. U nastavku će nam trebati svojstvo neobičnosti Laplaceove funkcije: F(−x)=F(x) za sve brojeve x.

Nađimo sada vjerojatnost da normalno raspodijeljena r.v. xće uzeti vrijednost iz zadanog numeričkog intervala (α, β) . Iz općih svojstava funkcije raspodjele R(α< x< β)= F(β) F(α) . Zamjena α i β u gornji izraz za F(x) , dobivamo

.

Kao što je gore navedeno, ako je r.v. x normalno distribuiran s parametrima a i σ , tada je njegova srednja vrijednost jednaka a, a standardna devijacija je jednaka σ. Zato prosjek odstupanje vrijednosti ove r.v. kada se testira iz broja a jednaki σ. Ali ovo je prosječno odstupanje. Stoga su moguća i veća odstupanja. Otkrivamo koliko su moguća ova ili ona odstupanja od prosječne vrijednosti. Nađimo vjerojatnost da je vrijednost slučajne varijable raspodijeljena prema normalnom zakonu x odstupiti od svoje srednje vrijednosti M(X)=a manji od nekog broja δ, tj. R(| xa|<δ ) : . Na ovaj način,

.

Zamjena u ovu jednakost δ=3σ, dobivamo vjerojatnost da vrijednost r.v. x(u jednom pokusu) odstupat će od srednje vrijednosti manje od tri puta σ (s prosječnim odstupanjem, kao što se sjećamo, jednakim σ ): (što znači F(3) preuzeto iz tablice vrijednosti Laplaceove funkcije). Skoro je 1 ! Tada je vjerojatnost suprotnog događaja (da vrijednost odstupa najmanje ) jednako je 1 0.997=0.003 , što je vrlo blizu 0 . Stoga je ovaj događaj "gotovo nemoguć" događa se vrlo rijetko (u prosjeku 3 istek vremena 1000 ). Ovo razmišljanje je obrazloženje za dobro poznato "pravilo tri sigme".

Pravilo tri sigme. Normalno distribuirana slučajna varijabla u jednom testu praktički ne odstupa od svog prosjeka dalje od .

Još jednom naglašavamo da je riječ o jednom testu. Ako postoji mnogo pokušaja slučajne varijable, tada je sasvim moguće da će se neke od njezinih vrijednosti kretati dalje od prosjeka od . Ovo potvrđuje sljedeće

Primjer. Kolika je vjerojatnost da nakon 100 pokušaja normalno raspodijeljene slučajne varijable x barem jedna njegova vrijednost će odstupati od srednje vrijednosti više od tri puta standardne devijacije? Što je s 1000 suđenja?

Riješenje. Neka događaj ALI znači da pri testiranju slučajne varijable x njegova vrijednost je odstupila od srednje vrijednosti za više od 3σ. Kako se upravo saznalo, vjerojatnost ovog događaja p=P(A)=0,003. Provedeno je 100 takvih testova. Moramo pronaći vjerojatnost da događaj ALI dogodilo se barem puta, tj. došao iz 1 prije 100 jednom. Ovo je tipičan problem Bernoullijeve sheme s parametrima n=100 (broj nezavisnih ispitivanja), p=0,003(vjerojatnost događaja ALI u jednom testu) q=1− str=0.997 . Htio pronaći R 100 (1≤ k≤100) . U ovom slučaju, naravno, lakše je prvo pronaći vjerojatnost suprotnog događaja R 100 (0) − vjerojatnost da događaj ALI nikada se nije dogodilo (tj. dogodilo se 0 puta). Uzimajući u obzir povezanost vjerojatnosti samog događaja i njegove suprotnosti, dobivamo:

Ne tako malo. Može se dogoditi (prosječno se događa u svakoj četvrtoj takvoj seriji testova). Na 1000 ispitivanja prema istoj shemi, može se dobiti da je vjerojatnost barem jednog odstupanja veća od , jednako je: . Stoga je sigurno čekati barem jedno takvo odstupanje.

Primjer. Visina muškaraca određene dobne skupine normalno je raspoređena s matematičkim očekivanjem a, i standardna devijacija σ . Koji omjer kostima k-th rast treba uključiti u ukupnu proizvodnju za određenu dobnu skupinu ako k-th rast određen je sljedećim granicama:

1 rast : 158 164 cm 2 rast : 164 - 170 cm 3 rast : 170 - 176 cm 4 rast : 176 - 182 cm

Riješenje. Riješimo problem sa sljedećim vrijednostima parametara: a=178,σ=6,k=3 . Neka r.v. x visina nasumično odabranog čovjeka (raspoređuje se prema stanju normalno sa zadanim parametrima). Nađite vjerojatnost koja će biti potrebna nasumično odabranom čovjeku 3 th rast. Korištenje neobičnosti Laplaceove funkcije F(x) i tablicu njegovih vrijednosti: P(170 Stoga je u ukupnom obujmu proizvodnje potrebno predvidjeti 0.2789*100%=27.89% kostimi 3 th rast.

Distribucija vjerojatnosti kontinuirane slučajne varijable x, koji uzima sve vrijednosti iz intervala , Zove se uniforma, ako je njegova gustoća vjerojatnosti na ovom segmentu konstantna, a izvan njega jednaka nuli. Dakle, gustoća vjerojatnosti kontinuirane slučajne varijable x, ravnomjerno raspoređen na segmentu , izgleda kao:

Idemo definirati očekivana vrijednost, disperzija a za slučajnu varijablu s ravnomjernom raspodjelom.

, , .

Primjer. Sve vrijednosti jednoliko raspoređene slučajne varijable leže na segmentu . Odredite vjerojatnost da slučajna varijabla padne u interval (3;5) .

a=2, b=8, .

Binomna distribucija

Neka se proizvodi n testovi i vjerojatnost pojavljivanja događaja A u svakom testu je str i ne ovisi o ishodu drugih pokusa (nezavisni pokusi). Budući da je vjerojatnost događanja događaja A u jednom testu je str, tada je vjerojatnost njegovog nepojavljivanja jednaka q=1-p.

Neka događaj A ušao n suđenja m jednom. Ovaj složeni događaj može se napisati kao proizvod:

.

Tada je vjerojatnost da n ispitni događaj A doći će m puta , izračunava se formulom:

ili (1)

Formula (1) se zove Bernoullijeva formula.

Neka x je slučajna varijabla jednaka broju pojavljivanja događaja A u n testovi, koji uzimaju vrijednosti s vjerojatnostima:

Rezultirajući zakon raspodjele slučajne varijable naziva se binomni zakon distribucije.

x m n
P

Očekivana vrijednost, disperzija i standardna devijacija slučajne varijable raspoređene prema binomnom zakonu određene su formulama:

, , .

Primjer. U metu se ispaljuju tri hica, a vjerojatnost pogotka svakog hica je 0,8. Smatramo slučajnu varijablu x- broj pogodaka u metu. Nađite njegov zakon distribucije, matematičko očekivanje, varijancu i standardnu ​​devijaciju.

p=0,8, q=0,2, n=3, , , .

- vjerojatnost 0 pogodaka;



Vjerojatnost jednog pogotka;

Vjerojatnost dva pogotka;

je vjerojatnost tri pogotka.

Dobivamo zakon raspodjele:

x
P 0,008 0,096 0,384 0,512

Zadaci

1. Novčić se baca 7 puta. Odredite vjerojatnost da će pasti naglavce 4 puta.

2. Novčić se baca 8 puta. Nađite vjerojatnost da se grb ne pojavi više od tri puta.

3. Vjerojatnost pogotka mete pucanjem iz puške p=0,6. Nađite matematičko očekivanje ukupnog broja pogodaka ako je ispaljeno 10 hitaca.

4. Nađite matematičko očekivanje broja srećki koje će dobiti ako se kupi 20 srećki, a vjerojatnost dobitka za jednu srećku je 0,3.

Funkcija distribucije u ovom slučaju, prema (5.7), će imati oblik:

gdje je: m matematičko očekivanje, s standardna devijacija.

Normalna distribucija se također naziva Gaussovom po njemačkom matematičaru Gaussu. Činjenica da slučajna varijabla ima normalnu distribuciju s parametrima: m,, označava se na sljedeći način: N (m, s), gdje je: m =a =M ;

Često se u formulama matematičko očekivanje označava sa a . Ako je slučajna varijabla raspodijeljena prema zakonu N(0,1), tada se naziva normalizirana ili standardizirana normalna vrijednost. Funkcija distribucije za njega ima oblik:

.

Graf gustoće normalne distribucije, koji se naziva normalna krivulja ili Gaussova krivulja, prikazan je na sl. 5.4.

Riža. 5.4. Normalna gustoća distribucije

Na primjeru je razmotreno određivanje numeričkih karakteristika slučajne varijable njezinom gustoćom.

Primjer 6.

Kontinuirana slučajna varijabla dana je gustoćom distribucije: .

Odrediti tip distribucije, pronaći matematičko očekivanje M(X) i varijancu D(X).

Uspoređujući zadanu gustoću raspodjele s (5.16), možemo zaključiti da je dan normalni zakon raspodjele s m =4. Dakle, matematičko očekivanje M(X)=4, varijanca D(X)=9.

Standardna devijacija s=3.

Laplaceova funkcija koja ima oblik:

,

povezana je s normalnom funkcijom distribucije (5.17), relacijom:

F 0 (x) \u003d F (x) + 0,5.

Laplaceova funkcija je neparna.

F(-x)=-F(x).

Vrijednosti Laplaceove funkcije F(h) prikazane su u tabeli i preuzete iz tablice prema vrijednosti x (vidi Dodatak 1).

Normalna distribucija kontinuirane slučajne varijable igra važnu ulogu u teoriji vjerojatnosti iu opisu stvarnosti, vrlo je raširena u slučajnim prirodnim pojavama. U praksi vrlo često postoje slučajne varijable koje nastaju upravo kao rezultat zbrajanja mnogih slučajnih članova. Konkretno, analiza mjernih pogrešaka pokazuje da su one zbroj različitih vrsta pogrešaka. Praksa pokazuje da je distribucija vjerojatnosti pogrešaka mjerenja bliska normalnom zakonu.

Pomoću Laplaceove funkcije mogu se riješiti problemi izračunavanja vjerojatnosti upadanja u zadani interval i zadano odstupanje normalne slučajne varijable.

Ova se problematika odavno detaljno proučava, a najviše je korištena metoda polarnih koordinata koju su predložili George Box, Mervyn Muller i George Marsaglia 1958. godine. Ova metoda vam omogućuje da dobijete par neovisnih normalno raspodijeljenih slučajnih varijabli sa srednjom vrijednosti 0 i varijancom 1 kako slijedi:

Gdje su Z 0 i Z 1 željene vrijednosti, s \u003d u 2 + v 2, a u i v su slučajne varijable jednoliko raspoređene na segmentu (-1, 1), odabrane na takav način da je zadovoljen uvjet 0< s < 1.
Mnogi koriste ove formule bez razmišljanja, a mnogi čak i ne sumnjaju u njihovo postojanje, jer koriste gotove implementacije. Ali postoje ljudi koji imaju pitanja: “Odakle je došla ova formula? I zašto dobivate par vrijednosti odjednom? U nastavku ću pokušati dati jasan odgovor na ova pitanja.


Za početak da vas podsjetim što su gustoća vjerojatnosti, funkcija distribucije slučajne varijable i inverzna funkcija. Pretpostavimo da postoji neka slučajna varijabla čija je distribucija dana funkcijom gustoće f(x) koja ima sljedeći oblik:

To znači da je vjerojatnost da će vrijednost ove slučajne varijable biti u intervalu (A, B) jednaka površini osjenčanog područja. I kao posljedica toga, površina cijelog osjenčanog područja trebala bi biti jednaka jedinici, jer će u svakom slučaju vrijednost slučajne varijable pasti u domenu funkcije f.
Funkcija distribucije slučajne varijable je integral funkcije gustoće. I u ovom slučaju, njegov približni oblik bit će sljedeći:

Ovdje je značenje da će vrijednost slučajne varijable biti manja od A s vjerojatnošću B. I kao rezultat toga, funkcija se nikada ne smanjuje, a njezine vrijednosti leže u intervalu .

Inverzna funkcija je funkcija koja vraća argument izvorne funkcije ako joj proslijedite vrijednost izvorne funkcije. Na primjer, za funkciju x 2 inverz će biti funkcija izvlačenja korijena, za sin (x) to je arcsin (x), itd.

Budući da većina generatora pseudoslučajnih brojeva daje samo jednoliku distribuciju na izlazu, često postaje potrebno pretvoriti ga u neki drugi. U ovom slučaju, normalnom Gaussovu:

Osnova svih metoda pretvaranja uniformne distribucije u bilo koju drugu distribuciju je metoda inverzne transformacije. Radi na sljedeći način. Pronađena je funkcija koja je inverzna funkciji tražene distribucije i proslijeđena joj je slučajna varijabla jednoliko raspoređena na segmentu (0, 1) kao argument. Na izlazu dobivamo vrijednost sa traženom distribucijom. Radi jasnoće, evo sljedeće slike.

Dakle, uniformni segment je, takoreći, razmazan u skladu s novom distribucijom, projicirajući se na drugu os kroz inverznu funkciju. No problem je u tome što integral gustoće Gaussove distribucije nije lako izračunati, pa su navedeni znanstvenici morali varati.

Postoji hi-kvadrat distribucija (Pearsonova distribucija), koja je distribucija zbroja kvadrata k nezavisnih normalnih slučajnih varijabli. A u slučaju kada je k = 2, ova raspodjela je eksponencijalna.

To znači da ako točka u pravokutnom koordinatnom sustavu ima nasumične X i Y koordinate raspoređene normalno, tada nakon pretvorbe tih koordinata u polarni sustav (r, θ), kvadrat polumjera (udaljenost od ishodišta do točke) raspodijelit će se eksponencijalno, jer je kvadrat polumjera zbroj kvadrata koordinata (prema Pitagorinom zakonu). Gustoća distribucije takvih točaka na ravnini izgledat će ovako:


Budući da je jednak u svim smjerovima, kut θ će imati jednoliku raspodjelu u rasponu od 0 do 2π. Vrijedi i obrnuto: ako specificirate točku u polarnom koordinatnom sustavu pomoću dvije neovisne slučajne varijable (kut raspoređen jednoliko i radijus raspoređen eksponencijalno), tada će pravokutne koordinate te točke biti neovisne normalne slučajne varijable. A eksponencijalnu distribuciju iz uniformne distribucije već je mnogo lakše dobiti, koristeći istu metodu inverzne transformacije. Ovo je bit Box-Mullerove polarne metode.
Sada uzmimo formule.

(1)

Da bi se dobili r i θ, potrebno je generirati dvije slučajne varijable jednoliko raspoređene na segmentu (0, 1) (nazovimo ih u i v), od kojih se distribucija jedne (recimo v) mora pretvoriti u eksponencijalnu u dobiti radijus. Funkcija eksponencijalne distribucije izgleda ovako:

Njegova inverzna funkcija:

Budući da je uniformna distribucija simetrična, transformacija će raditi na sličan način s funkcijom

Iz formule hi-kvadrat distribucije proizlazi da je λ = 0,5. Zamijenimo λ, v u ovu funkciju i dobijemo kvadrat polumjera, a zatim i sam polumjer:

Kut dobivamo rastezanjem jediničnog segmenta na 2π:

Sada zamijenimo r i θ u formule (1) i dobijemo:

(2)

Ove formule su spremne za upotrebu. X i Y će biti neovisni i normalno raspodijeljeni s varijancom od 1 i sredinom od 0. Da biste dobili distribuciju s drugim karakteristikama, dovoljno je pomnožiti rezultat funkcije sa standardnom devijacijom i dodati srednju vrijednost.
Ali moguće je riješiti se trigonometrijskih funkcija navođenjem kuta ne izravno, već neizravno kroz pravokutne koordinate slučajne točke u krugu. Zatim će pomoću tih koordinata biti moguće izračunati duljinu radijus vektora, a zatim pronaći kosinus i sinus dijeljenjem x odnosno y s njima. Kako i zašto radi?
Odaberemo slučajnu točku između ravnomjerno raspoređenih u krugu jediničnog polumjera i označimo kvadrat duljine radijus vektora te točke slovom s:

Izbor se vrši dodjeljivanjem slučajnih x i y pravokutnih koordinata jednoliko raspoređenih u intervalu (-1, 1), a odbacivanjem točaka koje ne pripadaju kružnici, kao i središnje točke u kojoj je kut radijus vektora nije definirano. Odnosno uvjet 0< s < 1. Тогда, как и в случае с Гауссовским распределением на плоскости, угол θ будет распределен равномерно. Это очевидно - количество точек в каждом направлении одинаково, значит каждый угол равновероятен. Но есть и менее очевидный факт - s тоже будет иметь равномерное распределение. Полученные s и θ будут независимы друг от друга. Поэтому мы можем воспользоваться значением s для получения экспоненциального распределения, не генерируя третью случайную величину. Подставим теперь s в формулы (2) вместо v, а вместо тригонометрических функций - их расчет делением координаты на длину радиус-вектора, которая в данном случае является корнем из s:

Dobivamo formule, kao na početku članka. Nedostatak ove metode je odbacivanje točaka koje nisu uključene u krug. To jest, koristeći samo 78,5% generiranih slučajnih varijabli. Na starijim računalima je nedostatak trigonometrijskih funkcija još uvijek bio velika prednost. Sada, kada jedna instrukcija procesora istovremeno izračunava sinus i kosinus u trenu, mislim da se ove metode još mogu natjecati.

Osobno imam još dva pitanja:

  • Zašto je vrijednost s ravnomjerno raspoređena?
  • Zašto je zbroj kvadrata dviju normalnih slučajnih varijabli eksponencijalno raspoređen?
Budući da je s kvadrat radijusa (radi jednostavnosti, radijus je duljina radijus vektora koji određuje položaj slučajne točke), prvo saznajemo kako su radijusi raspoređeni. Budući da je kružnica jednoliko ispunjena, očito je da je broj točaka polumjera r proporcionalan opsegu kružnice polumjera r. Opseg kruga proporcionalan je polumjeru. To znači da se gustoća raspodjele radijusa jednoliko povećava od središta kruga prema njegovim rubovima. A funkcija gustoće ima oblik f(x) = 2x na intervalu (0, 1). Koeficijent 2 tako da je površina figure ispod grafikona jednaka jedinici. Kada se takva gustoća kvadrira, postaje jednolika. Budući da je teoretski, u ovom slučaju, za to potrebno podijeliti funkciju gustoće s derivatom funkcije transformacije (odnosno, od x 2). I vizualno se događa ovako:

Ako se slična transformacija napravi za normalnu slučajnu varijablu, tada će se funkcija gustoće njenog kvadrata pokazati sličnom hiperboli. A zbrajanje dvaju kvadrata normalnih slučajnih varijabli već je mnogo složeniji proces povezan s dvostrukom integracijom. A to što će rezultat biti eksponencijalna distribucija, meni osobno preostaje provjeriti praktičnom metodom ili prihvatiti kao aksiom. A za one koji su zainteresirani, predlažem da se bliže upoznaju s temom, crpeći znanje iz ovih knjiga:

  • Wentzel E.S. Teorija vjerojatnosti
  • Knut D.E. Umjetnost programiranja, svezak 2

U zaključku ću dati primjer implementacije normalno distribuiranog generatora slučajnih brojeva u JavaScriptu:

Function Gauss() ( var ready = false; var second = 0.0; this.next = function(mean, dev) ( mean = mean == undefined ? 0.0: mean; dev = dev == undefined ? 1.0: dev; if ( this.ready) ( this.ready = false; return this.second * dev + mean; ) else ( var u, v, s; do ( u = 2.0 * Math.random() - 1.0; v = 2.0 * Math. random() - 1,0; s = u * u + v * v; ) while (s > 1,0 || s == 0,0); var r = Math.sqrt(-2,0 * Math.log(s) / s); this.second = r * u; this.ready = true; return r * v * dev + mean; ) ); ) g = new Gauss(); // kreiraj objekt a = g.next(); // generiraj par vrijednosti i dobij prvu b = g.next(); // dobijemo drugi c = g.next(); // ponovno generirajte par vrijednosti i uzmite prvu
Parametri srednja vrijednost (matematičko očekivanje) i dev (standardna devijacija) nisu obavezni. Skrećem vam pozornost na činjenicu da je logaritam prirodan.

KATEGORIJE

POPULARNI ČLANCI

2022 "kingad.ru" - ultrazvučni pregled ljudskih organa