O explicație simplă a teoremei lui Bayes. Formula probabilității totale

La derivarea formulei probabilității totale, s-a presupus că evenimentul DAR, a cărei probabilitate urma să fie determinată, s-ar putea întâmpla cu unul dintre evenimente H 1 , N 2 , ... , H n, formând un grup complet de evenimente incompatibile în perechi. Probabilitățile acestor evenimente (ipoteze) erau cunoscute dinainte. Să presupunem că a fost efectuat un experiment, în urma căruia evenimentul DAR a venit. Aceste informații suplimentare ne permit să reevaluăm probabilitățile ipotezelor Bună , având calculat P(Hi/A).

sau, folosind formula probabilității totale, obținem

Această formulă se numește formula Bayes sau teorema ipotezei. Formula Bayes vă permite să „revizuiți” probabilitățile ipotezelor după ce rezultatul experimentului devine cunoscut, în urma căruia a apărut evenimentul DAR.

Probabilități Р(Н i) sunt probabilitățile a priori ale ipotezelor (au fost calculate înainte de experiment). Probabilitățile P(H i /A) sunt probabilitățile a posteriori ale ipotezelor (se calculează după experiment). Formula Bayes vă permite să calculați probabilitățile posterioare din probabilitățile lor anterioare și din probabilitățile condiționate ale evenimentului DAR.

Exemplu. Se știe că 5% din toți bărbații și 0,25% dintre toate femeile sunt daltonici. O persoană aleasă aleatoriu după numărul cardului medical suferă de daltonism. Care este probabilitatea ca acesta să fie bărbat?

Soluţie. Eveniment DAR Persoana este daltonică. Spațiul evenimentelor elementare pentru experiment - o persoană este selectată după numărul cardului medical - Ω = ( H 1 , N 2 ) constă din 2 evenimente:

H 1 - este selectat un bărbat,

H 2 - este selectată o femeie.

Aceste evenimente pot fi alese ca ipoteze.

În funcție de starea problemei (alegere aleatorie), probabilitățile acestor evenimente sunt aceleași și egale cu P(H 1 ) = 0.5; P(H 2 ) = 0.5.

În acest caz, probabilitățile condiționate ca o persoană să sufere de daltonism sunt egale, respectiv:

TIGAIE 1 ) = 0.05 = 1/20; TIGAIE 2 ) = 0.0025 = 1/400.

Deoarece se știe că persoana selectată este daltonică, adică evenimentul a avut loc, folosim formula Bayes pentru a reevalua prima ipoteză:

Exemplu. Sunt trei cutii identice. Prima cutie conține 20 de bile albe, a doua cutie conține 10 bile albe și 10 negre, iar a treia cutie conține 20 de bile negre. Dintr-o cutie aleasa la intamplare se extrage o bila alba. Calculați probabilitatea ca mingea să fie extrasă din prima casetă.

Soluţie. Notează prin DAR eveniment - apariția unei mingi albe. Se pot face trei ipoteze (ipoteze) cu privire la alegerea casetei: H 1 ,H 2 , H 3 - selectarea primei, a doua și, respectiv, a treia casetă.

Deoarece alegerea oricăreia dintre casete este la fel de posibilă, probabilitățile ipotezelor sunt aceleași:

P(H 1 )=P(H 2 )=P(H 3 )= 1/3.

În funcție de starea problemei, probabilitatea de a extrage o minge albă din prima casetă

Probabilitatea de a extrage o minge albă din a doua casetă



Probabilitatea de a extrage o minge albă din a treia casetă

Găsim probabilitatea dorită folosind formula Bayes:

Repetarea testelor. formula Bernoulli.

Există n încercări, în fiecare dintre ele evenimentul A poate să apară sau nu, iar probabilitatea evenimentului A în fiecare încercare individuală este constantă, de exemplu. nu se schimba de la experienta la experienta. Știm deja cum să găsim probabilitatea unui eveniment A într-un experiment.

De interes deosebit este probabilitatea de apariție a unui anumit număr de ori (m ori) a evenimentului A în n experimente. astfel de probleme sunt ușor de rezolvat dacă testele sunt independente.

Def. Sunt numite mai multe teste independent față de evenimentul A dacă probabilitatea evenimentului A în fiecare dintre ele nu depinde de rezultatele altor experimente.

Probabilitatea P n (m) de apariție a evenimentului A exact de m ori (neapariția a n-m ori, eveniment ) în aceste n încercări. Evenimentul A apare într-o varietate de secvențe de m ori).

- Formula lui Bernoulli.

Următoarele formule sunt evidente:

P n (m Mai puțin k ori în n încercări.

P n (m>k) = P n (k+1) + P n (k+2) +…+ P n (n) - probabilitatea de apariție a evenimentului A Mai mult k ori în n încercări.

Să începem cu un exemplu. În urna din fața ta la fel de probabil pot fi (1) două bile albe, (2) una albă și una neagră, (3) două negre. Tragi mingea și se dovedește a fi albă. Cum apreciați acum? probabilitate aceste trei opțiuni (ipoteze)? Evident, probabilitatea ipotezei (3) cu două bile negre = 0. Dar cum se calculează probabilitățile celor două ipoteze rămase!? Acest lucru vă permite să faceți formula Bayes, care în cazul nostru are forma (numărul formulei corespunde numărului ipotezei testate):

Descărcați nota în format sau

X este o variabilă aleatoare (ipoteză) care ia următoarele valori: x 1- doi albi x 2- unul alb, unul negru; x 3- doua negre; la este o variabilă aleatoare (eveniment) care ia următoarele valori: 1- se extrage o bila alba si la 2- se extrage o bila neagra; P(x 1) este probabilitatea primei ipoteze înainte ca mingea să fie extrasă ( a priori probabilitate sau probabilitate inainte de experiență) = 1/3; P(x 2)– probabilitatea celei de-a doua ipoteze înainte de extragerea mingii = 1/3; P(x 3)– probabilitatea celei de-a treia ipoteze înainte de a scoate mingea = 1/3; P(y 1|x 1)– probabilitatea condiționată de a extrage o minge albă dacă prima ipoteză este adevărată (bilele sunt albe) = 1; P(y 1|x 2) probabilitatea de a extrage o minge albă, dacă a doua ipoteză este adevărată (o minge este albă, a doua este neagră) = ½; P(y 1|x 3) probabilitatea de a extrage o minge albă, dacă a treia ipoteză este adevărată (ambele negre) = 0; P(y 1)– probabilitatea extragerii unei bile albe = ½; P(y 2)– probabilitatea de a extrage o minge neagră = ½; și în sfârșit ceea ce căutăm - P(x 1|la 1) probabilitatea ca prima ipoteză să fie adevărată (ambele bile sunt albe), cu condiția să extragem o bilă albă ( a posteriori probabilitate sau probabilitate după experienţă); P(x 2|la 1) probabilitatea ca a doua ipoteză să fie adevărată (o bilă este albă, a doua este neagră), cu condiția să scoatem o bilă albă.

Probabilitatea ca prima ipoteză (două bile albe) să fie adevărată, având în vedere că am tras o bilă albă:

Probabilitatea ca a doua ipoteză să fie adevărată (una este albă, a doua este neagră), cu condiția să scoatem o bilă albă:

Probabilitatea ca a treia ipoteză (două negre) să fie adevărată, având în vedere că am desenat o minge albă:

Ce face formula Bayes? Face posibilă, pe baza probabilităților a priori de ipoteze - P(x 1), P(x 2), P(x 3)– și probabilitățile de apariție a evenimentelor – P(y 1), P(y 2)– calculați probabilitățile posterioare ale ipotezelor, de exemplu, probabilitatea primei ipoteze, cu condiția ca o minge albă să fie extrasă – P(x 1|la 1).

Să revenim la formula (1). Probabilitatea inițială a primei ipoteze a fost P(x 1) = 1/3. Cu probabilitate P(y 1) = 1/2 am putea trage o minge albă, și cu probabilitate P(y 2) = 1/2- negru. L-am scos pe cel alb. Probabilitatea de a desena alb, cu condiția ca prima ipoteză să fie adevărată P(y 1|x 1) = 1. Formula lui Bayes spune că, din moment ce albul este scos, probabilitatea primei ipoteze a crescut la 2/3, probabilitatea celei de-a doua ipoteze este încă 1/3, iar probabilitatea celei de-a treia ipoteze a devenit zero.

Este ușor de verificat că, dacă tragem o bilă neagră, probabilitățile posterioare s-ar schimba simetric: P(x 1|y 2) = 0, P(x 2|y 2) = 1/3, P(x 3|y 2) = 2/3.

Iată ce a scris Pierre Simon Laplace despre formula Bayes într-o lucrare publicată în 1814:

Acesta este principiul de bază al ramului analizei întâmplării care se ocupă de tranzițiile de la evenimente la cauze.

De ce este atât de greu de înțeles formula lui Bayes!? După părerea mea, pentru că abordarea noastră obișnuită este raționamentul de la cauze la efecte. De exemplu, dacă într-o urnă există 36 de bile, dintre care 6 sunt negre, iar restul sunt albe. Care este probabilitatea de a extrage o minge albă? Formula lui Bayes vă permite să treceți de la evenimente la cauze (ipoteze). Dacă am avut trei ipoteze și a avut loc un eveniment, atunci cum anume a afectat acest eveniment (și nu alternativa) probabilitățile inițiale ale ipotezelor? Cum s-au schimbat aceste probabilități?

Cred că formula lui Bayes nu este doar despre probabilități. Schimbă paradigma percepției. Care este trenul de gândire atunci când se folosește paradigma deterministă? Dacă are loc un eveniment, care este cauza lui? Dacă a fost un accident, o urgență, un conflict militar. Cine sau ce a fost vina lor? Cum crede un observator bayesian? Care este structura realității la care a condus dat caz la cutare sau cutare manifestare... Bayesian intelege ca in in caz contrar rezultatul poate fi diferit...

Să plasăm simbolurile în formulele (1) și (2) puțin diferit:

Să vorbim din nou despre ceea ce vedem. Cu o probabilitate inițială (a priori) egală, una dintre cele trei ipoteze ar putea fi adevărată. Cu aceeași probabilitate, am putea trage o bilă albă sau neagră. L-am scos pe cel alb. În lumina acestor noi informații suplimentare, evaluarea noastră a ipotezelor ar trebui revizuită. Formula lui Bayes vă permite să faceți acest lucru numeric. Probabilitatea a priori a primei ipoteze (formula 7) a fost P(x 1), se trage o bila alba, probabilitatea posterioara a primei ipoteze devine P(x 1|la 1). Aceste probabilități diferă printr-un factor.

Eveniment 1 numită dovezi care confirmă sau infirmă mai mult sau mai puțin o ipoteză x 1. Acest raport este uneori denumit puterea dovezilor. Cu cât dovezile sunt mai puternice (cu cât coeficientul diferă mai mult de unitate), cu atât este mai mare faptul de observare 1 modifică probabilitatea anterioară, cu atât probabilitatea posterioară diferă de cea anterioară. Dacă dovezile sunt slabe (coeficient ~ 1), posteriorul este aproape egal cu precedentul.

Certificat 1în = 2 ori a schimbat probabilitatea anterioară a ipotezei x 1(formula 4). În același timp, dovezi 1 nu a modificat probabilitatea ipotezei x 2, din moment ce puterea sa = 1 (formula 5).

În general, formula Bayes are următoarea formă:

X este o variabilă aleatoare (un set de ipoteze care se exclud reciproc) care ia valorile: x 1, x 2, … , Xn. la este o variabilă aleatorie (un set de evenimente care se exclud reciproc) care ia următoarele valori: 1, la 2, … , lan. Formula lui Bayes vă permite să găsiți probabilitatea posterioară a unei ipoteze Xi atunci când are loc un eveniment y j. Numătorul este produsul probabilității a priori a ipotezei XiP(xi) probabilitatea producerii unui eveniment y j dacă ipoteza este adevărată XiR(y j|xi). La numitor - suma produselor la același ca și la numărător, dar pentru toate ipotezele. Dacă calculăm numitorul, obținem probabilitatea totală a producerii evenimentului laj(dacă oricare dintre ipoteze este adevărată) - R(y j) (ca în formulele 1–3).

Încă o dată despre dovezi. Eveniment y j oferă informații suplimentare care vă permit să revizuiți probabilitatea anterioară a ipotezei Xi. Puterea probei - - contine in numarator probabilitatea producerii evenimentului y j dacă ipoteza este adevărată Xi. Numitorul este probabilitatea totală a producerii evenimentului laj(sau probabilitatea ca un eveniment să se producă laj media pentru toate ipotezele). laj mai sus pentru ipoteză Xi decât media pentru toate ipotezele, atunci dovezile joacă în mâinile ipotezei Xi, crescându-i probabilitatea posterioară R(y j|xi). Dacă probabilitatea producerii unui eveniment laj mai jos pentru ipoteză Xi decât media pentru toate ipotezele, atunci dovezile scade probabilitatea posterioară R(y j|xi) pentru ipoteze Xi. Dacă probabilitatea producerii unui eveniment laj pentru ipoteză Xi este aceeași cu media pentru toate ipotezele, atunci dovezile nu modifică probabilitatea posterioară R(y j|xi) pentru ipoteze Xi.

Iată câteva exemple care sper că vă vor consolida înțelegerea formulei Bayes.

Problema 2. Doi trăgători trag în mod independent în aceeași țintă, fiecare trăgând o lovitură. Probabilitatea de a lovi ținta pentru primul trăgător este de 0,8, pentru al doilea - 0,4. După împușcare, a fost găsită o gaură în țintă. Găsiți probabilitatea ca această gaură să aparțină primului trăgător. .

Sarcina 3. Obiectul monitorizat poate fi în una din două stări: H 1 = (funcționează) și H 2 = (nu funcționează). Probabilități a priori ale acestor stări Р(Н 1) = 0,7, Р(Н 2) = 0,3. Există două surse de informații care oferă informații contradictorii despre starea unui obiect; prima sursă raportează că obiectul nu funcționează, a doua - că funcționează. Se știe că prima sursă oferă informații corecte cu o probabilitate de 0,9, iar cu o probabilitate de 0,1 - eronată. A doua sursă este mai puțin de încredere: oferă informații corecte cu o probabilitate de 0,7 și cu o probabilitate de 0,3 - eronată. Aflați probabilitățile posterioare ale ipotezelor. .

Sarcinile 1–3 sunt preluate din manualul lui E.S. Ventzel, L.A. Ovcharov. Teoria probabilității și aplicațiile sale de inginerie, secțiunea 2.6 Teorema ipotezei (formula Bayes).

Problema 4 este preluată din carte, secțiunea 4.3 Teorema lui Bayes.

TEHNOLOGIA INFORMAȚIEI, INFORMATICĂ ȘI MANAGEMENT

Despre aplicabilitatea formulei Bayes

DOI 10.12737/16076

A. I. Dolgov**

1Societate pe acțiuni „Biroul de proiectare pentru monitorizarea radio a sistemelor de control, navigație și comunicații”, Rostov-pe-Don, Federația Rusă

Despre aplicabilitatea formulei Bayes*** A. I. Dolgov1**

1 „Biroul de proiectare pentru monitorizarea sistemelor de control, navigație și comunicații” SA, Rostov-pe-Don, Federația Rusă

Subiectul acestui studiu este formula Bayes. Scopul acestei lucrări este de a analiza și extinde domeniul de aplicare al formulei. Sarcina principală este studierea publicațiilor dedicate acestei probleme, ceea ce a făcut posibilă identificarea deficiențelor aplicării formulei Bayes, conducând la rezultate incorecte. Următoarea sarcină este de a construi modificări ale formulei Bayes care să ia în considerare diferite dovezi individuale și să obțină rezultate corecte. Și, în sfârșit, pe exemplul unor date inițiale specifice, se compară rezultatele incorecte obținute folosind formula Bayes și rezultatele corecte calculate folosind modificările propuse. În studiu au fost utilizate două metode. În primul rând, a fost efectuată analiza principiilor de construire a expresiilor cunoscute utilizate pentru a scrie formula Bayes și a modificărilor acesteia. În al doilea rând, a fost efectuată o evaluare comparativă a rezultatelor (inclusiv una cantitativă). Modificările propuse oferă o aplicare mai largă a formulei Bayes în teorie și practică, inclusiv în rezolvarea problemelor aplicate.

Cuvinte cheie: probabilități condiționate, ipoteze incompatibile, dovezi compatibile și incompatibile, normalizare.

Formula Bayes" este subiectul cercetării. Obiectivul muncii este de a analiza aplicarea formulei și de a lărgi domeniul de aplicabilitate a acesteia. Problema de primă prioritate include identificarea dezavantajelor formulei Bayes pe baza studiului publicațiilor relevante care conduc la incorecte rezultate. Următoarea sarcină este de a construi modificările formulei Bayes" pentru a oferi o contabilitate a diferitelor indicații unice pentru a obține rezultate corecte. Și, în final, rezultatele incorecte obținute prin aplicarea formulei Bayes" sunt comparate cu rezultatele corecte calculate cu utilizarea modificări de formulă propuse prin exemplul datelor inițiale specifice. În studii sunt utilizate două metode. În primul rând, se efectuează analiza principiilor de construire a expresiilor cunoscute utilizate pentru a înregistra formula bayesiană și modificările acesteia. În al doilea rând, se realizează o evaluare comparativă a rezultatelor (inclusiv cea cantitativă). Modificările propuse oferă o aplicare mai largă a formulei Bayes atât în ​​teorie, cât și în practică, inclusiv în soluționarea problemelor aplicate.

Cuvinte cheie: probabilități condiționate, ipoteze inconsistente, indicații compatibile și incompatibile, normalizare.

Introducere. Formula Bayes este din ce în ce mai folosită în teorie și practică, inclusiv în rezolvarea problemelor aplicate cu ajutorul tehnologiei computerului. Utilizarea procedurilor de calcul independente reciproc face ca această formulă să fie deosebit de eficientă la rezolvarea problemelor pe sisteme de calcul multiprocesor, deoarece în acest caz implementarea paralelă se realizează la nivelul schemei generale și la adăugarea următorului algoritm sau clasa de probleme. , nu este nevoie să efectuați din nou lucrările de paralelizare.

Subiectul acestui studiu este aplicabilitatea formulei Bayes pentru estimarea comparativă a probabilităților condiționale posterioare ale ipotezelor inconsistente sub diferite dovezi unice. După cum arată analiza, în astfel de cazuri, probabilitățile normalizate de evenimente combinate incompatibile aparținând

S X<и ч и

ESTE eö ȘI ESTE X X<и H

„Lucrarea a fost realizată ca parte a unui proiect de cercetare de inițiativă.

** E-mail: [email protected]

„Cercetarea se face în cadrul cercetării și dezvoltării independente.

pentru diferite grupuri complete de evenimente . În același timp, rezultatele comparate se dovedesc a fi inadecvate cu datele statistice reale. Acest lucru se datorează următorilor factori:

Se folosește normalizarea incorectă;

Nu se ia în considerare prezența sau absența intersecțiilor probelor avute în vedere.

Pentru a elimina neajunsurile identificate, sunt identificate cazuri de aplicabilitate a formulei Bayes. Dacă formula specificată nu este aplicabilă, se rezolvă problema construcției modificării acesteia, ceea ce asigură luarea în considerare a diferitelor dovezi unice la obținerea rezultatelor corecte. Pe exemplul datelor inițiale specifice, a fost efectuată o evaluare comparativă a rezultatelor:

Incorect - obtinut folosind formula Bayes;

Corect - calculat folosind modificarea propusă.

Poziții de start. Următoarele afirmații se bazează pe principiul păstrării rapoartelor de probabilitate: „Prelucrarea corectă a probabilităților de evenimente este fezabilă numai atunci când se normalizează folosind un divizor de normalizare comun care asigură egalitatea raporturilor dintre probabilitățile normalizate și rapoartele normalizate corespunzătoare. probabilități” . Acest principiu reprezintă baza subiectivă a teoriei probabilităților, dar nu este reflectat corespunzător în literatura educațională și științifică și tehnică modernă.

Dacă acest principiu este încălcat, informațiile despre gradul de posibilitate a evenimentelor luate în considerare sunt distorsionate. Rezultatele obținute pe baza informațiilor distorsionate și deciziile luate se dovedesc a fi inadecvate datelor statistice reale.

Următoarele concepte vor fi folosite în acest articol:

Un eveniment elementar este un eveniment care nu este divizibil în elemente;

Eveniment combinat - un eveniment reprezentând una sau alta combinație de evenimente elementare;

Evenimente compatibile - evenimente care în unele cazuri de evaluare comparativă a probabilităților lor pot fi incompatibile, iar în alte cazuri comune;

Evenimentele incompatibile sunt evenimente care sunt incompatibile în toate cazurile.

Conform teoremei înmulțirii probabilităților, probabilitatea P (U ^ E) a produsului evenimentelor elementare U ^ și

E se calculează ca produs de probabilități P(Uk E) = P(E)P(U^E) . În acest sens, formula Bayes este adesea

se scrie sub forma Р(Ик\Е) = - - - , descriind definiția probabilităților condiționate a posteriori

P(U^E) al ipotezelor Uk (k = 1,...n) bazate pe normalizarea probabilităților a priori P(U^E) a evenimentelor incompatibile combinate I la E luate în considerare. Fiecare dintre aceste evenimente reprezintă o produs ai cărui factori sunt una dintre ipotezele luate în considerare și o dovadă responsabilă. În același timp, totul este luat în considerare

Evenimentele uIKE (k = 1,...n) formează un grup complet de evenimente combinate incompatibile cu uIKE, datorită

cu care probabilitățile lor P(Ik E) ar trebui normalizate ținând cont de formula probabilității totale, conform căreia

roi P(E) = 2 P(Uk)P(E\Uk). Prin urmare, formula Bayes este cel mai adesea scrisă în forma cea mai frecvent utilizată:

P(Uik) P(EIK)

P(Uk \ E) \u003d -. (unu)

^ cation al formulei Bayes.

a Analiza caracteristicilor construcției formulei Bayes, care vizează rezolvarea problemelor aplicate, precum și exemple

„iar aplicarea sa practică ne permite să tragem o concluzie importantă cu privire la alegerea unui grup complet de evenimente combinate comparate din punct de vedere al gradului de posibilitate (fiecare dintre acestea fiind produsul a două evenimente elementare - una dintre ipoteze și dovezile luate). în considerare). O astfel de alegere este făcută subiectiv de către decident, pe baza unor date inițiale obiective inerente condițiilor tipice ale situației: tipurile și numărul de ipoteze evaluate și dovezile luate în considerare în mod specific.

Probabilități incomparabile de ipoteze cu o singură dovadă inconsistentă. Formula Bayes este folosită în mod tradițional în cazul determinării probabilităților condiționale posterioare care nu sunt comparabile în ceea ce privește gradul de posibilitate.

probabilitatea ipotezelor H^ cu o singură dovadă incompatibilă, fiecare dintre acestea putând „apari

numai în combinaţie cu oricare dintre aceste ipoteze. În acest caz, grupurile complete și HkE sunt selectate, combinate

evenimente de baie sub formă de produse, ai căror factori sunt unul dintre dovezile c. (1=1,...,m) și unul

dintre cele n ipoteze luate în considerare.

Formula Bayes este utilizată pentru o evaluare comparativă a probabilităților de evenimente combinate ale fiecărui astfel de grup complet, care diferă de alte grupuri complete nu numai prin dovezile e luate în considerare, ci și în cazul general în tipurile de ipoteze H ^ și (sau) numărul lor n (a se vedea, de exemplu, )

RNky = P(Hk) P(eH)

% P(Hk) P(Er\Hk) k = 1

Într-un caz special pentru n = 2

RNk\E,~ P(Hk) P(EN)

% P(Hk) P(E,\H k) k = 1

iar rezultatele obtinute sunt corecte, datorita respectarii principiului conservarii rapoartelor de probabilitate:

P(H1E,) _ P(H 1)P(E,\H1) / P(H2) P(E,\H2) = P(H 1) P(E,\H1)

P(H2 = % PW1!)

Subiectivitatea alegerii unui grup complet de evenimente combinate în comparație în ceea ce privește gradul de posibilitate (cu

anumite evenimente elementare variabile) vă permite să selectaţi un grup complet de evenimente şi Hk E ■ s

prin anularea evenimentului elementar E ■ () și scrieți formula Bayes (1 = 1,.. ., m) după cum urmează:

P(Hk \ E) -= - RNSh ±.

% P(Hk)P(E, Hk)

O astfel de formulă este de asemenea aplicabilă și face posibilă obținerea rezultatelor corecte dacă se calculează

probabilitățile normalizate sunt comparate sub diferitele ipoteze luate în considerare, dar nu sub diferite

Autoritățile. ¡^

Probabilități comparabile de ipoteze în baza unei singure dovezi inconsistente. Judecând după cunoscuta publica-^

este utilizat pentru o evaluare comparativă a probabilităților condiționale a posteriori ale ipotezelor pentru diferite dovezi individuale.

Autoritățile. În același timp, nu se acordă atenție următorului fapt. În aceste cazuri, se compară probabilitățile ^ normalizate de evenimente combinate incompatibile (incompatibile) aparținând diferitelor grupuri complete n de evenimente. Cu toate acestea, în acest caz, formula Bayes nu este aplicabilă, deoarece evenimentele combinate care nu sunt incluse într-un grup complet sunt comparate, a căror normalizare a probabilităților se realizează folosind diferiți n divizori de normalizare. Probabilitățile normalizate ale evenimentelor combinate incompatibile (incompatibile) pot fi comparate numai dacă aparțin aceluiași grup complet de evenimente și sunt normalizate cu ¡3 folosind un divizor comun egal cu suma probabilităților tuturor evenimentelor normalizate incluse în § complet.

În general, următoarele pot fi considerate dovezi incompatibile:

Două dovezi (de exemplu, dovezile și negarea acesteia); ^

Trei dovezi (de exemplu, într-o situație de joc, câștig, pierde și egal); ^

Patru mărturii (în special în sport, câștig, pierdere, remiză și reluare), etc. ^

Luați în considerare un exemplu destul de simplu (corespunzător exemplului dat în ) de aplicare a formulei Bayes ^ pentru a determina probabilitățile condiționale posterioare ale ipotezei H ^ pentru două evenimente incompatibile din

sub formă de probe L]- și negarea acesteia L]

P(H, k) - ^. ^ P(A^k" , (2)

] E P(Hk> P(A]\vk> k - 1

■ _ P(HkA ]) P(Hk> P(A ]\nk>

P(H,\A,) ----k-]-. (3)

V k\A]> P(A > n

] E P(Hk) P(A]\Hk) k -1

În cazurile (2) și (3), grupuri complete selectate subiectiv comparate în ceea ce privește gradul de posibilitate de com-

evenimentele grupate sunt, respectiv, seturile și H la A și și H la A. Acesta este cazul când formula

k-1 k ] k-1 k ]

Bayes este inaplicabil, deoarece principiul păstrării raporturilor probabilităților este încălcat - nu se respectă egalitatea rapoartelor probabilităților normalizate cu rapoartele probabilităților normalizate corespunzătoare:

P(H la A]] P(Hk) P(A]\Hk) / P(Hk) P(A]\Hk) P(Hk) P(A] Hk)

P(Hk E P(Hk) P(A]\Hk)/ E P(Hk) P(A]\Hk) P(Hk) P(A] Hk)

k - 1 /k - 1 Conform principiului conservării rapoartelor de probabilitate, procesarea corectă a probabilităților de evenimente este fezabilă numai atunci când se normalizează folosind un divizor de normalizare comun egal cu suma tuturor expresiilor normalizate comparate. De aceea

E P(Hk)P(A]\Hk) + E P(Hk)P(A]\Hk) - E P(Hk)[P(A]\Hk) + P(Hk) P(A]\Hk )] - EP (Hk) - 1. la -1 la -1 la -1 la -1

Astfel, se dezvăluie faptul că există varietăți ale formulei Bayes care diferă de

cunoscut pentru lipsa unui divizor de normalizare:

A,) - P(H) P(A]\Hk), P(Hk A,) - P(H) P(A, Hk). (patru)

J la I ■> la

În acest caz, se observă egalitatea rapoartelor probabilităților normalizate cu rapoartele probabilităților normalizate corespunzătoare:

m^A^ P(Hk) P(A]\Hk)

A,) P(H k) P(A, Hk)

Pe baza alegerii subiective a grupurilor complete neînregistrate în mod tradițional de evenimente combinate incompatibile, este posibil să se mărească numărul de modificări ale formulei Bayes care includ dovezi, precum și unul sau altul număr de negări ale acestora. De exemplu, cel mai complet grup de evenimente combinate

u și Hk /"./ ^ u și Hk E\ corespunde (ținând cont de absența unui divizor normalizator) formulei de modificare; =1 A"=1; \u003d 1 Bayesian

P(Hk\~) - P(Hk) ПЁ^^^

unde un eveniment elementar sub forma probei E \ e II II / "/ este unul dintre elementele multimii indicate

o În absența negărilor de probe, adică atunci când E\ \u003d // e și /"./,

^ P(H\E) P(Hk) P(E,\Hk)

E P(Hk) P(E \ Hk) k - 1

Astfel, modificarea formulei Bayes, menită să determine probabilitățile condiționate ale ipotezelor comparate în ceea ce privește gradul de posibilitate pentru o singură dovadă incompatibilă, este următoarea. Numătorul conține probabilitatea normalizată a unuia dintre evenimentele incompatibile combinate care formează un grup complet, exprimată ca produs al probabilităților a priori, iar numitorul conține suma tuturor

probabilități normalizate. În același timp, se respectă principiul păstrării rapoartelor probabilităților - iar rezultatul obținut este corect.

Probabilități de ipoteze în baza unei singure dovezi compatibile. Formulele bayesiene sunt utilizate în mod tradițional pentru a determina probabilitățile condiționale posterioare ale ipotezelor Hk (k = 1,...,n) comparate în ceea ce privește gradul de posibilitate pentru una dintre mai multe dovezi considerate compatibile EL (1 = 1,... ,m). În special (vezi

de exemplu, și ), la determinarea probabilităților condiționale a posteriori Р(Н 1Е^) și Р(Н 1 Е2) pentru fiecare dintre cele două dovezi compatibile Е1 și Е2, se folosesc formule de forma:

P(H 1) PE\H1) P(Hj) P(E2Hj) P(H J E1) = --1-și P(H J E 2) =--1-. (5)

I P(Hk) PE\Hk) I P(Hk) P(E2 Hk)

k = 1 k = 1 Rețineți că acesta este un alt caz în care formula Bayes nu este aplicabilă. Mai mult, în acest caz, două neajunsuri trebuie eliminate:

Normalizarea ilustrată a probabilităților de evenimente combinate este incorectă, datorită apartenenței la diferite grupuri complete de evenimente luate în considerare;

Înregistrările simbolice ale evenimentelor combinate HkEx și HkE2 nu reflectă faptul că dovezile considerate E x și E 2 sunt compatibile.

Pentru a elimina ultimul dezavantaj, poate fi utilizată o înregistrare mai detaliată a evenimentelor combinate, ținând cont de faptul că dovezile compatibile E1 și E2 în unele cazuri pot fi incompatibile, iar în altele comune:

HkE1 = HkE1 E2 și HkE2 = HkE 1E2+HkE1 E2, unde E1 și E 2 sunt dovezi opuse E1 și E 2.

Este evident că în astfel de cazuri produsul evenimentelor Hk E1E2 este luat în considerare de două ori. În plus, poate fi luată în considerare din nou separat, dar acest lucru nu se întâmplă. Cert este că, în situația luată în considerare, situația evaluată este influențată de trei evenimente combinate probabile incompatibile: HkE1E2, HkE 1E2 și

Hk E1E2. Totodată, pentru decident, interesează doar evaluarea gradului de posibilitate

două evenimente combinate incompatibile: HkE1 E2 și HkE 1E2, ceea ce corespunde luării în considerare doar a g

o singură dovadă. ¡C

Astfel, la construirea unei modificări a formulei Bayes pentru determinarea valorilor condiționale a posteriori,

Probabilitatea ipotezelor cu o singură dovadă compatibilă trebuie să se bazeze pe următoarele. Persoană care acceptă ^

decizie, ne interesează exact ce eveniment elementar, reprezentat de una sau alta probă din

numărul considerat s-a întâmplat efectiv în condiții specifice. Dacă un alt eveniment elementar are loc în K

sub forma unui singur certificat, se impune o reexaminare a deciziei, datorită rezultatelor unei evaluări comparative a n.

probabilități condiționale a posteriori ale ipotezelor cu indispensabila considerație a altor condiții care afectează generalul real

setare. 3

Să introducem următoarea notație: HkE- pentru una (și doar una) combinată incompatibilă co- ^

fiind, care constă în faptul că din m > 1 considerate evenimente elementare Ei (i = 1,...,m) împreună cu ipoteza „

Hk, a avut loc un eveniment elementar Ex și nu au avut loc alte evenimente elementare. se"

În cel mai simplu caz, sunt luate în considerare două probe unice incompatibile. Dacă se confirmă

unul dintre ele este de așteptat, probabilitatea condiționată a dovezilor într-o formă generală este exprimată prin formula l

P(Hk E-) = P(Ei\Hk) -P(EjE^Hk) = P(Ei\Hk) -P(M^Hk)P(M^Hk) , i = 1, -2 (6) g

Valabilitatea formulei poate fi văzută clar (Fig. 1).

Orez. 1. Interpretarea geometrică a calculului P(Hk E-) pentru / = 1,...,2 Cu dovezi independente condiționat

P(K1K2\Hk) = p(E\Hk)P(E2\Hk),

prin urmare, ținând cont de (6)

P(Hk E-) = PE Hk) - P(E1 Hk) P(E21Hk), = 1,.,2. (7)

În mod similar, probabilitatea P(HkE-) a unuia dintre cele trei (/ = 1,...,3) evenimente incompatibile HkE^ este exprimată prin formula

De exemplu, pentru i = 1:

p(HkEl) = P(Ei\Hk)-[ S P(Ei\Hk)P(Ej\Hk) ] + P(EiE2E3Hk)

p(HkE-) = P(E7|Hk)- P(E]E^Hk)- P(E7EjHk) + P(E]E2E3\Hk)

Valabilitatea acestei formule este confirmată clar de interpretarea geometrică prezentată în Fig.

Orez. 2. Interpretarea geometrică a calculului P(Hk E-) pentru / = 1,...,3

Folosind metoda inducției matematice, se poate demonstra formula generală pentru probabilitatea P(Hk E-) pentru orice număr de dovezi e, 0=1,...,m):

P(HkE-) = P(E, Hk) - m PE\Hk) P(E]\Hk) + 1 P(E\Hk) P(E]\Hk) P(E^Hk) + ■■■ + (-1)

] = 1(] * 0 ],1 * 1

Folosind teorema înmulțirii probabilităților, scriem probabilitatea condiționată Р(НкЕ~-) în două forme:

^ din care rezultă că

P(Hk E -) = P(Hk) P(E-|Hk) = P(E-) P(Hk)

E-)= P(HkE-) "" P(E-)

Folosind formula probabilității totale P(Ei) = S P(H£) P(Ei Hk) rezultă că

E-) \u003d P (HkET)

2 P(HkE-) k \u003d 1

Înlocuind în formula rezultată expresiile pentru Р(НкЕ-) sub forma laturii drepte a lui (8), obținem forma finală a formulei de determinare a probabilităților condiționate a posteriori ale ipotezelor H^ (k = 1, ...,n) pentru una dintre mai multe dovezi unice considerate incompatibile : (E^\Hk)

P(Hk)[P(E,\Hk) - 2 P(E,\Hk) P(Ep k) +...+ (-1)m-1 P(P P(Erk)] P(H, E ~) =-] = 1(] * ■----(9)

k 1 p t t t

2 P(Hk) 2 [P(E,\Hk) - 2 P(EgHk) P(E^Hk) + ...+ (-1)m-1 P(P P (Ep k)]

k=1 , = 1 ) = 1() *,) ■! =1

Estimări comparative. Sunt luate în considerare exemple destul de simple, dar ilustrative, limitate la analiza probabilităților condiționale posterioare calculate pentru una dintre cele două ipoteze cu două dovezi unice. 1. Probabilitățile ipotezelor sub evidență unică incompatibilă. Să comparăm rezultatele obținute folosind formulele Bayes (2) și (3), folosind exemplul a două dovezi L. = L și L. = L cu datele inițiale:

P(H1 = 0,7; P(H2) = 0,3; P(L| H^ = 0,1; P(L\n 1) = 0,9; P(L\H2) = 0,6 P(A\H2) = 0,4 În exemple luate în considerare cu ipoteza H1, formulele tradiționale (2) și (3) conduc la următoarele rezultate:

P(N.) P(A\Nr 0 07

P (N, L) \u003d - 11 \u003d - \u003d 0,28,

2 P(Hk) P(A\Hk)k = 1

R(N L R(A\N 1) 0 63

P (N, L) \u003d - 11 \u003d - \u003d 0,84,

2 P(Hk) P(A\Hk) k = 1

formând împarte P (H 1 L) \u003d P (H ^ P (L \ Hp \u003d 0,07; P (H ^ A) \u003d P (H 1) P (n | H ^ \u003d 0,63. 1 din propunerea formule cu privire la:

R<Н)Р(АНА-Р(А|Н1) _ 0,07

iar cu formulele propuse (4) care nu au divizori normalizatori: „și

Astfel, în cazul aplicării formulelor propuse, raportul probabilităților normalizate este egal cu raportul probabilităților normalizate: K

rm f P(H 1) P(A\H 1) A11 |

Când se utilizează formule cunoscute cu același raport -;-=-= 0,11 veroni normalizate

P(H 1) P(A\H 1) Ǥ

rapoartele indicate în numărători, raportul dintre probabilitățile normalizate rezultate: 2

P(H 1) P(A\H 1) P(A\H 1) 0,63

P (H1 L) \u003d 0,28 P (H 1 L) \u003d 0,84

Adică, principiul conservării rapoartelor de probabilitate nu este respectat și se obțin rezultate incorecte. În acest caz, £

în cazul aplicării formulelor cunoscute, valoarea abaterii relative a raportului (11) a probabilităţilor condiţionale şi condiţionale a posteriori ale ipotezelor din rezultatele corecte (10) se dovedeşte a fi foarte semnificativă, întrucât este

°, 33 - °, P x 100 \u003d 242%.. I

2. Probabilitățile ipotezelor sub evidență unică compatibilă. Să comparăm rezultatele obținute folosind formulele Bayes (5) și modificarea corectă construită (9), folosind următoarele date inițiale:

P(H1 = 0,7; P(H2) = 0,3; P(E1H1) = 0,4; P(E2H1) = 0,8; P(E1\H2) = 0,7; P(E^ H2) = 0,2,113

În exemplele luate în considerare cu ipoteza H 2 în cazul utilizării formulelor tradiționale (5):

P(H2) P(E1 H2) Q, 21

P(H 2 E1) =-2-!-2- = - = Q,429,

p(Hk) p(El Hk) k = 1

P(H2) P(E2H2) Q,Q6

P(H 2 E 2) \u003d -2-- \u003d - \u003d 0,097.

I P(Hk) P(E 2 Hk) k = 1

În cazul aplicării formulei propuse (9), ținând cont de (7), P(H

P(H2) 0,168

E.) ----- 0,291,

Z P(Hk) Z "

P(H2) 0,018

E0) ----- 0,031.

Z P(Hk) Z k - 1 i - 1

Atunci când se utilizează formulele corecte propuse, datorită acelorași numitori, raportul P(H2) -

Probabilitățile normalizate, indicate în numărători, sunt egale cu raportul

P(H2)

probabilități normalizate:

Adică se respectă principiul conservării rapoartelor de probabilitate.

Totuși, în cazul aplicării formulelor cunoscute cu raportul dintre probabilitățile normalizate indicate în numărători

P (H 2) P (E1 \ H 2) _ 0,21 _3 5 P (H 2) P (E 2 H 2) 0,06,

raportul probabilităților normalizate:

P (H 2 \u003d 0,429 \u003d 4,423. (13)

P(H2\e2) 0,097

Adică, principiul conservării rapoartelor de probabilitate, ca și înainte, nu este respectat. În acest caz, în cazul aplicării formulelor cunoscute, valoarea abaterii relative a raportului (13) a probabilităților condiționate a posteriori ale ipotezelor din rezultatele corecte (12) se dovedește a fi și ea foarte semnificativă:

9,387 4,423 x 100 = 52,9%.

Concluzie. O analiză a construcției relațiilor de formule specifice care implementează formula Bayes și modificările acesteia, propuse pentru rezolvarea problemelor practice, ne permite să enunțăm următoarele. Grupul complet de 2 evenimente combinate posibile comparabile poate fi selectat subiectiv de către decident. Această alegere se bazează pe datele inițiale obiective considerate, caracteristice unei situații tipice (tipuri specifice și număr de evenimente elementare - ipoteze estimate și dovezi). De interes practic este alegerea subiectivă a altor opțiuni ale întregului grup comparat din punct de vedere al gradului de posibilitate.

evenimente combinate - astfel, o varietate semnificativă de rapoarte de formulă este furnizată atunci când se construiesc variante netradiționale ale modificărilor formulei Bayes. Aceasta, la rândul său, poate fi baza pentru îmbunătățirea suportului matematic al implementării software, precum și extinderea domeniului de aplicare a noilor relații cu formule pentru rezolvarea problemelor aplicate.

Lista bibliografică

1. Gnedenko, B. V. O introducere elementară în teoria probabilității / B. V. Gnedenko, A. Ya. Khinchin. - 114 New York: Dover Publications, 1962. - 144 de ruble.

2. Venttsel, E. S. Teoria probabilității / E. S. Venttsel. - Ed. a X-a, șters. - Moscova: Şcoala superioară, 2006. - 575 p.

3. Andronov. A. M., Teoria probabilității și statistică matematică / A. M. Andronov, E. A. Kopytov, L. Ya. Gringlaz. - Sankt Petersburg: Peter, 2004. - 481 p.

4. Zmitrovich, A. I. Sisteme informatice inteligente / A. I. Zmitrovich. - Minsk: TetraSistems, 1997. - 496 p.

5. Chernorutsky, I. G. Metode decizionale / I. G. Chernorutsky. - Sankt Petersburg: BHV-Petersburg, 2005. - 416 p.

6 Naylor, C.-M. Construiește-ți propriul sistem expert / C.-M. Naylor. - Chichester: John Wiley & Sons, 1987. - 289 p.

7. Romanov, V.P.Sisteme informaţionale inteligente în economie / V.P.Romanov. - Ed. a II-a, șters.

Moscova: Examen, 2007. - 496 p.

8. Eficiență economică și competitivitate / D. Yu. Muromtsev [și alții]. - Tambov: Editura Tambov. stat tehnologie. un-ta, 2007.- 96 p.

9. Dolgov, A. I. Modificări corecte ale formulei Bayes pentru programarea paralelă / A. I. Dolgov // Tehnologii de supercomputer: materiale ale a treia All-Russian. științific-tehnic conf. - Rostov-pe-Don. - 2014.- Vol. 1 - S. 122-126.

10. A. I. Dolgov, Despre corectitudinea modificărilor formulei Bayes / A. I. Dolgov, Vestnik Don. stat tehnologie. universitate

2014. - V. 14, Nr. 3 (78). - S. 13-20.

1. Gnedenko, B.V., Khinchin, A.Ya. O introducere elementară în teoria probabilității. New York: Dover Publications, 1962, 144 p.

2 Ventsel, E.S. Teoria veroyatnostey. a 10-a ed., reimpr. Moscova: Vysshaya shkola, 2006, 575 p. (in rusa).

3. Andronov, A.M., Kopytov, E.A., Gringlaz, L.Y. Teoria veroyatnostey i matematicheskaya statistika. Sankt Petersburg: Piter, 2004, 481 p. (in rusa).

4. Zmitrovici, A.1. Intellektual "nye informatsionnye sistemy. Minsk: TetraSistems, 1997, 496 p. (în rusă).

5. Cernoruțki, I.G. Metodologie prinyatiya resheniy. Sankt Petersburg: BKhV-Peterburg, 2005, 416 p. (in rusa).

6 Naylor, C.-M. Construiește-ți propriul sistem expert. Chichester: John Wiley & Sons, 1987, 289 p.

7. Romanov, V.P. Intellektual "nye informatsionnye sistemy v ekonomike. Ed. a II-a, reimpr. Moscova: Ekzamen, 2007, 496 p. (în rusă).

8. Muromtsev, D.Y., et al. Ekonomicheskaya effektivnost" i konkurentosposobnost". Tambov: Izd-vo Tamb. du-te. tehnologie un-ta, 2007, 96 p. (in rusa). IB

9. Dolgov, A1. Korrektnye modifikatsii formula Bayesa dlya paralelă "nogo programrovaniya. Superkomp" yuternye tekhnologii: mat-ly 3-y vseros. științific-tehn. conf. Rostov-pe-Don, 2014, vol. 1, pp. 122-126 (în rusă). ^

10. Dolgov, A1. O korrektnosti modifikatsiy formuly Bayesa. ^ Vestnik al DSTU, 2014, vol. 14, nr. 3 (78), pp. 13-20 (în rusă). *

Cine este Bayes? Și ce legătură are cu managementul? – poate fi urmată de o întrebare destul de corectă. Deocamdată, credeți-mă pe cuvânt: asta este foarte important! .. și interesant (cel puțin pentru mine).

În ce paradigmă operează majoritatea managerilor: dacă observ ceva, ce concluzii pot trage din el? Ce învață Bayes: ce trebuie să fie de fapt pentru ca eu să observ acest ceva? Așa se dezvoltă toate științele și despre asta scrie (citez din memorie): o persoană care nu are o teorie în cap se va sfii de la o idee la alta sub influența diverselor evenimente (observații). Nu degeaba se spune: nu există nimic mai practic decât o teorie bună.

Un exemplu din practică. Subordonatul meu greșește, iar colegul meu (șeful altui departament) spune că ar fi necesar să se exercite o influență managerială asupra angajatului neglijent (cu alte cuvinte, pedepsi/cert). Și știu că acest angajat face 4-5 mii de operațiuni de același tip pe lună, iar în acest timp nu face mai mult de 10 greșeli. Simți diferența în paradigmă? Colegul meu reactioneaza la observatie, iar eu stiu a priori ca un angajat face un anumit numar de greseli, asa ca alta nu a afectat aceste cunostinte... Acum, daca la sfarsitul lunii se dovedeste ca exista, pt. exemplu, 15 astfel de erori! .. Acesta va deveni deja un motiv pentru a investiga cauzele nerespectării standardelor.

Sunteți convins de importanța abordării bayesiene? Intrigat? Așa sper". Și acum o muscă în unguent. Din nefericire, ideile bayesiene sunt rareori date din prima. Am avut sincer ghinion, căci am făcut cunoștință cu aceste idei prin literatura populară, după ce am citit că au rămas multe întrebări. Când plănuiam să scriu o notă, am adunat tot ceea ce am subliniat anterior conform lui Bayes și am studiat, de asemenea, ceea ce scriu ei pe Internet. Vă prezint cea mai bună presupunere a mea despre acest subiect. Introducere în Probabilitatea Bayesiană.

Derivarea teoremei lui Bayes

Luați în considerare următorul experiment: numim orice număr situat pe segment și fixăm când acest număr este, de exemplu, între 0,1 și 0,4 (Fig. 1a). Probabilitatea acestui eveniment este egală cu raportul dintre lungimea segmentului și lungimea totală a segmentului, cu condiția ca apariția numerelor pe segment echiprobabil. Din punct de vedere matematic, acest lucru poate fi scris p(0,1 <= X <= 0,4) = 0,3, или кратко R(X) = 0,3, unde R- probabilitate, X este o variabilă aleatorie în intervalul , X este o variabilă aleatoare în intervalul . Adică, probabilitatea de a atinge segmentul este de 30%.

Orez. 1. Interpretarea grafică a probabilităților

Acum luați în considerare pătratul x (Fig. 1b). Să presupunem că trebuie să numim perechi de numere ( X, y), fiecare dintre ele mai mare decât zero și mai mic decât unu. Probabilitatea ca X(primul număr) va fi în cadrul segmentului (zona albastră 1), egal cu raportul dintre aria zonei albastre și aria întregului pătrat, adică (0,4 - 0,1 ) * (1 - 0) / (1 * 1) = 0, 3, adică același 30%. Probabilitatea ca y este în interiorul segmentului (zona verde 2) este egal cu raportul dintre suprafața zonei verzi și suprafața întregului pătrat p(0,5 <= y <= 0,7) = 0,2, или кратко R(Y) = 0,2.

Ce se poate învăța despre valori în același timp Xși y. De exemplu, care este probabilitatea ca ambele Xși y sunt în segmentele date corespunzătoare? Pentru a face acest lucru, trebuie să calculați raportul dintre aria domeniului 3 (intersecția dungilor verzi și albastre) și aria întregului pătrat: p(X, Y) = (0,4 – 0,1) * (0,7 – 0,5) / (1 * 1) = 0,06.

Acum să presupunem că vrem să știm care este probabilitatea ca y este în intervalul dacă X este deja în gamă. Adică, de fapt, avem un filtru și când numim perechi ( X, y), apoi aruncăm imediat acele perechi care nu îndeplinesc condiția de găsire Xîntr-un interval dat, iar apoi din perechile filtrate numărăm cele pentru care y satisface condiţia noastră şi consideră probabilitatea ca raport al numărului de perechi pentru care y se află în segmentul de mai sus la numărul total de perechi filtrate (adică pentru care X se află în segment). Putem scrie această probabilitate ca p(Y|X la X lovit în rază”. Evident, această probabilitate este egală cu raportul dintre zona zonei 3 și zona zonei albastre 1. Zona zonei 3 este (0,4 - 0,1) * (0,7 - 0,5) = 0,06 și zona zonei albastre 1 ( 0,4 - 0,1) * (1 - 0) = 0,3, atunci raportul lor este 0,06 / 0,3 = 0,2. Cu alte cuvinte, probabilitatea de a găsi y pe segment, cu condiția ca X aparține segmentului p(Y|X) = 0,2.

În paragraful anterior, am formulat de fapt identitatea: p(Y|X) = p(X, Y) /p( X). Se scrie: „probabilitate de lovire laîn gamă, cu condiţia ca X lovirea în interval este egală cu raportul dintre probabilitatea de lovire simultană Xîn raza de acţiune şi laîn interval, la probabilitatea de a lovi Xîn rază”.

Prin analogie, luați în considerare probabilitatea p(X|Y). Sunăm cupluri X, y) și filtrează pe cele pentru care y se situează între 0,5 și 0,7, atunci probabilitatea ca X este în segment cu condiția ca y aparține segmentului este egal cu raportul dintre suprafața zonei 3 și zona zonei verzi 2: p(X|Y) = p(X, Y) / p(Y).

Rețineți că probabilitățile p(X, Y) și p(Y, X) sunt egale și ambele sunt egale cu raportul dintre aria zonei 3 și aria întregului pătrat, dar probabilitățile p(Y|X) și p(X|Y) nu este egal; în timp ce probabilitatea p(Y|X) este egal cu raportul dintre suprafața zonei 3 și zona 1 și p(X|Y) – domeniul 3 la domeniul 2. De asemenea, rețineți că p(X, Y) este adesea notat ca p(X&Y).

Deci avem două definiții: p(Y|X) = p(X, Y) /p( X) și p(X|Y) = p(X, Y) / p(Y)

Să rescriem aceste egalități ca: p(X, Y) = p(Y|X)*p( X) și p(X, Y) = p(X|Y) * p(Y)

Deoarece laturile stângi sunt egale, la fel sunt și cele din dreapta: p(Y|X)*p( X) = p(X|Y) * p(Y)

Sau putem rescrie ultima egalitate ca:

Aceasta este teorema lui Bayes!

Este posibil ca astfel de transformări simple (aproape tautologice) să dea naștere unei teoreme grozave!? Nu te grăbi să tragi concluzii. Să vorbim din nou despre ce avem. A existat o probabilitate inițială (a priori). R(X) că variabila aleatoare X distribuite uniform pe segment se încadrează în interval X. S-a întâmplat un eveniment Y, în urma căreia am obținut probabilitatea a posteriori a aceleiași variabile aleatoare X: R(X|Y), iar această probabilitate diferă de R(X) prin coeficientul . Eveniment Y numite dovezi, mai mult sau mai puțin care confirmă sau infirmă X. Acest coeficient este uneori numit puterea probei. Cu cât dovezile sunt mai puternice, cu atât faptul observării Y modifică probabilitatea anterioară, cu atât probabilitatea posterioară diferă mai mult de cea anterioară. Dacă dovezile sunt slabe, posteriorul este aproape egal cu precedentul.

Formula Bayes pentru variabile aleatoare discrete

În secțiunea anterioară, am derivat formula Bayes pentru variabile aleatoare continue x și y definite pe intervalul . Luați în considerare un exemplu cu variabile aleatoare discrete, fiecare luând două valori posibile. În cursul examinărilor medicale de rutină, s-a constatat că la vârsta de patruzeci de ani, 1% dintre femei suferă de cancer la sân. 80% dintre femeile cu cancer obțin rezultate pozitive la mamografie. 9,6% dintre femeile sănătoase obțin și rezultate pozitive la mamografie. În timpul examinării, o femeie din această grupă de vârstă a primit un rezultat pozitiv al mamografiei. Care este probabilitatea ca ea să aibă de fapt cancer la sân?

Cursul raționamentului/calculelor este următorul. Dintre cei 1% dintre bolnavii de cancer, mamografia va da 80% rezultate pozitive = 1% * 80% = 0,8%. Dintre 99% dintre femeile sănătoase, mamografia va da 9,6% rezultate pozitive = 99% * 9,6% = 9,504%. În total, din 10,304% (9,504% + 0,8%) cu rezultate pozitive la mamografie, doar 0,8% sunt bolnavi, iar restul de 9,504% sunt sănătoși. Astfel, probabilitatea ca o femeie cu o mamografie pozitivă să aibă cancer este de 0,8% / 10,304% = 7,764%. Ai crezut că 80% sau cam asa ceva?

În exemplul nostru, formula Bayes ia următoarea formă:

Să vorbim încă o dată despre sensul „fizic” al acestei formule. X este o variabilă aleatoare (diagnostic), care ia următoarele valori: X 1- bolnav si X 2- sănătos; Y– variabilă aleatoare (rezultatul măsurării - mamografie), care ia valorile: Y 1- un rezultat pozitiv și Y2- rezultat negativ; p(X 1)- probabilitatea de îmbolnăvire înainte de mamografie (probabilitate a priori), egală cu 1%; R(Y 1 |X 1 ) – probabilitatea unui rezultat pozitiv dacă pacientul este bolnav (probabilitate condiționată, întrucât trebuie specificată în condițiile sarcinii), egală cu 80%; R(Y 1 |X 2 ) – probabilitatea unui rezultat pozitiv dacă pacientul este sănătos (și probabilitate condiționată), egală cu 9,6%; p(X 2)- probabilitatea ca pacientul să fie sănătos înainte de mamografie (probabilitate a priori), egală cu 99%; p(X 1|Y 1 ) – probabilitatea ca pacientul să fie bolnav, având în vedere un rezultat pozitiv al mamografiei (probabilitate posterioară).

Se poate observa că probabilitatea posterioară (ceea ce căutăm) este proporțională cu probabilitatea anterioară (inițială) cu un coeficient puțin mai complex . Voi sublinia din nou. În opinia mea, acesta este un aspect fundamental al abordării bayesiene. Dimensiunea ( Y) a adăugat o anumită cantitate de informații la cele disponibile inițial (a priori), care ne-au clarificat cunoștințele despre obiect.

Exemple

Pentru a consolida materialul acoperit, încercați să rezolvați mai multe probleme.

Exemplul 1 Sunt 3 urne; in primele 3 bile albe si 1 neagra; în al doilea - 2 bile albe și 3 negre; în a treia - 3 bile albe. Cineva se apropie aleatoriu de una dintre urne și trage 1 minge din ea. Această minge este albă. Găsiți probabilitățile posterioare ca mingea să fie extrasă din prima, a doua, a treia urnă.

Soluţie. Avem trei ipoteze: H 1 = (prima urna selectata), H 2 = (a doua urna selectata), H 3 = (a treia urna selectata). Deoarece urna este aleasă la întâmplare, probabilitățile a priori ale ipotezelor sunt: ​​Р(Н 1) = Р(Н 2) = Р(Н 3) = 1/3.

În urma experimentului a apărut evenimentul A = (din urna selectată a fost scoasă o bilă albă). Probabilități condiționate ale evenimentului A în ipotezele H 1, H 2, H 3: P(A|H 1) = 3/4, P(A|H 2) = 2/5, P(A|H 3) = 1. De exemplu, prima egalitate sună astfel: „probabilitatea de a extrage o minge albă dacă se alege prima urna este de 3/4 (deoarece sunt 4 bile în prima urna, iar 3 dintre ele sunt albe)”.

Aplicând formula Bayes, găsim probabilitățile posterioare ale ipotezelor:

Astfel, în lumina informațiilor despre apariția evenimentului A, probabilitățile ipotezelor s-au schimbat: cea mai probabilă a devenit ipoteza H 3 , cea mai puțin probabilă - ipoteza H 2 .

Exemplul 2 Doi trăgători trag în mod independent în aceeași țintă, fiecare trăgând o lovitură. Probabilitatea de a lovi ținta pentru primul trăgător este de 0,8, pentru al doilea - 0,4. După împușcare, a fost găsită o gaură în țintă. Găsiți probabilitatea ca această gaură să aparțină primului trăgător (eliminăm rezultatul (ambele găuri au coincis) ca fiind puțin probabil).

Soluţie. Înainte de experiment, sunt posibile următoarele ipoteze: H 1 = (nici prima și nici a doua săgeată nu vor lovi), H 2 = (ambele săgeți vor lovi), H 3 - (primul trăgător va lovi, iar al doilea nu va lovi). ), H 4 = (primul trăgător nu va lovi, iar al doilea va lovi). Probabilități anterioare ale ipotezelor:

P (H 1) \u003d 0,2 * 0,6 \u003d 0,12; P (H 2) \u003d 0,8 * 0,4 \u003d 0,32; P (H 3) \u003d 0,8 * 0,6 \u003d 0,48; P (H 4) \u003d 0,2 * 0,4 \u003d 0,08.

Probabilitățile condiționate ale evenimentului observat A = (există o gaură în țintă) în aceste ipoteze sunt: ​​P(A|H 1) = P(A|H 2) = 0; P(A|H3) = P(A|H4) = 1

După experiență, ipotezele H 1 și H 2 devin imposibile, iar probabilitățile posterioare ale ipotezelor H 3 și H 4 conform formulei Bayes vor fi:

Bayes împotriva spam-ului

Formula lui Bayes și-a găsit o largă aplicație în dezvoltarea filtrelor de spam. Să presupunem că doriți să instruiți un computer pentru a determina ce e-mailuri sunt spam. Vom începe de la dicționar și combinații de cuvinte folosind estimări bayesiene. Să creăm mai întâi un spațiu de ipoteze. Să avem 2 ipoteze cu privire la orice scrisoare: H A este spam, H B nu este spam, ci o scrisoare normală, necesară.

În primul rând, să ne „antrenăm” viitorul nostru sistem anti-spam. Să luăm toate literele pe care le avem și să le împărțim în două „grămădițe” de 10 litere. Într-una punem scrisori spam și o numim grămada H A, în cealaltă punem corespondența necesară și o numim grămada H B. Acum să vedem: ce cuvinte și expresii se găsesc în spam și e-mailuri necesare și cu ce frecvență? Aceste cuvinte și expresii vor fi numite dovezi și notate cu E 1 , E 2 ... Se pare că cuvintele utilizate în mod obișnuit (de exemplu, cuvintele „ca”, „al tău”) din grămezi H A și H B apar cu aproximativ aceeasi frecventa. Astfel, prezența acestor cuvinte într-o scrisoare nu ne spune nimic despre care grămadă îi aparține (dovezi slabe). Să atribuim acestor cuvinte o valoare neutră a estimării probabilității de „spam”, să spunem, 0,5.

Lasă expresia „engleză conversațională” să apară în doar 10 litere și mai des în e-mailurile spam (de exemplu, în 7 e-mailuri spam din toate 10) decât în ​​cele potrivite (în 3 din 10). Să dăm acestei fraze un scor mai mare de 7/10 pentru spam și un scor mai mic pentru e-mailurile normale: 3/10. În schimb, s-a dovedit că cuvântul „buddy” era mai frecvent în litere normale (6 din 10). Și așa am primit o scrisoare scurtă: „Prietene! Cum e engleza ta vorbita?. Să încercăm să-i evaluăm „spam-ul”. Vom pune estimările generale P(HA), P(H B) ale apartenenței la fiecare grămadă folosind o formulă Bayes oarecum simplificată și estimările noastre aproximative:

P(H A) = A/(A+B), Unde A \u003d p a1 * p a2 * ... * pan, B \u003d p b1 * p b2 * ... * p b n \u003d (1 - p a1) * (1 - p a2) * ... * ( 1 - p an).

Tabelul 1. Evaluarea bayesiană simplificată (și incompletă) a scrisului

Astfel, scrisoarea noastră ipotetică a primit o evaluare a probabilității de apartenență cu accent în direcția „spam”. Putem decide să aruncăm scrisoarea într-una dintre grămezi? Să stabilim pragurile de decizie:

  • Vom presupune că litera aparține mormanului H i dacă P(H i) ≥ T.
  • Litera nu aparține mormanului dacă P(H i) ≤ L.
  • Dacă L ≤ P(H i) ≤ T, atunci nu se poate lua nicio decizie.

Puteți lua T = 0,95 și L = 0,05. Deoarece pentru scrisoarea în cauză și 0,05< P(H A) < 0,95, и 0,05 < P(H В) < 0,95, то мы не сможем принять решение, куда отнести данное письмо: к спаму (H A) или к нужным письмам (H B). Можно ли улучшить оценку, используя больше информации?

Da. Să calculăm scorul pentru fiecare dovadă într-un mod diferit, așa cum a sugerat Bayes. Lăsa:

F a este numărul total de e-mailuri spam;

F ai este numărul de litere cu un certificat iîntr-un morman de spam;

F b este numărul total de litere necesare;

F bi este numărul de litere cu un certificat iîntr-un morman de scrisori necesare (relevante).

Atunci: p ai = F ai /F a , p bi = F bi /F b . P(H A) = A/(A+B), P(H B) = B/(A+B), UndeА = p a1 *p a2 *…*p an , B = p b1 *p b2 *…*p b n

Vă rugăm să rețineți că scorurile cuvintelor dovezi p ai și p bi au devenit obiective și pot fi calculate fără intervenția umană.

Tabelul 2. O estimare bayesiană mai precisă (dar incompletă) pentru caracteristicile disponibile dintr-o scrisoare

Am obținut un rezultat destul de cert - cu o marjă mare de probabilitate, litera poate fi atribuită literelor necesare, deoarece P(H B) = 0,997 > T = 0,95. De ce s-a schimbat rezultatul? Pentru că am folosit mai multe informații - am ținut cont de numărul de litere din fiecare dintre grămezi și, apropo, am determinat estimările p ai și p bi mult mai corect. Ele au fost determinate în același mod ca și Bayes însuși, prin calcularea probabilităților condiționate. Cu alte cuvinte, p a3 este probabilitatea ca cuvântul „buddy” să apară în e-mail, având în vedere că e-mailul aparține deja heap-ului de spam H A . Rezultatul nu a întârziat să apară – se pare că putem lua o decizie cu o mai mare certitudine.

Bayes vs fraudă corporativă

O aplicație interesantă a abordării bayesiene a fost descrisă de MAGNUS8.

Proiectul meu actual (IS pentru detectarea fraudei într-o întreprindere de producție) folosește formula Bayes pentru a determina probabilitatea fraudei (fraudă) în prezența/absența mai multor fapte indirect în favoarea ipotezei posibilității fraudei. Algoritmul este de auto-învățare (cu feedback), adică. își recalculează coeficienții (probabilitățile condiționate) la confirmarea sau neconfirmarea efectivă a fraudei în timpul verificării de către serviciul de securitate economică.

Probabil că merită să spunem că astfel de metode la proiectarea algoritmilor necesită o cultură matematică destul de ridicată a dezvoltatorului, deoarece cea mai mică eroare în derivarea și/sau implementarea formulelor de calcul va anula și discredita întreaga metodă. Metodele probabilistice sunt vinovate în special de acest lucru, deoarece gândirea umană nu este adaptată să lucreze cu categorii probabiliste și, în consecință, nu există „vizibilitate” și înțelegere a „semnificației fizice” a parametrilor probabilistici intermediari și finali. O astfel de înțelegere există numai pentru conceptele de bază ale teoriei probabilităților și atunci trebuie doar să combinați cu mare atenție și să derivați lucruri complexe conform legile teoriei probabilităților - bunul simț nu va mai ajuta pentru obiectele compuse. Acest lucru, în special, este asociat cu bătălii metodologice destul de serioase care au loc pe paginile cărților moderne despre filosofia probabilității, precum și cu un număr mare de sofisme, paradoxuri și curiozități pe această temă.

O altă nuanță cu care a trebuit să mă confrunt este că, din păcate, aproape tot ce este mai mult sau mai puțin util ÎN PRACTIC pe această temă este scris în engleză. În sursele în limba rusă, există practic doar o teorie binecunoscută cu exemple demonstrative doar pentru cazurile cele mai primitive.

Sunt pe deplin de acord cu ultimul comentariu. De exemplu, Google, când a încercat să găsească ceva de genul cartea „Probabilitatea Bayesiană”, nu a dat nimic inteligibil. Adevărat, el a spus că o carte cu statistici bayesiene a fost interzisă în China. (Profesorul de statistică Andrew Gelman a raportat pe un blog al Universității Columbia că cartea sa, Data Analysis with Regression and Multilevel/Hierarchical Models, a fost interzisă publicării în China. text.”) Mă întreb dacă un motiv similar a dus la absența cărților despre Bayesian. probabilitate în Rusia?

Conservatorismul în procesul de prelucrare a informațiilor umane

Probabilitățile determină gradul de incertitudine. Probabilitatea, atât conform lui Bayes, cât și al intuiției noastre, este pur și simplu un număr între zero și ceea ce reprezintă gradul în care o persoană oarecum idealizată crede că afirmația este adevărată. Motivul pentru care o persoană este oarecum idealizată este că suma probabilităților sale pentru două evenimente care se exclud reciproc trebuie să fie egală cu probabilitatea sa ca oricare dintre aceste evenimente să se producă. Proprietatea aditivității are astfel de implicații încât puțini oameni reali le pot egala pe toate.

Teorema lui Bayes este o consecință banală a proprietății aditivității, de netăgăduit și agreată de toți probabiliștii, bayesieni și de altă natură. O modalitate de a o scrie este următoarea. Dacă P(H A |D) este probabilitatea ulterioară ca ipoteza A să fie după ce valoarea dată D a fost observată, P(H A) este probabilitatea sa anterioară înainte ca valoarea dată D să fie observată, P(D|H A ) este probabilitatea ca a se va observa valoarea dată D, dacă H A este adevărată și P(D) este probabilitatea necondiționată a unei valori date D, atunci

(1) P(H A |D) = P(D|H A) * P(H A) / P(D)

P(D) este cel mai bine gândit ca o constantă de normalizare care face ca probabilitățile posterioare să se adună la unu peste setul exhaustiv de ipoteze care se exclud reciproc care sunt luate în considerare. Dacă trebuie calculat, poate fi așa:

Dar mai des P(D) este eliminat mai degrabă decât numărat. O modalitate convenabilă de a o elimina este de a transforma teorema lui Bayes în forma unei relații probabilitate-cote.

Luați în considerare o altă ipoteză, H B , care se exclud reciproc pentru H A, și răzgândiți-vă despre ea pe baza aceleiași cantități date care v-a răzgândit despre H A. Teorema lui Bayes spune că

(2) P(H B |D) = P(D|H B) * P(H B) / P(D)

Acum împărțim ecuația 1 la ecuația 2; rezultatul va fi astfel:

unde Ω 1 sunt cotele posterioare în favoarea lui H A în termeni de H B , Ω 0 sunt cotele anterioare, iar L este un număr familiar statisticienilor ca raport al probabilităților. Ecuația 3 este aceeași versiune relevantă a teoremei lui Bayes ca și ecuația 1 și este adesea mult mai utilă în special pentru experimente care implică ipoteze. Susținătorii bayesieni susțin că teorema lui Bayes este o regulă optimă din punct de vedere formal pentru modul de revizuire a opiniilor în lumina noilor date.

Suntem interesați să comparăm comportamentul ideal definit de teorema lui Bayes cu comportamentul real al oamenilor. Pentru a vă face o idee despre ce înseamnă asta, să încercăm un experiment cu tine ca subiect. Această pungă conține 1000 de jetoane de poker. Am două dintre aceste genți, unul cu 700 roșii și 300 albastre, iar celălalt cu 300 roșii și 700 albastre. Am aruncat o monedă pentru a stabili pe care să o folosesc. Astfel, dacă părerile noastre sunt aceleași, probabilitatea dvs. actuală de a extrage o pungă cu mai multe jetoane roșii este de 0,5. Acum, eșantionați aleatoriu, revenind după fiecare simbol. În 12 jetoane, primești 8 roșii și 4 albastre. Acum, pe baza a tot ceea ce știți, care este probabilitatea ca o geantă să vină cu mai multe roșii? Este clar că este mai mare de 0,5. Vă rugăm să nu continuați să citiți până nu ați înregistrat evaluarea.

Dacă arăți ca un subiect tipic, scorul tău se încadrează între 0,7 și 0,8. Dacă am face calculul corespunzător, însă, răspunsul ar fi 0,97. Într-adevăr, este foarte rar ca o persoană căreia nu i s-a arătat anterior influența conservatorismului să vină cu o estimare atât de mare, chiar dacă era familiarizat cu teorema lui Bayes.

Dacă proporția de jetoane roșii din pungă este R, apoi probabilitatea de a obține r jetoane roșii și ( n-r) albastru în n mostre cu returnare - p r (1–p)n–r. Astfel, într-un experiment tipic de pungă și jetoane de poker, dacă HAînseamnă că proporția de jetoane roșii este r Ași HBînseamnă că cota este RB, atunci raportul de probabilitate:

Atunci când se aplică formula lui Bayes, trebuie luată în considerare doar probabilitatea observației efective și nu probabilitățile altor observații pe care el ar fi putut să le facă, dar nu a făcut-o. Acest principiu are implicații largi pentru toate aplicațiile statistice și non-statistice ale teoremei lui Bayes; este cel mai important instrument tehnic al gândirii bayesiene.

revoluția bayesiană

Prietenii și colegii tăi vorbesc despre ceva numit „teorema lui Bayes” sau „regula bayesiană” sau ceva numit gândire bayesiană. Sunt foarte interesați de asta, așa că intri online și găsești o pagină despre teorema lui Bayes și... Este o ecuație. Și asta-i tot... De ce un concept matematic dă naștere unui asemenea entuziasm în minte? Ce fel de „revoluție bayesiană” are loc în rândul oamenilor de știință și se susține că chiar și abordarea experimentală în sine poate fi descrisă ca fiind cazul său special? Care este secretul pe care îl cunosc adepții lui Bayes? Ce fel de lumină văd ei?

Revoluția bayesiană în știință nu s-a întâmplat deoarece tot mai mulți oameni de știință cognitiv au început brusc să observe că fenomenele mentale au o structură bayesiană; nu pentru că oamenii de știință din toate domeniile au început să folosească metoda bayesiană; ci pentru că știința însăși este un caz special al teoremei lui Bayes; dovezile experimentale sunt dovezi bayesiene. Revoluționarii bayesieni susțin că atunci când faci un experiment și obții dovezi care „susțin” sau „infirma” teoria ta, acea confirmare sau respingere are loc conform regulilor bayesiene. De exemplu, trebuie să ții cont nu doar că teoria ta poate explica fenomenul, ci și că există și alte explicații posibile care pot prezice și acest fenomen.

Anterior, cea mai populară filozofie a științei era vechea filozofie care a fost înlocuită de revoluția bayesiană. Ideea lui Karl Popper că teoriile pot fi complet falsificate, dar niciodată complet confirmate, este un alt caz special de reguli bayesiene; dacă p(X|A) ≈ 1 - dacă teoria face predicții corecte, atunci observația ~X falsifică foarte puternic A. Pe de altă parte, dacă p(X|A) ≈ 1 și observăm X, acest lucru nu suportă teoria foarte mult; o altă condiție B este posibilă, astfel încât p(X|B) ≈ 1, și în care observarea lui X nu dovedește pentru A, ci pentru B. Pentru a observa X confirmând cu siguranță A, ar trebui să știm că p( X|A) ≈ 1 și acel p(X|~A) ≈ 0, pe care nu îl putem ști deoarece nu putem lua în considerare toate explicațiile alternative posibile. De exemplu, când teoria relativității generale a lui Einstein a depășit teoria gravitațională a lui Newton, extrem de verificabilă, a făcut din toate predicțiile teoriei lui Newton un caz special al lui Einstein.

În mod similar, afirmația lui Popper că o idee trebuie să fie falsificabilă poate fi interpretată ca o manifestare a regulii bayesiene despre conservarea probabilității; dacă rezultatul X este o dovadă pozitivă pentru teorie, atunci rezultatul ~X trebuie să falsifice teoria într-o oarecare măsură. Dacă încercați să interpretați atât X, cât și ~X ca „susținând” o teorie, regulile bayesiene spun că este imposibil! Pentru a crește probabilitatea unei teorii, trebuie să o supui unor teste care pot reduce probabilitatea acesteia; aceasta nu este doar o regulă pentru a detecta șarlatani în știință, ci o consecință a teoremei probabilității bayesiene. Pe de altă parte, ideea lui Popper că este nevoie doar de falsificare și nu este necesară nicio confirmare este greșită. Teorema lui Bayes arată că falsificarea este o dovadă foarte puternică în comparație cu confirmarea, dar falsificarea este încă probabilistică în natură; nu este guvernată de reguli fundamental diferite și nu diferă în acest sens de confirmare, așa cum susține Popper.

Astfel constatăm că multe fenomene din științele cognitive, plus metodele statistice folosite de oamenii de știință, plus metoda științifică în sine, sunt toate cazuri speciale ale teoremei lui Bayes. Despre aceasta este revoluția bayesiană.

Bun venit la Conspirația Bayesiană!

Literatură despre probabilitatea bayesiană

2. Laureatul Nobel în economie Kahneman (et al.) descrie o mulțime de aplicații diferite ale lui Bayes într-o carte minunată. Numai în rezumatul meu al acestei cărți foarte mari, am numărat 27 de referințe la numele unui pastor presbiterian. Formule minime. (.. Mi-a plăcut foarte mult. Adevărat, e complicat, multă matematică (și unde fără ea), dar capitole individuale (de exemplu, Capitolul 4. Informații), clar pe subiect. Îi sfătuiesc pe toată lumea. Chiar dacă matematica este dificil pentru tine, citește rândul, sări peste matematică și pescuit după cereale utile...

14. (supliment din 15 ianuarie 2017), un capitol din cartea lui Tony Crilly. 50 de idei despre care trebuie să știi. Matematica.

Fizicianul Richard Feynman, laureat al Premiului Nobel, vorbind despre un filozof cu o îngâmfare deosebit de mare, a spus odată: „Nu filosofia ca știință mă irită deloc, ci fastul care a fost creat în jurul ei. Dacă filozofii ar putea râde de ei înșiși! Dacă ar putea spune: „Eu zic că este așa, dar Von Leipzig a crezut că este diferit și știe și el ceva despre asta”. Dacă și-ar fi amintit să clarifice că era doar a lor .

Formularul evenimentelor grup complet, dacă cel puțin unul dintre ele va apărea în mod necesar ca rezultat al experimentului și sunt inconsecvenți în perechi.

Să presupunem că evenimentul A poate apărea numai împreună cu unul dintre mai multe evenimente incompatibile în perechi care formează un grup complet. Să numim evenimentele i= 1, 2,…, n) ipoteze experiență suplimentară (a priori). Probabilitatea de apariție a evenimentului A este determinată de formula probabilitate deplină :

Exemplul 16 Sunt trei urne. Prima urnă conține 5 bile albe și 3 negre, a doua urnă conține 4 bile albe și 4 negre, iar a treia urnă conține 8 bile albe. Una dintre urne este aleasă la întâmplare (aceasta poate însemna, de exemplu, că se face o selecție dintr-o urna auxiliară care conține trei bile numerotate 1, 2 și 3). Din această urnă se extrage la întâmplare o minge. Care este probabilitatea ca acesta să fie negru?

Soluţie. Eveniment A– se extrage mingea neagră. Dacă s-ar ști din ce urnă este extrasă mingea, atunci probabilitatea necesară ar putea fi calculată conform definiției clasice a probabilității. Să introducem ipoteze (ipoteze) cu privire la ce urnă este aleasă pentru extragerea mingii.

Mingea poate fi extrasa fie din prima urna (ipoteza), fie din a doua (ipoteza), fie din a treia (ipoteza). Din moment ce există șanse egale să alegeți oricare dintre urne, atunci .

De aici rezultă că

Exemplul 17. Lămpile electrice sunt fabricate în trei fabrici. Prima fabrică produce 30% din numărul total de lămpi electrice, a doua - 25%,
iar al treilea pentru restul. Produsele primei fabrici conțin 1% lămpi electrice defecte, a doua - 1,5%, a treia - 2%. Magazinul primește produse de la toate cele trei fabrici. Care este probabilitatea ca o lampă cumpărată din magazin să fie defectă?

Soluţie. Trebuie introduse ipoteze cu privire la fabrica în care a fost fabricat becul. Știind acest lucru, putem găsi probabilitatea ca acesta să fie defect. Să introducem notația pentru evenimente: A– lampa electrică achiziționată s-a dovedit a fi defectă, – lampa a fost fabricată de prima fabrică, – lampa a fost fabricată de a doua fabrică,
– lampa este fabricată de a treia fabrică.

Probabilitatea dorită se găsește prin formula probabilității totale:

Formula Bayes. Fie un grup complet de evenimente incompatibile în perechi (ipoteze). DAR este un eveniment aleatoriu. Apoi,

Ultima formulă care vă permite să supraestimați probabilitățile ipotezelor după ce rezultatul testului devine cunoscut, în urma căreia a apărut evenimentul A, se numește Formula Bayes .

Exemplul 18.În medie, 50% dintre pacienții cu boală sunt internați într-un spital de specialitate La, 30% cu boală L, 20 % –
cu boala M. Probabilitatea unei vindecări complete a bolii K este egal cu 0,7 pentru boli Lși M aceste probabilități sunt, respectiv, 0,8 și respectiv 0,9. Pacientul internat la spital a fost externat sănătos. Găsiți probabilitatea ca acest pacient să aibă boala K.


Soluţie. Introducem ipoteze: - pacientul suferea de o boala La L, pacientul suferea de boala M.

Apoi, după condiția problemei, avem . Să introducem un eveniment DAR Pacientul internat la spital a fost externat sănătos. După condiție

Conform formulei probabilității totale, obținem:

Formula Bayes.

Exemplul 19. Să fie cinci bile în urnă și toate ipotezele despre numărul de bile albe sunt la fel de probabile. O minge este luată la întâmplare din urnă și se dovedește a fi albă. Care este cea mai probabilă presupunere despre compoziția inițială a urnei?

Soluţie. Să fie ipoteza că în urna de bile albe , adică este posibil să se facă șase ipoteze. Apoi, după condiția problemei, avem .

Să introducem un eveniment DAR O minge albă extrasă aleatoriu. Să calculăm. Deoarece , atunci conform formulei Bayes avem:

Astfel, ipoteza este cea mai probabilă, întrucât .

Exemplul 20. Două din trei elemente care funcționează independent ale dispozitivului de calcul au eșuat. Găsiți probabilitatea ca primul și al doilea element să eșueze dacă probabilitățile de eșec ale primului, celui de-al doilea și, respectiv, al treilea element sunt egale cu 0,2; 0,4 și 0,3.

Soluţie. Notează prin DAR eveniment - două elemente au eșuat. Se pot formula urmatoarele ipoteze:

- primul și al doilea element au eșuat, iar al treilea element este funcțional. Deoarece elementele funcționează independent, se aplică teorema înmulțirii:

CATEGORII

ARTICOLE POPULARE

2022 "kingad.ru" - examinarea cu ultrasunete a organelor umane