O explicație simplă a teoremei lui Bayes. Formula probabilității totale

La derivarea formulei probabilității totale, s-a presupus că evenimentul A, a cărei probabilitate trebuia determinată, s-ar putea întâmpla cu unul dintre evenimente N 1 , N 2 , ... , N n, formând un grup complet de evenimente incompatibile în perechi. Mai mult, probabilitățile acestor evenimente (ipoteze) erau cunoscute dinainte. Să presupunem că a fost efectuat un experiment, în urma căruia evenimentul A a sosit. Aceste informații suplimentare ne permit să reevaluăm probabilitățile ipotezelor. N i, având calculat P(Hi/A).

sau, folosind formula probabilității totale, obținem

Această formulă se numește formula lui Bayes sau teorema ipotezei. Formula lui Bayes vă permite să „revizuiți” probabilitățile ipotezelor după ce rezultatul experimentului care a dus la eveniment devine cunoscut A.

Probabilități Р(Н i)− acestea sunt probabilitățile a priori ale ipotezelor (se calculează înainte de experiment). Probabilitățile P(H i /A)− acestea sunt probabilitățile posterioare ale ipotezelor (se calculează în urma experimentului). Formula lui Bayes vă permite să calculați probabilitățile posterioare din probabilitățile lor anterioare și din probabilitățile condiționate ale unui eveniment A.

Exemplu. Se știe că 5% din toți bărbații și 0,25% dintre toate femeile sunt daltonici. O persoană aleasă aleatoriu pe baza numărului cardului medical suferă de daltonism. Care este probabilitatea ca acesta să fie bărbat?

Soluţie. Eveniment A– o persoană suferă de daltonism. Spațiul evenimentelor elementare pentru experiment - o persoană este selectată după numărul cardului medical - Ω = ( N 1 , N 2 ) constă din 2 evenimente:

N 1 - este selectat un bărbat,

N 2 – este selectată o femeie.

Aceste evenimente pot fi selectate ca ipoteze.

În funcție de condițiile problemei (alegere aleatorie), probabilitățile acestor evenimente sunt aceleași și egale P(N 1 ) = 0.5; P(N 2 ) = 0.5.

În acest caz, probabilitățile condiționate ca o persoană să sufere de daltonism sunt egale, respectiv:

A FUGIT 1 ) = 0.05 = 1/20; A FUGIT 2 ) = 0.0025 = 1/400.

Deoarece se știe că persoana selectată este daltonică, adică evenimentul a avut loc, folosim formula lui Bayes pentru a reevalua prima ipoteză:

Exemplu. Există trei cutii cu aspect identic. Prima cutie conține 20 de bile albe, a doua cutie conține 10 bile albe și 10 negre, iar a treia cutie conține 20 de bile negre. O minge albă este luată dintr-o cutie aleasă la întâmplare. Calculați probabilitatea ca mingea să fie extrasă din prima casetă.

Soluţie. Să notăm prin A eveniment - apariția unei mingi albe. Se pot face trei ipoteze (ipoteze) despre alegerea casetei: N 1 ,N 2 , N 3 – selectarea primei, a doua și, respectiv, a treia casetă.

Deoarece alegerea oricăreia dintre casete este la fel de posibilă, probabilitățile ipotezelor sunt aceleași:

P(N 1 )=P(N 2 )=P(N 3 )= 1/3.

Conform problemei, probabilitatea de a extrage o minge albă din prima casetă este

Probabilitatea de a extrage o minge albă din a doua casetă



Probabilitatea de a extrage o minge albă din a treia casetă

Găsim probabilitatea dorită folosind formula Bayes:

Repetarea testelor. formula lui Bernoulli.

Sunt efectuate N încercări, în fiecare dintre ele evenimentul A poate să apară sau nu, iar probabilitatea evenimentului A în fiecare încercare individuală este constantă, de exemplu. nu se schimba de la experienta la experienta. Știm deja cum să găsim probabilitatea evenimentului A într-un experiment.

Un interes deosebit este probabilitatea de apariție a unui anumit număr de ori (m ori) a evenimentului A în n experimente. Astfel de probleme pot fi rezolvate cu ușurință dacă testele sunt independente.

Def. Sunt numite mai multe teste independent față de evenimentul A , dacă probabilitatea evenimentului A în fiecare dintre ele nu depinde de rezultatele altor experimente.

Probabilitatea P n (m) de apariție a evenimentului A exact de m ori (neapariție n-m ori, eveniment ) în aceste n încercări. Evenimentul A apare în secvențe foarte diferite de m ori).

- formula Bernoulli.

Următoarele formule sunt evidente:

Р n (m Mai puțin k ori în n încercări.

P n (m>k) = P n (k+1) + P n (k+2) +…+ P n (n) - probabilitatea de apariție a evenimentului A Mai mult k ori în n încercări.

Să începem cu un exemplu. În urna din fața ta, la fel de probabil pot fi (1) două bile albe, (2) una albă și una neagră, (3) două negre. Tragi mingea și se dovedește a fi albă. Cum l-ai aprecia acum? probabilitate aceste trei opțiuni (ipoteze)? Evident, probabilitatea ipotezei (3) cu două bile negre = 0. Dar cum se calculează probabilitățile celor două ipoteze rămase!? Acest lucru se poate face prin formula Bayes, care în cazul nostru are forma (numărul formulei corespunde numărului ipotezei testate):

Descărcați nota în sau

X– o variabilă aleatoare (ipoteză) luând următoarele valori: x 1- doua albe, x 2– unul alb, unul negru; x 3– două negre; la– variabilă aleatoare (eveniment) luând valori: la 1– se scoate o bila alba si la 2– se scoate o bila neagra; P(x 1)– probabilitatea primei ipoteze înainte de a extrage mingea ( a priori probabilitate sau probabilitate inainte de experiență) = 1/3; P(x 2)– probabilitatea celei de-a doua ipoteze înainte de a extrage mingea = 1/3; P(x 3)– probabilitatea celei de-a treia ipoteze înainte de a extrage mingea = 1/3; P(y 1|x 1)– probabilitatea condiționată de a extrage o minge albă, dacă prima ipoteză este adevărată (bilele sunt albe) = 1; P(y 1|x 2) probabilitatea de a extrage o bilă albă dacă a doua ipoteză este adevărată (o bilă este albă, a doua este neagră) = ½; P(y 1|x 3) probabilitatea de a extrage o minge albă dacă a treia ipoteză este adevărată (ambele negre) = 0; P(y 1)– probabilitatea extragerii unei bile albe = ½; R(y ​​2)– probabilitatea extragerii unei bile negre = ½; și în sfârșit, ceea ce căutăm - P(x 1|y 1) probabilitatea ca prima ipoteză să fie adevărată (ambele bile sunt albe), având în vedere că am tras o bilă albă ( a posteriori probabilitate sau probabilitate după experienţă); P(x 2|y 1) probabilitatea ca a doua ipoteză să fie adevărată (o bilă este albă, a doua este neagră), cu condiția să extragem o bilă albă.

Probabilitatea ca prima ipoteză (două albe) să fie adevărată, având în vedere că am tras o minge albă:

Probabilitatea ca a doua ipoteză să fie adevărată (una este albă, cealaltă este neagră), cu condiția să desenăm o minge albă:

Probabilitatea ca a treia ipoteză să fie adevărată (două negre), având în vedere că am desenat o minge albă:

Ce face formula lui Bayes? Face posibilă, pe baza probabilităților a priori de ipoteze - P(x 1), P(x 2), P(x 3)– și probabilitățile de apariție a evenimentelor – P(y 1), R(y ​​2)– calculați probabilitățile posterioare ale ipotezelor, de exemplu, probabilitatea primei ipoteze, cu condiția ca o minge albă să fie extrasă – P(x 1|y 1).

Să revenim încă o dată la formula (1). Probabilitatea inițială a primei ipoteze a fost P(x 1) = 1/3. Cu probabilitate P(y 1) = 1/2 am putea trage o minge albă, și cu probabilitate P(y 2) = 1/2- negru. L-am scos pe cel alb. Probabilitatea de a desena alb, cu condiția ca prima ipoteză să fie adevărată P(y 1|x 1) = 1. Formula lui Bayes spune că, de când a fost desenat albul, probabilitatea primei ipoteze a crescut la 2/3, probabilitatea celei de-a doua ipoteze este încă 1/3, iar probabilitatea celei de-a treia ipoteze a devenit zero.

Este ușor să verificăm că dacă am scoate o bilă neagră, probabilitățile posterioare s-ar schimba simetric: P(x 1|y 2) = 0, P(x 2|y 2) = 1/3, P(x 3|y 2) = 2/3.

Iată ce a scris Pierre Simon Laplace despre formula lui Bayes într-o lucrare publicată în 1814:

Acesta este principiul de bază al acelei ramuri a analizei de contingență care se ocupă de tranzițiile de la evenimente la cauze.

De ce este atât de greu de înțeles formula lui Bayes!? După părerea mea, pentru că abordarea noastră obișnuită este raționamentul de la cauze la efecte. De exemplu, dacă într-o urnă există 36 de bile, dintre care 6 sunt negre, iar restul sunt albe. Care este probabilitatea de a extrage o minge albă? Formula lui Bayes vă permite să treceți de la evenimente la motive (ipoteze). Dacă am avut trei ipoteze și a avut loc un eveniment, cum a afectat acel eveniment (și nu alternativa) probabilitățile inițiale ale ipotezelor? Cum s-au schimbat aceste probabilități?

Cred că formula lui Bayes nu este doar despre probabilități. Schimbă paradigma percepției. Care este procesul de gândire când se folosește paradigma deterministă? Dacă a avut loc un eveniment, care a fost cauza lui? Dacă a fost un accident, urgență, conflict militar. Cine sau ce a fost vina lor? Ce crede un observator bayesian? Care este structura realității la care a condus dat caz la cutare şi cutare manifestare... Bayesianul înţelege că în in caz contrarÎn acest caz, rezultatul ar fi putut fi diferit...

Să plasăm simbolurile în formulele (1) și (2) puțin diferit:

Să vorbim din nou despre ceea ce vedem. Cu probabilitate inițială (a priori) egală, una dintre cele trei ipoteze ar putea fi adevărată. Cu aceeași probabilitate am putea trage o minge albă sau neagră. L-am scos pe cel alb. În lumina acestor noi informații suplimentare, evaluarea noastră a ipotezelor ar trebui reconsiderată. Formula lui Bayes ne permite să facem acest lucru numeric. Probabilitatea anterioară a primei ipoteze (formula 7) a fost P(x 1), s-a tras o minge albă, probabilitatea posterioară a primei ipoteze a devenit P(x 1|la 1). Aceste probabilități diferă printr-un factor.

Eveniment la 1 numită dovezi care confirmă sau infirmă mai mult sau mai puțin o ipoteză x 1. Acest coeficient este uneori numit puterea probei. Cu cât dovezile sunt mai puternice (cu cât coeficientul diferă mai mult de unitate), cu atât este mai mare faptul de observare la 1 modifică probabilitatea anterioară, cu atât probabilitatea posterioară diferă de cea anterioară. Dacă dovezile sunt slabe (coeficientul ~1), probabilitatea posterioară este aproape egală cu cea anterioară.

Certificat la 1 V = 2 ori a schimbat probabilitatea anterioară a ipotezei x 1(formula 4). În același timp, dovezi la 1 nu a modificat probabilitatea ipotezei x 2, din moment ce puterea sa = 1 (formula 5).

În general, formula Bayes are următoarea formă:

X– o variabilă aleatorie (un set de ipoteze care se exclud reciproc) luând următoarele valori: x 1, x 2, … , Xn. la– o variabilă aleatoare (un set de evenimente care se exclud reciproc) luând următoarele valori: la 1, la 2, … , lan. Formula lui Bayes vă permite să găsiți probabilitatea posterioară a unei ipoteze Xi la producerea unui eveniment y j. Numătorul este produsul probabilității anterioare a ipotezei XiP(xi) cu privire la probabilitatea producerii unui eveniment y j, dacă ipoteza este adevărată XiR(y j|xi). Numitorul este suma produselor aceluiași ca la numărător, dar pentru toate ipotezele. Dacă calculăm numitorul, obținem probabilitatea totală a producerii evenimentului laj(dacă oricare dintre ipoteze este adevărată) - R(y j) (ca în formulele 1–3).

Încă o dată despre mărturie. Eveniment y j oferă informații suplimentare, care vă permit să revizuiți probabilitatea anterioară a ipotezei Xi. Puterea probei - – conține în numărător probabilitatea producerii evenimentului y j, dacă ipoteza este adevărată Xi. Numitorul este probabilitatea totală a producerii evenimentului. laj(sau probabilitatea ca un eveniment să se producă laj media pentru toate ipotezele). laj mai sus pentru ipoteză Xi, decât media pentru toate ipotezele, atunci dovezile joacă în mâinile ipotezei Xi, crescându-i probabilitatea posterioară R(y j|xi). Dacă probabilitatea producerii unui eveniment laj mai jos pentru ipoteză Xi decât media pentru toate ipotezele, atunci dovezile scade probabilitatea posterioară R(y j|xi) Pentru ipoteze Xi. Dacă probabilitatea producerii unui eveniment laj pentru o ipoteză Xi este aceeași cu media pentru toate ipotezele, atunci dovezile nu modifică probabilitatea posterioară R(y j|xi) Pentru ipoteze Xi.

Iată câteva exemple care sper că vă vor întări înțelegerea formulei lui Bayes.

Problema 2. Doi trăgători trag în mod independent în aceeași țintă, fiecare trăgând o lovitură. Probabilitatea de a lovi ținta pentru primul trăgător este de 0,8, pentru al doilea - 0,4. După împușcare, a fost găsită o gaură în țintă. Găsiți probabilitatea ca această gaură să aparțină primului trăgător. .

Sarcina 3. Obiectul monitorizat poate fi în una din două stări: H 1 = (funcționează) și H 2 = (nu funcționează). Probabilitățile anterioare ale acestor stări sunt P(H 1) = 0,7, P(H 2) = 0,3. Există două surse de informații care oferă informații contradictorii despre starea obiectului; prima sursă raportează că obiectul nu funcționează, a doua - că funcționează. Se știe că prima sursă oferă informații corecte cu o probabilitate de 0,9, iar cu o probabilitate de 0,1 - informații incorecte. A doua sursă este mai puțin fiabilă: oferă informații corecte cu o probabilitate de 0,7 și informații incorecte cu o probabilitate de 0,3. Aflați probabilitățile posterioare ale ipotezelor. .

Problemele 1–3 sunt preluate din manualul lui E.S. Ventzel, L.A. Ovcharov. Teoria probabilității și aplicațiile sale de inginerie, secțiunea 2.6 Teorema ipotezei (formula Bayes).

Problema 4 preluată din carte, secțiunea 4.3 Teorema lui Bayes.

TEHNOLOGIA INFORMAȚIEI, INFORMATICĂ ȘI MANAGEMENT

Despre aplicabilitatea formulei lui Bayes

DOI 10.12737/16076

A. I. Dolgov **

1Societate pe acțiuni „Biroul de proiectare pentru monitorizarea radio a sistemelor de control, navigație și comunicații”, Rostov-pe-Don, Federația Rusă

Despre aplicabilitatea formulei Bayes*** A. I. Dolgov1**

1 „Biroul de proiectare pentru monitorizarea sistemelor de control, navigație și comunicații” SA, Rostov-on-Don, Federația Rusă

Subiectul acestui studiu este formula Bayes. Scopul acestei lucrări este de a analiza și extinde domeniul de aplicare al formulei. Sarcina principală este de a studia publicațiile dedicate acestei probleme, ceea ce a făcut posibilă identificarea deficiențelor în utilizarea formulei Bayes, ducând la rezultate incorecte. Următoarea sarcină este de a construi modificări ale formulei Bayes care să ia în considerare diverse probe individuale și să obțină rezultate corecte. Și, în final, folosind exemplul de date sursă specifice, rezultatele incorecte obținute folosind formula Bayes sunt comparate cu rezultatele corecte calculate folosind modificările propuse. Pentru realizarea studiului au fost utilizate două metode. În primul rând, a fost efectuată o analiză a principiilor de construire a expresiilor cunoscute utilizate pentru a scrie formula Bayes și a modificărilor acesteia. În al doilea rând, a fost efectuată o evaluare comparativă a rezultatelor (inclusiv cantitative). Modificările propuse asigură o aplicare mai largă a formulei Bayes în teorie și practică, inclusiv în rezolvarea problemelor aplicate.

Cuvinte cheie: probabilități condiționate, ipoteze inconsistente, dovezi compatibile și incompatibile, normalizare.

Formula Bayes" este subiectul cercetării. Obiectivul muncii este de a analiza aplicarea formulei și de a lărgi domeniul de aplicabilitate a acesteia. Problema de primă prioritate include identificarea dezavantajelor formulei Bayes pe baza studiului publicațiilor relevante care conduc la incorecte rezultate. Următoarea sarcină este de a construi modificările formulei Bayes" pentru a oferi o contabilitate a diferitelor indicații unice pentru a obține rezultate corecte. Și, în final, rezultatele incorecte obținute prin aplicarea formulei Bayes" sunt comparate cu rezultatele corecte calculate cu utilizarea modificări de formulă propuse prin exemplul datelor inițiale specifice. În studii sunt utilizate două metode. În primul rând, se efectuează analiza principiilor de construire a expresiilor cunoscute utilizate pentru a înregistra formula bayesiană și modificările acesteia. În al doilea rând, se realizează o evaluare comparativă a rezultatelor (inclusiv cea cantitativă). Modificările propuse oferă o aplicare mai largă a formulei Bayes atât în ​​teorie, cât și în practică, inclusiv în soluționarea problemelor aplicate.

Cuvinte cheie: probabilități condiționate, ipoteze inconsistente, indicații compatibile și incompatibile, normalizare.

Introducere. Formula lui Bayes este din ce în ce mai utilizată în teorie și practică, inclusiv în rezolvarea problemelor aplicate folosind tehnologia computerizată. Utilizarea procedurilor de calcul independente reciproc face posibilă utilizarea acestei formule în mod deosebit de eficient la rezolvarea problemelor pe sisteme de calcul multiprocesor, deoarece în acest caz implementarea paralelă se realizează la nivelul circuitului general și la adăugarea următorului algoritm sau clasă de probleme. nu este nevoie să reluciți paralelizarea.

Subiectul acestui studiu este aplicabilitatea formulei lui Bayes pentru evaluarea comparativă a probabilităților condiționale posterioare ale ipotezelor inconsistente în baza diferitelor probe unice. După cum arată analiza, în astfel de cazuri probabilitățile normalizate de evenimente combinate incompatibile aparțin

S X<и ч и

ESTE eö ȘI ESTE X X<и H

„Lucrarea a fost realizată ca parte a unui proiect de cercetare de inițiativă.

**E-mail: [email protected]

„Cercetarea se face în cadrul cercetării și dezvoltării independente.

corespunzând diferitelor grupuri complete de evenimente. În același timp, rezultatele comparate se dovedesc a fi inadecvate cu datele statistice reale. Acest lucru se datorează următorilor factori:

Se utilizează normalizarea incorectă;

Nu se ia în considerare prezența sau absența intersecțiilor probelor luate în considerare.

Pentru a elimina neajunsurile identificate, sunt identificate cazuri de aplicabilitate a formulei Bayes. Dacă formula specificată nu este aplicabilă, se rezolvă problema construcției modificării acesteia, asigurându-se că sunt luate în considerare diferite probe unice și se obțin rezultate corecte. Folosind date inițiale specifice ca exemplu, a fost efectuată o evaluare comparativă a rezultatelor:

Incorect - obtinut folosind formula Bayes;

Corect - calculat folosind modificarea propusă.

Dispoziții inițiale. Declarațiile de mai jos se vor baza pe principiul păstrării ratelor de probabilitate: „Prelucrarea corectă a probabilităților de evenimente este fezabilă numai cu normalizarea folosind un divizor de normalizare comun, care asigură că rapoartele probabilităților normalizate sunt egale cu rapoartele probabilităților normalizate corespunzătoare. .” Acest principiu reprezintă baza subiectivă a teoriei probabilităților, dar nu este reflectat corespunzător în literatura educațională și științifico-tehnică modernă.

Dacă acest principiu este încălcat, informațiile despre gradul de posibilitate a evenimentelor luate în considerare sunt distorsionate. Rezultatele și deciziile luate pe baza informațiilor distorsionate se dovedesc a fi inadecvate pentru datele statistice reale.

Acest articol va folosi următoarele concepte:

Un eveniment elementar este un eveniment care nu este divizibil în elemente;

Eveniment combinat - un eveniment reprezentând una sau alta combinație de evenimente elementare;

Evenimentele compatibile sunt evenimente care în unele cazuri de evaluare comparativă a probabilităților lor pot fi incompatibile, iar în alte cazuri compatibile;

Evenimentele incompatibile sunt evenimente care sunt incompatibile în toate cazurile.

Conform teoremei înmulțirii probabilităților, probabilitatea P (I ^E) a produsului evenimentelor elementare I ^ și

E se calculează ca produsul probabilităților P(Ik E) = P(E)P(I^E) . În acest sens, formula Bayes este adesea

se scrie sub forma P(Ik\E) =--- , descriind definiția probabilităților condiționale posterioare

P(I^E) ipotezele Ik (k = 1,...n) bazate pe normalizarea probabilităților a priori P(I^E) a evenimentelor incompatibile combinate I la E luate în considerare. Fiecare dintre astfel de evenimente reprezintă o produs ai cărui factori sunt una dintre ipotezele luate în considerare și o dovadă luată în considerare. În același timp, luăm în considerare totul

evenimentele posibile IKE (k = 1,...n) formează un grup complet IKE de evenimente combinate incompatibile, datorită

cu care probabilitățile lor P(Ik E) ar trebui normalizate ținând cont de formula probabilității totale, conform căreia

roi P(E) = 2 P(Ik)P(E\Ik). Prin urmare, formula Bayes este cel mai adesea scrisă în forma cea mai frecvent utilizată:

R(Ik) R(EIk)

P(Ik\E) = -. (1)

^ cation al formulei lui Bayes.

Analiza caracteristicilor construcției formulei Bayes care vizează rezolvarea problemelor aplicate, precum și exemple

„iar aplicarea sa practică ne permite să tragem o concluzie importantă cu privire la alegerea unui grup complet de evenimente combinate comparate în funcție de gradul de posibilitate (fiecare dintre acestea fiind produsul a două evenimente elementare - una dintre ipotezele și dovezile luate în considerare). cont). O astfel de alegere este făcută subiectiv de către decident, pe baza datelor de intrare obiective inerente condițiilor situaționale tipice: tipurile și numărul de ipoteze evaluate și dovezile luate în considerare în mod specific.

Probabilități necomparabile ale ipotezelor date fiind o singură dovadă inconsistentă. Formula lui Bayes este folosită în mod tradițional în cazul determinării probabilităților condiționate a posteriori care nu sunt comparabile ca grad de posibilitate.

probabilităţile ipotezelor H^ date fiind o singură dovadă incompatibilă, fiecare dintre acestea putând „apărea

numai în combinație cu oricare dintre aceste ipoteze.” În acest caz, sunt selectate grupuri complete și HkE, combinate

evenimente scăldate sub formă de produse, ai căror factori sunt unul dintre dovezi c. (1=1,...,t) și unul

din n ipoteze luate în considerare.

Formula lui Bayes este utilizată pentru o evaluare comparativă a probabilităților de evenimente combinate ale fiecărui astfel de grup complet, care diferă de alte grupuri complete nu numai prin dovezile e luate în considerare, ci și în cazul general prin tipurile de ipoteze H ^ și (sau) numărul lor n (vezi, de exemplu,)

RNkY = P(Hk) P(eH)

% Р(Нк) Р(Эг\Нк) к = 1

În cazul special cu n = 2

RNk\E,~ P(Hk) P(EN)

% Р(Нк) Р(Э,\Н к) к = 1

iar rezultatele obtinute sunt corecte, datorita principiului conservarii rapoartelor de probabilitate:

P(H1E,) _ P(H 1)P(E,\H1) / P(H2) P(E,\H2) = P(H 1) P(E,\H1)

Р(Н 2= % РШ1!) РЭ,\Н0 % ^) РЭ,\Н) "Р(Н 2> 2>"

Subiectivitatea alegerii unui grup complet de evenimente combinate în comparație cu gradul de posibilitate (cu

unul sau altul modificat de evenimente elementare) vă permite să selectați un grup complet de evenimente și Hk E ■ cu

negația evenimentului elementar E ■ () și scrieți formula lui Bayes (1 = 1,...,t) după cum urmează:

P(Hk\E) -=-RNSh±.

% P(Hk)P(E,Hk)

Această formulă este, de asemenea, aplicabilă și face posibilă obținerea de rezultate corecte dacă este calculată

probabilitățile normalizate sunt comparate în baza diferitelor ipoteze luate în considerare, dar nu în baza unor dovezi diferite.

treburile. ¡^

Probabilități comparabile de ipoteze în baza unei singure dovezi inconsistente. Judecând după publicațiile cunoscute

este utilizat pentru evaluarea comparativă a probabilităților condiționale posterioare ale ipotezelor pentru diferite probe unice.

treburile. În același timp, nu se acordă atenție următorului fapt. În aceste cazuri, se compară probabilitățile ^ normalizate de evenimente combinate incompatibile (incompatibile) aparținând diferitelor grupuri complete de n evenimente. Cu toate acestea, în acest caz, formula Bayes nu este aplicabilă, deoarece evenimentele combinate care nu sunt incluse într-un grup complet sunt comparate, a căror normalizare a probabilităților se realizează folosind diferiți n divizori de normalizare. Probabilitățile normalizate ale evenimentelor combinate incompatibile (incompatibile) pot fi comparate numai dacă aparțin aceluiași grup complet de evenimente și sunt normalizate ¡3 folosind un divizor comun egal cu suma probabilităților tuturor evenimentelor normalizate incluse în § complet.

În general, următoarele pot fi considerate dovezi incompatibile:

Două probe (de exemplu, dovezile și negarea acesteia); ^

Trei dovezi (de exemplu, într-o situație de joc există un câștig, o înfrângere și un egal); ^

Patru certificate (în special, în sport, victorie, înfrângere, egalitate și reluare), etc. ^

Să luăm în considerare un exemplu destul de simplu (corespunzător exemplului dat în) de utilizare a formulei Bayes ^ pentru a determina probabilitățile condiționale posterioare ale ipotezei H ^ pentru două evenimente incompatibile în

sub formă de probe L]- și negarea acesteia L]

P(H,k) - ^ . ^ P(A^k", (2)

] E R(Hk> R(A]\vk> k - 1

■ _ P(HkA ]) P(Hk> P(A ]\nc>

P(H,\A,) ----k-]-. (3)

V k\L]> P(A> p

] E R(Hk) R(A]\Hk) până la -1

În cazurile (2) și (3), grupuri complete selectate subiectiv comparate în funcție de gradul de posibilitate de com-

evenimentele grupate sunt, respectiv, seturile și H la A și și H la A. Acesta este cazul când formula

k-1 k ] k-1 k ]

Bayes nu este aplicabil, deoarece principiul conservării rapoartelor de probabilitate este încălcat - egalitatea rapoartelor probabilităților normalizate cu rapoartele probabilităților normalizate corespunzătoare nu este respectată:

P(N la A]] P(Nk) P(A]\Nk) / P(Nk) P(A]\Nk) P(Nk) P(A] Nk)

P(Nk E P(Nk) P(A]\Nk)/ E P(Nk) P(A]\Nk) P(Nk) P(A] Nk)

k - 1 /k - 1 Conform principiului păstrării rapoartelor de probabilitate, procesarea corectă a probabilităților de evenimente este posibilă numai atunci când se normalizează folosind un divizor de normalizare comun egal cu suma tuturor expresiilor normalizate comparate. De aceea

E R(Hk)R(A]\Hk) + E R(Hk)R(A]\Hk) - E R(Hk)[P(A]\Hk) + P(Hk) P(A]\Hk )] - EP(Hk) - 1 până la -1 până la -1 până la -1 până la -1

Astfel, se relevă faptul că există varietăți de formula lui Bayes care diferă de

cunoscut pentru absența unui divizor de normalizare:

А,) - Р(Н) Р(А]\Нк), Р(Нк А,) - Р(Н) Р(А, Нк). (4)

J la I ■> la

În acest caz, se observă egalitatea rapoartelor probabilităților normalizate cu rapoartele probabilităților normalizate corespunzătoare:

t^A^ P(Hk) P(A]\Hk)

A,) R(N k) R(A,Hk)

Pe baza alegerii subiective a grupurilor complete înregistrate neconvențional de evenimente combinate incompatibile, este posibil să se mărească numărul de modificări ale formulei Bayes, inclusiv dovezi, precum și un anumit număr de negații ale acestora. De exemplu, cel mai complet grup de evenimente combinate

și și Hk /"./ ^ și și Hk Yo\ corespunde (ținând cont de absența unui divizor de normalizare) modificării formulei; =1 A"=1 ; =1 Bayesian ly

Р(Нк\~) - Р(Н к) ПЁ^^^

unde un eveniment elementar sub forma probei E\ e II II / "/ este unul dintre elementele multiplicității specificate

o În absența negărilor de probe, adică atunci când Ё\ = // e și /"./,

^ P(H\E) P(Hk) P(E,\Hk)

E R(Hk) R(E\Hk) k - 1

Astfel, o modificare a formulei lui Bayes, menită să determine probabilitățile condiționate ale ipotezelor comparabile ca grad de posibilitate sub o singură dovadă incompatibilă, arată după cum urmează. Numătorul conține probabilitatea normalizată a unuia dintre evenimentele incompatibile combinate care formează un grup complet, exprimată ca produs al probabilităților a priori, iar numitorul conține suma tuturor

probabilități normalizate. În acest caz, se respectă principiul menținerii ratelor de probabilitate - iar rezultatul obținut este corect.

Probabilități de ipoteze având o singură dovadă consistentă. Formulele lui Bayes sunt utilizate în mod tradițional pentru a determina probabilități condiționale posterioare comparabile ale ipotezelor Hk (k = 1,...,n) având în vedere una dintre mai multe dovezi considerate compatibile EL (1 = 1,...,m). În special (vezi

de exemplu, și ), atunci când se determină probabilitățile condiționale posterioare P(H 1E^) și P(H 1 E2) pentru fiecare dintre cele două dovezi compatibile E1 și E2, se folosesc formule de forma:

P(H 1) PE\H1) P(Hj) P(E2Hj) P(H J E1) = --1- și P(H J E 2) =--1-. (5)

I P(Hk) PE\Hk) I P(Hk) P(E2 Hk)

k = 1 k = 1 Vă rugăm să rețineți că acesta este un alt caz în care formula lui Bayes nu este aplicabilă. Mai mult, în acest caz trebuie eliminate două neajunsuri:

Normalizarea ilustrată a probabilităților evenimentelor combinate este incorectă, datorită faptului că evenimentele luate în considerare aparțin unor grupuri complete diferite;

Înregistrările simbolice ale evenimentelor combinate HkEx și HkE2 nu reflectă faptul că dovezile luate în considerare E x și E 2 sunt compatibile.

Pentru a elimina ultimul dezavantaj, poate fi utilizată o înregistrare mai detaliată a evenimentelor combinate, ținând cont de faptul că dovezile compatibile E1 și E2 în unele cazuri pot fi incompatibile, iar în altele compatibile:

HkE1 = HkE1 E2 și HkE2 = HkE 1E2+HkE1 E2, unde E1 și E 2 sunt dovezi contrare E1 și E 2.

Evident, în astfel de cazuri produsul evenimentelor Hk E1E2 este luat în considerare de două ori. În plus, ar putea fi luată în considerare din nou separat, dar acest lucru nu se întâmplă. Cert este că în situația luată în considerare, situația evaluată este influențată de trei evenimente combinate probabile incompatibile: HkE1E2, HkE 1E2 și

Hk E1E2. În același timp, decidentul este interesat doar să evalueze gradul de posibilitate

două evenimente combinate incompatibile: HkE1 E2 și HkE 1E2, ceea ce corespunde luării în considerare doar a g

certificate unice. ¡Ts

Astfel, la construirea unei modificări a formulei Bayes pentru determinarea valorilor condiționale a posteriori,

Probabilitățile ipotezelor cu o singură dovadă compatibilă trebuie să se bazeze pe următoarele. Persoana care a acceptat- ^

luarea unei decizii, este interesat de ce fel de eveniment elementar reprezentat de cutare sau cutare dovezi din

numerele luate în considerare s-au produs efectiv în condiții specifice. Dacă un alt eveniment elementar are loc în K

forma unui singur certificat, este necesară o revizuire a deciziei pe baza rezultatelor unei evaluări comparative

probabilități condiționale posterioare ale ipotezelor cu luarea în considerare indispensabilă a altor condiții care afectează totalul real

instalare 3

Să introducem următoarea notație: HkE- pentru una (și doar una) co-^ combinată incompatibilă

existență, constând în faptul că din m > 1 evenimente elementare Ei (i = 1,...,m) luate în considerare, împreună cu ipoteza „

Hk a avut loc un eveniment elementar Ex și nu au avut loc alte evenimente elementare. se"

În cel mai simplu caz, sunt luate în considerare două probe unice incompatibile. Dacă se confirmă

unul dintre ele este de așteptat, probabilitatea condiționată a dovezilor în formă generală este exprimată prin formula l

P(Hk E-) = P(Ei\Hk) -P(EjE^Hk) = P(Ei\Hk) -P(M^Hk)P(M^Hk) , i = 1, -2 (6) g

Valabilitatea formulei poate fi văzută clar (Fig. 1).

Orez. 1. Interpretarea geometrică a calculului P(Hk E-) pentru / = 1,...,2 Cu dovezi independente condiționat

P(K1K2\Hk) = p(E\Hk)P(E2\Hk),

prin urmare, ținând cont de (6)

P(Hk E-) = PE Nk) - P(E1 Nk) P(E21Hk), = 1,.,2. (7)

În mod similar, probabilitatea P(HkE-) a unuia dintre cele trei (/ = 1,...,3) evenimente incompatibile HkE^ este exprimată prin formula

De exemplu, când i = 1:

p(HkEl) = P(Ei\Hk)-[ S P(Ei\Hk)P(Ej\Hk) ] + P(EiE2E3Hk)

p(HkE-) = P(E7|Hk)- P(E]E^Hk)- P(E7EjHk) + P(E]E2E3\Hk)

Valabilitatea acestei formule este confirmată clar de interpretarea geometrică prezentată în

Orez. 2. Interpretarea geometrică a calculului P(Hk E-) pentru / = 1,...,3

Folosind metoda inducției matematice, se poate demonstra formula generală pentru probabilitatea P(Hk E-) pentru orice cantitate de dovezi e, 0=1,...,t):

P(HkE-) = P(E,Hk)- t RE\Hk) P(E]\Hk) + 1 P(E\Hk) P(E]\Hk) P(E^Hk) +■■■ + (-1)

] = 1(] * 0 ],1 * 1

Folosind teorema înmulțirii probabilităților, scriem probabilitatea condiționată P(HkE~-) în două forme:

^ din care rezultă că

P(Hk E -) = P(H k) P(E-|Hk) = P(E-) P(Hk)

E-)= P(HkE-) "" P(E-)

Folosind formula probabilității totale P(Ei) = S P(H£) P(Ei Hk) rezultă că

E-) = P(HkET)

2 P(HkE-) k = 1

Înlocuind expresii pentru P(HkE-) sub forma părții drepte a lui (8) în formula rezultată, obținem forma finală a formulei pentru determinarea probabilităților condiționale posterioare ale ipotezelor H^ (k = 1,... ,n) pentru una dintre mai multe probe unice considerate incompatibile : (E^\Hk)

P(Nk)[P(E,\Nk) - 2 P(E,\Nk) P(Er k) +...+ (-1)t-1 P(P P(Erk)] P(N, E ~) =-] = 1(] * ■----(9)

la 1 p t t t

2 P(N k) 2 [P(E,\N k) - 2 P(EgHk) P(E^Hk) + ...+ (-1)m-1 P(P P (Ep k)]

k=1 , = 1 ) = 1() *,) ■! =1

Evaluări comparative. Sunt luate în considerare exemple destul de simple, dar ilustrative, limitate la analiza probabilităților condiționale posterioare calculate pentru una dintre cele două ipoteze având în vedere două probe unice. 1. Probabilități de ipoteze date inconsistente probe individuale. Să comparăm rezultatele obținute folosind formulele Bayes (2) și (3), folosind exemplul a două dovezi L. = L și L. = L cu datele inițiale:

Р(Н1 = 0,7; Р(Н2) = 0,3; Р(Л| Н^ = 0,1; Р(Л\н 1) = 0,9; Р(Л\Н2) = 0,6; P(A\H2) = 0,4. În exemplele considerate cu ipoteza H1, formulele tradiționale (2) și (3) conduc la următoarele rezultate:

R(N.) R(A\Nr 0 07

P(N, L) =-- 11 = - = 0,28,

2 Р(Н к) Р(А\Нк) к = 1

R(N L R(A\N 1) 0 63

P(N, L) =-- 11 = - = 0,84,

2 Р(Нк) Р(А\Нк) к = 1

formând divize P(H 1 A) = P(H^ P(L\Hp = 0.07; P(H^ A) = P(H1) P(l|H^ = 0.63. 1acțiuni ale formulelor propuse privind:

R<Н)Р(АНА-Р(А|Н1) _ 0,07

iar cu formulele propuse (4), care nu au divizori normalizatori: „și

Astfel, în cazul aplicării formulelor propuse, raportul probabilităților normalizate este egal cu raportul probabilităților normalizate: K

gt f P(N 1) P(A\N 1) A11 |

Când se utilizează formule cunoscute cu același raport -;-=-= 0,11 veron normalizat

Р(Н 1) Р(А\Н 1) «§

probabilitățile indicate în numărători, raportul dintre probabilitățile normalizate rezultate: 2

Р(Н 1) Р(А\Н 1) Р(А\Н 1) 0,63

P(N1L) = 0,28 P(N1L) = 0,84

Adică, principiul păstrării ratelor de probabilitate nu este respectat și se obțin rezultate incorecte. În același timp £

în cazul utilizării formulelor cunoscute, valoarea abaterii relative a raportului (11) dintre probabilitățile condiționale posterioare ale ipotezelor de la rezultatele corecte (10) se dovedește a fi foarte semnificativă, deoarece se ridică la

°.33 - °.P x 100 = 242%.. I

2. Probabilitățile ipotezelor date fiind probe individuale compatibile. Să comparăm rezultatele obținute folosind formulele Bayes (5) și modificarea corectă construită (9), folosind următoarele date inițiale: ^

P(H1 = 0,7; P(H2) = 0,3; P(E1H1) = 0,4; P(E2H1) = 0,8; P(E1\H2) = 0,7; P(E^ H2) = 0,2,113

În exemplele considerate cu ipoteza H 2 în cazul utilizării formulelor tradiționale (5):

P(H2) P(E1 H2) Q, 21

P(H 2 E1) = -2-!-2- = - = Q,429,

I p(Hk) p(El Hk) k = 1

P(H2) P(E2H2) Q,Q6

P(H2E2) = -2-- = - = 0,097.

I P(Hk) P(E 2 Hk) k = 1

În cazul aplicării formulei propuse (9) luând în considerare (7) P(H

P(H2) 0,168

E.) ----- 0,291,

Z P(Hk) Z "

P(H2) 0,018

E0) ----- 0,031.

Z P(Hk) Z k - 1 i - 1

Atunci când se utilizează formulele corecte propuse, datorită acelorași numitori, raportul P(H2) -

Probabilitățile normalizate indicate în numărători sunt egale cu raportul

P(H2)

probabilități normalizate:

Adică se respectă principiul conservării rapoartelor de probabilitate.

Totuși, în cazul utilizării formulelor cunoscute cu raportul probabilităților normalizate indicate în numărători

P(H 2) P(E1\H 2) _ 0,21 _3 5 P(H 2)P(E 2 H 2) 0,06,

raportul probabilităților normalizate:

P(H2 = 0,429 = 4,423. (13)

P(H2\e2) 0,097

Adică, principiul menținerii ratelor de probabilitate, ca și înainte, nu este respectat. Mai mult decât atât, în cazul utilizării formulelor cunoscute, valoarea abaterii relative a raportului (13) a probabilităților condiționale posterioare ale ipotezelor de la rezultatele corecte (12) se dovedește, de asemenea, a fi foarte semnificativă:

9,387 4,423 x 100 = 52,9%.

Concluzie. Analiza construcției relațiilor de formule specifice care implementează formula Bayes și modificările acesteia propuse pentru rezolvarea problemelor practice ne permite să enunțăm următoarele. Grupul complet de evenimente combinate comparabile poate fi selectat subiectiv de către decident. Această alegere se bazează pe datele inițiale obiective luate în considerare caracteristice unui cadru tipic (tipuri specifice și număr de evenimente elementare - ipoteze și dovezi evaluate). De interes practic este alegerea subiectivă a altor opțiuni pentru grupul complet comparat din punct de vedere al gradului de posibilitate.

itatea evenimentelor combinate - asigurând astfel o varietate semnificativă de relații de formule atunci când se construiesc variante netradiționale de modificări ale formulei Bayes. Aceasta, la rândul său, poate fi baza pentru îmbunătățirea suportului matematic al implementării software, precum și extinderea domeniului de aplicare a noilor relații cu formule pentru rezolvarea problemelor aplicate.

Bibliografie

1. Gnedenko, B. V. O introducere elementară în teoria probabilității / B. V. Gnedenko, A. Ya. Khinchin. - 114 New York: Dover Publications, 1962. - 144 r.

2. Ventzel, E. S. Teoria probabilității / E. S. Ventzel. - Ed. a X-a, șters. - Moscova: Şcoala superioară, 2006. - 575 p.

3. Andronov. A. M., Teoria probabilității și statistică matematică / A. M. Andronov, E. A. Kopytov, L. Ya. Gringlaz. - Sankt Petersburg: Peter, 2004. - 481 p.

4. Zmitrovich, A. I. Sisteme informatice inteligente / A. I. Zmitrovich. - Minsk: TetraSystems, 1997. - 496 p.

5. Chernorutsky, I. G. Metode decizionale / I. G. Chernorutsky. - Sankt Petersburg: BHV-Petersburg, 2005. - 416 p.

6. Naylor, C.-M. Construiește-ți propriul sistem expert / C.-M. Naylor. - Chichester: John Wiley & Sons, 1987. - 289 p.

7. Romanov, V. P. Sisteme informatice inteligente în economie / V. P. Romanov. - Ed. a II-a, șters.

Moscova: Examen, 2007. - 496 p.

8. Eficiență economică și competitivitate / D. Yu. Muromtsev [et al.]. - Tambov: Editura Tamb. stat tehnologie. Universitatea, 2007.- 96 p.

9. Dolgov, A. I. Modificări corecte ale formulei Bayes pentru programarea paralelă / A. I. Dolgov // Tehnologii de supercomputer: materiale ale a treia All-Russian. științific-tehnic conf. - Rostov-pe-Don. - 2014.- T. 1 - P. 122-126.

10. Dolgov, A. I. Despre corectitudinea modificărilor formulei Bayes / A. I. Dolgov // Vestnik Don. stat tehnologie. un-ta.

2014. - T. 14, nr. 3 (78). - P. 13-20.

1. Gnedenko, B.V., Khinchin, A.Ya. O introducere elementară în teoria probabilității. New York: Dover Publications, 1962, 144 r.

2. Ventsel, E.S. Teoria veroyatnostey. a 10-a ed., reimpr. Moscova: Vysshaya shkola, 2006, 575 p. (in rusa).

3. Andronov, A.M., Kopytov, E.A., Gringlaz, L.Y. Teoria veroyatnostey i matematicheskaya statistika. Sankt Petersburg: Piter, 2004, 481 p. (in rusa).

4. Zmitrovici, A.1. Intellektual"nye informatsionnye systemy. Minsk: TetraSistems, 1997, 496 p. (în rusă).

5. Cernoruțki, I.G. Decizia Metody prinyatiya. Sankt Petersburg: BKhV-Petersburg, 2005, 416 p. (in rusa).

6. Naylor, C.-M. Construiește-ți propriul sistem expert. Chichester: John Wiley & Sons, 1987, 289 p.

7. Romanov, V.P. Intellektual"nye informatsionnye sistemy v ekonomike. Ed. a 2-a, reimpr. Moscova: Ekzamen, 2007, 496 p. (în rusă).

8. Muromtsev, D.Y., et al. Efecte economice" i konkurentosposobnost". Tambov: Izd-vo Tamb. du-te. tehn. un-ta, 2007, 96 p. (in rusa). I.B.

9. Dolgov, A1. Korrektnye modifikatsii formula Bayesa dlya paralel"nogo programrovaniya. Superkomp"yuternye tekhnologii: mat-ly 3-y vseros. nauch-techn. conf. Rostov-pe-Don, 2014, vol. 1, pp. 122-126 (în rusă). ^

10. Dolgov, A1. O korrektnosti modifikatsiy formully Bayesa. ^ Vestnik al DSTU, 2014, vol. 14, nr. 3 (78), pp. 13-20 (în rusă). *

Cine este Bayes? si ce legatura are cu managementul? - poate urma o întrebare complet corectă. Deocamdată, credeți-mă pe cuvânt: asta este foarte important!.. și interesant (cel puțin pentru mine).

Care este paradigma în care operează majoritatea managerilor: dacă observ ceva, ce concluzii pot trage din el? Ce învață Bayes: ce trebuie să fie cu adevărat acolo pentru ca eu să observ acest ceva? Exact așa se dezvoltă toate științele și despre asta scrie (citez din memorie): o persoană care nu are o teorie în cap se va sfii de la o idee la alta sub influența diferitelor evenimente (observații). Nu degeaba spun ei: nu există nimic mai practic decât o teorie bună.

Exemplu din practică. Subordonatul meu greșește, iar colegul meu (șeful altui departament) spune că ar fi necesar să se exercite o influență managerială asupra angajatului neglijent (cu alte cuvinte, pedepsi/cert). Și știu că acest angajat efectuează 4-5 mii de operațiuni de același tip pe lună și în acest timp nu face mai mult de 10 greșeli. Simți diferența în paradigmă? Colega mea reacționează la observație, iar eu știu a priori că angajatul face un anumit număr de greșeli, așa că alta nu a afectat aceste cunoștințe... Acum, dacă la sfârșitul lunii se dovedește că există, de exemplu, 15 astfel de greșeli!.. Acesta va fi deja un motiv pentru a studia motivele nerespectării standardelor.

Sunteți convins de importanța abordării bayesiene? Intrigat? Așa sper". Și acum musca în unguent. Din păcate, ideile bayesiene sunt rareori date imediat. Am avut sincer ghinion, de când am făcut cunoștință cu aceste idei prin literatura populară, după ce am citit că au rămas multe întrebări. Când plănuiam să scriu o notă, am adunat tot ce luam notițe anterior despre Bayes și am studiat, de asemenea, ceea ce a fost scris pe Internet. Vă prezint atenția cea mai bună presupunere a subiectului. Introducere în Probabilitatea Bayesiană.

Derivarea teoremei lui Bayes

Luați în considerare următorul experiment: numim orice număr situat pe segment și înregistrăm când acest număr este, de exemplu, între 0,1 și 0,4 (Fig. 1a). Probabilitatea acestui eveniment este egală cu raportul dintre lungimea segmentului și lungimea totală a segmentului, cu condiția ca apariția numerelor pe segment la fel de probabil. Matematic acest lucru poate fi scris p(0,1 <= X <= 0,4) = 0,3, или кратко R(X) = 0,3, unde R- probabilitate, X– variabilă aleatoare în intervalul , X– variabilă aleatoare în intervalul . Adică, probabilitatea de a atinge segmentul este de 30%.

Orez. 1. Interpretarea grafică a probabilităților

Acum luați în considerare pătratul x (Fig. 1b). Să presupunem că trebuie să numim perechi de numere ( X, y), fiecare dintre ele mai mare decât zero și mai mic decât unu. Probabilitatea ca X(primul număr) va fi în cadrul segmentului (zona albastră 1), egal cu raportul dintre aria zonei albastre și aria întregului pătrat, adică (0,4 – 0,1) * (1 – 0) ) / (1 * 1) = 0, 3, adică același 30%. Probabilitatea ca y situat în interiorul segmentului (zona verde 2) este egal cu raportul dintre aria zonei verzi și aria întregului pătrat p(0,5 <= y <= 0,7) = 0,2, или кратко R(Y) = 0,2.

Ce poți învăța despre valori în același timp? XȘi y. De exemplu, care este probabilitatea ca în același timp XȘi y sunt în segmentele date corespunzătoare? Pentru a face acest lucru, trebuie să calculați raportul dintre aria zonei 3 (intersecția dungilor verzi și albastre) și aria întregului pătrat: p(X, Y) = (0,4 – 0,1) * (0,7 – 0,5) / (1 * 1) = 0,06.

Acum să presupunem că vrem să știm care este probabilitatea y este în intervalul dacă X este deja în gamă. Adică, de fapt, avem un filtru și când numim perechi ( X, y), apoi aruncăm imediat acele perechi care nu îndeplinesc condiția de găsire Xîntr-un interval dat, iar apoi din perechile filtrate numărăm cele pentru care y satisface condiţia noastră şi consideră probabilitatea ca fiind raportul dintre numărul de perechi pentru care y se află în segmentul de mai sus la numărul total de perechi filtrate (adică pentru care X se află în segment). Putem scrie această probabilitate ca p(Y|X la X a lovit gama." Evident, această probabilitate este egală cu raportul dintre zona zonei 3 și zona zonei albastre 1. Zona zonei 3 este (0,4 – 0,1) * (0,7 – 0,5) = 0,06 și zona zonei albastre 1 ( 0,4 – 0,1) * (1 – 0) = 0,3, atunci raportul lor este 0,06 / 0,3 = 0,2. Cu alte cuvinte, probabilitatea de a găsi y pe segmentul cu conditia ca X aparține segmentului p(Y|X) = 0,2.

În paragraful anterior am formulat de fapt identitatea: p(Y|X) = p(X, Y) / p( X). Se scrie: „probabilitate de lovire laîn intervalul , cu condiția ca X atingeți intervalul, egal cu raportul dintre probabilitatea de lovire simultană Xîn gamă și la la interval, la probabilitatea de a lovi Xîn rază”.

Prin analogie, luați în considerare probabilitatea p(X|Y). Numim cupluri ( X, y) și filtrează pe cele pentru care y se situează între 0,5 și 0,7, atunci probabilitatea ca X este în intervalul cu condiţia ca y aparține segmentului este egal cu raportul dintre aria regiunii 3 și aria regiunii verzi 2: p(X|Y) = p(X, Y) / p(Y).

Rețineți că probabilitățile p(X, Y) Și p(Y, X) sunt egale și ambele sunt egale cu raportul dintre aria zonei 3 și aria întregului pătrat, dar probabilitățile p(Y|X) Și p(X|Y) nu este egal; în timp ce probabilitatea p(Y|X) este egal cu raportul dintre aria regiunii 3 și regiunea 1 și p(X|Y) – regiunea 3 la regiunea 2. De asemenea, rețineți că p(X, Y) este adesea notat ca p(X&Y).

Așa că am introdus două definiții: p(Y|X) = p(X, Y) / p( X) Și p(X|Y) = p(X, Y) / p(Y)

Să rescriem aceste egalități sub forma: p(X, Y) = p(Y|X) * p( X) Și p(X, Y) = p(X|Y) * p(Y)

Deoarece laturile stângi sunt egale, laturile drepte sunt egale: p(Y|X) * p( X) = p(X|Y) * p(Y)

Sau putem rescrie ultima egalitate ca:

Aceasta este teorema lui Bayes!

Oare astfel de transformări simple (aproape tautologice) chiar dau naștere unei teoreme grozave!? Nu te grăbi să tragi concluzii. Să vorbim din nou despre ce avem. A existat o anumită probabilitate inițială (a priori). R(X), că variabila aleatoare X distribuite uniform pe segment se încadrează în interval X. A avut loc un eveniment Y, în urma căreia am primit probabilitatea posterioară a aceleiași variabile aleatoare X: R(X|Y), iar această probabilitate diferă de R(X) prin coeficient. Eveniment Y numite dovezi, mai mult sau mai puțin care confirmă sau infirmă X. Acest coeficient este uneori numit puterea probei. Cu cât dovezile sunt mai puternice, cu atât faptul de a observa Y modifică probabilitatea anterioară, cu atât probabilitatea posterioară diferă mai mult de cea anterioară. Dacă dovezile sunt slabe, probabilitatea posterioară este aproape egală cu cea anterioară.

Formula lui Bayes pentru variabile aleatoare discrete

În secțiunea anterioară, am derivat formula lui Bayes pentru variabile aleatoare continue x și y definite pe interval. Să luăm în considerare un exemplu cu variabile aleatoare discrete, fiecare luând două valori posibile. În timpul examinărilor medicale de rutină, s-a constatat că la vârsta de patruzeci de ani, 1% dintre femei suferă de cancer la sân. 80% dintre femeile cu cancer primesc rezultate pozitive la mamografie. 9,6% dintre femeile sănătoase primesc și rezultate pozitive la mamografie. În timpul examinării, o femeie din această grupă de vârstă a primit un rezultat pozitiv la mamografie. Care este probabilitatea ca ea să aibă de fapt cancer la sân?

Linia de raționament/calcul este după cum urmează. Dintre cei 1% dintre bolnavii de cancer, mamografia va da 80% rezultate pozitive = 1% * 80% = 0,8%. Dintre 99% dintre femeile sănătoase, mamografia va da 9,6% rezultate pozitive = 99% * 9,6% = 9,504%. În total 10,304% (9,504% + 0,8%) cu rezultate pozitive la mamografie, doar 0,8% sunt bolnavi, iar restul de 9,504% sunt sănătoși. Astfel, probabilitatea ca o femeie cu o mamografie pozitivă să aibă cancer este de 0,8% / 10,304% = 7,764%. Ai crezut că 80% sau cam asa ceva?

În exemplul nostru, formula Bayes ia următoarea formă:

Să vorbim încă o dată despre sensul „fizic” al acestei formule. X– variabilă aleatoare (diagnostic), luând valori: X 1- bolnav si X 2- sănătos; Y– variabilă aleatoare (rezultatul măsurării – mamografie), luând valori: Y 1- rezultat pozitiv și Y2- rezultat negativ; p(X 1)– probabilitate de îmbolnăvire înainte de mamografie (probabilitate a priori) egală cu 1%; R(Y 1 |X 1 ) – probabilitatea unui rezultat pozitiv dacă pacientul este bolnav (probabilitate condiționată, întrucât trebuie specificată în condițiile sarcinii), egală cu 80%; R(Y 1 |X 2 ) – probabilitatea unui rezultat pozitiv dacă pacientul este sănătos (și probabilitate condiționată) este de 9,6%; p(X 2)– probabilitatea ca pacientul să fie sănătos înainte de mamografie (probabilitate a priori) este de 99%; p(X 1|Y 1 ) – probabilitatea ca pacientul să fie bolnav, având în vedere un rezultat pozitiv al mamografiei (probabilitate posterioară).

Se poate observa că probabilitatea posterioară (ceea ce căutăm) este proporțională cu probabilitatea anterioară (inițială) cu un coeficient puțin mai complex . Lasă-mă să subliniez din nou. În opinia mea, acesta este un aspect fundamental al abordării bayesiene. Măsurare ( Y) a adăugat o anumită cantitate de informații la ceea ce era disponibil inițial (a priori), ceea ce ne-a clarificat cunoștințele despre obiect.

Exemple

Pentru a consolida materialul pe care l-ați acoperit, încercați să rezolvați mai multe probleme.

Exemplul 1. Sunt 3 urne; in prima sunt 3 bile albe si 1 neagra; în al doilea - 2 bile albe și 3 negre; in a treia sunt 3 bile albe. Cineva se apropie de una dintre urne la întâmplare și scoate 1 minge din ea. Această minge s-a dovedit a fi albă. Găsiți probabilitățile posterioare ca mingea să fie extrasă din prima, a doua, a treia urnă.

Soluţie. Avem trei ipoteze: H 1 = (se selectează prima urna), H 2 = (se selectează a doua urnă), H 3 = (se selectează a treia urnă). Deoarece urna este aleasă la întâmplare, probabilitățile a priori ale ipotezelor sunt egale: P(H 1) = P(H 2) = P(H 3) = 1/3.

În urma experimentului a apărut evenimentul A = (din urna selectată a fost extrasă o bilă albă). Probabilități condiționate ale evenimentului A în ipotezele H 1, H 2, H 3: P(A|H 1) = 3/4, P(A|H 2) = 2/5, P(A|H 3) = 1. De exemplu, prima egalitate arată astfel: „probabilitatea de a extrage o minge albă dacă este aleasă prima urna este de 3/4 (deoarece sunt 4 bile în prima urna, iar 3 dintre ele sunt albe).”

Folosind formula lui Bayes, găsim probabilitățile posterioare ale ipotezelor:

Astfel, în lumina informațiilor despre apariția evenimentului A, probabilitățile ipotezelor s-au schimbat: ipoteza H 3 a devenit cea mai probabilă, ipoteza H 2 a devenit cea mai puțin probabilă.

Exemplul 2. Doi trăgători trag în mod independent în aceeași țintă, fiecare trăgând o lovitură. Probabilitatea de a lovi ținta pentru primul trăgător este de 0,8, pentru al doilea - 0,4. După împușcare, a fost găsită o gaură în țintă. Găsiți probabilitatea ca această gaură să aparțină primului trăgător (Rezultatul (ambele găuri au coincis) este aruncat ca fiind puțin probabil).

Soluţie. Înainte de experiment, sunt posibile următoarele ipoteze: H 1 = (nici prima și nici a doua săgeată nu va lovi), H 2 = (ambele săgeți vor lovi), H 3 - (primul trăgător va lovi, dar al doilea nu va lovi). ), H 4 = (primul trăgător nu va lovi, iar al doilea va lovi). Probabilități anterioare ale ipotezelor:

P(H1) = 0,2*0,6 = 0,12; P(H2) = 0,8*0,4 = 0,32; P (H3) = 0,8 * 0,6 = 0,48; P(H4) = 0,2*0,4 = 0,08.

Probabilitățile condiționate ale evenimentului observat A = (există o gaură în țintă) în aceste ipoteze sunt egale: P(A|H 1) = P(A|H 2) = 0; P(A|H3) = P(A|H4) = 1

După experiment, ipotezele H 1 și H 2 devin imposibile, iar probabilitățile posterioare ale ipotezelor H 3 și H 4 conform formulei lui Bayes vor fi:

Bayes împotriva spam-ului

Formula lui Bayes și-a găsit o largă aplicație în dezvoltarea filtrelor de spam. Să presupunem că doriți să instruiți un computer pentru a determina ce e-mailuri sunt spam. Vom continua din dicționar și expresii folosind estimări bayesiene. Să creăm mai întâi un spațiu de ipoteze. Să avem două ipoteze cu privire la orice scrisoare: H A este spam, H B nu este spam, ci o scrisoare normală, necesară.

În primul rând, să „antrenăm” viitorul nostru sistem anti-spam. Să luăm toate literele pe care le avem și să le împărțim în două „grămezi” a câte 10 litere fiecare. Să punem e-mailuri spam într-unul și să-l numim heap H A, în celălalt vom pune corespondența necesară și îl vom numi heap H B. Acum să vedem: ce cuvinte și expresii se găsesc în spam și literele necesare și cu ce frecvență? Vom numi aceste cuvinte și expresii dovezi și le vom desemna E 1 , E 2 ... Se pare că cuvintele utilizate în mod obișnuit (de exemplu, cuvintele „ca”, „al tău”) din grămezi H A și H B apar cu aproximativ aceeasi frecventa. Astfel, prezența acestor cuvinte într-o scrisoare nu ne spune nimic despre care grămadă să o atribuim (dovezi slabe). Să atribuim acestor cuvinte un scor neutru de probabilitate „spam”, să spunem 0,5.

Lăsați expresia „engleză vorbită” să apară în doar 10 litere și mai des în scrisorile spam (de exemplu, în 7 litere spam din toate cele 10) decât în ​​cele necesare (în 3 din 10). Să dăm acestei fraze o evaluare mai mare pentru spam: 7/10 și o evaluare mai mică pentru e-mailurile normale: 3/10. În schimb, s-a dovedit că cuvântul „buddy” a apărut mai des în litere normale (6 din 10). Și apoi am primit o scrisoare scurtă: "Prietenul meu! Cum îți vorbești engleza?”. Să încercăm să-i evaluăm „spamitatea”. Vom oferi estimări generale P(H A), P(H B) ale unei litere care aparțin fiecărei grămezi folosind o formulă Bayes oarecum simplificată și estimările noastre aproximative:

P(H A) = A/(A+B), Unde A = p a1 *p a2 *…*p an , B = p b1 *p b2 *…*p b n = (1 – p a1)*(1 – p a2)*… *(1 – p an).

Tabelul 1. Estimarea Bayes simplificată (și incompletă) a scrierii.

Astfel, scrisoarea noastră ipotetică a primit un scor de probabilitate de apartenență cu accent pe „spam”. Putem decide să aruncăm scrisoarea într-una dintre grămezi? Să stabilim praguri de decizie:

  • Vom presupune că litera aparține mormanului H i dacă P(H i) ≥ T.
  • O literă nu aparține mormanului dacă P(H i) ≤ L.
  • Dacă L ≤ P(H i) ≤ T, atunci nu se poate lua nicio decizie.

Puteți lua T = 0,95 și L = 0,05. Deoarece pentru scrisoarea în cauză și 0,05< P(H A) < 0,95, и 0,05 < P(H В) < 0,95, то мы не сможем принять решение, куда отнести данное письмо: к спаму (H A) или к нужным письмам (H B). Можно ли улучшить оценку, используя больше информации?

Da. Să calculăm scorul pentru fiecare dovadă într-un mod diferit, așa cum a propus Bayes. Lasa:

F a este numărul total de e-mailuri spam;

F ai este numărul de litere cu certificat iîntr-un morman de spam;

F b este numărul total de litere necesare;

F bi este numărul de litere cu certificat iîntr-o grămadă de scrisori necesare (relevante).

Atunci: p ai = F ai /F a, p bi = F bi /F b. P(H A) = A/(A+B), P(H B) = B/(A+B), Unde A = p a1 *p a2 *…*p an , B = p b1 *p b2 *…*p b n

Vă rugăm să rețineți că evaluările cuvintelor dovezi p ai și p bi au devenit obiective și pot fi calculate fără intervenția umană.

Tabelul 2. Estimare Bayes mai precisă (dar incompletă), bazată pe caracteristicile disponibile dintr-o scrisoare

Am primit un rezultat foarte cert - cu un mare avantaj, litera poate fi clasificată drept litera potrivită, deoarece P(H B) = 0,997 > T = 0,95. De ce s-a schimbat rezultatul? Pentru că am folosit mai multe informații – am ținut cont de numărul de litere din fiecare dintre grămezi și, de altfel, am determinat estimările p ai și p bi mult mai corect. Au fost determinate așa cum a făcut Bayes însuși, prin calcularea probabilităților condiționate. Cu alte cuvinte, p a3 este probabilitatea ca cuvântul „buddy” să apară într-o scrisoare, cu condiția ca această literă să aparțină deja grămezii de spam H A . Rezultatul nu a întârziat să apară – se pare că putem lua o decizie cu o mai mare certitudine.

Bayes împotriva fraudei corporative

O aplicație interesantă a abordării bayesiene a fost descrisă de MAGNUS8.

Proiectul meu actual (IS pentru detectarea fraudei la o întreprindere de producție) folosește formula Bayes pentru a determina probabilitatea de fraudă (fraudă) în prezența/absența mai multor fapte care mărturisesc indirect în favoarea ipotezei despre posibilitatea comiterii fraudei. Algoritmul este de auto-învățare (cu feedback), adică. își recalculează coeficienții (probabilitățile condiționate) la confirmarea efectivă sau neconfirmarea fraudei în timpul unei inspecții de către serviciul de securitate economică.

Probabil că merită spus că astfel de metode atunci când se proiectează algoritmi necesită o cultură matematică destul de ridicată a dezvoltatorului, deoarece cea mai mică eroare în derivarea și/sau implementarea formulelor de calcul va anula și discredita întreaga metodă. Metodele probabilistice sunt deosebit de predispuse la acest lucru, deoarece gândirea umană nu este adaptată să lucreze cu categorii probabiliste și, în consecință, nu există „vizibilitate” și înțelegere a „semnificației fizice” a parametrilor probabilistici intermediari și finali. Această înțelegere există numai pentru conceptele de bază ale teoriei probabilităților și atunci trebuie doar să combinați cu mare atenție și să derivați lucruri complexe conform legile teoriei probabilităților - bunul simț nu va mai ajuta pentru obiectele compuse. Acest lucru, în special, este asociat cu bătălii metodologice destul de serioase care au loc pe paginile cărților moderne despre filosofia probabilității, precum și cu un număr mare de sofisme, paradoxuri și puzzle-uri curioase pe această temă.

O altă nuanță cu care a trebuit să mă confrunt este că, din păcate, aproape totul chiar mai mult sau mai puțin UTIL ÎN PRACTIC pe această temă este scris în engleză. În sursele în limba rusă există în principal doar o teorie binecunoscută cu exemple demonstrative doar pentru cazurile cele mai primitive.

Sunt complet de acord cu ultima observație. De exemplu, Google, când a încercat să găsească ceva de genul „cartea Probabilitatea Bayesiană”, nu a produs nimic inteligibil. Adevărat, el a raportat că o carte cu statistici bayesiene a fost interzisă în China. (Profesorul de statistică Andrew Gelman a raportat pe blogul Universității Columbia că cartea sa, Data Analysis with Regression and Multilevel/Hierarchical Models, a fost interzisă de la publicare în China. Editorul de acolo a raportat că „cartea nu a fost aprobată de autorități din cauza diferitelor aspecte sensibile din punct de vedere politic. material în text.") Mă întreb dacă un motiv similar a dus la lipsa cărților despre probabilitatea bayesiană în Rusia?

Conservatorism în procesarea informațiilor umane

Probabilitățile determină gradul de incertitudine. Probabilitatea, atât conform lui Bayes, cât și a intuițiilor noastre, este pur și simplu un număr între zero și cel care reprezintă gradul în care o persoană oarecum idealizată crede că afirmația este adevărată. Motivul pentru care o persoană este oarecum idealizată este că suma probabilităților sale pentru două evenimente care se exclud reciproc trebuie să fie egală cu probabilitatea sa ca oricare dintre evenimente să se producă. Proprietatea aditivității are astfel de consecințe încât puțini oameni reali le pot întâlni pe toate.

Teorema lui Bayes este o consecință banală a proprietății aditivității, indiscutabilă și agreată de toți probabiliștii, bayesieni și de altă natură. O modalitate de a scrie acest lucru este următoarea. Dacă P(H A |D) este probabilitatea ulterioară ca ipoteza A să fie după ce a fost observată o anumită valoare D, P(H A) este probabilitatea sa anterioară înainte ca o anumită valoare D să fie observată, P(D|H A ) este probabilitatea ca a valoarea dată D va fi observată dacă H A este adevărată și P(D) este probabilitatea necondiționată a unei valori date D, atunci

(1) P(H A |D) = P(D|H A) * P(H A) / P(D)

P(D) este cel mai bine gândit ca o constantă de normalizare care face ca probabilitățile posterioare să se adună la unitate peste setul exhaustiv de ipoteze care se exclud reciproc, care sunt luate în considerare. Dacă trebuie calculat, ar putea fi așa:

Dar mai des, P(D) este eliminat mai degrabă decât calculat. O modalitate convenabilă de a elimina acest lucru este de a transforma teorema lui Bayes în formă de raport probabilitate-cote.

Luați în considerare o altă ipoteză, H B , care se exclud reciproc cu H A , și răzgândiți-vă cu privire la ea pe baza aceleiași cantități date care v-a răzgândit despre H A. Teorema lui Bayes spune că

(2) P(H B |D) = P(D|H B) * P(H B) / P(D)

Acum să împărțim ecuația 1 la ecuația 2; rezultatul va fi astfel:

unde Ω 1 sunt cotele posterioare în favoarea lui H A prin H B , Ω 0 sunt cotele anterioare și L este cantitatea familiară statisticienilor ca raport de probabilitate. Ecuația 3 este aceeași versiune relevantă a teoremei lui Bayes ca și ecuația 1 și este adesea mult mai utilă în special pentru experimente care implică ipoteze. Bayesienii susțin că teorema lui Bayes este o regulă optimă din punct de vedere formal cu privire la modul de revizuire a opiniilor în lumina noilor dovezi.

Suntem interesați să comparăm comportamentul ideal definit de teorema lui Bayes cu comportamentul real al oamenilor. Pentru a vă face o idee despre ce înseamnă acest lucru, să încercăm un experiment cu dvs. ca subiect de testare. Această pungă conține 1000 de jetoane de poker. Am două astfel de genți, unul care conține 700 de jetoane roșii și 300 de albastre, iar celălalt conține 300 de jetoane roșii și 700 de albastre. Am aruncat o monedă pentru a stabili pe care să o folosesc. Deci, dacă opiniile noastre sunt aceleași, probabilitatea dvs. actuală de a obține o pungă care conține mai multe jetoane roșii este de 0,5. Acum, faceți un eșantion aleatoriu cu un randament după fiecare cip. În 12 jetoane primești 8 roșii și 4 albastre. Acum, pe baza a tot ceea ce știți, care este probabilitatea de a ateriza geanta cu cele mai multe roșii? Este clar că este mai mare de 0,5. Vă rugăm să nu continuați să citiți până nu ați înregistrat scorul.

Dacă sunteți ca un testator obișnuit, scorul dvs. a scăzut în intervalul de la 0,7 la 0,8. Dacă ar fi să facem calculul corespunzător, însă, răspunsul ar fi 0,97. Este într-adevăr foarte rar ca o persoană căreia nu i s-a arătat anterior influența conservatorismului să ajungă la o estimare atât de mare, chiar dacă era familiarizat cu teorema lui Bayes.

Dacă proporția de jetoane roșii din pungă este R, apoi probabilitatea de a primi r jetoane roșii și ( n –r) albastru în n mostre cu returnare – p r (1–p)n–r. Deci, într-un experiment tipic cu o pungă și jetoane de poker, dacă NAînseamnă că proporția de jetoane roșii este r AȘi NB– înseamnă că cota este RB, atunci raportul de probabilitate:

Când se aplică formula lui Bayes, trebuie să se ia în considerare doar probabilitatea observației reale și nu probabilitățile altor observații pe care el ar fi putut să le fi făcut, dar nu le-a făcut. Acest principiu are implicații largi pentru toate aplicațiile statistice și non-statistice ale teoremei lui Bayes; este cel mai important instrument tehnic pentru raționamentul bayesian.

revoluția bayesiană

Prietenii și colegii tăi vorbesc despre ceva numit „Teorema lui Bayes” sau „Regula lui Bayes” sau ceva numit Raționament Bayesian. Sunt foarte interesați de asta, așa că intri online și găsești o pagină despre teorema lui Bayes și... Este o ecuație. Și gata... De ce un concept matematic creează un asemenea entuziasm în minte? Ce fel de „revoluție bayesiană” se întâmplă printre oamenii de știință și se susține că chiar și abordarea experimentală în sine poate fi descrisă ca fiind cazul său special? Care este secretul pe care îl cunosc bayesienii? Ce fel de lumină văd ei?

Revoluția bayesiană în știință nu s-a produs pentru că tot mai mulți oameni de știință cognitiv au început brusc să observe că fenomenele mentale au o structură bayesiană; nu pentru că oamenii de știință din toate domeniile au început să folosească metoda bayesiană; ci pentru că știința însăși este un caz special al teoremei lui Bayes; dovezile experimentale sunt dovezi bayesiene. Revoluționarii bayesieni susțin că atunci când efectuați un experiment și obțineți dovezi care „confirmă” sau „infirmă” teoria voastră, acea confirmare sau infirmare are loc conform regulilor bayesiene. De exemplu, trebuie să iei în considerare nu numai că teoria ta poate explica un fenomen, ci și că există și alte explicații posibile care pot prezice și acel fenomen.

Anterior, cea mai populară filozofie a științei era vechea filozofie, care a fost înlocuită de revoluția bayesiană. Ideea lui Karl Popper că teoriile pot fi complet falsificate, dar niciodată pe deplin verificate este un alt caz special de reguli bayesiene; dacă p(X|A) ≈ 1 – dacă teoria face predicții corecte, atunci observând ~X falsifică foarte puternic A. Pe de altă parte, dacă p(X|A) ≈ 1 și observăm X, acest lucru nu confirmă puternic teoria; poate că este posibilă o altă condiție B, astfel încât p(X|B) ≈ 1 și sub care observația X nu mărturisește în favoarea lui A, dar mărturisește în favoarea lui B. Pentru ca observația X să confirme definitiv A, am avea să nu știm că p(X|A) ≈ 1 și că p(X|~A) ≈ 0, ceea ce nu putem ști deoarece nu putem lua în considerare toate explicațiile alternative posibile. De exemplu, când teoria relativității generale a lui Einstein a depășit teoria gravitației bine susținută a lui Newton, a făcut din toate predicțiile teoriei lui Newton un caz special al predicțiilor lui Einstein.

Într-un mod similar, afirmația lui Popper că o idee trebuie să fie falsificabilă poate fi interpretată ca o manifestare a regulii bayesiene de conservare a probabilității; dacă rezultatul X este o dovadă pozitivă pentru teorie, atunci rezultatul ~X trebuie să infirme teoria într-o oarecare măsură. Dacă încercați să interpretați atât X, cât și ~X ca „confirmând” teoria, regulile bayesiene spun că este imposibil! Pentru a crește probabilitatea unei teorii, trebuie să o supui unor teste care pot reduce probabilitatea acesteia; Aceasta nu este doar o regulă pentru a identifica șarlatanii în știință, ci un corolar al teoremei probabilității bayesiene. Pe de altă parte, ideea lui Popper că este nevoie doar de falsificare și nu este necesară nicio confirmare este incorectă. Teorema lui Bayes arată că falsificarea este o dovadă foarte puternică în comparație cu confirmarea, dar falsificarea este încă probabilistică în natură; nu este guvernată de reguli fundamental diferite și nu este diferită în acest fel de confirmare, așa cum susține Popper.

Astfel, constatăm că multe fenomene din științele cognitive, plus metodele statistice folosite de oameni de știință, plus metoda științifică în sine, sunt toate cazuri speciale ale teoremei lui Bayes. Aceasta este revoluția bayesiană.

Bun venit la Conspirația Bayesiană!

Literatură despre probabilitatea bayesiană

2. O mulțime de aplicații diferite ale lui Bayes sunt descrise de laureatul Nobel pentru economie Kahneman (și tovarășii săi) într-o carte minunată. Numai în scurtul meu rezumat al acestei cărți foarte mari, am numărat 27 de mențiuni ale numelui unui pastor presbiterian. Formule minime. (.. Mi-a plăcut foarte mult. Adevărat, e puțin complicat, există multă matematică (și unde am fi noi fără ea), dar capitolele individuale (de exemplu, Capitolul 4. Informații) sunt clar la subiect. O recomand pentru toată lumea. Chiar dacă matematica este dificilă pentru tine, citește fiecare rând, sări peste matematică și pescuiește cereale utile...

14. (completare din 15 ianuarie 2017), un capitol din cartea lui Tony Crilly. 50 de idei despre care trebuie să știi. Matematică.

Fizicianul laureat al Nobel Richard Feynman, vorbind despre un filozof cu o importanță deosebită de sine, a spus odată: „Ceea ce mă irită nu este filosofia ca știință, ci pompozitatea care se creează în jurul ei. Dacă filozofii ar putea râde de ei înșiși! Dacă ar putea spune: „Eu spun că este așa, dar Von Leipzig a crezut că este diferit și știe și el ceva despre asta.” Dacă și-ar fi amintit să clarifice că este doar al lor .

Formularul evenimentelor grup complet, dacă cel puțin unul dintre ele va apărea cu siguranță ca urmare a experimentului și este incompatibil în perechi.

Să presupunem că evenimentul A poate apărea numai împreună cu unul dintre mai multe evenimente incompatibile perechi care formează un grup complet. Vom chema evenimente ( i= 1, 2,…, n) ipoteze experiență suplimentară (a priori). Probabilitatea de apariție a evenimentului A este determinată de formula probabilitate deplină :

Exemplul 16. Sunt trei urne. Prima urnă conține 5 bile albe și 3 negre, a doua conține 4 bile albe și 4 negre, iar a treia conține 8 bile albe. Una dintre urne este selectată la întâmplare (aceasta ar putea însemna, de exemplu, că alegerea se face dintr-o urna auxiliară care conține trei bile numerotate 1, 2 și 3). Din această urnă se extrage la întâmplare o minge. Care este probabilitatea ca acesta să fie negru?

Soluţie. Eveniment A– bila neagră este îndepărtată. Dacă s-ar ști din ce urnă a fost extrasă mingea, atunci probabilitatea dorită ar putea fi calculată folosind definiția clasică a probabilității. Să introducem ipoteze (ipoteze) cu privire la ce urnă este aleasă pentru a recupera mingea.

Bila poate fi extrasa fie din prima urna (conjectura), fie din a doua (conjectura), fie din a treia (conjectura). Întrucât există șanse egale de a alege oricare dintre urne, atunci .

Rezultă că

Exemplul 17. Lămpile electrice sunt fabricate în trei fabrici. Prima fabrică produce 30% din numărul total de lămpi electrice, a doua - 25%,
iar al treilea - restul. Produsele primei fabrici conțin 1% lămpi electrice defecte, a doua - 1,5%, a treia - 2%. Magazinul primește produse de la toate cele trei fabrici. Care este probabilitatea ca o lampă cumpărată dintr-un magazin să se dovedească a fi defectă?

Soluţie. Trebuie făcute ipoteze cu privire la instalația în care a fost fabricat becul. Știind acest lucru, putem găsi probabilitatea ca acesta să fie defect. Să introducem notația pentru evenimente: A– lampa electrică achiziționată s-a dovedit a fi defectă, – lampa a fost fabricată de prima fabrică, – lampa a fost fabricată de a doua fabrică,
– lampa a fost fabricată de a treia fabrică.

Găsim probabilitatea dorită folosind formula probabilității totale:

Formula lui Bayes. Fie un grup complet de evenimente incompatibile în perechi (ipoteze). A– un eveniment aleatoriu. Apoi,

Ultima formulă care permite reestimarea probabilităților ipotezelor după ce se cunoaște rezultatul testului care a rezultat în evenimentul A se numește Formula Bayes .

Exemplul 18.În medie, 50% dintre pacienții cu boală sunt internați într-un spital de specialitate LA, 30% – cu boală L, 20 % –
cu boala M. Probabilitatea de vindecare completă a bolii K egal cu 0,7 pentru boli LȘi M aceste probabilități sunt 0,8 și, respectiv, 0,9. Pacientul internat la spital a fost externat sănătos. Găsiți probabilitatea ca acest pacient să fi suferit de boală K.


Soluţie. Să introducem ipotezele: – pacientul suferea de o boală LA L, – pacientul suferea de o boală M.

Apoi, conform condițiilor problemei, avem . Să introducem un eveniment A– pacientul internat în spital a fost externat sănătos. După condiție

Folosind formula probabilității totale obținem:

Conform formulei lui Bayes.

Exemplul 19. Să fie cinci bile în urnă și toate presupunerile despre numărul de bile albe sunt la fel de posibile. O minge este luată la întâmplare din urnă și se dovedește a fi albă. Ce presupunere despre compoziția inițială a urnei este cea mai probabilă?

Soluţie. Să fie ipoteza că în urnă sunt bile albe , adică se pot face șase ipoteze. Apoi, conform condițiilor problemei, avem .

Să introducem un eveniment A– o minge albă luată la întâmplare. Să calculăm. Deoarece , atunci conform formulei lui Bayes avem:

Astfel, cea mai probabilă ipoteză este pentru că .

Exemplul 20. Două dintre cele trei elemente care funcționează independent ale dispozitivului de calcul au eșuat. Găsiți probabilitatea ca primul și al doilea element să eșueze dacă probabilitățile de eșec ale primului, al doilea și respectiv al treilea element sunt 0,2; 0,4 și 0,3.

Soluţie. Să notăm prin A eveniment – ​​două elemente au eșuat. Se pot formula urmatoarele ipoteze:

– primul și al doilea element au eșuat, dar al treilea element este operațional. Deoarece elementele funcționează independent, se aplică teorema înmulțirii:

CATEGORII

ARTICOLE POPULARE

2023 „kingad.ru” - examinarea cu ultrasunete a organelor umane