Jednoduché vysvetlenie Bayesovej vety. Vzorec úplnej pravdepodobnosti

Pri odvodzovaní vzorca celkovej pravdepodobnosti sa predpokladalo, že udalosť A, ktorej pravdepodobnosť mala byť určená, sa mohla stať jednej z udalostí H 1 , N 2 , ... , H n, ktoré tvoria ucelenú skupinu párovo nekompatibilných udalostí. Pravdepodobnosti týchto udalostí (hypotézy) boli vopred známe. Predpokladajme, že bol vykonaný experiment, v dôsledku ktorého došlo k udalosti A Prišiel. Tieto dodatočné informácie nám umožňujú prehodnotiť pravdepodobnosti hypotéz Ahoj , s vypočítaným P(Hj/A).

alebo pomocou vzorca celkovej pravdepodobnosti dostaneme

Tento vzorec sa nazýva Bayesov vzorec alebo hypotéza. Bayesov vzorec vám umožňuje „revidovať“ pravdepodobnosti hypotéz po tom, čo bude známy výsledok experimentu, v dôsledku ktorého sa udalosť objavila. A.

Pravdepodobnosti Р(Н i) sú apriórne pravdepodobnosti hypotéz (boli vypočítané pred experimentom). Pravdepodobnosti P(H i /A) sú a posteriori pravdepodobnosti hypotéz (sú vypočítané po experimente). Bayesov vzorec vám umožňuje vypočítať zadné pravdepodobnosti z ich predchádzajúcich pravdepodobností a z podmienených pravdepodobností udalosti A.

Príklad. Je známe, že 5% všetkých mužov a 0,25% všetkých žien je farboslepých. Náhodne vybraná osoba podľa čísla zdravotného preukazu trpí farbosleposťou. Aká je pravdepodobnosť, že ide o muža?

Riešenie. Udalosť A Osoba je farboslepá. Priestor elementárnych udalostí pre experiment - osoba je vybraná podľa čísla zdravotnej karty - Ω = ( H 1 , N 2 ) pozostáva z 2 udalostí:

H 1 - je vybraný muž,

H 2 - vyberie sa žena.

Tieto udalosti možno zvoliť ako hypotézy.

Podľa stavu problému (náhodný výber) sú pravdepodobnosti týchto udalostí rovnaké a rovnaké P(H 1 ) = 0.5; P(H 2 ) = 0.5.

V tomto prípade sú podmienené pravdepodobnosti, že osoba trpí farbosleposťou, rovnaké, resp.

P(A/N 1 ) = 0.05 = 1/20; P(A/N 2 ) = 0.0025 = 1/400.

Keďže je známe, že vybraná osoba je farboslepá, t. j. udalosť nastala, na prehodnotenie prvej hypotézy použijeme Bayesov vzorec:

Príklad. Existujú tri rovnaké krabice. Prvý box obsahuje 20 bielych guľôčok, druhý box obsahuje 10 bielych a 10 čiernych guľôčok a tretí box obsahuje 20 čiernych guľôčok. Z náhodne vybratého boxu sa vyžrebuje biela guľa. Vypočítajte pravdepodobnosť, že loptičku vytiahnete z prvého políčka.

Riešenie. Označiť podľa A udalosť - vzhľad bielej gule. O výbere krabice možno urobiť tri predpoklady (hypotézy): H 1 ,H 2 , H 3 - výber prvého, druhého a tretieho políčka.

Keďže výber ktoréhokoľvek z políčok je rovnako pravdepodobný, pravdepodobnosti hypotéz sú rovnaké:

P(H 1 ) = P (H 2 ) = P (H 3 )= 1/3.

Podľa stavu problému pravdepodobnosť vytiahnutia bielej gule z prvého políčka

Pravdepodobnosť vytiahnutia bielej gule z druhého poľa



Pravdepodobnosť vytiahnutia bielej gule z tretieho poľa

Požadovanú pravdepodobnosť nájdeme pomocou Bayesovho vzorca:

Opakovanie testov. Bernoulliho vzorec.

Existuje n pokusov, v každom z nich udalosť A môže alebo nemusí nastať a pravdepodobnosť udalosti A v každom jednotlivom pokuse je konštantná, t.j. nemení zo skúsenosti na skúsenosť. Už vieme, ako zistiť pravdepodobnosť udalosti A v jednom experimente.

Osobitne zaujímavá je pravdepodobnosť výskytu určitého počtu (m-krát) udalosti A v n experimentoch. takéto problémy sa dajú ľahko vyriešiť, ak sú testy nezávislé.

Def. Niekoľko testov je tzv nezávislý vo vzťahu k udalosti A ak pravdepodobnosť udalosti A v každom z nich nezávisí od výsledkov iných experimentov.

Pravdepodobnosť P n (m) výskytu javu A presne m-krát (nevýskyt n-m-krát, udalosť ) v týchto n pokusoch. Udalosť A sa objavuje v rôznych sekvenciách m-krát).

- Bernoulliho vzorec.

Nasledujúce vzorce sú zrejmé:

P n (m menej k-krát v n pokusoch.

P n (m>k) = P n (k+1) + P n (k+2) +…+ P n (n) - pravdepodobnosť výskytu udalosti A viac k-krát v n pokusoch.

Začnime príkladom. V urne pred vami rovnako pravdepodobné môžu byť (1) dve biele gule, (2) jedna biela a jedna čierna, (3) dve čierne. Potiahnete loptu a ukáže sa, že je biela. Ako hodnotíte teraz? pravdepodobnosť tieto tri možnosti (hypotézy)? Je zrejmé, že pravdepodobnosť hypotézy (3) s dvoma čiernymi guličkami = 0. Ale ako vypočítať pravdepodobnosti dvoch zostávajúcich hypotéz!? To vám umožní vytvoriť Bayesov vzorec, ktorý má v našom prípade tvar (číslo vzorca zodpovedá číslu testovanej hypotézy):

Stiahnite si poznámku vo formáte resp

X je náhodná premenná (hypotéza), ktorá nadobúda tieto hodnoty: x 1- dva biele x 2- jeden biely, jeden čierny; x 3- dve čierne; pri je náhodná premenná (udalosť), ktorá nadobúda tieto hodnoty: 1- vytiahne sa biela guľa a o 2- je nakreslená čierna guľa; P(x 1) je pravdepodobnosť prvej hypotézy pred vytiahnutím lopty ( a priori pravdepodobnosť alebo pravdepodobnosť predtým skúsenosti) = 1/3; P(x 2)– pravdepodobnosť druhej hypotézy pred vytiahnutím lopty = 1/3; P(x 3)– pravdepodobnosť tretej hypotézy pred vytiahnutím lopty = 1/3; P(y 1|x 1)– podmienená pravdepodobnosť vytiahnutia bielej gule, ak je pravdivá prvá hypotéza (guličky sú biele) = 1; P(y 1|x 2) pravdepodobnosť vytiahnutia bielej gule, ak je pravdivá druhá hypotéza (jedna guľa je biela, druhá čierna) = ½; P(y 1|x 3) pravdepodobnosť vytiahnutia bielej gule, ak je pravdivá tretia hypotéza (obe čierne) = 0; P(y 1)– pravdepodobnosť vytiahnutia bielej gule = ½; P(y 2)– pravdepodobnosť vytiahnutia čiernej gule = ½; a nakoniec to, čo hľadáme - P(x 1|o 1) pravdepodobnosť, že prvá hypotéza je pravdivá (obe loptičky sú biele), za predpokladu, že sme vytiahli bielu guľu ( a posteriori pravdepodobnosť alebo pravdepodobnosť po skúsenosti); P(x 2|o 1) pravdepodobnosť, že je pravdivá druhá hypotéza (jedna gulička je biela, druhá čierna), za predpokladu, že sme vytiahli bielu guľu.

Pravdepodobnosť, že prvá hypotéza (dve biele gule) je pravdivá, ak sme vytiahli bielu guľu:

Pravdepodobnosť, že druhá hypotéza je pravdivá (jedna je biela, druhá čierna), za predpokladu, že sme vytiahli bielu guľu:

Pravdepodobnosť, že tretia hypotéza (dve čierne) je pravdivá, ak sme vytiahli bielu guľu:

Čo robí Bayesov vzorec? Umožňuje na základe apriórnych pravdepodobností hypotéz - P(x 1), P(x 2), P(x 3)– a pravdepodobnosti výskytu udalostí – P(y 1), P(y 2)– vypočítajte zadné pravdepodobnosti hypotéz, napríklad pravdepodobnosť prvej hypotézy, za predpokladu, že sa vytiahne biela guľa – P(x 1|o 1).

Vráťme sa k vzorcu (1). Počiatočná pravdepodobnosť prvej hypotézy bola P(x 1) = 1/3. S pravdepodobnosťou P(y1) = 1/2 mohli by sme nakresliť bielu guľu as pravdepodobnosťou P(y2) = 1/2- čierna. Vytiahli sme bielu. Pravdepodobnosť kresby bielou za predpokladu, že prvá hypotéza je pravdivá P(y 1|x 1) = 1. Bayesov vzorec hovorí, že po vytiahnutí bielej sa pravdepodobnosť prvej hypotézy zvýšila na 2/3, pravdepodobnosť druhej hypotézy je stále 1/3 a pravdepodobnosť tretej hypotézy sa stala nulou.

Je ľahké skontrolovať, že ak nakreslíme čiernu guľu, zadné pravdepodobnosti by sa zmenili symetricky: P(x 1|y2) = 0, P(x2|y2) = 1/3, P(x 3|y2) = 2/3.

Tu je to, čo Pierre Simon Laplace napísal o Bayesovom vzorci v článku publikovanom v roku 1814:

Toto je základný princíp odvetvia analýzy náhody, ktorá sa zaoberá prechodmi od udalostí k príčinám.

Prečo je Bayesov vzorec také ťažké pochopiť!? Podľa môjho názoru preto, že náš obvyklý prístup je uvažovanie od príčin k následkom. Napríklad, ak je v urne 36 loptičiek, z ktorých je 6 čiernych a zvyšok je biely. Aká je pravdepodobnosť vytiahnutia bielej gule? Bayesov vzorec umožňuje prejsť od udalostí k príčinám (hypotézam). Ak by sme mali tri hypotézy a došlo k udalosti, ako presne táto udalosť (a nie alternatíva) ovplyvnila počiatočné pravdepodobnosti hypotéz? Ako sa zmenili tieto pravdepodobnosti?

Verím, že Bayesov vzorec nie je len o pravdepodobnosti. Mení paradigmu vnímania. Aký je myšlienkový pochod pri použití deterministickej paradigmy? Ak dôjde k udalosti, aká je jej príčina? Ak by došlo k nehode, mimoriadnej udalosti, vojenskému konfliktu. Kto alebo čo bola ich chyba? Ako uvažuje Bayesovský pozorovateľ? Aká je štruktúra reality, ktorá viedla k daný prípad k takému a takému prejavu ... Bayesian chápe, že v inak výsledok môže byť iný...

Umiestnime symboly do vzorcov (1) a (2) trochu inak:

Poďme sa znova porozprávať o tom, čo vidíme. S rovnakou počiatočnou (a priori) pravdepodobnosťou môže byť pravdivá jedna z troch hypotéz. S rovnakou pravdepodobnosťou by sme mohli nakresliť bielu alebo čiernu guľu. Vytiahli sme bielu. Vo svetle týchto nových dodatočných informácií by sa naše hodnotenie hypotéz malo zrevidovať. Bayesov vzorec vám to umožňuje urobiť číselne. Apriórna pravdepodobnosť prvej hypotézy (vzorec 7) bola P(x 1), nakreslí sa biela guľa, zadná pravdepodobnosť prvej hypotézy sa stane P(x 1|v 1). Tieto pravdepodobnosti sa líšia faktorom.

Udalosť 1 nazývané dôkazy, ktoré viac-menej potvrdzujú alebo vyvracajú hypotézu x 1. Tento pomer sa niekedy označuje ako sila dôkazov. Čím silnejší je dôkaz (čím viac sa koeficient líši od jednoty), tým väčšia je skutočnosť pozorovania 1 mení predchádzajúcu pravdepodobnosť, tým viac sa neskoršia pravdepodobnosť líši od predchádzajúcej. Ak je dôkaz slabý (koeficient ~ 1), posterior je takmer rovnaký ako predchádzajúci.

Certifikát 1 V = 2 časy zmenili predchádzajúcu pravdepodobnosť hypotézy x 1(vzorec 4). Zároveň dôkazy 1 nezmenila pravdepodobnosť hypotézy x 2, od svojej moci = 1 (vzorec 5).

Vo všeobecnosti má Bayesov vzorec nasledujúcu formu:

X je náhodná premenná (súbor vzájomne sa vylučujúcich hypotéz), ktorá nadobúda hodnoty: x 1, x 2, … , Xn. pri je náhodná premenná (množina vzájomne sa vylučujúcich udalostí), ktorá nadobúda nasledujúce hodnoty: 1, o 2, … , prin. Bayesov vzorec vám umožňuje nájsť zadnú pravdepodobnosť hypotézy Xi keď dôjde k udalosti y j. Čitateľ je súčinom apriórnej pravdepodobnosti hypotézy XiP(xi) pravdepodobnosť výskytu udalosti y j ak je hypotéza pravdivá XiR(y j|xi). V menovateli - súčet súčinov toho istého ako v čitateli, ale pre všetky hypotézy. Ak vypočítame menovateľa, dostaneme celkovú pravdepodobnosť, že udalosť nastane prij(ak je niektorá z hypotéz pravdivá) – R(y j) (ako vo vzorcoch 1–3).

Ešte raz k dôkazom. Udalosť y j poskytuje dodatočné informácie, ktoré vám umožňujú revidovať predchádzajúcu pravdepodobnosť hypotézy Xi. Sila dôkazov - - obsahuje v čitateli pravdepodobnosť výskytu udalosti y j ak je hypotéza pravdivá Xi. Menovateľ je celková pravdepodobnosť výskytu udalosti prij(alebo pravdepodobnosť výskytu udalosti prij spriemerované cez všetky hypotézy). prij vyššie pre hypotézu Xi ako je priemer pre všetky hypotézy, potom dôkazy hrajú do karát hypotéze Xi, čím sa zvyšuje jeho zadná pravdepodobnosť R(y j|xi). Ak pravdepodobnosť výskytu udalosti prij nižšie pre hypotézu Xi ako je priemer pre všetky hypotézy, potom dôkaz znižuje zadnú pravdepodobnosť R(y j|xi) Pre hypotéz Xi. Ak pravdepodobnosť výskytu udalosti prij pre hypotézu Xi je rovnaký ako priemer pre všetky hypotézy, potom dôkaz nemení zadnú pravdepodobnosť R(y j|xi) Pre hypotéz Xi.

Tu je niekoľko príkladov, ktoré, dúfam, upevnia vaše chápanie Bayesovho vzorca.

Úloha 2. Dvaja strelci nezávisle strieľajú na ten istý cieľ, pričom každý strieľa jednu ranu. Pravdepodobnosť zasiahnutia cieľa pre prvého strelca je 0,8, pre druhého - 0,4. Po streľbe sa našla jedna diera v terči. Nájdite pravdepodobnosť, že táto jamka patrí prvému strelcovi. .

Úloha 3. Monitorovaný objekt môže byť v jednom z dvoch stavov: H 1 = (funkčný) a H 2 = (nefunkčný). Apriórne pravdepodobnosti týchto stavov Р(Н 1) = 0,7, Р(Н 2) = 0,3. Existujú dva zdroje informácií, ktoré poskytujú protichodné informácie o stave objektu; prvý zdroj hlási, že objekt nefunguje, druhý - že funguje. Je známe, že prvý zdroj poskytuje správne informácie s pravdepodobnosťou 0,9 a s pravdepodobnosťou 0,1 - chybné. Druhý zdroj je menej spoľahlivý: poskytuje správne informácie s pravdepodobnosťou 0,7 a s pravdepodobnosťou 0,3 - chybné. Nájdite zadné pravdepodobnosti hypotéz. .

Úlohy 1–3 sú prevzaté z učebnice E.S.Ventzela, L.A.Ovcharova. Teória pravdepodobnosti a jej inžinierske aplikácie, časť 2.6 Veta o hypotéze (Bayesov vzorec).

Problém 4 je prevzatý z knihy, časť 4.3 Bayesova veta.

INFORMAČNÉ TECHNOLÓGIE, POČÍTAČOVÁ VEDA A RIADENIE

O použiteľnosti Bayesovho vzorca

DOI 10.12737/16076

A. I. Dolgov**

1Akciová spoločnosť „Konštrukčný úrad pre rádiové monitorovanie riadiacich, navigačných a komunikačných systémov“, Rostov na Done, Ruská federácia

O použiteľnosti Bayesovho vzorca*** A. I. Dolgov1**

1"Konštrukčná kancelária pre monitorovanie riadiacich, navigačných a komunikačných systémov" JSC, Rostov na Done, Ruská federácia

Predmetom tejto štúdie je Bayesov vzorec. Účelom tejto práce je analyzovať a rozšíriť rozsah vzorca. Prvoradou úlohou je preštudovať publikácie venované tomuto problému, ktoré umožnili identifikovať nedostatky aplikácie Bayesovho vzorca vedúce k nesprávnym výsledkom. Ďalšou úlohou je zostaviť modifikácie Bayesovho vzorca, ktoré zohľadnia rôzne jednotlivé dôkazy a získajú správne výsledky. A napokon na príklade konkrétnych počiatočných údajov sa porovnávajú nesprávne výsledky získané pomocou Bayesovho vzorca a správne výsledky vypočítané pomocou navrhovaných úprav. V štúdii boli použité dve metódy. Najprv bola vykonaná analýza princípov konštrukcie známych výrazov používaných na písanie Bayesovho vzorca a jeho modifikácií. Po druhé, vykonalo sa porovnávacie vyhodnotenie výsledkov (vrátane kvantitatívneho). Navrhované úpravy poskytujú širšiu aplikáciu Bayesovho vzorca v teórii a praxi, vrátane riešenia aplikovaných problémov.

Kľúčové slová: podmienené pravdepodobnosti, nekompatibilné hypotézy, kompatibilné a nekompatibilné dôkazy, normalizácia.

Bayesov vzorec je predmetom výskumu. Cieľom práce je analyzovať aplikáciu vzorca a rozšíriť rozsah jeho použiteľnosti. Problém prvej priority zahŕňa identifikáciu nevýhod Bayesovho vzorca na základe štúdia relevantných publikácií vedúcich k nesprávnym výsledky. Ďalšou úlohou je skonštruovať modifikácie Bayesovho vzorca, aby sa zabezpečilo započítanie rôznych jednotlivých indikácií na získanie správnych výsledkov. A nakoniec, nesprávne výsledky získané aplikáciou Bayesovho vzorca sa porovnajú so správnymi výsledkami vypočítanými s použitím navrhované úpravy vzorca na príklade konkrétnych počiatočných údajov. V štúdiách sa používajú dve metódy. Najprv sa vykoná analýza princípov konštrukcie známych výrazov používaných na zaznamenanie Bayesovho vzorca a jeho modifikácií. Po druhé, vykoná sa porovnávacie vyhodnotenie výsledkov (vrátane kvantitatívneho). Navrhované modifikácie poskytujú širšiu aplikáciu Bayesovho vzorca v teórii aj praxi vrátane riešenia aplikovaných problémov.

Kľúčové slová: podmienené pravdepodobnosti, nekonzistentné hypotézy, kompatibilné a nekompatibilné indikácie, normalizácia.

Úvod. Bayesov vzorec sa čoraz viac používa v teórii a praxi, vrátane riešenia aplikovaných problémov pomocou výpočtovej techniky. Použitie vzájomne nezávislých výpočtových postupov umožňuje obzvlášť efektívne aplikovať tento vzorec pri riešení problémov na viacprocesorových výpočtových systémoch, pretože v tomto prípade sa paralelná implementácia vykonáva na úrovni všeobecnej schémy a pri pridávaní ďalšieho algoritmu alebo triedy problémov. , nie je potrebné znovu vykonávať paralelizačné práce.

Predmetom tejto štúdie je použiteľnosť Bayesovho vzorca na porovnávací odhad zadných podmienených pravdepodobností nekonzistentných hypotéz pri rôznych jednotlivých dôkazoch. Ako ukazuje analýza, v takýchto prípadoch normalizované pravdepodobnosti nekompatibilných kombinovaných udalostí patriacich do

S X<и ч и

JE eö A JE X X<и H

„Práce boli realizované v rámci iniciatívneho výskumného projektu.

** E-mail: [e-mail chránený]

""Výskum sa robí v rámci nezávislého výskumu a vývoja.

pre rôzne ucelené skupiny podujatí . Porovnávané výsledky sa zároveň ukazujú ako neadekvátne reálnym štatistickým údajom. Je to spôsobené nasledujúcimi faktormi:

Používa sa nesprávna normalizácia;

Prítomnosť alebo neprítomnosť priesečníkov posudzovaných dôkazov sa neberie do úvahy.

Za účelom odstránenia zistených nedostatkov sú identifikované prípady použiteľnosti Bayesovho vzorca. V prípade, že zadaný vzorec nie je použiteľný, rieši sa problém konštrukcie jeho modifikácie, čím sa zabezpečí zohľadnenie rôznych jednotlivých dôkazov pri získavaní správnych výsledkov. Na príklade konkrétnych počiatočných údajov sa vykonalo porovnávacie hodnotenie výsledkov:

Nesprávne - získané pomocou Bayesovho vzorca;

Správne - vypočítané pomocou navrhovanej úpravy.

Východiskové pozície. Z princípu zachovania pravdepodobnostných pomerov vychádzajú nasledovné tvrdenia: „Správne spracovanie pravdepodobností udalostí je možné len pri normalizácii pomocou jedného spoločného normalizačného deliteľa, ktorý zabezpečuje rovnosť pomerov normalizovaných pravdepodobností k pomerom zodpovedajúcich normalizovaných pravdepodobnosti“. Tento princíp predstavuje subjektívny základ teórie pravdepodobnosti, ale nie je náležite odzrkadlený v modernej vzdelávacej a vedeckej a technickej literatúre.

Ak dôjde k porušeniu tejto zásady, dochádza k skresleniu informácií o miere možnosti uvažovaných udalostí. Výsledky získané na základe skreslených informácií a prijaté rozhodnutia sa ukázali byť neadekvátne skutočným štatistickým údajom.

V tomto článku budú použité nasledujúce pojmy:

Elementárny dej je dej, ktorý nie je deliteľný na prvky;

Kombinovaná udalosť - udalosť predstavujúca jednu alebo inú kombináciu základných udalostí;

Kompatibilné udalosti - udalosti, ktoré v niektorých prípadoch porovnávacieho hodnotenia ich pravdepodobnosti môžu byť nezlučiteľné av iných prípadoch spoločné;

Nekompatibilné udalosti sú udalosti, ktoré sú nekompatibilné vo všetkých prípadoch.

Podľa vety o násobení pravdepodobnosti pravdepodobnosť P (U ^ E) súčinu elementárnych dejov U ^ a

E sa vypočíta ako súčin pravdepodobností P(Uk E) = P(E)P(U^E) . V tomto ohľade je Bayesov vzorec často

sa píše v tvare Р(Ик\Е) = - - - , popisujúci definíciu aposteriórnych podmienených pravdepodobností

P(U^E) hypotéz Uk (k = 1,...n) na základe normalizácie apriórnych pravdepodobností P(U^E) kombinovaných nekompatibilných udalostí I až E. Každá z týchto udalostí predstavuje produkt, ktorého faktory sú jednou z uvažovaných hypotéz a jedným zodpovedným dôkazom. Zároveň sa berie do úvahy všetko

Udalosti uIKE (k = 1,...n) tvoria kompletnú skupinu nekompatibilných kombinovaných udalostí uIKE v dôsledku

s ktorými by sa ich pravdepodobnosti P(Ik E) mali normalizovať s prihliadnutím na vzorec celkovej pravdepodobnosti, podľa ktorého

roj P(E) = 2 P(Uk)P(E\Uk). Preto sa Bayesov vzorec najčastejšie píše v najpoužívanejšej forme:

P(Uik) P(EIK)

P(Uk \ E) \u003d -. (1)

^ katión Bayesovho vzorca.

Analýza vlastností konštrukcie Bayesovho vzorca, zameraná na riešenie aplikovaných problémov, ako aj príklady

„a jeho praktická aplikácia nám umožňuje vyvodiť dôležitý záver týkajúci sa výberu úplnej skupiny kombinovaných udalostí porovnávaných z hľadiska stupňa možnosti (každá z nich je výsledkom dvoch základných udalostí – jednej z hypotéz a vykonaných dôkazov do úvahy). Takúto voľbu subjektívne prijíma osoba s rozhodovacou právomocou na základe objektívnych počiatočných údajov obsiahnutých v typických podmienkach situácie: typy a počet hodnotených hypotéz a konkrétne zohľadnené dôkazy.

Neporovnateľné pravdepodobnosti hypotéz s jediným nekonzistentným dôkazom. Bayesov vzorec sa tradične používa v prípade určovania zadných podmienených pravdepodobností, ktoré nie sú porovnateľné z hľadiska miery možnosti.

pravdepodobnosť hypotéz H^ s jediným nezlučiteľným dôkazom, z ktorých každý sa môže „objaviť

len v kombinácii s ktoroukoľvek z týchto hypotéz. V tomto prípade sú vybrané celé skupiny a HkE, kombinované

kúpeľné akcie vo forme produktov, ktorých faktory sú jedným z dôkazov c. (1=1,...,m) a jedna

z uvažovaných n hypotéz.

Bayesov vzorec sa používa na porovnávacie hodnotenie pravdepodobností kombinovaných udalostí každej takejto kompletnej skupiny, ktorá sa líši od ostatných kompletných skupín nielen zohľadňovanými dôkazmi, ale aj vo všeobecnom prípade typmi hypotéz H ^ a (alebo) ich počet n (pozri napríklad )

RNky = P(Hk) P(eH)

% P(Hk) P(Er\Hk) k = 1

V špeciálnom prípade pre n = 2

RNk\E,~ P(Hk) P(EN)

% P(Hk)P(E,\Hk)k = 1

a získané výsledky sú správne, vzhľadom na dodržanie princípu zachovania pomerov pravdepodobnosti:

P(H1E,) _ P(H1)P(E,\H1) / P(H2) P(E,\H2) = P(H1) P(E,\H1)

P(H2 = % PW1!)

Subjektivita výberu kompletnej skupiny kombinovaných udalostí v porovnaní s mierou možnosti (s

určité premenné elementárne udalosti) umožňuje vybrať kompletnú skupinu udalostí a Hk E ■ s

negáciou elementárneho javu E ■ () a napíšte Bayesov vzorec (1 = 1,.. ., m) takto:

P(Hk \ E) -= - RNSh ±.

% P(Hk)P(E, Hk)

Takýto vzorec je tiež použiteľný a umožňuje získať správne výsledky, ak sa vypočíta

normalizované pravdepodobnosti sa porovnávajú podľa rôznych uvažovaných hypotéz, ale nie podľa rôznych

orgány. ¡^

Porovnateľné pravdepodobnosti hypotéz pri jednom nekonzistentnom dôkaze. Súdiac podľa známej publica-^

sa používa na porovnávacie hodnotenie aposteriórnych podmienených pravdepodobností hypotéz pre rôzne jednotlivé dôkazy.

orgány. Zároveň sa nevenuje pozornosť nasledujúcej skutočnosti. V týchto prípadoch sa porovnávajú normalizované ^ pravdepodobnosti nekompatibilných (nekompatibilných) kombinovaných udalostí patriacich do rôznych úplných skupín n udalostí. V tomto prípade však Bayesov vzorec nie je použiteľný, pretože sa porovnávajú kombinované udalosti, ktoré nie sú zahrnuté v jednej úplnej skupine, ktorých normalizácia pravdepodobností sa vykonáva pomocou rôznych n normalizačných deliteľov. Normalizované pravdepodobnosti nekompatibilných (nekompatibilných) kombinovaných udalostí možno porovnávať len vtedy, ak patria do rovnakej úplnej skupiny udalostí a sú normalizované pomocou ¡3 pomocou spoločného deliteľa, ktorý sa rovná súčtu pravdepodobností všetkých normalizovaných udalostí zahrnutých v úplnom §

Vo všeobecnosti možno považovať tieto dôkazy za nezlučiteľné:

Dva dôkazy (napríklad dôkaz a jeho popretie); ^

Tri dôkazy (napríklad v hernej situácii výhra, prehra a remíza); ^

Štyri posudky (najmä v športe, výhra, prehra, remíza a opakovanie) atď. ^

Zvážte pomerne jednoduchý príklad (zodpovedajúci príkladu uvedenému v ) použitia Bayesovho vzorca ^ na určenie zadnej podmienenej pravdepodobnosti hypotézy H ^ pre dve nekompatibilné udalosti v r.

vo forme dôkazu L]- a jeho popretie L]

P(H, k) - ^. ^ P(A^k" , (2)

] E P(Hk> P(A]\vk> k - 1

■ _ P(HkA ]) P(Hk> P(A ]\nk>

P(H,\A,) ----k-]-. (3)

V k\A]> P(A > n

] E P(Hk) P(A]\Hk) k-1

V prípadoch (2) a (3) boli subjektívne vybrané celé skupiny porovnávané z hľadiska miery možnosti kom-

binned udalosti sú, v tomto poradí, množiny a H k A a a H k A. To je prípad, keď vzorec

k-1 k ] k-1 k ]

Bayes je nepoužiteľný, pretože je porušená zásada zachovania pomerov pravdepodobností - nie je dodržaná rovnosť pomerov normalizovaných pravdepodobností k pomerom zodpovedajúcich normalizovaných pravdepodobností:

P(H až A]] P(Hk) P(A]\Hk) / P(Hk) P(A]\Hk) P(Hk) P(A] Hk)

P(Hk E P(Hk) P(A]\Hk)/ E P(Hk) P(A]\Hk) P(Hk) P(A] Hk)

k - 1 /k - 1 Podľa princípu zachovania pravdepodobnostných pomerov je správne spracovanie pravdepodobností udalostí realizovateľné len pri normalizácii pomocou jedného spoločného normalizačného deliteľa, ktorý sa rovná súčtu všetkých porovnávaných normalizovaných výrazov. Preto

E P(Hk)P(A]\Hk) + E P(Hk)P(A]\Hk) - E P(Hk)[P(A]\Hk) + P(Hk) P(A]\Hk )] - EP (Hk) - 1. až -1 až -1 až -1 až -1

Odhalila sa teda skutočnosť, že existujú odrody Bayesovho vzorca, ktoré sa líšia od

známy tým, že chýba normalizačný deliteľ:

A,) - P(H) P(A]\Hk), P(Hk A,) - P(H) P(A, Hk). (4)

J do I ■> do

V tomto prípade sa pozoruje rovnosť pomerov normalizovaných pravdepodobností k pomerom zodpovedajúcich normalizovaných pravdepodobností:

m^A^ P(Hk) P(A]\Hk)

A,) P(Hk) P(A, Hk)

Na základe subjektívneho výberu netradične zaznamenaných ucelených skupín nekompatibilných kombinovaných udalostí je možné zvýšiť počet modifikácií Bayesovho vzorca, ktoré zahŕňajú dôkazy, ako aj počet ich odmietnutí. Napríklad najkompletnejšia skupina kombinovaných podujatí

u a Hk /"./ ^ u a Hk E\ zodpovedá (berúc do úvahy absenciu normalizačného deliteľa) modifikačnému vzorcu; =1 A"=1; \u003d 1 Bayesian

P(Hk\~) - P(Hk) ПЁ^^^

kde elementárna udalosť vo forme dôkazu E \ e II II / "/ je jedným z prvkov uvedeného súboru

o Pri absencii odmietnutia dôkazov, to znamená, keď E\ \u003d // e a /"./,

^ P(H\E) P(Hk) P(E,\Hk)

E P(Hk) P(E \ Hk) k - 1

Modifikácia Bayesovho vzorca, určená na určenie podmienených pravdepodobností hypotéz porovnávaných z hľadiska stupňa možnosti pre jeden nekompatibilný dôkaz, je teda nasledovná. Čitateľ obsahuje normalizovanú pravdepodobnosť jednej z kombinovaných nekompatibilných udalostí, ktoré tvoria úplnú skupinu, vyjadrenú ako súčin apriórnych pravdepodobností, a menovateľ obsahuje súčet všetkých

normalizované pravdepodobnosti. Zároveň je dodržaná zásada zachovania pomerov pravdepodobností – a získaný výsledok je správny.

Pravdepodobnosti hypotéz pri jednom kompatibilnom dôkaze. Bayesovské vzorce sa tradične používajú na určenie zadných podmienených pravdepodobností hypotéz Hk (k = 1,...,n) porovnávaných z hľadiska miery možnosti pre jeden z viacerých považovaných za kompatibilné dôkazy EL (1 = 1,... ,m). Najmä (pozri

napríklad a ), pri určovaní aposteriórnych podmienených pravdepodobností Р(Н 1Е^) a Р(Н 1 Е2) pre každý z dvoch kompatibilných dôkazov Е1 a Е2 sa používajú vzorce v tvare:

P(H1)PE\H1) P(Hj) P(E2Hj) P(HJE1) = -1- a P(HJE2) =-1-. (5)

I P(Hk) PE\Hk) I P(Hk) P(E2 Hk)

k = 1 k = 1 Všimnite si, že toto je ďalší prípad, keď Bayesov vzorec nie je použiteľný. Okrem toho je v tomto prípade potrebné odstrániť dva nedostatky:

Ilustrovaná normalizácia pravdepodobností kombinovaných udalostí je nesprávna z dôvodu príslušnosti k rôznym úplným skupinám uvažovaných udalostí;

Symbolické záznamy o kombinovaných udalostiach HkEx a HkE2 neodrážajú skutočnosť, že posudzované dôkazy E x a E 2 sú kompatibilné.

Na odstránenie posledného nedostatku je možné použiť podrobnejší záznam kombinovaných udalostí, berúc do úvahy skutočnosť, že kompatibilné dôkazy E1 a E2 môžu byť v niektorých prípadoch nezlučiteľné a v iných spojené:

HkE1 = HkE1 E2 a HkE2 = HkE 1E2 + HkE1 E2, kde El a E2 sú dôkazy opačné k El a E2.

Je zrejmé, že v takýchto prípadoch sa súčin udalostí Hk E1E2 berie do úvahy dvakrát. Okrem toho sa môže brať do úvahy opäť samostatne, ale to sa nestane. Faktom je, že v posudzovanej situácii je posudzovaná situácia ovplyvnená tromi pravdepodobnými nezlučiteľnými kombinovanými udalosťami: HkE1E2, HkE 1E2 a

Hk E1E2. Pre toho, kto rozhoduje, je zároveň zaujímavé posúdiť len mieru možnosti

dve nezlučiteľné kombinované udalosti: HkE1 E2 a HkE 1E2, čo zodpovedá zohľadneniu iba g

jediný dôkaz. ¡C

Takže pri konštrukcii modifikácie Bayesovho vzorca na určenie aposteriórnych podmienených hodnôt,

Pravdepodobnosť hypotéz s jedným kompatibilným dôkazom musí byť založená na nasledujúcom. Osoba prijímajúca ^

rozhodnutie, nás presne zaujíma, z akej elementárnej udalosti, reprezentovanej tým či oným dôkazom

uvažovaný počet sa skutočne stal za špecifických podmienok. Ak dôjde k inej elementárnej udalosti v K

formou jednotného osvedčenia je potrebné prehodnotenie rozhodnutia, vzhľadom na výsledky porovnávacieho posúdenia n.

a posteriori podmienené pravdepodobnosti hypotéz s nevyhnutným zohľadnením iných podmienok ovplyvňujúcich skutočný všeobecný

nastavenie. 3

Zaveďme nasledujúci zápis: HkE- pre jeden (a jediný) nekompatibilný kombinovaný ko- ^

bytie, ktoré spočíva v tom, že z m > 1 uvažovaných elementárnych dejov Ei (i = 1,...,m) spolu s hypotézou „

Hk, nastala jedna elementárna udalosť Ex a nenastali žiadne ďalšie elementárne udalosti. se"

V najjednoduchšom prípade sa berú do úvahy dva jednotlivé nezlučiteľné dôkazy. Ak sa potvrdí

jeden z nich sa očakáva, podmienená pravdepodobnosť dôkazu vo všeobecnej forme je vyjadrená vzorcom l

P(Hk E-) = P(Ei\Hk) -P(EjE^Hk) = P(Ei\Hk) -P(M^Hk)P(M^Hk), i = 1, -2 (6) g

Platnosť vzorca je dobre vidieť (obr. 1).

Ryža. 1. Geometrická interpretácia výpočtu P(Hk E-) pre / = 1,...,2 S podmienene nezávislým dôkazom

P(K1K2\Hk) = p(E\Hk)P(E2\Hk),

preto berúc do úvahy (6)

P(Hk E-) = PE Hk) - P(E1Hk) P(E21Hk), = 1,,2. (7)

Podobne pravdepodobnosť P(HkE-) jedného z troch (/ = 1,...,3) nezlučiteľných udalostí HkE^ je vyjadrená vzorcom

Napríklad pre i = 1:

p(HkEl) = P(Ei\Hk)-[S P(Ei\Hk)P(Ej\Hk) ] + P(EiE2E3Hk)

p(HkE-) = P(E7|Hk)- P(E]E^Hk)- P(E7EjHk) + P(E]E2E3\Hk)

Platnosť tohto vzorca jasne potvrdzuje geometrická interpretácia uvedená na obr.

Ryža. 2. Geometrická interpretácia výpočtu P(Hk E-) pre / = 1,...,3

Pomocou metódy matematickej indukcie je možné dokázať všeobecný vzorec pre pravdepodobnosť P(Hk E-) pre ľubovoľný počet dôkazov e, 0=1,...,m):

P(HkE-) = P(E, Hk) - m PE\Hk) P(E]\Hk) + 1 P(E\Hk) P(E]\Hk) P(E^Hk) + ■■■ + (-1)

] = 1(] * 0 ],1 * 1

Pomocou vety o násobení pravdepodobnosti zapíšeme podmienenú pravdepodobnosť Р(НкЕ~-) v dvoch formách:

^ z čoho vyplýva, že

P(Hk E -) = P(Hk) P(E-|Hk) = P(E-) P(Hk

E-)= P(HkE-) "" P(E-)

Použitím vzorca celkovej pravdepodobnosti P(Ei) = S P(H£) P(Ei Hk) sa ukáže, že

E-) \u003d P (HkET)

2 P(HkE-) k \u003d 1

Dosadením do výsledného vzorca výrazy pre Р(НкЕ-) v tvare pravej strany (8) dostaneme konečný tvar vzorca na určenie aposteriórnych podmienených pravdepodobností hypotéz H^ (k = 1, ...,n) pre jeden z niekoľkých považovaných za nezlučiteľné jednotlivé dôkazy: (E^\Hk)

P(Hk)[P(E,\Hk) - 2 P(E,\Hk) P(Ep k) +...+ (-1)m-1 P(P P(Erk)] P(H, E ~) =-] = 1(] * ■----(9)

k 1 p t t t

2 P(Hk) 2 [P(E,\Hk) - 2 P(EgHk) P(E^Hk) + ...+ (-1)m-1 P(P P (Ep k)]

k=1, = 1) = 1() *,) ■! =1

Porovnávacie odhady. Zvažujú sa celkom jednoduché, ale ilustratívne príklady obmedzené na analýzu vypočítaných zadných podmienených pravdepodobností jednej z dvoch hypotéz s dvoma jedinými dôkazmi. 1. Pravdepodobnosti hypotéz pri nezlučiteľných jednotlivých dôkazoch. Porovnajme výsledky získané pomocou Bayesových vzorcov (2) a (3) na príklade dvoch dôkazov L. = L a L. = L s počiatočnými údajmi:

P(H1 = 0,7; P(H2) = 0,3; P(L|H^ = 0,1; P(L\n1) = 0,9; P(L\H2) = 0,6 P(A\H2) = 0,4 ako príklady s hypotézou H1, tradičné vzorce (2) a (3) vedú k nasledujúcim výsledkom:

P(N.) P(A\Č. 0 07

P (N, L) \u003d - 11 \u003d - \u003d 0,28,

2 P(Hk) P(A\Hk)k = 1

R(N L R(A\N 1) 0 63

P (N, L) \u003d - 11 \u003d - \u003d 0,84,

2 P(Hk) P(A\Hk) k = 1

tvoriace priečky P (H 1 L) \u003d P (H ^ P (L \ Hp \u003d 0,07; P (H ^ A) \u003d P (H 1) P (n | H ^ \u003d 0,63, 1 navrhovaného vzorce vzhľadom na:

R<Н)Р(АНА-Р(А|Н1) _ 0,07

as navrhovanými vzorcami (4), ktoré nemajú normalizačných deliteľov: „a

V prípade aplikácie navrhovaných vzorcov sa teda pomer normalizovaných pravdepodobností rovná pomeru normalizovaných pravdepodobností: K

rm f P(H1) P(A\H1) A11 |

Pri použití známych vzorcov s rovnakým pomerom -;-=-= 0,11 normalizovaných veronov

P(H 1) P(A\H 1) Ǥ

pomery uvedené v čitateloch, pomer výsledných normalizovaných pravdepodobností: 2

P(H1) P(A\H1) P(A\H1) 0,63

P (H1 L) \u003d 0,28 P (H 1 L) \u003d 0,84

To znamená, že nie je dodržaný princíp zachovania pravdepodobnostných pomerov a získavajú sa nesprávne výsledky. V tomto prípade £

v prípade aplikácie známych vzorcov sa hodnota relatívnej odchýlky pomeru (11) aposteriórnej podmienenej a podmienenej pravdepodobnosti hypotéz od ​​správnych výsledkov (10) ukazuje ako veľmi významná, pretože je

°, 33 - °, P x 100 \u003d 242 %.. I

2. Pravdepodobnosti hypotéz pri kompatibilných jednotlivých dôkazoch. Porovnajme výsledky získané pomocou Bayesových vzorcov (5) a zostrojenej správnej modifikácie (9) s použitím nasledujúcich počiatočných údajov:

P(H1 = 0,7; P(H2) = 0,3; P(E1H1) = 0,4; P(E2H1) = 0,8; P(E1\H2) = 0,7; P(E^H2) = 0,2,113

V uvažovaných príkladoch s hypotézou H2 v prípade použitia tradičných vzorcov (5):

P(H2)P(E1H2)Q, 21

P(H2E1) =-2-!-2- = - = Q,429,

p(Hk) p(El Hk) k = 1

P(H2) P(E2H2) Q,Q6

P(H 2 E 2) \u003d -2-- \u003d - \u003d 0,097.

I P(Hk) P(E2Hk) k = 1

V prípade použitia navrhovaného vzorca (9), berúc do úvahy (7), P(H

P(H2) 0,168

E.) ----- 0,291,

Z P(Hk) Z "

P(H2) 0,018

E0) ----- 0,031.

Z P(Hk) Z k - 1 i - 1

Pri použití navrhnutých správnych vzorcov je v dôsledku rovnakých menovateľov pomer P(H2) -

Normalizované pravdepodobnosti uvedené v čitateloch sa rovnajú pomeru

P(H2)

normalizované pravdepodobnosti:

To znamená, že je dodržaný princíp zachovania pravdepodobnostných pomerov.

Avšak v prípade použitia známych vzorcov s pomerom normalizovaných pravdepodobností uvedených v čitateloch

P(H2)P(E1\H2)_0,21_35P(H2)P(E2H2) 0,06,

pomer normalizovaných pravdepodobností:

P (H 2 \u003d 0,429 \u003d 4,423. (13)

P(H2\e2) 0,097

To znamená, že zásada zachovania pomerov pravdepodobnosti, ako predtým, nie je rešpektovaná. V tomto prípade sa v prípade aplikácie známych vzorcov ukazuje ako veľmi významná aj hodnota relatívnej odchýlky pomeru (13) aposteriórnych podmienených pravdepodobností hypotéz od ​​správnych výsledkov (12):

9,387 4,423 x 100 = 52,9 %.

Záver. Analýza konštrukcie špecifických vzorcových vzťahov, ktoré implementujú Bayesov vzorec a jeho modifikácie, navrhnuté na riešenie praktických problémov, nám umožňuje konštatovať nasledovné. Osoba s rozhodovacou právomocou môže subjektívne vybrať celú skupinu porovnateľných 2 možných kombinovaných udalostí. Tento výber je založený na uvažovaných objektívnych počiatočných údajoch, charakteristických pre typickú situáciu (konkrétne typy a počet elementárnych udalostí – odhadnuté hypotézy a dôkazy). Prakticky zaujímavý je subjektívny výber iných možností celej skupiny porovnávaných z hľadiska miery možností.

kombinované udalosti - teda pri konštrukcii netradičných variantov modifikácií Bayesovho vzorca je poskytnutá významná rozmanitosť pomerov vzorcov. To zase môže byť základom pre zlepšenie matematickej podpory implementácie softvéru, ako aj rozšírenie rozsahu nových vzťahov vzorcov na riešenie aplikovaných problémov.

Bibliografický zoznam

1. Gnedenko, B. V. Elementárny úvod do teórie pravdepodobnosti / B. V. Gnedenko, A. Ya. Khinchin. - 114 New York: Dover Publications, 1962. - 144 rubľov.

2. Venttsel, E. S. Teória pravdepodobnosti / E. S. Venttsel. - 10. vyd., vymazané. - Moskva: Vyššia škola, 2006. - 575 s.

3. Andronov. A. M., Teória pravdepodobnosti a matematická štatistika / A. M. Andronov, E. A. Kopytov, L. Ya. Gringlaz. - Petrohrad: Peter, 2004. - 481 s.

4. Zmitrovich, A. I. Inteligentné informačné systémy / A. I. Zmitrovich. - Minsk: TetraSistems, 1997. - 496 s.

5. Chernorutsky, I. G. Metódy rozhodovania / I. G. Chernorutsky. - Petrohrad: BHV-Petersburg, 2005. - 416 s.

6 Naylor, C.-M. Zostavte si svoj vlastný expertný systém / C.-M. Naylor. - Chichester: John Wiley & Sons, 1987. - 289 s.

7. Romanov, V.P. Inteligentné informačné systémy v ekonomike / V.P. Romanov. - 2. vyd., vymazané.

Moskva: Skúška, 2007. - 496 s.

8. Ekonomická efektívnosť a konkurencieschopnosť / D. Yu. Muromtsev [a ďalší]. - Tambov: Vydavateľstvo Tambov. štát tech. un-ta, 2007.- 96 s.

9. Dolgov, A. I. Správne úpravy Bayesovho vzorca pre paralelné programovanie / A. I. Dolgov // Superpočítačové technológie: materiály 3. všeruskej. vedecko-technická conf. - Rostov na Done. - 2014.- Zväzok 1 - S. 122-126.

10. A. I. Dolgov, O správnosti úprav Bayesovho vzorca / A. I. Dolgov, Vestnik Don. štát tech. univerzite

2014. - V. 14, č. 3 (78). - S. 13-20.

1. Gnedenko, B.V., Khinchin, A.Ya. Základný úvod do teórie pravdepodobnosti. New York: Dover Publications, 1962, 144 s.

2 Ventsel, E.S. Teoriya veroyatnostey. 10. vydanie, reimpr. Moskva: Vysshaya shkola, 2006, 575 s. (v ruštine).

3. Andronov, A.M., Kopytov, E.A., Gringlaz, L.Y. Teoriya veroyatnostey a matematicheskaya štatistika. Petrohrad: Piter, 2004, 481 s. (v ruštine).

4. Zmitrovič, A.1. Intelektuálny "nye informatsionnye sistemy. Minsk: TetraSistems, 1997, 496 s. (v ruštine).

5. Chernorutskiy, I.G. Metodika prinyatiya resheniy. Petrohrad: BKhV-Peterburg, 2005, 416 s. (v ruštine).

6 Naylor, C.-M. Zostavte si svoj vlastný expertný systém. Chichester: John Wiley & Sons, 1987, 289 s.

7. Romanov, V.P. Intelektuálny "nye informatsionnye sistemy v ekonomike. 2. vyd., reimpr. Moskva: Ekzamen, 2007, 496 s. (v ruštine).

8. Muromtsev, D. Y., a kol. Ekonomicheskaya effektivnost" a konkurentosposobnost". Tambov: Izd-vo Tamb. ide. technológie un-ta, 2007, 96 s. (v ruštine). IB

9. Dolgov, A1. Korrektnye modifikatsii formuly Bayesa dlya paralelne "nogo programmirovaniya. Superkomp" yuternye techhnologii: mat-ly 3-y vseros. vedecko-techn. conf. Rostov na Done, 2014, roč. 1, str. 122-126 (v ruštine). ^

10. Dolgov, A1. O korrektnosti modifikatsiy formuly Bayesa. ^ Vestník DSTU, 2014, roč. 14, č. 3 (78), str. 13-20 (v ruštine). *

Kto je Bayes? A čo to má spoločné s manažmentom? – môže nasledovať celkom spravodlivá otázka. Zatiaľ ma berte za slovo: toto je veľmi dôležité! .. a zaujímavé (aspoň pre mňa).

V akej paradigme funguje väčšina manažérov: ak niečo pozorujem, aké závery z toho môžem vyvodiť? Čo učí Bayes: čo vlastne musí byť, aby som to mohol pozorovať? Takto sa vyvíjajú všetky vedy a o tom píše (citujem spamäti): človek, ktorý nemá v hlave teóriu, pod vplyvom rôznych udalostí (pozorovaní) uhne od jednej myšlienky k druhej. Nie nadarmo sa hovorí: nie je nič praktickejšie ako dobrá teória.

Príklad z praxe. Môj podriadený sa pomýli a kolega (vedúci iného oddelenia) hovorí, že na nedbanlivého zamestnanca by bolo potrebné uplatniť manažérsky vplyv (inými slovami potrestať / pokarhať). A viem, že tento zamestnanec urobí 4-5 tisíc operácií rovnakého typu mesačne a počas tejto doby neurobí viac ako 10 chýb. Cítite rozdiel v paradigme? Kolegyňa reaguje na pozorovanie a ja mám a priori vedomosť o tom, že zamestnanec robí určitý počet chýb, takže ďalší tento poznatok neovplyvnil... Teraz, ak sa na konci mesiaca ukáže, že sú napr. príklad 15 takýchto chýb!.. To sa už stane dôvodom na skúmanie príčin nedodržiavania noriem.

Ste presvedčení o dôležitosti bayesovského prístupu? Zaujatý? Dúfam". A teraz mucha. Žiaľ, Bayesovské myšlienky sa zriedkakedy dávajú na prvý pokus. Úprimne povedané, nemal som šťastie, pretože som sa s týmito myšlienkami zoznámil prostredníctvom populárnej literatúry, po ktorej prečítaní zostalo veľa otázok. Keď som plánoval napísať poznámku, zozbieral som všetko, čo som predtým načrtol podľa Bayesa, a naštudoval som si aj to, čo píšu na internete. Predstavujem vám svoj najlepší odhad na túto tému. Úvod do Bayesovskej pravdepodobnosti.

Odvodenie Bayesovej vety

Uvažujme nasledujúci experiment: pomenujeme ľubovoľné číslo ležiace na segmente a zafixujeme, keď je toto číslo napríklad medzi 0,1 a 0,4 (obr. 1a). Pravdepodobnosť tejto udalosti sa rovná pomeru dĺžky segmentu k celkovej dĺžke segmentu za predpokladu, že výskyt čísel na segmente ekvipravdepodobný. Matematicky sa to dá napísať p(0,1 <= X <= 0,4) = 0,3, или кратко R(X) = 0,3, kde R- pravdepodobnosť, X je náhodná premenná v rozsahu , X je náhodná premenná v rozsahu . To znamená, že pravdepodobnosť zasiahnutia segmentu je 30 %.

Ryža. 1. Grafická interpretácia pravdepodobností

Teraz uvažujme štvorec x (obr. 1b). Povedzme, že musíme pomenovať dvojice čísel ( X, r), z ktorých každá je väčšia ako nula a menšia ako jedna. Pravdepodobnosť, že X(prvé číslo) bude v rámci segmentu (modrá oblasť 1), rovná sa pomeru plochy modrej plochy k ploche celého štvorca, tj (0,4 - 0,1 ) * (1 - 0) / (1 * 1) = 0, 3, teda rovnakých 30 %. Pravdepodobnosť, že r je vo vnútri segmentu (zelená plocha 2) sa rovná pomeru plochy zelenej plochy k ploche celého štvorca p(0,5 <= y <= 0,7) = 0,2, или кратко R(Y) = 0,2.

Čo sa zároveň dá naučiť o hodnotách X A r. Napríklad, aká je pravdepodobnosť, že obaja X A r sú v zodpovedajúcich daných segmentoch? Aby ste to dosiahli, musíte vypočítať pomer plochy domény 3 (priesečník zeleného a modrého pruhu) k ploche celého štvorca: p(X, Y) = (0,4 – 0,1) * (0,7 – 0,5) / (1 * 1) = 0,06.

Teraz predpokladajme, že chceme vedieť, aká je to pravdepodobnosť r je v intervale ak X je už v dosahu. To znamená, že v skutočnosti máme filter a keď voláme páry ( X, r), potom tie dvojice, ktoré nespĺňajú podmienku na nájdenie, ihneď vyradíme X v danom intervale a potom z vyfiltrovaných dvojíc spočítame tie, pre ktoré r spĺňa našu podmienku a pravdepodobnosť považujeme za pomer počtu párov, pre ktoré r leží vo vyššie uvedenom segmente k celkovému počtu filtrovaných párov (to znamená, pre ktoré X leží v segmente). Túto pravdepodobnosť môžeme zapísať ako p(Y|X pri X zasiahnuť v dosahu." Je zrejmé, že táto pravdepodobnosť sa rovná pomeru plochy plochy 3 k ploche modrej plochy 1. Plocha plochy 3 je (0,4 – 0,1) * (0,7 – 0,5) = 0,06 a plocha modrej oblasti 1 ( 0,4 - 0,1) * (1 - 0) = 0,3, potom je ich pomer 0,06 / 0,3 = 0,2. Inými slovami, pravdepodobnosť nájdenia r na segmente za predpokladu, že X patrí do segmentu p(Y|X) = 0,2.

V predchádzajúcom odseku sme vlastne sformulovali identitu: p(Y|X) = p(X, Y) /p( X). Znie: „pravdepodobnosť zasiahnutia pri v rozsahu za predpokladu, že X zásah v dosahu sa rovná pomeru pravdepodobnosti súčasného zásahu X v dosahu a pri v rozsahu, na pravdepodobnosť zásahu X do rozsahu."

Analogicky zvážte pravdepodobnosť p(X|Y). Voláme páry X, r) a filtrovať tie, pre ktoré r leží medzi 0,5 a 0,7, potom je pravdepodobnosť, že X je v segmente za predpokladu, že r patrí do segmentu sa rovná pomeru plochy 3 k ploche zelene 2: p(X|Y) = p(X, Y) / p(Y).

Všimnite si, že pravdepodobnosti p(X, Y) A p(Y, X) sú rovnaké a obe sa rovnajú pomeru plochy zóny 3 k ploche celého štvorca, ale pravdepodobnosti p(Y|X) A p(X|Y) nerovná sa; kým pravdepodobnosť p(Y|X) sa rovná pomeru plochy 3 k ploche 1 a p(X|Y) – doména 3 až doména 2. Všimnite si aj to p(X, Y) sa často označuje ako p(X&Y).

Máme teda dve definície: p(Y|X) = p(X, Y) /p( X) A p(X|Y) = p(X, Y) / p(Y)

Prepíšme tieto rovnosti ako: p(X, Y) = p(Y|X)*p( X) A p(X, Y) = p(X|Y) * p(Y)

Keďže ľavé strany sú rovnaké, sú rovnaké aj pravé: p(Y|X)*p( X) = p(X|Y) * p(Y)

Alebo môžeme prepísať poslednú rovnosť ako:

Toto je Bayesova veta!

Je možné, že takéto jednoduché (takmer tautologické) transformácie dávajú vznik veľkej vete!? Neponáhľajte sa k záverom. Poďme sa znova porozprávať o tom, čo sme dostali. Bola tu určitá počiatočná (a priori) pravdepodobnosť R(X), že náhodná premenná X rovnomerne rozložené na segmente spadá do rozsahu X. Stala sa nejaká udalosť Y, v dôsledku čoho sme získali aposteriórnu pravdepodobnosť tej istej náhodnej premennej X: R(X|Y) a táto pravdepodobnosť sa líši od R(X) koeficientom . Udalosť Y nazývané dôkazy, viac-menej potvrdzujúce alebo vyvracajúce X. Tento koeficient sa niekedy nazýva dôkaznú silu. Čím silnejší je dôkaz, tým viac skutočnosť pozorovania Y mení predchádzajúcu pravdepodobnosť, tým viac sa neskoršia pravdepodobnosť líši od predchádzajúcej. Ak sú dôkazy slabé, posterior je takmer rovnaký ako predchádzajúci.

Bayesov vzorec pre diskrétne náhodné premenné

V predchádzajúcej časti sme odvodili Bayesov vzorec pre spojité náhodné premenné x a y definované na intervale . Uvažujme o príklade s diskrétnymi náhodnými premennými, z ktorých každá nadobúda dve možné hodnoty. Pri bežných lekárskych prehliadkach sa zistilo, že vo veku 40 rokov trpí rakovinou prsníka 1 % žien. 80% žien s rakovinou má pozitívne výsledky mamografie. 9,6 % zdravých žien má tiež pozitívne výsledky mamografie. Pri vyšetrení mala žena tejto vekovej kategórie pozitívny výsledok na mamografii. Aká je pravdepodobnosť, že skutočne má rakovinu prsníka?

Priebeh uvažovania/výpočtov je nasledovný. Z 1 % pacientov s rakovinou poskytne mamografia 80 % pozitívnych výsledkov = 1 % * 80 % = 0,8 %. Z 99 % zdravých žien poskytne mamografia 9,6 % pozitívnych výsledkov = 99 % * 9,6 % = 9,504 %. Celkovo je z 10,304 % (9,504 % + 0,8 %) s pozitívnymi výsledkami na mamografii iba 0,8 % chorých a zvyšných 9,504 % je zdravých. Pravdepodobnosť, že žena s pozitívnym mamografom má rakovinu, je teda 0,8 % / 10,304 % = 7,764 %. Mysleli ste si 80% alebo tak?

V našom príklade má Bayesov vzorec nasledujúcu formu:

Povedzme si ešte raz o „fyzickom“ význame tohto vzorca. X je náhodná premenná (diagnóza), ktorá nadobúda tieto hodnoty: X 1- chorý a X 2- zdravý; Y– náhodná premenná (výsledok merania - mamografia), ktorá nadobúda hodnoty: Y 1- pozitívny výsledok a Y2- negatívny výsledok; p(X 1)- pravdepodobnosť ochorenia pred mamografiou (a priori pravdepodobnosť), rovná 1 %; R(Y 1 |X 1 ) – pravdepodobnosť pozitívneho výsledku, ak je pacient chorý (podmienená pravdepodobnosť, pretože musí byť špecifikovaná v podmienkach úlohy), rovná 80 %; R(Y 1 |X 2 ) – pravdepodobnosť pozitívneho výsledku, ak je pacient zdravý (tiež podmienená pravdepodobnosť), rovná 9,6 %; p(X 2)- pravdepodobnosť, že je pacientka zdravá pred mamografiou (a priori pravdepodobnosť), rovná sa 99 %; p(X1|Y 1 ) – pravdepodobnosť, že je pacientka chorá pri pozitívnom výsledku mamografie (zadná pravdepodobnosť).

Je vidieť, že zadná pravdepodobnosť (to, čo hľadáme) je úmerná predchádzajúcej pravdepodobnosti (počiatočnej) s o niečo zložitejším koeficientom . Ešte raz zdôrazním. Podľa môjho názoru je to základný aspekt Bayesovského prístupu. rozmer ( Y) pridal k pôvodne dostupným (a priori) určité množstvo informácií, ktoré objasnili naše poznatky o objekte.

Príklady

Ak chcete konsolidovať pokrytý materiál, skúste vyriešiť niekoľko problémov.

Príklad 1 Sú tam 3 urny; v prvých 3 biele guličky a 1 čierna; v druhom - 2 biele gule a 3 čierne; v treťom - 3 biele gule. Niekto sa náhodne priblíži k jednej z urien a vytiahne z nej 1 loptičku. Táto lopta je biela. Nájdite zadné pravdepodobnosti, že loptičku vytiahnete z 1., 2., 3. urny.

Riešenie. Máme tri hypotézy: H 1 = (vybratá prvá urna), H 2 = (vybratá druhá urna), H 3 = (vybratá tretia urna). Keďže urna je vybraná náhodne, apriórne pravdepodobnosti hypotéz sú: Р(Н 1) = Р(Н 2) = Р(Н 3) = 1/3.

V dôsledku experimentu sa objavila udalosť A = (z vybranej urny bola vybratá biela guľa). Podmienené pravdepodobnosti udalosti A pri hypotézach H 1, H 2, H 3: P(A|H 1) = 3/4, P(A|H 2) = 2/5, P(A|H 3) = 1. Prvá rovnosť napríklad znie takto: „pravdepodobnosť vytiahnutia bielej gule, ak je vybratá prvá urna, je 3/4 (keďže v prvej urne sú 4 gule a 3 z nich sú biele)“.

Použitím Bayesovho vzorca nájdeme zadné pravdepodobnosti hypotéz:

Vo svetle informácií o výskyte udalosti A sa teda zmenili pravdepodobnosti hypotéz: najpravdepodobnejšou sa stala hypotéza H 3, najmenej pravdepodobnou - hypotéza H 2 .

Príklad 2 Dvaja strelci nezávisle strieľajú na ten istý cieľ, pričom každý strieľa jednu ranu. Pravdepodobnosť zasiahnutia cieľa pre prvého strelca je 0,8, pre druhého - 0,4. Po streľbe sa našla jedna diera v terči. Nájdite pravdepodobnosť, že táto jamka patrí prvému strelcovi (výsledok (obe jamky sa zhodujú) zahodíme ako zanedbateľne nepravdepodobný).

Riešenie. Pred experimentom sú možné nasledujúce hypotézy: H 1 = (prvý ani druhý šíp nezasiahne), H 2 = (oba šípy zasiahnu), H 3 - (prvý strelec zasiahne a druhý nezasiahne). ), H 4 = (prvý strelec nezasiahne a druhý zasiahne). Predchádzajúce pravdepodobnosti hypotéz:

P (H 1) \u003d 0,2 * 0,6 \u003d 0,12; P (H2) \u003d 0,8 * 0,4 \u003d 0,32; P (H 3) \u003d 0,8 * 0,6 \u003d 0,48; P (H 4) \u003d 0,2 * 0,4 \u003d 0,08.

Podmienené pravdepodobnosti pozorovaného javu A = (v cieli je jedna diera) podľa týchto hypotéz sú: P(A|H 1) = P(A|H 2) = 0; P(A|H3) = P(A|H4) = 1

Po skúsenostiach sa hypotézy H 1 a H 2 stanú nemožnými a zadné pravdepodobnosti hypotéz H 3 a H 4 podľa Bayesovho vzorca budú:

Bayes proti spamu

Bayesov vzorec našiel široké uplatnenie pri vývoji spamových filtrov. Povedzme, že chcete trénovať počítač, aby určil, ktoré e-maily sú spam. Vychádzame zo slovníka a slovných spojení pomocou bayesovských odhadov. Najprv vytvorte priestor pre hypotézy. Majme 2 hypotézy týkajúce sa akéhokoľvek písmena: H A je spam, H B nie je spam, ale normálne, potrebné písmeno.

Najprv si „natrénujme“ náš budúci antispamový systém. Vezmime si všetky písmenká, ktoré máme a rozdelíme ich na dve „kopy“ po 10 písmen. Do jednej vložíme spamové listy a nazveme ju halda H A, do druhej vložíme potrebnú korešpondenciu a nazveme ju halda H B. Teraz sa pozrime: aké slová a frázy sa nachádzajú v spame a potrebných e-mailoch a s akou frekvenciou? Tieto slová a frázy sa budú nazývať dôkazy a označovať ich E 1 , E 2 ... Ukazuje sa, že bežne používané slová (napríklad slová „ako“, „váš“) v hromadách H A a H B sa vyskytujú približne s rovnakú frekvenciu. Prítomnosť týchto slov v liste nám teda nehovorí nič o tom, do ktorej haldy patrí (slabý dôkaz). Priraďme týmto slovám neutrálnu hodnotu odhadu pravdepodobnosti „spamu“, povedzme 0,5.

Nech sa fráza „konverzačná angličtina“ objavuje len v 10 písmenách a častejšie v spamových e-mailoch (napríklad v 7 spamových e-mailoch zo všetkých 10) ako v tých správnych (3 z 10). Dajme tejto fráze vyššie skóre 7/10 pre spam a nižšie skóre pre bežné e-maily: 3/10. Naopak, ukázalo sa, že slovo „kamarát“ sa častejšie vyskytuje v bežných písmenách (6 z 10). A tak sme dostali krátky list: „Priateľ! Ako sa hovorí po anglicky?. Skúsme zhodnotiť jeho „spamovosť“. Uvedieme všeobecné odhady P(H A), P(H B) príslušnosti ku každej halde pomocou trochu zjednodušeného Bayesovho vzorca a našich približných odhadov:

P(HA) = A/(A+B), Kde A \u003d p a1 * p a2 * ... * panvica, B \u003d p b1 * p b2 * ... * p b n \u003d (1 - p a1) * (1 - p a2) * ... * ( 1 - p an).

Tabuľka 1. Zjednodušené (a neúplné) Bayesovské hodnotenie písania

Náš hypotetický list teda dostal hodnotenie pravdepodobnosti spolupatričnosti s dôrazom v smere „spamu“. Môžeme sa rozhodnúť hodiť list do jednej z kôp? Stanovme si prahy rozhodovania:

  • Budeme predpokladať, že písmeno patrí do haldy H i, ak P(Hi) ≥ T.
  • Písmeno nepatrí do haldy, ak P(H i) ≤ L.
  • Ak L ≤ P(Hi) ≤ T, potom nemožno urobiť žiadne rozhodnutie.

Môžete si vziať T = 0,95 a L = 0,05. Keďže za predmetný list a 0,05< P(H A) < 0,95, и 0,05 < P(H В) < 0,95, то мы не сможем принять решение, куда отнести данное письмо: к спаму (H A) или к нужным письмам (H B). Можно ли улучшить оценку, используя больше информации?

Áno. Vypočítajme skóre pre každý dôkaz iným spôsobom, presne ako navrhol Bayes. Nechať byť:

F a je celkový počet spamových e-mailov;

F ai je počet písmen s certifikátom i v hromade spamu;

Fb je celkový počet potrebných písmen;

F bi je počet písmen s certifikátom i v hromade potrebných (relevantných) písmen.

Potom: p ai = Fai/Fa, pbi = Fbi/Fb. P(HA) = A/(A+B), P(HB) = B/(A+B), KdeА = p a1 *p a2 *…*p an , B = p b1 *p b2 *…*p b n

Upozorňujeme, že skóre dôkazových slov p ai a p bi sa stalo objektívnym a možno ich vypočítať bez ľudskej účasti.

Tabuľka 2. Presnejší (ale neúplný) Bayesovský odhad dostupných funkcií z listu

Dostali sme celkom jednoznačný výsledok - s veľkou pravdepodobnosťou možno písmenu priradiť potrebné písmená, keďže P(H B) = 0,997 > T = 0,95. Prečo sa zmenil výsledok? Pretože sme použili viac informácií - zohľadnili sme počet písmen v každej z kôp a mimochodom oveľa správnejšie určili odhady p ai a p bi. Boli určené rovnakým spôsobom ako samotný Bayes, a to výpočtom podmienených pravdepodobností. Inými slovami, p a3 je pravdepodobnosť, že sa v e-maile objaví slovo „kamarát“, keďže e-mail už patrí do haldy spamu H A . Výsledok na seba nenechal dlho čakať – zdá sa, že sa vieme rozhodnúť s väčšou istotou.

Bayes vs korporátne podvody

Zaujímavú aplikáciu Bayesovho prístupu opísal MAGNUS8.

Môj aktuálny projekt (IS na odhaľovanie podvodov vo výrobnom podniku) využíva Bayesov vzorec na určenie pravdepodobnosti podvodu (podvodu) za prítomnosti/neprítomnosti viacerých skutočností nepriamo v prospech hypotézy o možnosti podvodu. Algoritmus je samoučiaci sa (so spätnou väzbou), t.j. prepočítava svoje koeficienty (podmienené pravdepodobnosti) pri skutočnom potvrdení alebo nepotvrdení podvodu počas overovania ekonomickou bezpečnostnou službou.

Pravdepodobne stojí za to povedať, že takéto metódy pri navrhovaní algoritmov vyžadujú pomerne vysokú matematickú kultúru vývojára, pretože najmenšia chyba pri odvodzovaní a/alebo implementácii výpočtových vzorcov anuluje a zdiskredituje celú metódu. Na vine sú najmä pravdepodobnostné metódy, pretože ľudské myslenie nie je prispôsobené na prácu s pravdepodobnostnými kategóriami, a preto neexistuje „viditeľnosť“ a pochopenie „fyzikálneho významu“ medziľahlých a konečných pravdepodobnostných parametrov. Takéto chápanie existuje len pre základné pojmy teórie pravdepodobnosti a potom už len treba veľmi opatrne kombinovať a odvodzovať zložité veci podľa zákonov teórie pravdepodobnosti – pri zložených objektoch už zdravý rozum nepomôže. S tým sú spojené najmä dosť vážne metodologické súboje, ktoré sa odohrávajú na stránkach moderných kníh o filozofii pravdepodobnosti, ako aj veľké množstvo sofizmov, paradoxov a kuriozít na túto tému.

Ďalšou nuansou, ktorej som musel čeliť, je, že bohužiaľ takmer všetko, čo je viac či menej POUŽITEĽNÉ V PRAXI na túto tému, je napísané v angličtine. V ruskojazyčných zdrojoch je v podstate len známa teória s demonštračnými príkladmi len pre najprimitívnejšie prípady.

Plne súhlasím s posledným komentárom. Napríklad Google, keď sa snažil nájsť niečo ako kniha „Bayesian Probability“, nedal nič zrozumiteľné. Pravda, povedal, že kniha s Bayesovskou štatistikou bola v Číne zakázaná. (Profesor štatistiky Andrew Gelman informoval na blogu Kolumbijskej univerzity, že jeho kniha Analýza údajov s regresiou a viacúrovňovými/hierarchickými modelmi bola v Číne zakázaná publikovať. text.“) Zaujímalo by ma, či podobný dôvod neviedol k absencii kníh o Bayesianovi. pravdepodobnosť v Rusku?

Konzervativizmus v procese spracovania ľudskej informácie

Pravdepodobnosti určujú mieru neistoty. Pravdepodobnosť, ako podľa Bayesa, tak aj podľa našej intuície, je jednoducho číslo medzi nulou a tým, čo predstavuje mieru, do akej trochu idealizovaný človek verí, že tvrdenie je pravdivé. Dôvod, prečo je človek do istej miery idealizovaný, je ten, že súčet jeho pravdepodobností pre dve navzájom sa vylučujúce udalosti sa musí rovnať jeho pravdepodobnosti, že nastane jedna z týchto udalostí. Vlastnosť aditivity má také dôsledky, že len málo skutočných ľudí sa s nimi všetkým vyrovná.

Bayesova veta je triviálnym dôsledkom vlastnosti aditivity, nepopierateľný a schválený všetkými pravdepodobnostami, bayesovskými aj inými. Jedným zo spôsobov, ako to napísať, je nasledujúci. Ak P(H A |D) je následná pravdepodobnosť, že hypotéza A bola po pozorovaní danej hodnoty D, P(HA) je jej predchádzajúca pravdepodobnosť pred pozorovaním danej hodnoty D, P(D|HA ) je pravdepodobnosť, že a bude dodržaná daná hodnota D, ak H A je pravdivé a P(D) je nepodmienená pravdepodobnosť danej hodnoty D, potom

(1) P(HA |D) = P(D|HA) * P(HA) / P(D)

P(D) je najlepšie chápať ako normalizujúcu konštantu, ktorá spôsobuje, že zadné pravdepodobnosti sa pridávajú k jednej v rámci vyčerpávajúceho súboru vzájomne sa vylučujúcich hypotéz, ktoré sa zvažujú. Ak to treba vypočítať, môže to byť takto:

Ale častejšie je P(D) skôr eliminované ako započítané. Pohodlný spôsob, ako ho odstrániť, je transformovať Bayesovu vetu do podoby vzťahu pravdepodobnosť-pravdepodobnosť.

Zvážte ďalšiu hypotézu, H B , vzájomne sa vylučujúcu s H A, a zmeňte svoj názor na to na základe rovnakej danej veličiny, ktorá zmenila váš názor na HA. ​​Bayesova veta hovorí, že

(2) P(H B | D) = P(D|H B) * P(H B) / P(D)

Teraz vydelíme rovnicu 1 rovnicou 2; výsledok bude takýto:

kde Ω 1 je zadná pravdepodobnosť v prospech HA z hľadiska HB, Ω 0 je skoršia pravdepodobnosť a L je číslo známe štatistikom ako pomer pravdepodobností. Rovnica 3 je rovnakou relevantnou verziou Bayesovej vety ako rovnica 1 a je často oveľa užitočnejšia najmä pre experimenty zahŕňajúce hypotézy. Bayesovskí zástancovia tvrdia, že Bayesov teorém je formálne optimálnym pravidlom, ako revidovať názory vo svetle nových údajov.

Máme záujem porovnať ideálne správanie definované Bayesovou vetou so skutočným správaním ľudí. Aby ste mali nejakú predstavu o tom, čo to znamená, skúsme experiment s vami ako subjektom. Táto taška obsahuje 1000 pokrových žetónov. Mám dve z týchto vrecúšok, jednu so 700 červenými a 300 modrými žetónmi a druhú s 300 červenými a 700 modrými. Hodil som si mincou, aby som sa rozhodol, ktorý použijem. Ak sú teda naše názory rovnaké, vaša aktuálna pravdepodobnosť, že vytiahnete vrece s viacerými červenými žetónmi, je 0,5. Teraz náhodne vzorkujete a vraciate sa po každom tokene. V 12 žetónoch získate 8 červených a 4 modré. Teraz, na základe všetkého, čo viete, aká je pravdepodobnosť, že taška má viac červených? Je jasné, že je vyššia ako 0,5. Prosím, nepokračujte v čítaní, kým si nezaznamenáte svoje hodnotenie.

Ak vyzeráte ako typický subjekt, vaše skóre sa pohybuje medzi 0,7 a 0,8. Ak by sme však urobili zodpovedajúci výpočet, odpoveď by bola 0,97. Skutočne je veľmi zriedkavé, že človek, u ktorého sa predtým nepreukázal vplyv konzervativizmu, príde s takým vysokým odhadom, aj keď poznal Bayesovu vetu.

Ak je podiel červených lupienkov vo vrecúšku R, potom pravdepodobnosť získania rčervené žetóny a ( n-r) modrá in n vzorky s návratom - pr r (1–p)n–r. V typickom experimente so sáčkom a pokerovými žetónmi, ak HA znamená, že podiel červených žetónov je r A A HB znamená, že podiel je RB, potom pomer pravdepodobnosti:

Pri aplikácii Bayesovho vzorca sa musí brať do úvahy iba pravdepodobnosť skutočného pozorovania a nie pravdepodobnosti iných pozorovaní, ktoré mohol urobiť, ale neurobil. Tento princíp má široké dôsledky pre všetky štatistické a neštatistické aplikácie Bayesovej vety; je najdôležitejším technickým nástrojom bayesovského myslenia.

Bayesovská revolúcia

Vaši priatelia a kolegovia hovoria o niečom, čo sa nazýva "Bayesova veta" alebo "Bayesovské pravidlo" alebo niečo, čo sa nazýva Bayesovské myslenie. Naozaj ich to baví, takže idete online a nájdete stránku o Bayesovej vete a... Je to rovnica. A to je všetko... Prečo matematický pojem vyvoláva v mysliach také nadšenie? Aký druh „Bayesovskej revolúcie“ prebieha medzi vedcami a tvrdí sa, že aj samotný experimentálny prístup možno označiť za jej špeciálny prípad? Aké je tajomstvo, ktoré prívrženci Bayesa poznajú? Aké svetlo vidia?

Bayesovská revolúcia vo vede nenastala, pretože čoraz viac kognitívnych vedcov si zrazu začalo všímať, že duševné javy majú bayesovskú štruktúru; nie preto, že vedci v každej oblasti začali používať Bayesovu metódu; ale pretože samotná veda je špeciálnym prípadom Bayesovej vety; experimentálny dôkaz je Bayesovský dôkaz. Bayesiánski revolucionári tvrdia, že keď urobíte experiment a získate dôkaz, ktorý „podporí“ alebo „vyvráti“ vašu teóriu, toto potvrdenie alebo vyvrátenie sa deje podľa Bayesovských pravidiel. Napríklad musíte vziať do úvahy nielen to, že vaša teória môže vysvetliť tento jav, ale aj to, že existujú ďalšie možné vysvetlenia, ktoré môžu tiež predpovedať tento jav.

Predtým bola najpopulárnejšou filozofiou vedy stará filozofia, ktorú vytlačila Bayesovská revolúcia. Myšlienka Karla Poppera, že teórie možno úplne sfalšovať, ale nikdy nie úplne potvrdiť, je ďalším špeciálnym prípadom Bayesovských pravidiel; ak p(X|A) ≈ 1 - ak teória robí správne predpovede, potom pozorovanie ~X veľmi silne falšuje A. Na druhej strane, ak p(X|A) ≈ 1 a pozorujeme X, toto nepodporuje teória veľmi veľa; je možná nejaká iná podmienka B, taká, že p(X|B) ≈ 1, a pri ktorej pozorovanie X nie je dôkazom pre A, ale dôkazom pre B. Aby sme pozorovali, že X definitívne potvrdzuje A, nemuseli by sme vedieť, že p( X|A) ≈ 1 a to p(X|~A) ≈ 0, čo nemôžeme vedieť, pretože nemôžeme zvážiť všetky možné alternatívne vysvetlenia. Napríklad, keď Einsteinova teória všeobecnej relativity prekonala Newtonovu vysoko overiteľnú teóriu gravitácie, urobila zo všetkých predpovedí Newtonovej teórie špeciálny prípad Einsteinovej.

Podobne Popperovo tvrdenie, že myšlienka musí byť falzifikovateľná, možno interpretovať ako prejav Bayesovho pravidla o zachovaní pravdepodobnosti; ak je výsledok X pozitívnym dôkazom teórie, potom výsledok ~X musí do určitej miery falšovať teóriu. Ak sa snažíte interpretovať X aj ~X ako „podporu“ teórie, Bayesovské pravidlá hovoria, že je to nemožné! Ak chcete zvýšiť pravdepodobnosť teórie, musíte ju podrobiť testom, ktoré môžu potenciálne znížiť jej pravdepodobnosť; nie je to len pravidlo na odhaľovanie šarlatánov vo vede, ale dôsledok Bayesovskej vety o pravdepodobnosti. Na druhej strane, Popperova myšlienka, že je potrebné iba falšovanie a nie je potrebné žiadne potvrdenie, je mylná. Bayesov teorém ukazuje, že falšovanie je v porovnaní s potvrdením veľmi silným dôkazom, ale falšovanie má stále pravdepodobnostný charakter; neriadi sa zásadne odlišnými pravidlami a nelíši sa v tomto od potvrdenia, ako tvrdí Popper.

Zisťujeme teda, že mnohé javy v kognitívnych vedách plus štatistické metódy používané vedcami, plus samotná vedecká metóda, to všetko sú špeciálne prípady Bayesovej vety. O tom je Bayesovská revolúcia.

Vitajte v Bayesianskom sprisahaní!

Literatúra o Bayesovej pravdepodobnosti

2. Nositeľ Nobelovej ceny za ekonómiu Kahneman (et al.) opisuje množstvo rôznych aplikácií Bayesa v nádhernej knihe. Len v zhrnutí tejto veľmi rozsiahlej knihy som napočítal 27 zmienok o mene presbyteriánskeho kazateľa. Minimálne vzorce. (.. veľmi sa mi to páčilo. Pravda, je to komplikované, veľa matematiky (a kde bez nej), ale jednotlivé kapitoly (napr. kapitola 4. Informácie), jasne k téme. Radím každému. Aj keď matematika je je pre vás ťažké, prečítajte si riadok, preskočte matematiku a lovte užitočné obilniny ...

14. (dodatok zo dňa 15.1.2017), kapitola z knihy Tonyho Crillyho. 50 nápadov, o ktorých by ste mali vedieť. Matematika.

Fyzik Richard Feynman, laureát Nobelovej ceny, o jednom filozofovi s obzvlášť veľkou domýšľavosťou raz povedal: „Vôbec ma nedráždi filozofia ako veda, ale pompéznosť, ktorá sa okolo nej vytvorila. Keby sa tak filozofi dokázali smiať sami sebe! Keby tak mohli povedať: "Ja hovorím, že je to takto, ale von Leipzig si myslel, že je to inak, a tiež o tom niečo vie." Keby si aspoň spomenuli objasniť, že je to len ich .

Formulár udalostí celá skupina, ak sa aspoň jedna z nich nevyhnutne vyskytne ako výsledok experimentu a sú párovo nekonzistentné.

Predpokladajme, že udalosť A môže nastať len spolu s jednou z niekoľkých párovo nekompatibilných udalostí, ktoré tvoria kompletnú skupinu. Zavolajme udalosti i= 1, 2,…, n) hypotézďalšie skúsenosti (a priori). Pravdepodobnosť výskytu udalosti A je určená vzorcom plná pravdepodobnosť :

Príklad 16 Sú tam tri urny. Prvá urna obsahuje 5 bielych a 3 čierne gule, druhá urna obsahuje 4 biele a 4 čierne gule a tretia urna obsahuje 8 bielych guľôčok. Jedna z urien sa vyberie náhodne (môže to znamenať, že sa napríklad vyberie pomocná urna obsahujúca tri loptičky očíslované 1, 2 a 3). Z tejto urny sa náhodne vyžrebuje lopta. Aká je pravdepodobnosť, že bude čierna?

Riešenie. Udalosť A– ťahá sa čierna guľa. Ak by sa vedelo, z ktorej urny sa loptička ťahá, potom by sa požadovaná pravdepodobnosť dala vypočítať podľa klasickej definície pravdepodobnosti. Uveďme predpoklady (hypotézy) o tom, ktorá urna sa vyberie na vytiahnutie lopty.

Loptičku je možné žrebovať buď z prvej urny (hypotéza), alebo z druhej (hypotéza) alebo z tretej (hypotéza). Keďže sú rovnaké šance vybrať si ktorúkoľvek z urien, potom .

Z toho teda vyplýva

Príklad 17. Elektrické lampy sa vyrábajú v troch továrňach. Prvý závod vyrába 30% z celkového počtu elektrických lámp, druhý - 25%,
a tretí pre zvyšok. Výrobky prvého závodu obsahujú 1% chybných elektrických lámp, druhý - 1,5%, tretí - 2%. Obchod dostáva produkty zo všetkých troch tovární. Aká je pravdepodobnosť, že lampa zakúpená v obchode je chybná?

Riešenie. Je potrebné zadať predpoklady, v ktorom závode bola žiarovka vyrobená. Keď to vieme, môžeme nájsť pravdepodobnosť, že je chybný. Predstavme si notáciu udalostí: A– zakúpená elektrická lampa sa ukázala ako chybná, – lampa bola vyrobená v prvom závode, – lampa bola vyrobená v druhom závode,
– lampu vyrába tretia továreň.

Požadovaná pravdepodobnosť sa zistí podľa vzorca celkovej pravdepodobnosti:

Bayesov vzorec. Nech je úplná skupina párovo nekompatibilných udalostí (hypotéz). A je náhodná udalosť. potom

Posledný vzorec, ktorý vám umožňuje preceňovať pravdepodobnosti hypotéz po tom, čo sa dozvieme výsledok testu, v dôsledku čoho sa objavila udalosť A, sa nazýva Bayesov vzorec .

Príklad 18. Priemerne 50 % pacientov s týmto ochorením je prijatých do špecializovanej nemocnice TO, 30 % s ochorením L, 20 % –
s chorobou M. Pravdepodobnosť úplného vyliečenia choroby K sa rovná 0,7 pre choroby L A M tieto pravdepodobnosti sú 0,8 a 0,9. Pacient prijatý do nemocnice bol prepustený zdravý. Nájdite pravdepodobnosť, že tento pacient mal toto ochorenie K.


Riešenie. Zavádzame hypotézy: - pacient trpel chorobou TO L, pacientka trpela chorobou M.

Potom, podľa stavu problému, máme . Predstavme si udalosť A Pacient prijatý do nemocnice bol prepustený zdravý. Podľa podmienok

Podľa vzorca celkovej pravdepodobnosti dostaneme:

Bayesov vzorec.

Príklad 19. Nech je v urne päť loptičiek a všetky predpoklady o počte bielych loptičiek sú rovnako pravdepodobné. Z urny sa náhodne vyberie lopta a ukáže sa, že je biela. Aký je najpravdepodobnejší predpoklad o počiatočnom zložení urny?

Riešenie. Nech je hypotéza, že v urne biele gule t.j. je možné urobiť šesť predpokladov. Potom, podľa stavu problému, máme .

Predstavme si udalosť A Náhodne vytiahnutá biela guľa. Poďme počítať. Od , potom podľa Bayesovho vzorca máme:

Hypotéza je teda najpravdepodobnejšia, keďže .

Príklad 20. Zlyhali dva z troch nezávisle fungujúcich prvkov výpočtového zariadenia. Nájdite pravdepodobnosť zlyhania prvého a druhého prvku, ak sa pravdepodobnosť zlyhania prvého, druhého a tretieho prvku rovná 0,2; 0,4 a 0,3.

Riešenie. Označiť podľa A udalosť - dva prvky zlyhali. Je možné urobiť nasledujúce hypotézy:

- prvý a druhý prvok zlyhal a tretí prvok je prevádzkyschopný. Keďže prvky pracujú nezávisle, platí násobiaca veta:

KATEGÓRIE

POPULÁRNE ČLÁNKY

2023 "kingad.ru" - ultrazvukové vyšetrenie ľudských orgánov