Një shpjegim i thjeshtë i teoremës së Bayes. Formula e probabilitetit total

Gjatë nxjerrjes së formulës së probabilitetit total, supozohej se ngjarja A, probabiliteti i të cilit duhej përcaktuar, mund të ndodhte me një nga ngjarjet N 1 , N 2 , ... , N n, duke formuar një grup të plotë ngjarjesh të papajtueshme në çift. Për më tepër, gjasat e këtyre ngjarjeve (hipotezave) ishin të njohura paraprakisht. Le të supozojmë se është kryer një eksperiment, si rezultat i të cilit ngjarja A ka ardhur. Ky informacion shtesë na lejon të rivlerësojmë probabilitetet e hipotezave. N i, duke llogaritur P(H i /A).

ose, duke përdorur formulën e probabilitetit total, marrim

Kjo formulë quhet formula e Bayes ose teorema e hipotezës. Formula e Bayes ju lejon të "rishikoni" probabilitetet e hipotezave pasi rezultati i eksperimentit që rezultoi në ngjarje të bëhet i njohur. A.

Probabilitetet Р(Н i)− këto janë probabilitetet apriori të hipotezave (llogariten para eksperimentit). Probabilitetet P(H i /A)− këto janë probabilitetet e pasme të hipotezave (ato llogariten pas eksperimentit). Formula e Bayes ju lejon të llogaritni probabilitetet e pasme nga probabilitetet e tyre të mëparshme dhe nga probabilitetet e kushtëzuara të një ngjarjeje A.

Shembull. Dihet se 5% e të gjithë meshkujve dhe 0.25% e të gjitha femrave janë të verbër. Një person i zgjedhur rastësisht bazuar në numrin e kartës së tij mjekësore vuan nga verbëria e ngjyrave. Sa është probabiliteti që të jetë mashkull?

Zgjidhje. Ngjarje A– një person vuan nga verbëria e ngjyrave. Hapësira e ngjarjeve elementare për eksperimentin - një person zgjidhet me numrin e kartës mjekësore - Ω = ( N 1 , N 2 ) përbëhet nga 2 ngjarje:

N 1 - zgjidhet një burrë,

N 2 - zgjidhet një grua.

Këto ngjarje mund të zgjidhen si hipoteza.

Sipas kushteve të problemit (zgjedhja e rastësishme), probabilitetet e këtyre ngjarjeve janë të njëjta dhe të barabarta P(N 1 ) = 0.5; P(N 2 ) = 0.5.

Në këtë rast, probabilitetet e kushtëzuara që një person vuan nga verbëria e ngjyrave janë të barabarta, përkatësisht:

R(A/N 1 ) = 0.05 = 1/20; R(A/N 2 ) = 0.0025 = 1/400.

Meqenëse dihet që personi i përzgjedhur është i verbër nga ngjyra, pra ngjarja ka ndodhur, ne përdorim formulën e Bayes për të rivlerësuar hipotezën e parë:

Shembull. Ka tre kuti me pamje identike. Kutia e parë përmban 20 topa të bardhë, kutia e dytë përmban 10 topa të bardhë dhe 10 topa të zinj dhe kutia e tretë përmban 20 topa të zinj. Një top i bardhë merret nga një kuti e zgjedhur rastësisht. Llogaritni probabilitetin që topi të jetë tërhequr nga kutia e parë.

Zgjidhje. Le të shënojmë me A ngjarje - shfaqja e një topi të bardhë. Mund të bëhen tre supozime (hipoteza) në lidhje me zgjedhjen e kutisë: N 1 ,N 2 , N 3 – përzgjedhja e kutisë së parë, të dytë dhe të tretë, përkatësisht.

Meqenëse zgjedhja e cilësdo prej kutive është po aq e mundshme, probabilitetet e hipotezave janë të njëjta:

P(N 1 )=P(N 2 )=P(N 3 )= 1/3.

Sipas problemit, probabiliteti për të nxjerrë një top të bardhë nga kutia e parë është

Probabiliteti për të nxjerrë një top të bardhë nga kutia e dytë



Probabiliteti për të nxjerrë një top të bardhë nga kutia e tretë

Ne gjejmë probabilitetin e dëshiruar duke përdorur formulën Bayes:

Përsëritja e testeve. formula e Bernulit.

Kryhen N prova, në secilën prej të cilave ngjarja A mund të ndodhë ose jo, dhe probabiliteti i ngjarjes A në çdo provë individuale është konstante, d.m.th. nuk ndryshon nga përvoja në përvojë. Ne tashmë e dimë se si të gjejmë probabilitetin e ngjarjes A në një eksperiment.

Me interes të veçantë është probabiliteti i shfaqjes së një numri të caktuar herë (m herë) të ngjarjes A në n eksperimente. Probleme të tilla mund të zgjidhen lehtësisht nëse testet janë të pavarura.

Def. Quhen disa teste i pavarur në lidhje me ngjarjen A , nëse probabiliteti i ngjarjes A në secilën prej tyre nuk varet nga rezultatet e eksperimenteve të tjera.

Probabiliteti P n (m) i ndodhjes së ngjarjes A saktësisht m herë (nuk ndodh n-m herë, ngjarje ) në këto n prova. Ngjarja A shfaqet në sekuenca shumë të ndryshme m herë).

- Formula e Bernulit.

Formulat e mëposhtme janë të dukshme:

Р n (m më pak k herë në n prova.

P n (m>k) = P n (k+1) + P n (k+2) +…+ P n (n) - probabiliteti i ndodhjes së ngjarjes A më shumë k herë në n prova.

Le të fillojmë me një shembull. Në urnën përballë jush, po aq e mundshme mund të ketë (1) dy topa të bardhë, (2) një të bardhë dhe një të zi, (3) dy të zinj. E tërhiqni topin dhe ai rezulton të jetë i bardhë. Si do ta vlerësonit tani? probabiliteti këto tre opsione (hipoteza)? Natyrisht, probabiliteti i hipotezës (3) me dy topa të zinj = 0. Por si të llogariten probabilitetet e dy hipotezave të mbetura!? Kjo mund të bëhet me formula Bayes, e cila në rastin tonë ka formën (numri i formulës korrespondon me numrin e hipotezës që testohet):

Shkarkoni shënimin në ose

X– variabla e rastësishme (hipoteza) duke marrë vlera: x 1- dy të bardha, x 2– një e bardhë, një e zezë; x 3– dy të zeza; – variabla e rastësishme (ngjarje) merr vlera: në 1– nxirret një top i bardhë dhe në 2– nxirret një top i zi; P(x 1)– probabiliteti i hipotezës së parë përpara se të vizatojë topin ( A priori gjasat ose mundësitë përpara përvojë) = 1/3; P(x 2)– probabiliteti i hipotezës së dytë para tërheqjes së topit = 1/3; P(x 3)– probabiliteti i hipotezës së tretë para tërheqjes së topit = 1/3; P(y 1|x 1)– probabiliteti i kushtëzuar për të vizatuar një top të bardhë, nëse hipoteza e parë është e vërtetë (topat janë të bardhë) = 1; P(y 1|x 2) probabiliteti për të vizatuar një top të bardhë nëse hipoteza e dytë është e vërtetë (një top është i bardhë, i dyti është i zi) = ½; P(y 1|x 3) probabiliteti për të vizatuar një top të bardhë nëse hipoteza e tretë është e vërtetë (të dyja të zeza) = 0; P(y 1)– probabiliteti për të vizatuar një top të bardhë = ½; R(y ​​2)– probabiliteti për të vizatuar një top të zi = ½; dhe së fundi, ajo që ne po kërkojmë - P (x 1|y 1) probabiliteti që hipoteza e parë të jetë e vërtetë (të dy topat janë të bardhë), duke pasur parasysh që ne vizatuam një top të bardhë ( a posteriori gjasat ose mundësitë pas përvojë); P (x 2|y 1) probabiliteti që hipoteza e dytë të jetë e vërtetë (një top është i bardhë, i dyti është i zi), me kusht që të vizatojmë një top të bardhë.

Probabiliteti që hipoteza e parë (dy të bardha) të jetë e vërtetë, duke pasur parasysh që kemi vizatuar një top të bardhë:

Probabiliteti që hipoteza e dytë të jetë e vërtetë (njëra është e bardhë, tjetra është e zezë), me kusht që të vizatojmë një top të bardhë:

Probabiliteti që hipoteza e tretë të jetë e vërtetë (dy të zeza), duke pasur parasysh që ne vizatuam një top të bardhë:

Çfarë bën formula e Bayes? Ai bën të mundur, bazuar në probabilitetet a priori të hipotezave - P(x 1), P(x 2), P(x 3)- dhe gjasat e ndodhjes së ngjarjeve - P (y 1), R(y ​​2)- llogaritni probabilitetet e pasme të hipotezave, për shembull, probabilitetin e hipotezës së parë, me kusht që të vizatohet një top i bardhë - P (x 1|y 1).

Le të kthehemi edhe një herë në formulën (1). Probabiliteti fillestar i hipotezës së parë ishte P(x 1) = 1/3. Me probabilitet P(y 1) = 1/2 ne mund të vizatojmë një top të bardhë, dhe me gjasë P(y 2) = 1/2- e zezë. E kemi nxjerrë të bardhën. Probabiliteti i vizatimit të bardhë, me kusht që hipoteza e parë të jetë e vërtetë P(y 1|x 1) = 1. Formula e Bayes thotë se që kur është tërhequr e bardha, probabiliteti i hipotezës së parë është rritur në 2/3, probabiliteti i hipotezës së dytë është ende 1/3 dhe probabiliteti i hipotezës së tretë është bërë zero.

Është e lehtë të kontrollosh që nëse nxirrnim një top të zi, probabilitetet e pasme do të ndryshonin në mënyrë simetrike: P (x 1|y 2) = 0, P (x 2|y 2) = 1/3, P(x 3|y 2) = 2/3.

Ja çfarë shkroi Pierre Simon Laplace për formulën e Bayes në një vepër të botuar në 1814:

Ky është parimi bazë i asaj dege të analizës së kontingjentit që merret me kalimet nga ngjarjet në shkaqe.

Pse formula e Bayes është kaq e vështirë për t'u kuptuar!? Sipas mendimit tim, sepse qasja jonë e zakonshme është arsyetimi nga shkaqet në pasoja. Për shembull, nëse ka 36 topa në një urnë, 6 prej të cilave janë të zeza dhe pjesa tjetër janë të bardha. Sa është probabiliteti për të vizatuar një top të bardhë? Formula e Bayes ju lejon të kaloni nga ngjarjet në arsye (hipoteza). Nëse do të kishim tre hipoteza dhe do të ndodhte një ngjarje, si ndikoi ajo ngjarje (dhe jo alternativa) në probabilitetet fillestare të hipotezave? Si kanë ndryshuar këto probabilitete?

Unë besoj se formula e Bayes nuk ka të bëjë vetëm me probabilitetet. Ajo ndryshon paradigmën e perceptimit. Cili është procesi i të menduarit kur përdoret paradigma deterministe? Nëse ka ndodhur një ngjarje, cili ishte shkaku i saj? Nëse ka pasur një aksident, emergjencë, konflikt ushtarak. Kush apo cili ishte faji i tyre? Çfarë mendon një vëzhgues Bayesian? Cila është struktura e realitetit që çoi në dhënë rasti ndaj një manifestimi të tillë dhe atij... Bajeziani e kupton se në ndryshe Në këtë rast, rezultati mund të ishte i ndryshëm...

Le t'i vendosim simbolet në formulat (1) dhe (2) pak më ndryshe:

Le të flasim përsëri për atë që shohim. Me probabilitet të barabartë fillestar (apriori), një nga tre hipotezat mund të jetë e vërtetë. Me probabilitet të barabartë mund të vizatojmë një top të bardhë ose të zi. E kemi nxjerrë të bardhën. Në dritën e këtij informacioni të ri shtesë, vlerësimi ynë i hipotezave duhet të rishqyrtohet. Formula e Bayes na lejon ta bëjmë këtë në mënyrë numerike. Probabiliteti paraprak i hipotezës së parë (formula 7) ishte P(x 1), u vizatua një top i bardhë, u bë probabiliteti i pasmë i hipotezës së parë P (x 1|në 1). Këto probabilitete ndryshojnë nga një faktor.

Ngjarje në 1 quhet provë që pak a shumë vërteton ose hedh poshtë një hipotezë x 1. Ky koeficient nganjëherë quhet fuqia e provës. Sa më e fuqishme të jetë prova (sa më shumë koeficienti ndryshon nga uniteti), aq më i madh është fakti i vëzhgimit në 1 ndryshon probabilitetin e mëparshëm, aq më shumë probabiliteti i pasëm ndryshon nga ai i mëparshmi. Nëse provat janë të dobëta (koeficienti ~1), probabiliteti i pasëm është pothuajse i barabartë me atë të mëparshëm.

Certifikata në 1 V = 2 herë ndryshuan probabilitetin paraprak të hipotezës x 1(formula 4). Në të njëjtën kohë, prova në 1 nuk ka ndryshuar probabilitetin e hipotezës x 2, që nga fuqia e saj = 1 (formula 5).

Në përgjithësi, formula e Bayes ka formën e mëposhtme:

X– një ndryshore e rastësishme (një grup hipotezash ekskluzive reciproke) që merr vlerat e mëposhtme: x 1, x 2, … , Xn. – një ndryshore e rastësishme (një grup ngjarjesh reciprokisht ekskluzive) që merr vlerat e mëposhtme: në 1, në 2, … , n. Formula e Bayes ju lejon të gjeni probabilitetin e pasëm të një hipoteze Xi me ndodhjen e një ngjarjeje y j. Numëruesi është produkt i probabilitetit paraprak të hipotezës XiP(xi) mbi probabilitetin që të ndodhë një ngjarje y j, nëse hipoteza është e vërtetë XiR(y j|xi). Emëruesi është shuma e produkteve të njëjtë si në numërues, por për të gjitha hipotezat. Nëse llogarisim emëruesin, marrim probabilitetin total të ndodhjes së ngjarjes j(nëse ndonjë nga hipotezat është e vërtetë) - R(y j) (si në formulat 1-3).

Edhe një herë për dëshminë. Ngjarje y j jep informacion shtesë, i cili ju lejon të rishikoni probabilitetin paraprak të hipotezës Xi. Fuqia e provës - – përmban në numërues probabilitetin e ndodhjes së ngjarjes y j, nëse hipoteza është e vërtetë Xi. Emëruesi është probabiliteti total i ndodhjes së ngjarjes. j(ose probabiliteti që të ndodhë një ngjarje j mesatare mbi të gjitha hipotezat). j më lart për hipotezë xi, se sa mesatarja për të gjitha hipotezat, atëherë provat janë në dobi të hipotezës xi, duke rritur probabilitetin e tij të pasëm R(y j|xi). Nëse probabiliteti i ndodhjes së një ngjarjeje j më poshtë për hipotezën xi se mesatarja për të gjitha hipotezat, atëherë evidenca ul probabilitetin e pasëm R(y j|xi) Për hipoteza xi. Nëse probabiliteti i ndodhjes së një ngjarjeje j për një hipotezë xiështë e njëjtë me mesataren për të gjitha hipotezat, atëherë evidenca nuk ndryshon probabilitetin e pasëm R(y j|xi) Për hipoteza xi.

Këtu janë disa shembuj që shpresoj se do të përforcojnë të kuptuarit tuaj të formulës së Bayes.

Problemi 2. Dy gjuajtës qëllojnë në mënyrë të pavarur në të njëjtin objektiv, secili qëllon nga një gjuajtje. Probabiliteti për të goditur objektivin për gjuajtësin e parë është 0.8, për të dytin - 0.4. Pas të shtënave, në objektiv është gjetur një vrimë. Gjeni probabilitetin që kjo vrimë i përket gjuajtësit të parë. .

Detyra 3. Objekti që monitorohet mund të jetë në një nga dy gjendjet: H 1 = (funksionon) dhe H 2 = (nuk funksionon). Probabilitetet paraprake të këtyre gjendjeve janë P(H 1) = 0.7, P(H 2) = 0.3. Ekzistojnë dy burime informacioni që ofrojnë informacione kontradiktore për gjendjen e objektit; burimi i parë raporton se objekti nuk funksionon, i dyti - se është duke funksionuar. Dihet se burimi i parë jep informacion të saktë me një probabilitet prej 0.9, dhe me një probabilitet prej 0.1 - informacion të pasaktë. Burimi i dytë është më pak i besueshëm: ai jep informacion të saktë me një probabilitet prej 0.7 dhe informacion të pasaktë me një probabilitet prej 0.3. Gjeni probabilitetet e pasme të hipotezave. .

Problemet 1–3 janë marrë nga libri shkollor nga E.S. Ventzel, L.A. Ovcharov. Teoria e probabilitetit dhe aplikimet e saj inxhinierike, seksioni 2.6 Teorema e hipotezës (formula Bayes).

Problemi 4 marrë nga libri, seksioni 4.3 Teorema e Bayes.

TEKNOLOGJIA E INFORMACIONIT, SHKENCA KOMPJUTERIKE DHE MENAXHIMI

Mbi zbatueshmërinë e formulës së Bayes

DOI 10.12737/16076

A. I. Dolgov **

1 Shoqëria aksionare "Byroja e Dizajnit për Monitorimin e Radios të Sistemit të Kontrollit, Navigimit dhe Komunikimit", Rostov-on-Don, Federata Ruse

Mbi zbatueshmërinë e formulës Bayes"*** A. I. Dolgov1**

1 "Zyra e projektimit për monitorimin e sistemeve të kontrollit, navigimit dhe komunikimit" SHA, Rostov-on-Don, Federata Ruse

Subjekti i këtij studimi është formula e Bayes. Qëllimi i kësaj pune është të analizojë dhe zgjerojë fushën e zbatimit të formulës. Detyra kryesore është të studiohen botimet kushtuar këtij problemi, të cilat bënë të mundur identifikimin e mangësive në përdorimin e formulës Bayes, duke çuar në rezultate të pasakta. Detyra tjetër është të ndërtojmë modifikime të formulës Bayes që marrin parasysh prova të ndryshme të vetme dhe marrin rezultate të sakta. Dhe së fundi, duke përdorur shembullin e të dhënave specifike të burimit, rezultatet e pasakta të marra duke përdorur formulën Bayes krahasohen me rezultatet e sakta të llogaritura duke përdorur modifikimet e propozuara. Për kryerjen e studimit janë përdorur dy metoda. Së pari, u krye një analizë e parimeve të ndërtimit të shprehjeve të njohura të përdorura për të shkruar formulën Bayes dhe modifikimet e saj. Së dyti, u krye një vlerësim krahasues i rezultateve (përfshirë atë sasior). Modifikimet e propozuara sigurojnë aplikim më të gjerë të formulës Bayes në teori dhe praktikë, duke përfshirë zgjidhjen e problemeve të aplikuara.

Fjalët kyçe: probabilitete të kushtëzuara, hipoteza jokonsistente, prova të pajtueshme dhe të papajtueshme, normalizim.

Formula Bayes" është objekti i kërkimit. Objektivi i punës është të analizojë aplikimin e formulës dhe të zgjerojë fushën e zbatueshmërisë së saj. Problemi i prioritetit të parë përfshin identifikimin e disavantazheve të formulës Bayes bazuar në studimin e botimeve përkatëse që çojnë në gabime. rezultatet. Detyra tjetër është ndërtimi i modifikimeve të formulës Bayes" për të siguruar një llogaritje të indikacioneve të ndryshme të vetme për të marrë rezultate të sakta. Dhe së fundi, rezultatet e pasakta të marra me aplikimin e formulës Bayes" krahasohen me rezultatet e sakta të llogaritura me përdorimin e modifikimet e propozuara të formulës me shembullin e të dhënave specifike fillestare. Në studime përdoren dy metoda. Së pari, bëhet analiza e parimeve të ndërtimit të shprehjeve të njohura të përdorura për të regjistruar formulën Bayesian dhe modifikimet e saj. Së dyti, bëhet një vlerësim krahasues i rezultateve (përfshirë atë sasior). Modifikimet e propozuara ofrojnë një aplikim më të gjerë të formulës Bayes" si në teori ashtu edhe në praktikë duke përfshirë zgjidhjen e problemeve të aplikuara.

Fjalët kyçe: probabilitete të kushtëzuara, hipoteza jokonsistente, tregues të pajtueshëm dhe të papajtueshëm, normalizues.

Prezantimi. Formula e Bayes përdoret gjithnjë e më shumë në teori dhe praktikë, duke përfshirë në zgjidhjen e problemeve të aplikuara duke përdorur teknologjinë kompjuterike. Përdorimi i procedurave llogaritëse të pavarura reciprokisht bën të mundur përdorimin e kësaj formule veçanërisht në mënyrë efektive gjatë zgjidhjes së problemeve në sistemet llogaritëse me shumë procesor, pasi në këtë rast zbatimi paralel kryhet në nivelin e qarkut të përgjithshëm dhe kur shtohet algoritmi ose klasa e problemeve tjetër. nuk ka nevojë të ripunohet për paralelizimin.

Objekti i këtij studimi është zbatueshmëria e formulës së Bayes për vlerësimin krahasues të probabiliteteve të kushtëzuara të pasme të hipotezave jokonsistente nën prova të ndryshme të vetme. Siç tregon analiza, në raste të tilla probabilitetet e normalizuara të ngjarjeve të kombinuara të papajtueshme që i përkasin

S X<и ч и

ËSHTË eö DHE ËSHTË X X<и H

“Puna u krye si pjesë e një projekti kërkimor iniciativ.

**E-mail: [email i mbrojtur]

""Kërkimi është bërë në kuadër të R&D të pavarur.

që korrespondojnë me grupe të ndryshme të plota ngjarjesh. Në të njëjtën kohë, rezultatet e krahasuara rezultojnë të jenë të pamjaftueshme për të dhënat reale statistikore. Kjo është për shkak të faktorëve të mëposhtëm:

Përdoret një normalizim i gabuar;

Prania ose mungesa e kryqëzimeve të provave të marra në konsideratë nuk merret parasysh.

Për të eliminuar mangësitë e identifikuara, janë identifikuar rastet e zbatueshmërisë së formulës Bayes. Nëse formula e specifikuar nuk është e zbatueshme, problemi i ndërtimit të modifikimit të saj zgjidhet, duke siguruar që të merren parasysh prova të ndryshme të vetme dhe të merren rezultate të sakta. Duke përdorur të dhëna fillestare specifike si shembull, u krye një vlerësim krahasues i rezultateve:

E pasaktë - e marrë duke përdorur formulën Bayes;

E saktë - llogaritet duke përdorur modifikimin e propozuar.

Dispozitat fillestare. Deklaratat e dhëna më poshtë do të bazohen në parimin e ruajtjes së raporteve të probabilitetit: “Përpunimi i saktë i probabiliteteve të ngjarjeve është i realizueshëm vetëm me normalizimin duke përdorur një pjesëtues normalizues të përbashkët, i cili siguron që raportet e probabiliteteve të normalizuara të jenë të barabarta me raportet e probabiliteteve të normalizuara përkatëse. . Ky parim paraqet bazën subjektive të teorisë së probabilitetit, por nuk është pasqyruar siç duhet në literaturën moderne arsimore dhe shkencore-teknike.

Nëse shkelet ky parim, informacioni për shkallën e mundësisë së ngjarjeve në shqyrtim shtrembërohet. Rezultatet dhe vendimet e marra bazuar në informacione të shtrembëruara rezultojnë të papërshtatshme ndaj të dhënave reale statistikore.

Ky artikull do të përdorë konceptet e mëposhtme:

Një ngjarje elementare është një ngjarje që nuk ndahet në elemente;

Ngjarje e kombinuar - një ngjarje që përfaqëson një ose një tjetër kombinim të ngjarjeve elementare;

Ngjarjet e përputhshme janë ngjarje që në disa raste të vlerësimit krahasues të probabiliteteve të tyre mund të jenë të papajtueshme, dhe në raste të tjera të pajtueshme;

Ngjarjet e papajtueshme janë ngjarje që janë të papajtueshme në të gjitha rastet.

Sipas teoremës së shumëzimit të probabilitetit, probabiliteti P (I ^E) i produktit të ngjarjeve elementare I ^ dhe

E llogaritet si prodhim i probabiliteteve P(Ik E) = P(E)P(I^E) . Në këtë drejtim, formula e Bayes është shpesh

është shkruar në formën P(Ik\E) =--- , duke përshkruar përkufizimin e probabiliteteve të kushtëzuara të pasme

Hipotezat P(I^E) Ik (k = 1,...n) bazuar në normalizimin e probabiliteteve apriori P(I^E) të ngjarjeve të kombinuara të papajtueshme I deri në E të marra në konsideratë produkt, faktorët e të cilit janë një nga hipotezat e konsideruara dhe një pjesë e provës e marrë në konsideratë. Në të njëjtën kohë, ne konsiderojmë gjithçka

ngjarjet e mundshme IKE (k = 1,...n) formojnë një grup të plotë IKE të ngjarjeve të kombinuara të papajtueshme, për shkak të

me të cilat probabilitetet e tyre P(Ik E) duhet të normalizohen duke marrë parasysh formulën e probabilitetit total, sipas së cilës

tufa P(E) = 2 P(Ik)P(E\Ik). Prandaj, formula e Bayes shkruhet më shpesh në formën më të përdorur:

R(Ik) R(EIk)

P(Ik\E) = -. (1)

^ kation i formulës së Bayes.

th Analiza e veçorive të ndërtimit të formulës Bayes që synon zgjidhjen e problemeve të aplikuara, si dhe shembuj

"dhe zbatimi i tij praktik na lejon të nxjerrim një përfundim të rëndësishëm në lidhje me zgjedhjen e një grupi të plotë ngjarjesh të kombinuara krahasuar sipas shkallës së mundësisë (secila prej të cilave është produkt i dy ngjarjeve elementare - njëra nga hipotezat dhe provat e marra në llogari). Kjo zgjedhje bëhet subjektivisht nga vendimmarrësi, bazuar në të dhënat hyrëse objektive të natyrshme në kushtet tipike të situatës: llojet dhe numri i hipotezave që vlerësohen dhe evidencat e marra veçanërisht parasysh.

Probabilitete të pakrahasueshme të hipotezave të dhëna të vetme të papajtueshme. Formula e Bayes përdoret tradicionalisht në rastin e përcaktimit të probabiliteteve të kushtëzuara a posteriori që nuk janë të krahasueshme në shkallën e mundësisë.

probabilitetet e hipotezave H^ dhënë dëshmi të vetme të papajtueshme, secila prej të cilave mund të “shfaqet

vetëm në kombinim me ndonjë nga këto hipoteza." Në këtë rast, grupet e plota dhe HkE përzgjidhen, kombinohen

ngjarje të lara në formën e produkteve, faktorët e të cilave janë një nga dëshmitë c. (1=1,...,t) dhe një

e n hipotezave në shqyrtim.

Formula e Bayes përdoret për një vlerësim krahasues të probabiliteteve të ngjarjeve të kombinuara të secilit grup të tillë të plotë, i cili ndryshon nga grupet e tjera të plota jo vetëm nga provat e marra parasysh, por edhe në rastin e përgjithshëm nga llojet e hipotezave H ^ dhe (ose) numri i tyre n (shih, për shembull,)

RNkY = P(Hk) P(eH)

% Р(Нк) Р(Эг\Нк) к = 1

Në rastin e veçantë me n = 2

RNk\E,~ P(Hk) P(EN)

% Р(Нк) Р(Э,\Н к) к = 1

dhe rezultatet e marra janë të sakta, për shkak të parimit të ruajtjes së raporteve të probabilitetit:

P(H1E,) _ P(H 1)P(E,\H1) / P(H2) P(E,\H2) = P(H 1) P(E,\H1)

Р(Н 2= % РШ1!) РЭ,\Н0 % ^) РЭ,\Н) "Р(Н 2> 2>"

Subjektiviteti i zgjedhjes së një grupi të plotë ngjarjesh të kombinuara në krahasim me shkallën e mundësisë (me

një ose një tjetër modifikuar nga ngjarje elementare) ju lejon të zgjidhni një grup të plotë ngjarjesh dhe Hk E ■ me

mohimi i ngjarjes elementare E ■ () dhe shkruani formulën e Bayes (1 = 1,...,t) si më poshtë:

P(Hk\E) -=-RNSh±.

% P(Hk)P(E,Hk)

Kjo formulë është gjithashtu e zbatueshme dhe bën të mundur marrjen e rezultateve të sakta nëse llogaritet

probabilitetet e normalizuara krahasohen sipas hipotezave të ndryshme në shqyrtim, por jo nën prova të ndryshme.

punët. ¡^

Probabilitete të krahasueshme të hipotezave nën prova të vetme të papajtueshme. Duke gjykuar nga publiku i njohur ^

përdoret për vlerësimin krahasues të probabiliteteve të kushtëzuara të pasme të hipotezave për prova të ndryshme të vetme.

punët. Në të njëjtën kohë, nuk i kushtohet vëmendje faktit të mëposhtëm. Në këto raste, krahasohen probabilitetet ^ të normalizuara të ngjarjeve të kombinuara të papajtueshme (të papajtueshme) që u përkasin grupeve të ndryshme të plota prej n ngjarjesh. Sidoqoftë, në këtë rast, formula e Bayes nuk është e zbatueshme, pasi krahasohen ngjarjet e kombinuara që nuk përfshihen në një grup të plotë, normalizimi i probabiliteteve të të cilave kryhet duke përdorur n pjesëtues të ndryshëm normalizues. Probabilitetet e normalizuara të ngjarjeve të kombinuara të papajtueshme (të papajtueshme) mund të krahasohen vetëm nëse i përkasin të njëjtit grup të plotë ngjarjesh dhe normalizohen ¡3 duke përdorur një pjesëtues të përbashkët të barabartë me shumën e probabiliteteve të të gjitha ngjarjeve të normalizuara të përfshira në § të plotë

Në përgjithësi, të mëposhtmet mund të konsiderohen prova të papajtueshme:

Dy prova (për shembull, prova dhe mohimi i saj); ^

Tre prova (për shembull, në një situatë lojërash ka një fitore, një humbje dhe një barazim); ^

Katër certifikata (në veçanti, në sport, fitore, humbje, barazim dhe riluajtje), etj. ^

Le të shqyrtojmë një shembull mjaft të thjeshtë (që korrespondon me shembullin e dhënë në) të përdorimit të formulës Bayes ^ për të përcaktuar probabilitetet e pasme të kushtëzuara të hipotezës H ^ për dy ngjarje të papajtueshme në

në formën e provës L]- dhe mohimi i saj L]

P(H,k) - ^ . ^ P(A^k", (2)

] E R(Hk> R(A]\vk> k - 1

■ _ P(HkA ]) P(Hk> P(A ]\nc>

P(H,\A,) ----k-]-. (3)

V k\L]> P(A> fq

] E R(Hk) R(A]\Hk) në -1

Në rastet (2) dhe (3), grupet e plota të përzgjedhura subjektivisht u krahasuan për sa i përket shkallës së mundësisë së kom-

ngjarjet e lidhura janë përkatësisht bashkësitë dhe H në A dhe dhe H në A. Ky është rasti kur formula

k-1 k] k-1 k]

Bayes nuk është i zbatueshëm, pasi parimi i ruajtjes së raporteve të probabilitetit është shkelur - barazia e raporteve të probabiliteteve të normalizuara me raportet e probabiliteteve përkatëse të normalizuara nuk respektohet:

P(N në A]] P(Nk) P(A]\Nk) / P(Nk) P(A]\Nk) P(Nk) P(A] Nk)

P(Nk E P(Nk) P(A]\Nk)/ E P(Nk) P(A]\Nk) P(Nk) P(A] Nk)

k - 1 /k - 1 Sipas parimit të ruajtjes së raporteve të probabilitetit, përpunimi i saktë i probabiliteteve të ngjarjeve është i mundur vetëm kur normalizohet duke përdorur një pjesëtues normalizues të përbashkët të barabartë me shumën e të gjitha shprehjeve të normalizuara të krahasuara. Kjo është arsyeja pse

E R(Hk)R(A]\Hk) + E R(Hk)R(A]\Hk) - E R(Hk)[P(A]\Hk) + P(Hk) P(A]\Hk )] - EP(Hk) - 1. në -1 në -1 në -1 në -1

Kështu, zbulohet fakti se ka varietete të formulës së Bayes që ndryshojnë nga

i njohur për mungesën e një pjesëtuesi normalizues:

А,) - Р(Н) Р(А]\Нк), Р(Нк А,) - Р(Н) Р(А, Нк). (4)

J te I ■> te

Në këtë rast, vërehet barazia e raporteve të probabiliteteve të normalizuara me raportet e probabiliteteve përkatëse të normalizuara:

t^A^ P(Hk) P(A]\Hk)

A,) R(N k) R(A,Hk)

Bazuar në zgjedhjen subjektive të grupeve të plota të regjistruara në mënyrë jokonvencionale të ngjarjeve të kombinuara të papajtueshme, është e mundur të rritet numri i modifikimeve të formulës Bayes, duke përfshirë dëshmitë, si dhe një numër të caktuar të mohimeve të tyre. Për shembull, grupi më i plotë i ngjarjeve të kombinuara

dhe dhe Hk /"./ ^ dhe dhe Hk Yo\ korrespondon (duke marrë parasysh mungesën e një pjesëtuesi normalizues) modifikimin e formulës; =1 A"=1 ; =1 ly Bayesian

Р(Нк\~) - Р(Н к) ПЁ^^^

ku një ngjarje elementare në formën e provës E\ e II II / "/ është një nga elementet e shumëfishimit të specifikuar

o Në mungesë të mohimeve të provave, pra kur Ё\ = // e dhe /"./,

^ P(H\E) P(Hk) P(E,\Hk)

E R(Hk) R(E\Hk) k - 1

Kështu, një modifikim i formulës së Bayes, që synon të përcaktojë probabilitete të kushtëzuara të hipotezave të krahasueshme në shkallën e mundësisë nën prova të vetme të papajtueshme, duket si më poshtë. Numëruesi përmban probabilitetin e normalizuar të një prej ngjarjeve të kombinuara të papajtueshme që formojnë një grup të plotë, të shprehur si produkt i probabiliteteve a priori, dhe emëruesi përmban shumën e të gjitha

probabilitete të normalizuara. Në këtë rast, respektohet parimi i ruajtjes së marrëdhënieve të probabilitetit - dhe rezultati i marrë është i saktë.

Probabilitetet e hipotezave të dhëna një dëshmi e vetme konsistente. Formulat e Bayes përdoren tradicionalisht për të përcaktuar probabilitete të krahasueshme të kushtëzuara të pasme të hipotezave Hk (k = 1,...,n) duke pasur parasysh një nga disa prova të konsideruara të pajtueshme EL (1 = 1,...,m). Në veçanti (shih

për shembull, dhe ), kur përcaktohen probabilitetet e pasme të kushtëzuara P(H 1E^) dhe P(H 1 E2) për secilën nga dy provat e pajtueshme E1 dhe E2, përdoren formulat e formës:

P(H 1) PE\H1) P(Hj) P(E2Hj) P(H J E1) = --1- dhe P(H J E 2) =--1-. (5)

I P(Hk) PE\Hk) I P(Hk) P(E2 Hk)

k = 1 k = 1 Ju lutemi vini re se ky është një rast tjetër ku formula e Bayes nuk është e zbatueshme. Për më tepër, në këtë rast duhet të eliminohen dy mangësi:

Normalizimi i ilustruar i probabiliteteve të ngjarjeve të kombinuara është i pasaktë, për faktin se ngjarjet në shqyrtim i përkasin grupeve të ndryshme të plota;

Të dhënat simbolike të ngjarjeve të kombinuara HkEx dhe HkE2 nuk pasqyrojnë faktin që provat e marra parasysh E x dhe E 2 janë të pajtueshme.

Për të eliminuar pengesën e fundit, mund të përdoret një regjistrim më i detajuar i ngjarjeve të kombinuara, duke marrë parasysh faktin se provat e pajtueshme E1 dhe E2 në disa raste mund të jenë të papajtueshme, dhe në të tjera të pajtueshme:

HkE1 = HkE1 E2 dhe HkE2 = HkE 1E2+HkE1 E2, ku E1 dhe E 2 janë prova në kundërshtim me E1 dhe E 2.

Natyrisht, në raste të tilla produkti i ngjarjeve Hk E1E2 merret parasysh dy herë. Për më tepër, mund të merret parasysh përsëri veçmas, por kjo nuk ndodh. Fakti është se në situatën në shqyrtim, situata e vlerësuar ndikohet nga tre ngjarje të kombinuara të mundshme të papajtueshme: HkE1E2, HkE 1E2 dhe

Hk E1E2. Në të njëjtën kohë, vendimmarrësi është i interesuar të vlerësojë vetëm shkallën e mundësisë

dy ngjarje të kombinuara të papajtueshme: HkE1 E2 dhe HkE 1E2, që korrespondon me marrjen në konsideratë vetëm g

certifikata të vetme. ¡Ts

Kështu, kur ndërtohet një modifikim i formulës Bayes për përcaktimin e vlerave të kushtëzuara a posteriori,

Probabilitetet e hipotezave me prova të vetme të përputhshme duhet të bazohen në sa vijon. Personi që pranoi- ^

duke marrë një vendim, është i interesuar se çfarë lloj ngjarje elementare përfaqësohet nga kjo apo ajo dëshmi

numrat në shqyrtim kanë ndodhur në të vërtetë në kushte specifike. Nëse një ngjarje tjetër elementare ndodh në K

në formën e një certifikate të vetme, kërkohet rishikimi i vendimit bazuar në rezultatet e një vlerësimi krahasues

probabilitetet e pasme të kushtëzuara të hipotezave me konsideratë të domosdoshme të kushteve të tjera që ndikojnë në totalin real

instalimi 3

Le të prezantojmë shënimin e mëposhtëm: HkE- për një (dhe vetëm një) të kombinuar të papajtueshëm bashkë-^

ekzistenca, që konsiston në faktin se nga m> ​​1 ngjarje elementare Ei (i = 1,...,m) në shqyrtim, së bashku me hipotezën “

Hk një ngjarje elementare Ex ka ndodhur dhe nuk ka ndodhur asnjë ngjarje tjetër elementare. se"

Në rastin më të thjeshtë, merren parasysh dy prova të vetme të papajtueshme. Nëse konfirmohet

një prej tyre pritet, probabiliteti i kushtëzuar i provës në formë të përgjithshme shprehet me formulën l

P(Hk E-) = P(Ei\Hk) -P(EjE^Hk) = P(Ei\Hk) -P(M^Hk)P(M^Hk) , i = 1, -2 (6) g

Vlefshmëria e formulës mund të shihet qartë (Fig. 1).

Oriz. 1. Interpretimi gjeometrik i llogaritjes së P(Hk E-) për / = 1,...,2 Me dëshmi të pavarura kushtimisht

P(K1K2\Hk) = p(E\Hk)P(E2\Hk),

prandaj, duke marrë parasysh (6)

P(Hk E-) = PE Nk) - P(E1 Nk) P(E21Hk) , = 1,.,2. (7)

Në mënyrë të ngjashme, probabiliteti P(HkE-) i një prej tre (/ = 1,...,3) ngjarjeve të papajtueshme HkE^ shprehet me formulën

Për shembull, kur i = 1:

p(HkEl) = P(Ei\Hk)-[ S P(Ei\Hk)P(Ej\Hk) ] + P(EiE2E3Hk)

p(HkE-) = P(E7|Hk)- P(E]E^Hk)- P(E7EjHk) + P(E]E2E3\Hk)

Vlefshmëria e kësaj formule konfirmohet qartë nga interpretimi gjeometrik i paraqitur në

Oriz. 2. Interpretimi gjeometrik i llogaritjes së P(Hk E-) për / = 1,...,3

Duke përdorur metodën e induksionit matematik, është e mundur të vërtetohet formula e përgjithshme për probabilitetin P(Hk E-) për çdo sasi të provave e, 0=1,...,m:

P(HkE-) = P(E,Hk)- t RE\Hk) P(E]\Hk) + 1 P(E\Hk) P(E]\Hk) P(E^Hk) +■■■ + (-1)

] = 1(] * 0 ],1 * 1

Duke përdorur teoremën e shumëzimit të probabilitetit, ne shkruajmë probabilitetin e kushtëzuar P(HkE~-) në dy forma:

^ nga ku rrjedh se

P(Hk E -) = P(H k) P(E-|Hk) = P(E-) P(Hk

E-)= P(HkE-) "" P(E-)

Duke përdorur formulën e probabilitetit total P(Ei) = S P(H£) P(Ei Hk) rezulton se

E-) = P(HkET)

2 P(HkE-) k = 1

Duke zëvendësuar shprehjet për P(HkE-) në formën e anës së djathtë të (8) në formulën që rezulton, marrim formën përfundimtare të formulës për përcaktimin e probabiliteteve të kushtëzuara të pasme të hipotezave H^ (k = 1, ... ,n) për një nga disa prova të vetme të konsideruara të papajtueshme: (E^\Hk)

P(Nk)[P(E,\Nk) - 2 P(E,\Nk) P(Er k) +...+ (-1)t-1 P(P P(Erk)] P(N, E ~) =-] = 1(] * ■----(9)

deri në 1 p t t t

2 P(N k) 2 [P(E,\N k) - 2 P(EgHk) P(E^Hk) + ...+ (-1)m-1 P(P P (Ep k)]

k=1 , = 1 ) = 1() *,) ■! =1

Vlerësime krahasuese. Janë konsideruar shembuj mjaft të thjeshtë, por ilustrues, të kufizuar në analizën e probabiliteteve të llogaritura të kushtëzuara të pasme të njërës prej dy hipotezave të dhëna dy prova të vetme. 1. Probabilitetet e hipotezave të dhëna prova të vetme të papajtueshme. Le të krahasojmë rezultatet e marra duke përdorur formulat e Bayes (2) dhe (3), duke përdorur shembullin e dy dëshmive L. = L dhe L. = L me të dhënat fillestare:

Р(Н1 = 0,7; Р(Н2) = 0,3; Р(Л| Н^ = 0,1; Р(Л\н 1) = 0,9; Р(Л\Н2) = 0,6; P(L\H2) = 0,4. Në shembujt e konsideruar me hipotezën H1, formulat tradicionale (2) dhe (3) çojnë në rezultatet e mëposhtme:

R(N.) R(A\Jo 0 07

P(N, L) =-- 11 = - = 0,28,

2 Р(Н к) Р(А\Нк) к = 1

R(N L R(A\N 1) 0 63

P(N, L) =-- 11 = - = 0,84,

2 Р(Нк) Р(А\Нк) к = 1

duke formuar ndarje P(H 1 A) = P(H^ P(L\Hp = 0.07; P(H^ A) = P(H1) P(l|H^ = 0.63. 1acionet e formulave të propozuara në lidhje me:

R<Н)Р(АНА-Р(А|Н1) _ 0,07

dhe me formulat e propozuara (4), të cilat nuk kanë pjesëtues normalizues: “dhe

Kështu, në rastin e aplikimit të formulave të propozuara, raporti i probabiliteteve të normalizuara është i barabartë me raportin e probabiliteteve të normalizuara: K

gt f P(N 1) P(A\N 1) A11 |

Kur përdoren formula të njohura me të njëjtin raport -;-=-= 0,11 veron i normalizuar

Р(Н 1) Р(А\Н 1) «§

probabilitetet e treguara në numërues, raporti i probabiliteteve të normalizuara që rezultojnë: 2

Р(Н 1) Р(А\Н 1) Р(А\Н 1) 0,63

P(N1 L) = 0,28 P(N 1 L) = 0,84

Kjo do të thotë, parimi i ruajtjes së raporteve të probabilitetit nuk respektohet dhe merren rezultate të pasakta. Në të njëjtën kohë £

në rastin e përdorimit të formulave të njohura, vlera e devijimit relativ të raportit (11) të probabiliteteve të kushtëzuara të pasme të hipotezave nga rezultatet e sakta (10) rezulton të jetë shumë domethënëse, pasi arrin në

°.33 - °.P x 100 = 242%.. I

2. Probabilitetet e hipotezave të dhëna prova të përputhshme të vetme. Le të krahasojmë rezultatet e marra duke përdorur formulat Bayes (5) dhe modifikimin e saktë të ndërtuar (9), duke përdorur të dhënat fillestare të mëposhtme: ^

P(H1 = 0,7; P(H2) = 0,3; P(E1H1) = 0,4; P(E2H1) = 0,8; P(E1\H2) = 0,7; P(E^ H2) = 0,2.

Në shembujt e konsideruar me hipotezën H 2 në rastin e përdorimit të formulave tradicionale (5):

P(H 2) P(E1 H 2) Q, 21

P(H 2 E1) = -2-!-2- = - = Q,429,

I p(Hk) p(El Hk) k = 1

P(H 2) P(E 2 H 2) Q,Q6

P(H 2 E 2) = -2-- = - = 0,097.

I P(Hk) P(E 2 Hk) k = 1

Në rastin e aplikimit të formulës së propozuar (9) duke marrë parasysh (7) P(H

P(H2) 0,168

E.) ----- 0,291,

Z P(Hk) Z"

P(H2) 0,018

E0) ----- 0,031.

Z P(Hk) Z k - 1 i - 1

Kur përdorni formulat e sakta të propozuara, për shkak të emëruesve të njëjtë, raporti P(H2) -

Probabilitetet e normalizuara të treguara në numërues janë të barabarta me raportin

P(H2)

probabilitete të normalizuara:

Kjo do të thotë, respektohet parimi i ruajtjes së raporteve të probabilitetit.

Sidoqoftë, në rastin e përdorimit të formulave të njohura me raportin e probabiliteteve të normalizuara të treguara në numërues

P(H 2) P(E1\H 2) _ 0,21 _3 5 P(H 2) P(E 2 H 2) 0,06,

raporti i probabiliteteve të normalizuara:

P(H 2 = 0,429 = 4,423. (13)

P(H 2\e2) 0,097

Kjo do të thotë, parimi i ruajtjes së raporteve të probabilitetit, si më parë, nuk respektohet. Për më tepër, në rastin e përdorimit të formulave të njohura, vlera e devijimit relativ të raportit (13) të probabiliteteve të kushtëzuara të pasme të hipotezave nga rezultatet e sakta (12) rezulton gjithashtu të jetë shumë domethënëse:

9,387 4,423 x 100 = 52,9%.

konkluzioni. Analiza e ndërtimit të marrëdhënieve të formulës specifike që zbatojnë formulën Bayes dhe modifikimet e saj të propozuara për zgjidhjen e problemeve praktike na lejon të themi sa vijon. Grupi i plotë i ngjarjeve të kombinuara të krahasueshme mund të zgjidhet subjektivisht nga vendimmarrësi. Kjo zgjedhje bazohet në të dhënat fillestare objektive të marra parasysh karakteristike të një mjedisi tipik (llojet specifike dhe numri i ngjarjeve elementare - hipotezat dhe provat e vlerësuara). Me interes praktik është zgjedhja subjektive e opsioneve të tjera për grupin e plotë krahasuar për nga shkalla e mundësisë.

ity e ngjarjeve të kombinuara - duke siguruar kështu një shumëllojshmëri të konsiderueshme të marrëdhënieve të formulës kur ndërtojmë variante jo tradicionale të modifikimeve të formulës Bayes. Kjo, nga ana tjetër, mund të jetë baza për përmirësimin e mbështetjes matematikore të zbatimit të softuerit, si dhe zgjerimin e fushës së aplikimit të marrëdhënieve të formulës së re për zgjidhjen e problemeve të aplikuara.

Bibliografi

1. Gnedenko, B. V. Një hyrje elementare në teorinë e probabilitetit / B. V. Gnedenko, A. Ya. Khinçin. - 114 New York: Dover Publications, 1962. - 144 r.

2. Ventzel, E. S. Teoria e Probabilitetit / E. S. Ventzel. - Botimi i 10-të, i fshirë. - Moskë: Shkolla e Lartë, 2006. - 575 f.

3. Andronov. A. M., Teoria e probabilitetit dhe statistikat matematikore / A. M. Andronov, E. A. Kopytov, L. Gringlaz. - Shën Petersburg: Peter, 2004. - 481 f.

4. Zmitrovich, A. I. Sistemet inteligjente të informacionit / A. I. Zmitrovich. - Minsk: TetraSystems, 1997. - 496 f.

5. Chernorutsky, I. G. Metodat e vendimmarrjes / I. G. Chernorutsky. - Shën Petersburg: BHV-Petersburg, 2005. - 416 f.

6. Naylor, C.-M. Ndërtoni sistemin tuaj të ekspertëve / C.-M. Naylor. - Chichester: John Wiley & Sons, 1987. - 289 f.

7. Romanov, V. P. Sistemet inteligjente të informacionit në ekonomi / V. P. Romanov. - Botimi i dytë, i fshirë.

Moskë: Provim, 2007. - 496 f.

8. Efiçenca ekonomike dhe konkurrenca / D. Yu. - Tambov: Shtëpia Botuese Tamb. shteti teknologjisë. Universiteti, 2007.- 96 f.

9. Dolgov, A. I. Modifikimet e sakta të formulës Bayes për programimin paralel / A. I. Dolgov // Teknologjitë e superkompjuterëve: materialet e 3-të All-Russian. shkencore-teknike konf. - Rostov-on-Don. - 2014.- T. 1 - F. 122-126.

10. Dolgov, A. I. Mbi korrektësinë e modifikimeve të formulës Bayes / A. I. Dolgov // Vestnik Don. shteti teknologjisë. un-ta.

2014. - T. 14, nr 3 (78). - F. 13-20.

1. Gnedenko, B.V., Khinchin, A.Ya. Një hyrje elementare në teorinë e probabilitetit. New York: Dover Publications, 1962, 144 r.

2. Ventsel, E.S. Teoriya veroyatnostey. Ed. 10, reimpr. Moskë: Vysshaya shkola, 2006, 575 f. (në rusisht).

3. Andronov, A.M., Kopytov, E.A., Gringlaz, L.Y. Teoriya veroyatnostey dhe statistika matematicheskaya. Shën Petersburg: Piter, 2004, 481 f. (në rusisht).

4. Zmitroviç, A.1. Intelektual"nye informatsionnye systemy. Minsk: TetraSistems, 1997, 496 f. (në Rusisht).

5. Chernorutskiy, I.G. Metody prinyatiya vendim. Shën Petersburg: BKhV-Petersburg, 2005, 416 f. (në rusisht).

6. Naylor, C.-M. Ndërtoni sistemin tuaj të ekspertëve. Chichester: John Wiley & Sons, 1987, 289 f.

7. Romanov, V.P. Intellektual"nye informatsionnye sistemy v ekonomike. 2nd ed., reimpr. Moscow: Ekzamen, 2007, 496 f. (në rusisht).

8. Muromtsev, D.Y., et al. Efektivnost ekonomik" dhe konkurentosposobnost". Tambov: Izd-vo Tamb. shkon. tekhn. un-ta, 2007, 96 f. (në rusisht). I.B.

9. Dolgov, A1. Korrektnye modifikatsii formuly Bayesa dlya paralel"nogo programmirovaniya. Superkomp"yuternye tekhnologii: mat-ly 3-y vseros. nauch-tekn. konf. Rostov-on-Don, 2014, vëll. 1, fq. 122-126 (në Rusisht). ^

10. Dolgov, A1. O korrektnosti modifikatsiy formully Bayesa. ^ Vestnik i DSTU, 2014, vëll. 14, nr. 3 (78), fq. 13-20 (në rusisht). *

Kush është Bayes? dhe cfare lidhje ka me menaxhmentin? - mund të vijojë një pyetje krejtësisht e drejtë. Tani për tani, pranoni fjalën time: kjo është shumë e rëndësishme!.. dhe interesante (të paktën për mua).

Cila është paradigma në të cilën veprojnë shumica e menaxherëve: Nëse vëzhgoj diçka, çfarë përfundimesh mund të nxjerr prej saj? Çfarë mëson Bayes: çfarë duhet të jetë vërtet atje që unë të vëzhgoj këtë diçka? Pikërisht kështu zhvillohen të gjitha shkencat dhe ai shkruan për këtë (citoj nga kujtesa): një person që nuk ka një teori në kokën e tij do të shmanget nga një ide në tjetrën nën ndikimin e ngjarjeve (vëzhgimeve) të ndryshme. Jo më kot thonë: nuk ka asgjë më praktike se një teori e mirë.

Shembull nga praktika. Vartësi im bën një gabim dhe kolegu im (drejtuesi i një departamenti tjetër) thotë se do të ishte e nevojshme të ushtrohej ndikim menaxherial mbi punonjësin neglizhent (me fjalë të tjera, ndëshkimi/qortimi). Dhe unë e di që ky punonjës kryen 4-5 mijë të të njëjtit lloj operacionesh në muaj, dhe gjatë kësaj kohe nuk bën më shumë se 10 gabime. A e ndjeni ndryshimin në paradigmë? Kolegja ime reagon ndaj vëzhgimit dhe unë kam njohuri apriori që punonjësi bën një numër të caktuar gabimesh, kështu që një tjetër nuk ka ndikuar në këtë njohuri... Tani, nëse në fund të muajit del se ka, për shembull, 15 gabime të tilla!.. Kjo tashmë do të jetë një arsye për të studiuar arsyet e mosrespektimit të standardeve.

Jeni të bindur për rëndësinë e qasjes Bayesian? Të intriguar? Shpresoj keshtu". Dhe tani miza në vaj. Fatkeqësisht, idetë Bayesian rrallë jepen menjëherë. Sinqerisht, pata fat, pasi u njoha me këto ide përmes letërsisë popullore, pas leximit të së cilës mbetën shumë pyetje. Kur planifikoja të shkruaj një shënim, mblodha gjithçka që kisha marrë më parë shënime në Bayes, dhe gjithashtu studiova atë që shkruhej në internet. Unë paraqes në vëmendjen tuaj supozimin tim më të mirë për këtë temë. Hyrje në probabilitetin Bayesian.

Nxjerrja e teoremës së Bayes

Merrni parasysh eksperimentin e mëposhtëm: ne thërrasim çdo numër që shtrihet në segment dhe regjistrojmë kur ky numër është, për shembull, midis 0.1 dhe 0.4 (Fig. 1a). Probabiliteti i kësaj ngjarje është i barabartë me raportin e gjatësisë së segmentit me gjatësinë totale të segmentit, me kusht që paraqitja e numrave në segment po aq e mundshme. Matematikisht kjo mund të shkruhet fq(0,1 <= x <= 0,4) = 0,3, или кратко R(X) = 0.3, ku R- probabiliteti, X– ndryshore e rastësishme në diapazonin, X– ndryshore e rastësishme në rangun . Kjo do të thotë, probabiliteti për të goditur segmentin është 30%.

Oriz. 1. Interpretimi grafik i probabiliteteve

Tani merrni parasysh katrorin x (Fig. 1b). Le të themi se duhet të emërtojmë çifte numrash ( x, y), secila prej të cilave është më e madhe se zero dhe më e vogël se një. Probabiliteti që x(numri i parë) do të jetë brenda segmentit (zona blu 1), e barabartë me raportin e sipërfaqes së zonës blu me sipërfaqen e të gjithë katrorit, domethënë (0.4 - 0.1) * (1 - 0 ) / (1 * 1) = 0, 3, domethënë e njëjta 30%. Probabiliteti që y e vendosur brenda segmentit (zona e gjelbër 2) është e barabartë me raportin e sipërfaqes së zonës së gjelbër me sipërfaqen e të gjithë sheshit fq(0,5 <= y <= 0,7) = 0,2, или кратко R(Y) = 0,2.

Çfarë mund të mësoni për vlerat në të njëjtën kohë? x Dhe y. Për shembull, sa është probabiliteti që në të njëjtën kohë x Dhe y janë në segmentet përkatëse të dhëna? Për ta bërë këtë, duhet të llogarisni raportin e sipërfaqes së zonës 3 (kryqëzimi i shiritave të gjelbër dhe blu) me sipërfaqen e të gjithë sheshit: fq(X, Y) = (0,4 – 0,1) * (0,7 – 0,5) / (1 * 1) = 0,06.

Tani le të themi se duam të dimë se cila është probabiliteti yështë në intervalin nëse xështë tashmë në rangun . Kjo është, në fakt, ne kemi një filtër dhe kur thërrasim çifte ( x, y), pastaj i hedhim menjëherë ato çifte që nuk plotësojnë kushtin për gjetje x në një interval të caktuar, dhe më pas nga çiftet e filtruara numërojmë ato për të cilat y plotëson gjendjen tonë dhe e konsideron probabilitetin si raport të numrit të çifteve për të cilat y qëndron në segmentin e mësipërm ndaj numrit total të çifteve të filtruara (d.m.th., për të cilat x shtrihet në segment). Këtë probabilitet mund ta shkruajmë si fq(Y|X X goditi rrezen." Natyrisht, ky probabilitet është i barabartë me raportin e sipërfaqes së zonës 3 me sipërfaqen e zonës blu 1. Sipërfaqja e zonës 3 është (0,4 – 0,1) * (0,7 – 0,5) = 0,06, dhe sipërfaqja e zonës blu 1 ( 0,4 – 0,1) * (1 – 0) = 0,3, atëherë raporti i tyre është 0,06 / 0,3 = 0,2. Me fjalë të tjera, probabiliteti i gjetjes y në segmentin me kusht që x i përket segmentit fq(Y|X) = 0,2.

Në paragrafin e mëparshëm ne në fakt formuluam identitetin: fq(Y|X) = fq(X, Y) / p( X). Aty shkruhet: “probabiliteti i goditjes në rangun , me kusht që X goditi diapazonin, i barabartë me raportin e probabilitetit të goditjes së njëkohshme X në gamë dhe në rreze, në probabilitet për të goditur X në rreze”.

Për analogji, merrni parasysh probabilitetin fq(X|Y). Ne i quajmë çifte ( x, y) dhe filtro ato për të cilat y qëndron ndërmjet 0.5 dhe 0.7, atëherë probabiliteti që xështë në intervalin me kusht që y i përket segmentit është i barabartë me raportin e sipërfaqes së rajonit 3 me sipërfaqen e rajonit të gjelbër 2: fq(X|Y) = fq(X, Y) / fq(Y).

Vini re se probabilitetet fq(X, Y) Dhe fq(Y, X) janë të barabarta, dhe të dyja janë të barabarta me raportin e sipërfaqes së zonës 3 me sipërfaqen e të gjithë katrorit, por probabilitetet fq(Y|X) Dhe fq(X|Y) jo e barabartë; ndërsa probabiliteti fq(Y|X) është e barabartë me raportin e sipërfaqes së rajonit 3 me rajonin 1, dhe fq(X|Y) – rajoni 3 në rajonin 2. Vini re gjithashtu se fq(X, Y) shpesh shënohet si fq(X&Y).

Pra, ne prezantuam dy përkufizime: fq(Y|X) = fq(X, Y) / p( X) Dhe fq(X|Y) = fq(X, Y) / fq(Y)

Le t'i rishkruajmë këto barazi në formën: fq(X, Y) = fq(Y|X) * p( X) Dhe fq(X, Y) = fq(X|Y) * fq(Y)

Meqenëse anët e majta janë të barabarta, anët e djathta janë të barabarta: fq(Y|X) * p( X) = fq(X|Y) * fq(Y)

Ose mund ta rishkruajmë barazinë e fundit si:

Kjo është teorema e Bayes!

A lindin vërtet një teoremë të madhe transformime të tilla të thjeshta (pothuajse tautologjike)!? Mos nxitoni në përfundime. Le të flasim përsëri për atë që kemi. Kishte një probabilitet të caktuar fillestar (apriori). R(X), se ndryshorja e rastit X shpërndara në mënyrë uniforme në segment bie brenda intervalit X. Ndodhi një ngjarje Y, si rezultat i së cilës morëm probabilitetin e pasëm të së njëjtës ndryshore të rastësishme X: R(X|Y), dhe kjo probabilitet ndryshon nga R(X) sipas koeficientit. Ngjarje Y të quajtur prova, pak a shumë vërtetuese ose përgënjeshtuese X. Ky koeficient nganjëherë quhet fuqia e provës. Sa më e fortë të jetë prova, aq më shumë fakti i vëzhgimit të Y ndryshon probabilitetin e mëparshëm, aq më shumë probabiliteti i pasëm ndryshon nga ai i mëparshmi. Nëse provat janë të dobëta, probabiliteti i mëvonshëm është pothuajse i barabartë me atë të mëparshëm.

Formula e Bayes për variablat diskrete të rastësishme

Në seksionin e mëparshëm, kemi nxjerrë formulën e Bayes për ndryshoret e vazhdueshme të rastësishme x dhe y të përcaktuara në interval. Le të shqyrtojmë një shembull me variabla të rastësishme diskrete, secila duke marrë dy vlera të mundshme. Gjatë ekzaminimeve rutinë mjekësore, u konstatua se në moshën dyzetvjeçare, 1% e grave vuajnë nga kanceri i gjirit. 80% e grave me kancer marrin rezultate pozitive të mamografisë. 9.6% e grave të shëndetshme marrin gjithashtu rezultate pozitive të mamografisë. Gjatë ekzaminimit, një grua e kësaj grupmoshe ka marrë rezultat pozitiv të mamografisë. Cilat janë shanset që ajo të ketë vërtet kancer gjiri?

Linja e arsyetimit/llogaritjes është si më poshtë. Nga 1% e pacientëve me kancer, mamografia do të japë 80% rezultate pozitive = 1% * 80% = 0.8%. Nga 99% e grave të shëndetshme, mamografia do të japë 9,6% rezultate pozitive = 99% * 9,6% = 9,504%. Gjithsej 10.304% (9.504% + 0.8%) me rezultate pozitive të mamografisë, vetëm 0.8% janë të sëmurë, ndërsa pjesa tjetër 9.504% janë të shëndetshëm. Kështu, probabiliteti që një grua me mamografi pozitive të ketë kancer është 0,8% / 10,304% = 7,764%. Mendonit 80% apo më shumë?

Në shembullin tonë, formula e Bayes merr formën e mëposhtme:

Le të flasim edhe një herë për kuptimin "fizik" të kësaj formule. X– variabli i rastësishëm (diagnoza), duke marrë vlera: X 1- i sëmurë dhe X 2– i shëndetshëm; Y– variabli i rastësishëm (rezultati i matjes – mamografia), duke marrë vlerat: Y 1- rezultat pozitiv dhe Y2- rezultat negativ; p(X 1)– probabiliteti i sëmundjes para mamografisë (probabiliteti a priori) i barabartë me 1%; R(Y 1 |X 1 ) – probabiliteti i një rezultati pozitiv nëse pacienti është i sëmurë (probabiliteti i kushtëzuar, pasi duhet të specifikohet në kushtet e detyrës), i barabartë me 80%; R(Y 1 |X 2 ) – probabiliteti i një rezultati pozitiv nëse pacienti është i shëndetshëm (gjithashtu probabiliteti i kushtëzuar) është 9.6%; p(X 2)– probabiliteti që pacienti të jetë i shëndetshëm para mamografisë (probabiliteti a priori) është 99%; p(X 1|Y 1 ) – probabiliteti që pacienti të jetë i sëmurë, duke pasur parasysh një rezultat pozitiv të mamografisë (probabiliteti posterior).

Mund të shihet se probabiliteti i pasëm (ajo që ne kërkojmë) është proporcional me probabilitetin e mëparshëm (fillestar) me një koeficient pak më kompleks. . Më lejoni të theksoj përsëri. Sipas mendimit tim, ky është një aspekt themelor i qasjes Bayesian. matje ( Y) shtoi një sasi të caktuar informacioni në atë që ishte fillimisht e disponueshme (a priori), e cila sqaroi njohuritë tona për objektin.

Shembuj

Për të konsoliduar materialin që keni mbuluar, përpiquni të zgjidhni disa probleme.

Shembulli 1. Ka 3 urna; në të parën ka 3 topa të bardhë dhe 1 të zi; në të dytën - 2 topa të bardhë dhe 3 të zinj; në të tretën ka 3 topa të bardhë. Dikush i afrohet njërës nga urnat rastësisht dhe nxjerr 1 top prej saj. Ky top doli të ishte i bardhë. Gjeni probabilitetet e pasme që topi është tërhequr nga urna e 1, 2, 3.

Zgjidhje. Kemi tre hipoteza: H 1 = (zgjidhet urna e parë), H 2 = (zgjidhet urna e dytë), H 3 = (zgjidhet urna e tretë). Meqenëse urna zgjidhet në mënyrë të rastësishme, probabilitetet a priori të hipotezave janë të barabarta: P(H 1) = P(H 2) = P(H 3) = 1/3.

Si rezultat i eksperimentit, u shfaq ngjarja A = (një top i bardhë u nxor nga urna e zgjedhur). Probabilitetet e kushtëzuara të ngjarjes A sipas hipotezave H 1, H 2, H 3: P(A|H 1) = 3/4, P(A|H 2) = 2/5, P(A|H 3) = 1. Për shembull, barazia e parë thotë kështu: "probabiliteti për të nxjerrë një top të bardhë nëse zgjidhet urna e parë është 3/4 (pasi ka 4 topa në urnën e parë dhe 3 prej tyre janë të bardha).

Duke përdorur formulën e Bayes, gjejmë probabilitetet e pasme të hipotezave:

Kështu, në dritën e informacionit për ndodhjen e ngjarjes A, probabilitetet e hipotezave ndryshuan: hipoteza H 3 u bë më e mundshme, hipoteza H 2 u bë më e mundshme.

Shembulli 2. Dy gjuajtës qëllojnë në mënyrë të pavarur në të njëjtin objektiv, secili qëllon nga një gjuajtje. Probabiliteti për të goditur objektivin për gjuajtësin e parë është 0.8, për të dytin - 0.4. Pas të shtënave, në objektiv është gjetur një vrimë. Gjeni probabilitetin që kjo vrimë t'i përkasë gjuajtësit të parë (Rezultati (të dyja vrimat përkuan) hidhet poshtë si paksa e pamundur).

Zgjidhje. Para eksperimentit, hipotezat e mëposhtme janë të mundshme: H 1 = (as shigjeta e parë dhe as e dyta nuk do të godasë), H 2 = (të dy shigjetat do të godasin), H 3 - (qitësi i parë do të godasë, por i dyti jo ), H 4 = (qitësi i parë nuk do të godasë, dhe i dyti do të godasë). Probabilitetet e mëparshme të hipotezave:

P(H1) = 0,2*0,6 = 0,12; P(H2) = 0,8*0,4 = 0,32; P (H 3) = 0,8 * 0,6 = 0,48; P(H 4) = 0,2*0,4 = 0,08.

Probabilitetet e kushtëzuara të ngjarjes së vëzhguar A = (ka një vrimë në objektiv) sipas këtyre hipotezave janë të barabarta: P(A|H 1) = P(A|H 2) = 0; P(A|H 3) = P(A|H 4) = 1

Pas eksperimentit, hipotezat H 1 dhe H 2 bëhen të pamundura, dhe probabilitetet e pasme të hipotezave H 3 dhe H 4 sipas formulës së Bayes do të jenë:

Bayes kundër spamit

Formula e Bayes ka gjetur aplikim të gjerë në zhvillimin e filtrave të spamit. Le të themi se dëshironi të trajnoni një kompjuter për të përcaktuar se cilat email janë postë të padëshiruar. Ne do të vazhdojmë nga fjalori dhe frazat duke përdorur vlerësimet Bayesian. Le të krijojmë së pari një hapësirë ​​hipotezash. Le të kemi dy hipoteza në lidhje me çdo shkronjë: H A është spam, H B nuk është spam, por një shkronjë normale, e nevojshme.

Së pari, le të "trajnojmë" sistemin tonë të ardhshëm anti-spam. Le të marrim të gjitha shkronjat që kemi dhe t'i ndajmë në dy "grumbulla" me nga 10 shkronja secila. Le të vendosim emailet e padëshiruara në njërën dhe ta quajmë grumbulli H A, në tjetrin do të vendosim korrespondencën e nevojshme dhe do ta quajmë grumbulli H B. Tani le të shohim: cilat fjalë dhe fraza gjenden në letrat e padëshiruara dhe të nevojshme dhe me çfarë frekuence? Ne do t'i quajmë këto fjalë dhe fraza prova dhe do t'i shënojmë ato E 1 , E 2 ... Rezulton se fjalët e përdorura zakonisht (për shembull, fjalët "si", "juaj") në grumbullimet H A dhe H B ndodhin afërsisht me të njëjtën frekuencë. Pra, prania e këtyre fjalëve në një letër nuk na tregon asgjë se cilit grumbull t'i caktojmë (prova të dobëta). Le t'u caktojmë këtyre fjalëve një rezultat probabiliteti neutral "spam", le të themi 0.5.

Shprehja "anglisht e folur" le të shfaqet vetëm me 10 shkronja, dhe më shpesh me shkronja të padëshiruara (për shembull, në 7 shkronja të padëshiruara nga të gjitha 10) sesa në ato të nevojshme (në 3 nga 10). Le t'i japim kësaj fraze një vlerësim më të lartë për postën e padëshiruar: 7/10 dhe një vlerësim më të ulët për emailet normale: 3/10. Anasjelltas, doli që fjala "shok" shfaqej më shpesh me shkronja normale (6 nga 10). Dhe pastaj morëm një letër të shkurtër: “Shoku im! Si është anglishtja juaj e folur?”. Le të përpiqemi të vlerësojmë "spammyness" e tij. Ne do të japim vlerësime të përgjithshme P(H A), P(H B) të një shkronje që i përket çdo grumbulli duke përdorur një formulë disi të thjeshtuar të Bayes dhe vlerësimet tona të përafërta:

P(H A) = A/(A+B), Ku A = p a1 *p a2 *…*p an , B = p b1 *p b2 *…*p b n = (1 – p a1)*(1 – p a2)*… *(1 – p an).

Tabela 1. Vlerësimi i thjeshtuar (dhe i paplotë) i Bayes i shkrimit.

Kështu, letra jonë hipotetike mori një probabilitet të pikës përkatëse me theks në "spammy". A mund të vendosim ta hedhim letrën në një nga pirgjet? Le të vendosim pragjet e vendimit:

  • Do të supozojmë se shkronja i përket grumbullit H i nëse P(H i) ≥ T.
  • Një shkronjë nuk i përket grumbullit nëse P(H i) ≤ L.
  • Nëse L ≤ P(H i) ≤ T, atëherë nuk mund të merret asnjë vendim.

Ju mund të merrni T = 0,95 dhe L = 0,05. Që për letrën në fjalë dhe 0.05< P(H A) < 0,95, и 0,05 < P(H В) < 0,95, то мы не сможем принять решение, куда отнести данное письмо: к спаму (H A) или к нужным письмам (H B). Можно ли улучшить оценку, используя больше информации?

Po. Le të llogarisim rezultatin për secilën pjesë të provës në një mënyrë të ndryshme, ashtu siç propozoi në të vërtetë Bayes. Le te jete:

F a është numri i përgjithshëm i emaileve të padëshiruara;

F ai është numri i shkronjave me certifikatë i në një grumbull spam;

F b është numri i përgjithshëm i shkronjave të nevojshme;

F bi është numri i shkronjave me certifikatë i në një tufë shkronjash të nevojshme (përkatëse).

Atëherë: p ai = F ai /F a, p bi = F bi /F b. P(H A) = A/(A+B), P(H B) = B/(A+B), Ku A = p a1 *p a2 *…*p an , B = p b1 *p b2 *…*p b n

Ju lutemi vini re se vlerësimet e fjalëve provuese p ai dhe p bi janë bërë objektive dhe mund të llogariten pa ndërhyrjen njerëzore.

Tabela 2. Vlerësim më i saktë (por jo i plotë) i Bayes bazuar në veçoritë e disponueshme nga një letër

Ne morëm një rezultat shumë të caktuar - me një avantazh të madh, shkronja mund të klasifikohet si shkronja e duhur, pasi P(H B) = 0,997 > T = 0,95. Pse ndryshoi rezultati? Për shkak se ne përdorëm më shumë informacion - morëm parasysh numrin e shkronjave në secilën prej shtyllave dhe, nga rruga, përcaktuam vlerësimet p ai dhe p bi shumë më saktë. Ata u përcaktuan siç bëri vetë Bayes, duke llogaritur probabilitetet e kushtëzuara. Me fjalë të tjera, p a3 është probabiliteti që fjala "shok" të shfaqet në një shkronjë, me kusht që kjo shkronjë i përket tashmë grumbullit të postës së padëshiruar H A . Rezultati nuk vonoi - duket se mund të marrim një vendim me siguri më të madhe.

Bayes kundër mashtrimit të korporatës

Një aplikim interesant i qasjes Bayesian u përshkrua nga MAGNUS8.

Projekti im aktual (IS për zbulimin e mashtrimit në një ndërmarrje prodhuese) përdor formulën Bayes për të përcaktuar probabilitetin e mashtrimit (mashtrimit) në prani/mungesë të disa fakteve që indirekt dëshmojnë në favor të hipotezës për mundësinë e kryerjes së mashtrimit. Algoritmi është vetë-mësues (me reagime), d.m.th. rillogarit koeficientët e tij (probabilitetet e kushtëzuara) me konfirmimin ose moskonfirmimin faktik të mashtrimit gjatë verifikimit nga shërbimi i sigurisë ekonomike.

Ndoshta ia vlen të thuhet se metoda të tilla gjatë hartimit të algoritmeve kërkojnë një kulturë mjaft të lartë matematikore të zhvilluesit, sepse gabimi më i vogël në nxjerrjen dhe/ose zbatimin e formulave llogaritëse do të anulojë dhe diskreditojë të gjithë metodën. Metodat probabiliste janë veçanërisht të prirura për këtë, pasi të menduarit njerëzor nuk është përshtatur për të punuar me kategori probabiliste dhe, në përputhje me rrethanat, nuk ka "dukshmëri" dhe kuptim të "kuptimit fizik" të parametrave probabilistikë të ndërmjetëm dhe përfundimtarë. Ky kuptim ekziston vetëm për konceptet themelore të teorisë së probabilitetit, dhe atëherë ju vetëm duhet të kombinoni dhe nxirrni me shumë kujdes gjëra komplekse sipas ligjeve të teorisë së probabilitetit - sensi i përbashkët nuk do të ndihmojë më për objektet e përbëra. Kjo, në veçanti, shoqërohet me beteja mjaft serioze metodologjike që zhvillohen në faqet e librave modernë mbi filozofinë e probabilitetit, si dhe me një numër të madh sofizmash, paradoksesh dhe enigmash kurioze për këtë temë.

Një nuancë tjetër me të cilën më është dashur të përballem është se, për fat të keq, pothuajse gjithçka edhe pak a shumë E DOBISHME NË PRAKTIKË për këtë temë është e shkruar në anglisht. Në burimet në gjuhën ruse ekziston kryesisht vetëm një teori e njohur me shembuj demonstrues vetëm për rastet më primitive.

Jam plotësisht dakord me vërejtjen e fundit. Për shembull, Google, kur u përpoq të gjente diçka si "libri i probabilitetit Bayesian", nuk prodhoi asgjë të kuptueshme. Vërtetë, ai raportoi se një libër me statistika Bayesian ishte i ndaluar në Kinë. (Profesori i statistikave Andrew Gelman raportoi në blogun e Universitetit të Kolumbias se libri i tij, Analiza e të dhënave me regresion dhe modele shumënivelëshe/hierarkike, u ndalua nga botimi në Kinë. Botuesi atje raportoi se "libri nuk u miratua nga autoritetet për shkak të shumë ndjeshmërisë politike materiali në tekst.") Pyes veten nëse një arsye e ngjashme çoi në mungesën e librave mbi probabilitetin Bayesian në Rusi?

Konservatorizmi në përpunimin e informacionit njerëzor

Probabilitetet përcaktojnë shkallën e pasigurisë. Probabiliteti, si sipas Bayes ashtu edhe sipas intuitave tona, është thjesht një numër midis zeros dhe atij që përfaqëson shkallën në të cilën një person disi i idealizuar beson se pohimi është i vërtetë. Arsyeja pse një person është disi i idealizuar është se shuma e probabiliteteve të tij për dy ngjarje reciprokisht ekskluzive duhet të jetë e barabartë me probabilitetin e tij për të ndodhur secila ngjarje. Vetia e aditivitetit ka pasoja të tilla që pak njerëz të vërtetë mund t'i takojnë të gjitha.

Teorema e Bayes është një pasojë e parëndësishme e vetive të aditivitetit, e padiskutueshme dhe e pranuar nga të gjithë probabilistët, Bayesian dhe të tjerë. Një mënyrë për të shkruar këtë është si më poshtë. Nëse P(H A |D) është probabiliteti pasues që hipoteza A ishte pasi u vëzhgua një vlerë e caktuar D, P(H A) është probabiliteti i saj paraprak përpara se të vëzhgohej një vlerë e caktuar D, P(D|H A) është probabiliteti që një vlera e dhënë D do të vërehet nëse H A është e vërtetë, dhe P(D) është probabiliteti i pakushtëzuar i një vlere të dhënë D, atëherë

(1) P(H A |D) = P(D|H A) * P(H A) / P(D)

P(D) mendohet më së miri si një konstante normalizuese që bën që probabilitetet e pasme të shtohen në unitet mbi grupin shterues të hipotezave reciproke ekskluzive që po shqyrtohen. Nëse duhet të llogaritet, mund të jetë kështu:

Por më shpesh P(D) eliminohet në vend që të llogaritet. Një mënyrë e përshtatshme për ta eliminuar këtë është transformimi i teoremës së Bayes në formën e raportit probabilitet-shans.

Konsideroni një hipotezë tjetër, H B, e cila është reciprokisht ekskluzive me H A, dhe ndryshoni mendjen tuaj për të bazuar në të njëjtën sasi të dhënë që ju ndryshoi mendjen për teorema e Bayes-it

(2) P(H B |D) = P(D|H B) * P(H B) / P(D)

Tani le të ndajmë ekuacionin 1 me ekuacionin 2; rezultati do të jetë si ky:

ku Ω 1 janë shanset e pasme në favor të H A deri në H B, Ω 0 janë shanset e mëparshme dhe L është sasia e njohur për statisticienët si raport probabiliteti. Ekuacioni 3 është i njëjti version përkatës i teoremës së Bayes si Ekuacioni 1, dhe shpesh është dukshëm më i dobishëm veçanërisht për eksperimentet që përfshijnë hipoteza. Bayesians argumentojnë se teorema e Bayes është një rregull formalisht optimal për mënyrën e rishikimit të opinioneve në dritën e provave të reja.

Ne jemi të interesuar të krahasojmë sjelljen ideale të përcaktuar nga teorema e Bayes me sjelljen aktuale të njerëzve. Për t'ju dhënë një ide se çfarë do të thotë kjo, le të provojmë një eksperiment me ju si subjekt i testimit. Kjo çantë përmban 1000 patate të skuqura pokeri. Unë kam dy çanta të tilla, njëra përmban 700 patate të skuqura të kuqe dhe 300 blu, dhe tjetra përmban 300 të kuqe dhe 700 blu. Unë hodha një monedhë për të përcaktuar se cilën të përdor. Pra, nëse mendimet tona janë të njëjta, probabiliteti juaj aktual për të marrë një qese që përmban më shumë patate të skuqura është 0,5. Tani, ju bëni një mostër të rastësishme me një kthim pas çdo çipi. Në 12 patate të skuqura ju merrni 8 të kuqe dhe 4 blu. Tani, bazuar në gjithçka që dini, sa është probabiliteti që të ulni çantën me më shumë të kuqe? Është e qartë se është më e lartë se 0.5. Ju lutemi mos vazhdoni të lexoni derisa të keni regjistruar rezultatin tuaj.

Nëse jeni si një testues tipik, rezultati juaj ra në rangun nga 0.7 deri në 0.8. Megjithatë, nëse do të bënim llogaritjen përkatëse, përgjigja do të ishte 0.97. Është me të vërtetë shumë e rrallë që një personi të cilit nuk i është treguar më parë ndikimi i konservatorizmit të arrijë në një vlerësim kaq të lartë, edhe nëse ai ishte i njohur me teoremën e Bayes.

Nëse proporcioni i patatinave të kuqe në qese është R, atëherë probabiliteti i marrjes r patate të skuqura të kuqe dhe ( n -r) blu në n mostrat me kthim - p r (1-p)n-r. Pra, në një eksperiment tipik me një çantë dhe patate të skuqura pokeri, nëse NA do të thotë se proporcioni i patate të skuqura të kuqe është r A Dhe NB– do të thotë se pjesa është RB, atëherë raporti i probabilitetit:

Kur aplikoni formulën e Bayes, duhet të merrni parasysh vetëm probabilitetin e vëzhgimit aktual dhe jo probabilitetin e vëzhgimeve të tjera që ai mund të kishte bërë por nuk i bëri. Ky parim ka implikime të gjera për të gjitha aplikimet statistikore dhe jostatistikore të teoremës së Bayes; është mjeti teknik më i rëndësishëm për arsyetimin Bayesian.

Revolucioni Bayesian

Miqtë dhe kolegët tuaj po flasin për diçka të quajtur "Teorema e Bayes" ose "Rregulla e Bayes" ose diçka që quhet Arsyetimi Bayesian. Ata janë vërtet të interesuar për këtë, kështu që ju shkoni në internet dhe gjeni një faqe rreth teoremës së Bayes dhe... Është një ekuacion. Dhe kjo është e gjitha... Pse një koncept matematikor gjeneron një entuziazëm të tillë në mendjet? Çfarë lloj "revolucioni Bayesian" po ndodh midis shkencëtarëve dhe argumentohet se edhe vetë qasja eksperimentale mund të përshkruhet si rasti i saj i veçantë? Cili është sekreti që dinë bajezianët? Çfarë lloj drite shohin ata?

Revolucioni Bayesian në shkencë nuk ndodhi sepse gjithnjë e më shumë shkencëtarë njohës filluan të vinin re befas se fenomenet mendore kishin një strukturë Bayesian; jo sepse shkencëtarët në çdo fushë kanë filluar të përdorin metodën Bayesian; por sepse vetë shkenca është një rast i veçantë i teoremës së Bayes; provat eksperimentale janë prova Bayesian. Revolucionarët Bayesian argumentojnë se kur kryeni një eksperiment dhe merrni prova që "konfirmojnë" ose "kundërshtojnë" teorinë tuaj, ai konfirmim ose përgënjeshtrim ndodh sipas rregullave Bayesian. Për shembull, ju duhet të merrni parasysh jo vetëm që teoria juaj mund të shpjegojë një fenomen, por gjithashtu se ka shpjegime të tjera të mundshme që gjithashtu mund ta parashikojnë atë fenomen.

Më parë, filozofia më e njohur e shkencës ishte filozofia e vjetër, e cila u zhvendos nga revolucioni Bayesian. Ideja e Karl Popper-it se teoritë mund të falsifikohen plotësisht, por kurrë nuk verifikohen plotësisht, është një rast tjetër i veçantë i rregullave Bayesian; nëse p(X|A) ≈ 1 – nëse teoria bën parashikime të sakta, atëherë vëzhgimi i ~X falsifikon A shumë fuqishëm. Nga ana tjetër, nëse p(X|A) ≈ 1 dhe ne vëzhgojmë X, kjo nuk konfirmon fuqishëm. teoria; ndoshta një kusht tjetër B është i mundur, i tillë që p(X|B) ≈ 1, dhe sipas të cilit vëzhgimi X nuk dëshmon në favor të A, por dëshmon në favor të B. Që vëzhgimi X të konfirmojë përfundimisht A, do të kishim të mos e dimë se p(X|A) ≈ 1 dhe atë p(X|~A) ≈ 0, të cilat nuk mund t'i dimë sepse nuk mund t'i shqyrtojmë të gjitha shpjegimet e mundshme alternative. Për shembull, kur teoria e relativitetit të përgjithshëm të Ajnshtajnit tejkaloi teorinë e gravitetit të mbështetur mirë të Njutonit, ajo i bëri të gjitha parashikimet e teorisë së Njutonit një rast të veçantë të parashikimeve të Ajnshtajnit.

Në mënyrë të ngjashme, pretendimi i Popper-it se një ide duhet të jetë e falsifikueshme mund të interpretohet si një manifestim i rregullit Bayesian të ruajtjes së probabilitetit; nëse rezultati X është provë pozitive për teorinë, atëherë rezultati ~X duhet ta hedhë poshtë teorinë në një farë mase. Nëse përpiqeni të interpretoni X dhe ~X si "konfirmim" të teorisë, rregullat Bayesian thonë se është e pamundur! Për të rritur gjasat e një teorie, duhet t'i nënshtroheni testeve që potencialisht mund të zvogëlojnë gjasat e saj; Ky nuk është vetëm një rregull për të identifikuar sharlatanët në shkencë, por një pasojë e teoremës së probabilitetit Bayesian. Nga ana tjetër, ideja e Popper-it se nevojitet vetëm falsifikim dhe nuk nevojitet konfirmim është i pasaktë. Teorema e Bayes tregon se falsifikimi është provë shumë e fortë në krahasim me konfirmimin, por falsifikimi është ende i natyrës probabiliste; ai nuk drejtohet nga rregulla thelbësisht të ndryshme dhe nuk ndryshon në këtë mënyrë nga konfirmimi, siç pretendon Popper.

Kështu, ne zbulojmë se shumë dukuri në shkencat njohëse, plus metodat statistikore të përdorura nga shkencëtarët, plus vetë metoda shkencore, janë të gjitha raste të veçanta të teoremës së Bayes. Ky është revolucioni Bayesian.

Mirë se vini në Komplotin Bayesian!

Literatura mbi probabilitetin Bayesian

2. Shumë aplikime të ndryshme të Bayes janë përshkruar nga laureati i Nobelit në ekonomi Kahneman (dhe shokët e tij) në një libër të mrekullueshëm. Vetëm në përmbledhjen time të shkurtër të këtij libri shumë të madh, unë numërova 27 përmendje të emrit të një ministri presbiterian. Formulat minimale. (.. Më pëlqeu shumë. Vërtetë, është pak e komplikuar, ka shumë matematikë (dhe ku do të ishim pa të), por kapitujt individualë (për shembull, Kapitulli 4. Informacioni) janë qartësisht në temë. Unë e rekomandoj atë për të gjithë edhe nëse matematika është e vështirë për ju, lexoni çdo rresht tjetër, duke anashkaluar matematikën dhe duke peshkuar për kokrra të dobishme.

14. (shtesë e datës 15 janar 2017), një kapitull nga libri i Tony Crilly. 50 ide për të cilat duhet të dini. Matematika.

Fizikani laureat i Nobelit, Richard Feynman, duke folur për një filozof me vetëvlerësim veçanërisht të madh, një herë tha: “Ajo që më irriton mua nuk është filozofia si shkencë, por pompoziteti që krijohet rreth saj. Sikur filozofët të qeshin me veten! Sikur të mund të thoshin: "Unë them se është kështu, por Von Leipzig mendoi se ishte ndryshe, dhe ai gjithashtu di diçka për të." Sikur të kujtoheshin të sqaronin se është vetëm e tyre .

Forma e ngjarjeve grupi i plotë, nëse të paktën njëri prej tyre do të ndodhë patjetër si rezultat i eksperimentit dhe janë të papajtueshëm në çift.

Le të supozojmë se ngjarja A mund të ndodhë vetëm së bashku me një nga disa ngjarje të papajtueshme në çift që formojnë një grup të plotë. Ne do të quajmë ngjarje ( i= 1, 2,…, n) hipoteza përvojë shtesë (a priori). Probabiliteti i ndodhjes së ngjarjes A përcaktohet nga formula probabilitet të plotë :

Shembulli 16. Ka tre urna. Urna e parë përmban 5 topa të bardhë dhe 3 të zinj, e dyta përmban 4 topa të bardhë dhe 4 të zinj dhe e treta përmban 8 topa të bardhë. Njëra nga urnat zgjidhet në mënyrë të rastësishme (kjo mund të nënkuptojë, për shembull, se zgjedhja është bërë nga një urnë ndihmëse që përmban tre topa me numër 1, 2 dhe 3). Një top nxirret rastësisht nga kjo urnë. Sa është probabiliteti që të jetë i zi?

Zgjidhje. Ngjarje A– hiqet topi i zi. Nëse do të dihej se nga cila urnë është tërhequr topi, atëherë probabiliteti i dëshiruar mund të llogaritet duke përdorur përkufizimin klasik të probabilitetit. Le të paraqesim supozime (hipoteza) në lidhje me cilën urnë është zgjedhur për të tërhequr topin.

Topi mund të tërhiqet ose nga urna e parë (supozim), ose nga e dyta (supozim), ose nga e treta (hamendje). Meqenëse ka shanse të barabarta për të zgjedhur ndonjë nga urnat, atëherë .

Nga kjo rrjedh se

Shembulli 17. Llambat elektrike prodhohen në tre fabrika. Fabrika e parë prodhon 30% të numrit të përgjithshëm të llambave elektrike, e dyta - 25%.
dhe e treta - pjesa tjetër. Produktet e fabrikës së parë përmbajnë 1% llamba elektrike me defekt, e dyta - 1,5%, e treta - 2%. Dyqani merr produkte nga të tre fabrikat. Sa është probabiliteti që një llambë e blerë në një dyqan të rezultojë e dëmtuar?

Zgjidhje. Duhet të bëhen supozime në lidhje me cilën fabrikë është prodhuar llamba. Duke e ditur këtë, ne mund të gjejmë probabilitetin që ai të jetë i dëmtuar. Le të prezantojmë shënimin për ngjarjet: A– llamba elektrike e blerë ka rezultuar me defekt, – llamba është prodhuar nga fabrika e parë, – llamba është prodhuar nga fabrika e dytë,
– llamba është prodhuar nga fabrika e tretë.

Ne gjejmë probabilitetin e dëshiruar duke përdorur formulën e probabilitetit total:

Formula e Bayes. Le të jetë një grup i plotë i ngjarjeve të papajtueshme në çift (hipoteza). A- një ngjarje e rastësishme. Pastaj,

Formula e fundit, e cila lejon që dikush të rivlerësojë probabilitetet e hipotezave pasi rezultati i testit, si rezultat i së cilës u shfaq ngjarja A, bëhet i njohur, quhet Formula e Bayes .

Shembulli 18. Mesatarisht, 50% e pacientëve me këtë sëmundje shtrohen në një spital të specializuar TE, 30% – me sëmundje L, 20 % –
me sëmundje M. Mundësia e shërimit të plotë të sëmundjes K e barabartë me 0.7 për sëmundjet L Dhe M këto probabilitete janë përkatësisht 0.8 dhe 0.9. Pacienti i shtruar në spital ka dalë i shëndetshëm. Gjeni probabilitetin që ky pacient të vuante nga sëmundja K.


Zgjidhje. Le të paraqesim hipotezat: – pacienti vuante nga një sëmundje TE L, – pacienti vuante nga një sëmundje M.

Pastaj, sipas kushteve të problemit, kemi . Le të prezantojmë një ngjarje A– pacienti i shtruar në spital ka dalë i shëndetshëm. Sipas kushteve

Duke përdorur formulën e probabilitetit total marrim:

Sipas formulës së Bayes.

Shembulli 19. Le të ketë pesë topa në urnë dhe të gjitha supozimet për numrin e topave të bardhë janë po aq të mundshme. Një top merret rastësisht nga urna dhe rezulton të jetë i bardhë. Cili është supozimi më i mundshëm për përbërjen fillestare të urnës?

Zgjidhje. Le të jetë hipoteza se ka topa të bardhë në urnë , d.m.th., mund të bëhen gjashtë supozime. Më pas, sipas kushteve të problemit, kemi .

Le të prezantojmë një ngjarje A– një top i bardhë i marrë rastësisht. Le të llogarisim. Meqenëse, atëherë sipas formulës së Bayes kemi:

Kështu, hipoteza më e mundshme është sepse .

Shembulli 20. Dy nga tre elementët që funksionojnë në mënyrë të pavarur të pajisjes kompjuterike kanë dështuar. Gjeni probabilitetin që elementi i parë dhe i dytë të dështojnë nëse probabiliteti i dështimit të elementit të parë, të dytë dhe të tretë, përkatësisht, janë 0,2; 0.4 dhe 0.3.

Zgjidhje. Le të shënojmë me A ngjarja - dy elementë kanë dështuar. Mund të bëhen hipotezat e mëposhtme:

– elementi i parë dhe i dytë kanë dështuar, por elementi i tretë është funksional. Meqenëse elementet funksionojnë në mënyrë të pavarur, zbatohet teorema e shumëzimit:

KATEGORITË

ARTIKUJ POPULLOR

2024 "kingad.ru" - ekzaminimi me ultratinguj i organeve të njeriut