Kde: p 1 , p 2 - pravdepodobnosti (frekvencie), s ktorými sú stratégie A 1 a A 2 aplikované

Z teórie hier je známe, že ak hráč „A“ použije svoju optimálnu stratégiu a hráč „B“ zostane v rámci svojich aktívnych stratégií, potom priemerná výplata zostane nezmenená a rovná sa cene hry. v bez ohľadu na to, ako hráč „B“ používa svoje aktívne stratégie. A v našom prípade sú obe stratégie aktívne, inak by hra mala riešenie v čistých stratégiách. Ak teda predpokladáme, že hráč „B“ použije čistú stratégiu B 1 , potom priemerná odmena v bude:

k 11 p 1 + k 21 p 2 = v (1)

Kde: k ij - prvky výplatnej matice.

Na druhej strane, ak predpokladáme, že hráč „B“ použije čistú stratégiu B 2 , potom bude priemerná odmena:

k 12 p 1 + k 22 p 2 \u003d v (2)

Prirovnaním ľavých častí rovníc (1) a (2) dostaneme:

k 11 p 1 + k 21 p 2 \u003d k 12 p 1 + k 22 p 2

A berúc do úvahy skutočnosť, že p 1 + p 2 = 1 máme:

k 11 p 1 + k 21 (1 – p 1) \u003d k 12 p 1 + k 22 (1 – 1)


Preto je ľahké nájsť optimálnu frekvenciu stratégie A 1 :

Teória matematických hier. Príklady nahrávania a riešenia hier zo života

Všimnite si! Riešenie vášho konkrétneho problému bude vyzerať podobne ako tento príklad, vrátane všetkých nižšie uvedených tabuliek, vysvetľujúcich textov a obrázkov, ale s prihliadnutím na vaše počiatočné údaje ...

Úloha:
Maticová hra je daná nasledujúcou výplatnou maticou:

"B" stratégie
„A“ stratégie B1B2
A 1 3 5
A2 6
3
2

Nájdite riešenie pre maticovú hru, konkrétne:
- nájsť najvyššiu cenu hry;
- nižšia cena hry;
- čistá cena hry;
- naznačiť optimálne stratégie hráčov;
- v prípade potreby poskytnúť grafické riešenie (geometrickú interpretáciu).

Krok 1

Stanovme si nižšiu cenu hry - α

Nižšia cena hryα je maximálna odmena, ktorú si môžeme zaručiť v hre proti rozumnému súperovi, ak počas hry používame iba jednu stratégiu (takejto stratégii sa hovorí „čistá“).

Nájdite v každom riadku výplatnej matice minimálne prvok a zapíšte ho do ďalšieho stĺpca (zvýrazneného žltou farbou, pozri tabuľku 1).

Potom nájdeme maximálne prvok doplnkového stĺpca (označený hviezdičkou), bude to nižšia cena hry.

stôl 1

"B" stratégie
„A“ stratégie B1B2 Minimum riadkov
A 1 3 5 3 *
A2 6
3
2
3
2

V našom prípade sa nižšia cena hry rovná: a = 3 a aby sme si zaručili výplatu nie horšiu ako 3, musíme dodržiavať stratégiu A 1

Krok 2

Stanovme si hornú cenu hry - β

Top cena hryβ je minimálna strata, ktorú si hráč „B“ môže zaručiť v hre proti rozumnému súperovi, ak počas celej hry používa jednu a len jednu stratégiu.

Nájdite v každom stĺpci výplatnej matice maximálne prvok a napíšte ho na ďalší riadok nižšie (zvýraznený žltou farbou, pozri tabuľku 2).

Potom nájdeme minimálne prvok doplnkového riadku (označený plusom), bude to najvyššia cena hry.

tabuľka 2

"B" stratégie
„A“ stratégie B1B2 Minimum riadkov
A 1 3 5 3 *
A2 6
3
2

V našom prípade sa horná cena hry rovná: p = 5 a aby si zaručil prehru nie horšiu ako 5, súper (hráč „B“) musí dodržiavať stratégiu B 2

Krok: 3
Porovnajme si spodnú a hornú cenu hry, v tomto probléme sa líšia, t.j. α ≠ β, výplatná matica neobsahuje sedlový bod. To znamená, že hra nemá riešenie v čistých minimax stratégiách, ale vždy má riešenie v zmiešaných stratégiách.

Zmiešaná stratégia, ide o náhodne sa striedajúce čisté stratégie, s určitými pravdepodobnosťami (frekvenciami).

Zmiešaná stratégia hráča „A“ bude označená

S A=

kde B1, B2 sú stratégie hráča „B“ a q1, q2 sú pravdepodobnosti, s ktorými sú tieto stratégie aplikované, a q1 + q2 = 1.

Optimálna zmiešaná stratégia pre hráča „A“ je tá, ktorá mu zabezpečí maximálnu odmenu. Preto pre "B" - minimálna strata. Tieto stratégie sú označené S A* a S B* resp. Dvojica optimálnych stratégií tvorí riešenie hry.

Vo všeobecnosti nemusí optimálna stratégia hráča zahŕňať všetky počiatočné stratégie, ale len niektoré z nich. Takéto stratégie sú tzv aktívne stratégie.

Krok: 4

p 1 =
k 22 - k 21
k 11 + k 22 - k 12 - k 21
(3)

V tejto úlohe:

p 1 =
3
2
- 6
3 +
3
2
- 5 - 6
=
9
13

Pravdepodobnosť R 2 nájsť odčítaním R 1 z jednotky:
p 2 = 1 - p 1 = 1 -
9
13
= + 6 ·

Kde: q 1 , q 2 - pravdepodobnosti (frekvencie), s ktorými sú aplikované stratégie B 1 a B 2, resp

Z teórie hier je známe, že ak hráč „B“ používa svoju optimálnu stratégiu a hráč „A“ zostáva v rámci svojich aktívnych stratégií, potom priemerná výplata zostáva nezmenená a rovná sa cene hry. v bez ohľadu na to, ako hráč „A“ používa svoje aktívne stratégie. Ak teda predpokladáme, že hráč „A“ použije čistú stratégiu A 1 , potom priemerná odmena v bude:

k 11 q 1 + k 12 q 2 = v (4)


Pretože cena hry v už vieme a vzhľadom na to q 1 + q 2 = 1 , potom optimálnu frekvenciu stratégie B 1 možno nájsť ako:
q 1 =
v - k 12
k 11 - k 12
(5)

V tejto úlohe:

q 1 =
51
13
- 5
3 - 5
=
7
13

Pravdepodobnosť q 2 nájsť odčítaním q 1 z jednotky:
q 2 = 1 - q 1 = 1 -
7
13
=
6
13

odpoveď:

Nižšia cena hry: α = 3
Najlepšia cena hry: β = 5
Cena hry: v =
51
13
Optimálna stratégia hráča A je:
S A*=
A 1A2
9
13
4
13

Optimálna stratégia hráča "B" :
S B*=
B1B2
7
13
6
13

Geometrická interpretácia (grafické riešenie):

Uveďme geometrický výklad uvažovanej hry. Vezmite časť osi x jednotkovej dĺžky a nakreslite zvislé čiary cez jej konce a 1 A a 2 zodpovedajúce našim stratégiám A 1 a A 2 . Predpokladajme teraz, že hráč „B“ použije stratégiu B 1 v jej najčistejšej forme. Potom, ak (hráč "A") použijeme čistú stratégiu A 1 , naša odmena bude 3. Označme zodpovedajúci bod na osi a 1 .
Ak použijeme čistú stratégiu A 2 , tak naša odmena bude 6. Označíme príslušný bod na osi a 2
(Pozri obr. 1). Je zrejmé, že ak použijeme zmiešanie stratégií A 1 a A 2 v rôznych pomeroch, naša odmena sa bude meniť pozdĺž priamky prechádzajúcej bodmi so súradnicami (0 , 3) ​​a (1 , 6), nazvime to čiara stratégia B 1 (na obr. .1 znázornená červenou farbou). Úsečka ľubovoľného bodu na danej priamke sa rovná pravdepodobnosti p 2 (frekvencia), s ktorou aplikujeme stratégiu A 2 , a ordináta - výsledná výplata k (pozri obr. 1).

Obrázok 1.
výplatný graf k z frekvencie p 2 , keď súper používa stratégiu B1.

Predpokladajme teraz, že hráč „B“ použije stratégiu B 2 v jej najčistejšej forme. Potom, ak my (hráč "A") použijeme čistú stratégiu A 1 , potom naša odmena bude 5. Ak použijeme čistú stratégiu A 2, naša odmena bude 3/2 (pozri obr. 2). Podobne, ak zmiešame stratégie A 1 a A 2 v rôznych pomeroch, naša výplata sa bude meniť po priamke prechádzajúcej bodmi so súradnicami (0 , 5) a (1 , 3/2), nazvime to línia stratégie B2. Rovnako ako v predchádzajúcom prípade, úsečka ľubovoľného bodu na tejto priamke sa rovná pravdepodobnosti, s akou aplikujeme stratégiu A 2 a ordináta sa rovná zisku získanému v tomto prípade, ale len pre stratégiu B 2 (pozri Obr. 2).

Obrázok 2
v a optimálnu frekvenciu p 2 pre hráča "A".

V skutočnej hre, keď rozumný hráč "B" ​​použije všetky svoje stratégie, naša výplata sa bude meniť pozdĺž prerušovanej čiary znázornenej na obr. 2 červenou farbou. Táto čiara vymedzuje tzv spodná hranica zisku. Je zrejmé, že najvyšší bod tejto prerušovanej čiary zodpovedá našej optimálnej stratégii. V tomto prípade ide o priesečník línií stratégií B 1 a B 2 . Upozorňujeme, že ak vyberiete frekvenciu p 2 rovná jeho úsečke, potom naša výplata zostane nezmenená a rovná sa v pre akúkoľvek stratégiu hráča „B“ to navyše bude maximum, čo môžeme sami garantovať. Frekvencia (pravdepodobnosť) p 2 , je v tomto prípade zodpovedajúca frekvencia našej optimálnej zmiešanej stratégie. Mimochodom, na obrázku 2 je znázornená aj frekvencia p 1 , naša optimálna zmiešaná stratégia, je dĺžka segmentu [ p 2 ; 1] na osi x. (Je to pretože p 1 + p 2 = 1 )

Úplne podobným spôsobom možno nájsť aj frekvencie optimálnej stratégie pre hráča „B“, ktorá je znázornená na obrázku 3.

Obrázok 3
Grafické určenie ceny hry v a optimálnu frekvenciu q2 pre hráča "IN".

Len pre neho by mal stavať tzv horná hranica straty(červená prerušovaná čiara) a hľadajte na nej najnižší bod, pretože pre hráča „B“ je cieľom minimalizovať stratu. Podobne aj hodnota frekvencie q 1 , je dĺžka segmentu [ q 2 ; 1] na osi x.

Herná teória ako odvetvie operačného výskumu ide o teóriu matematických modelov pre prijímanie optimálnych rozhodnutí v podmienkach neistoty alebo konfliktu viacerých strán s rôznymi záujmami. Teória hier skúma optimálne stratégie v situáciách herného charakteru. Patria sem situácie súvisiace s výberom najvýhodnejších výrobných riešení pre systém vedeckých a ekonomických experimentov, organizáciou štatistickej kontroly, ekonomickými vzťahmi medzi podnikmi v priemysle a iných odvetviach. Formalizáciou konfliktných situácií matematicky môžu byť reprezentované ako hra dvoch, troch atď. hráčov, z ktorých každý sleduje cieľ maximalizovať svoj vlastný prospech, svoj zisk na úkor toho druhého.

Časť "Teória hier" je zastúpená tromi online kalkulačky:

  1. Optimálne hráčske stratégie. V takýchto problémoch je daná výplatná matica. Je potrebné nájsť čisté alebo zmiešané stratégie hráčov a, cena hry. Ak chcete vyriešiť, musíte zadať rozmer matice a metódu riešenia. Služba implementuje nasledujúce metódy riešenia hry pre dvoch hráčov:
    1. Minimax . Ak potrebujete nájsť čistú stratégiu hráčov alebo odpovedať na otázku o sedlovom bode hry, zvoľte tento spôsob riešenia.
    2. Simplexná metóda. Používa sa na riešenie hry v zmiešaných stratégiách pomocou metód lineárneho programovania.
    3. Grafická metóda. Používa sa na riešenie zmiešaných strategických hier. Ak existuje sedlový bod, riešenie sa zastaví. Príklad: Pre danú výplatnú maticu nájdite pomocou grafickej metódy riešenia hry optimálne zmiešané stratégie hráčov a cenu hry.
    4. Iteratívna Brown-Robinsonova metóda. Iteračná metóda sa používa vtedy, keď nie je možné použiť grafickú metódu a keď algebraické a maticové metódy nie sú prakticky použiteľné. Táto metóda poskytuje aproximáciu hodnoty hry a skutočnú hodnotu možno získať s ľubovoľným požadovaným stupňom presnosti. Táto metóda nestačí na nájdenie optimálnych stratégií, ale umožňuje vám sledovať dynamiku ťahovej hry a určiť cenu hry pre každého z hráčov v každom kroku.
    Úloha môže napríklad znieť ako „uveďte optimálne stratégie hráčov pre hru dané výplatnou maticou“.
    Všetky metódy používajú kontrolu dominantných riadkov a stĺpcov.
  2. Hra Bimatrix. Zvyčajne sa v takejto hre nastavujú dve matice rovnakej veľkosti výplat prvého a druhého hráča. Riadky týchto matíc zodpovedajú stratégiám prvého hráča a stĺpce matíc zodpovedajú stratégiám druhého hráča. V tomto prípade prvá matica predstavuje výnosy prvého hráča a druhá matica zobrazuje výnosy druhého hráča.
  3. Hry s prírodou. Používa sa, keď je potrebné zvoliť manažérske rozhodnutie podľa kritérií Maximax, Bayes, Laplace, Wald, Savage, Hurwitz.
    Pre Bayesovo kritérium bude potrebné zaviesť aj pravdepodobnosti výskytu udalostí. Ak nie sú nastavené, ponechajte predvolené hodnoty (budú ekvivalentné udalosti).
    Pre Hurwitzovo kritérium špecifikujte úroveň optimizmu λ . Ak tento parameter nie je uvedený v podmienkach, možno použiť hodnoty 0, 0,5 a 1.

Pri mnohých problémoch je potrebné nájsť riešenie pomocou počítača. Jedným z nástrojov sú vyššie uvedené služby a funkcie

Herná teória - súbor matematických metód riešenia konfliktných situácií (zrážky záujmov). V teórii hier je hra matematický model konfliktnej situácie. Predmetom osobitného záujmu v teórii hier je štúdium rozhodovacích stratégií účastníkov hry v podmienkach neistoty. Neistota je spôsobená skutočnosťou, že dve alebo viac strán sledujú opačné ciele a výsledky akéhokoľvek konania každej zo strán závisia od ťahov partnera. Každá zo strán sa zároveň snaží robiť optimálne rozhodnutia, ktoré v čo najväčšej miere realizujú stanovené ciele.

Teória hier sa najdôslednejšie uplatňuje v ekonomike, kde vznikajú konfliktné situácie napríklad vo vzťahoch medzi dodávateľom a spotrebiteľom, kupujúcim a predávajúcim, bankou a klientom. Aplikáciu teórie hier možno nájsť aj v politike, sociológii, biológii a vojenskom umení.

Z histórie teórie hier

História teórie hier ako samostatná disciplína začína v roku 1944, keď John von Neumann a Oscar Morgenstern vydali knihu „Teória hier a ekonomické správanie“ („Teória hier a ekonomické správanie“). Hoci s príkladmi teórie hier sme sa stretli už skôr: pojednanie z babylonského Talmudu o rozdelení majetku zosnulého manžela medzi jeho manželky, kartové hry v 18. storočí, vývoj teórie šachu na začiatku 20. storočia, dôkaz minimaxovej vety toho istého Johna von Neumanna v roku 1928, bez ktorej by neexistovala teória hier.

V 50. rokoch 20. storočia Melvin Drescher a Meryl Flood z Rand Corporation Prvý, kto experimentálne aplikoval väzňovu dilemu, John Nash vo svojej práci o rovnovážnom stave v hrách pre dve osoby, vyvinul koncept Nashovej rovnováhy.

Reinhard Salten v roku 1965 vydal knihu „Oligopoly Processing in Game Theory on Demand“ („Spieltheoretische Behandlung eines Oligomodells mit Nachfrageträgheit“), s ktorou aplikácia teórie hier v ekonómii dostala nový impulz. Krok vpred vo vývoji teórie hier je spojený s prácou Johna Maynarda Smitha „Evolutionary Stable Strategy“ („Evolutionary Stable Strategy“, 1974). Väzňova dilema bola popularizovaná v knihe Roberta Axelroda The Evolution of Cooperation, ktorá vyšla v roku 1984. V roku 1994 získali John Nash, John Harsanyi a Reinhard Salten Nobelovu cenu za teóriu hier.

Teória hier v živote a podnikaní

Zastavme sa podrobnejšie pri podstate konfliktnej situácie (stretu záujmov) v zmysle, ako ju chápe teória hier pre ďalšie modelovanie rôznych situácií v živote a podnikaní. Nechajte jednotlivca byť v pozícii, ktorá vedie k jednému z niekoľkých možných výsledkov, a jednotlivec má určité osobné preferencie vo vzťahu k týmto výsledkom. Ale hoci môže do určitej miery kontrolovať premenlivé faktory, ktoré určujú výsledok, nemá nad nimi úplnú kontrolu. Niekedy je kontrola v rukách niekoľkých jednotlivcov, ktorí podobne ako on majú určité preferencie pre možné výsledky, ale vo všeobecnosti sa záujmy týchto jednotlivcov nezhodujú. V iných prípadoch môže konečný výsledok závisieť od nehôd (v právnych vedách niekedy nazývaných prírodné katastrofy), ako aj od iných jednotlivcov. Teória hier systematizuje pozorovanie takýchto situácií a formulovanie všeobecných princípov na usmernenie rozumného konania v takýchto situáciách.

V niektorých ohľadoch je názov „teória hier“ nešťastný, pretože naznačuje, že teória hier sa zaoberá iba spoločensky nevýznamnými kolíziami, ktoré sa vyskytujú v spoločenských hrách, no napriek tomu má táto teória oveľa širší význam.

Nasledujúca ekonomická situácia môže poskytnúť predstavu o aplikácii teórie hier. Predpokladajme, že existuje niekoľko podnikateľov, z ktorých každý sa snaží maximalizovať zisk, pričom má len obmedzenú moc nad premennými, ktoré tento zisk určujú. Podnikateľ nemá kontrolu nad premennými, ktoré kontroluje iný podnikateľ, ale ktoré môžu veľmi ovplyvniť príjem toho prvého. Interpretácia tejto situácie ako hry môže viesť k nasledujúcej námietke. Herný model predpokladá, že každý podnikateľ si vyberie jednu možnosť z oblasti možných možností a zisky sú určené týmito jednotlivými možnosťami. Je zrejmé, že v skutočnosti je to takmer nemožné, keďže v tomto prípade by v priemysle neboli potrebné zložité administratívne aparáty. Jednoducho existuje množstvo rozhodnutí a modifikácií týchto rozhodnutí, ktoré závisia od volieb ostatných účastníkov ekonomického systému (hráčov). V zásade si však možno predstaviť, že každý správca predvída všetky možné nepredvídané udalosti a podrobne popisuje kroky, ktoré treba v každom prípade vykonať, namiesto toho, aby riešil každú úlohu tak, ako sa objaví.

Vojenský konflikt je podľa definície stret záujmov, v ktorom ani jedna strana nemá plnú kontrolu nad premennými určujúcimi výsledok, o ktorom rozhoduje séria bitiek. Výsledok môžete jednoducho považovať za výhru alebo prehru a priradiť im číselné hodnoty 1 a 0.

Jednou z najjednoduchších konfliktných situácií, ktoré sa dajú v teórii hier zapísať a vyriešiť, je súboj, čo je konflikt medzi dvoma hráčmi 1 a 2, ktorí majú resp. p A q zábery. Pre každého hráča existuje funkcia označujúca pravdepodobnosť výstrelu hráča i v tom čase t dá zásah, ktorý sa stane osudným.

Výsledkom je, že teória hier prichádza k nasledujúcej formulácii určitej triedy konfliktov záujmov: existujú n hráčov a každý hráč si musí vybrať jednu možnosť z určitej množiny 100, pričom pri výbere nemá hráč žiadne informácie o možnostiach ostatných hráčov. Oblasť možných volieb hráča môže obsahovať prvky ako „pohyb pikového esa“, „výroba tankov namiesto áut“ alebo vo všeobecnom zmysle stratégia, ktorá definuje všetky akcie, ktoré sa majú vykonať za všetkých možných okolností. Každý hráč stojí pred úlohou: akú voľbu by mal urobiť, aby mu jeho súkromný vplyv na výsledok priniesol čo najväčší zisk?

Matematický model v teórii hier a formalizácii problémov

Ako sme už poznamenali, hra je matematickým modelom konfliktnej situácie a vyžaduje nasledujúce komponenty:

  1. zainteresované strany;
  2. možné akcie na každej strane;
  3. záujmy strán.

Záujemcovia o hru sa nazývajú hráči. , každý z nich môže vykonať minimálne dve akcie (ak má hráč iba jednu akciu, tak sa vlastne hry nezúčastňuje, keďže je vopred známe, čo urobí). Výsledok hry sa nazýva výhra. .

Skutočná konfliktná situácia nie je vždy, ale hra (v koncepte teórie hier) - vždy - pokračuje určité pravidlá , ktoré presne definujú:

  1. možnosti hráča;
  2. množstvo informácií, ktoré má každý hráč o správaní partnera;
  3. odmena, ku ktorej vedie každý súbor akcií.

Príkladmi formalizovaných hier sú futbal, kartová hra, šach.

V ekonómii však vzniká model správania hráčov, napríklad keď sa niekoľko firiem snaží zaujať výhodnejšie miesto na trhu, niekoľko jednotlivcov sa snaží medzi sebou zdieľať nejaké dobro (zdroje, financie), aby každý dostal čo najviac. . Aktérmi v konfliktných situáciách v ekonomike, ktoré možno modelovať ako hru, sú firmy, banky, jednotlivci a iné ekonomické subjekty. Vo vojnových podmienkach sa zase herný model využíva napríklad pri výbere najlepšej zbrane (z existujúcich alebo potenciálne možných) na porazenie nepriateľa alebo obranu pred útokom.

Pre hru je charakteristická neistota výsledku . Príčiny neistoty možno rozdeliť do nasledujúcich skupín:

  1. kombinatorické (ako v šachu);
  2. vplyv náhodných faktorov (ako v hre „hlavy alebo chvosty“, kocky, kartové hry);
  3. strategické (hráč nevie, akú akciu urobí súper).

Stratégia hráča je súbor pravidiel, ktoré určujú jeho činnosť pri každom pohybe v závislosti od situácie.

Cieľ teórie hier je určiť optimálnu stratégiu pre každého hráča. Určiť takúto stratégiu znamená vyriešiť hru. Optimalizácia stratégie sa dosiahne, keď jeden z hráčov musí získať maximálnu výplatu, zatiaľ čo druhý sa drží svojej stratégie. A druhý hráč by mal mať minimálnu stratu, ak prvý dodrží svoju stratégiu.

Klasifikácia hry

  1. Klasifikácia podľa počtu hráčov (hra dvoch alebo viacerých osôb). Hry pre dve osoby sú ústredným bodom celej teórie hier. Základný koncept teórie hier pre hry pre dve osoby je zovšeobecnením veľmi základnej myšlienky rovnováhy, ktorá sa prirodzene objavuje v hrách pre dve osoby. Čo sa týka hier n osôb, potom je jedna časť teórie hier venovaná hrám, v ktorých je zakázaná spolupráca medzi hráčmi. V inej časti teórie hier n osôb sa predpokladá, že hráči môžu spolupracovať pre obojstranný prospech (pozri ďalej v tomto odseku o nekooperatívnych a kooperatívnych hrách).
  2. Klasifikácia podľa počtu hráčov a ich stratégií (počet stratégií je aspoň dve, môže byť nekonečno).
  3. Klasifikácia podľa množstva informácií ohľadom minulých ťahov: hry s úplnými informáciami a neúplnými informáciami. Nech je hráč 1 - kupujúci a hráč 2 - predávajúci. Ak hráč 1 nemá úplné informácie o činnosti hráča 2, potom hráč 1 nemusí rozlišovať medzi dvoma alternatívami, medzi ktorými si musí vybrať. Napríklad výber medzi dvoma typmi určitého produktu a nevedomosť, že podľa niektorých vlastností je produkt A horšie ako tovar B, hráč 1 nemusí vidieť rozdiel medzi alternatívami.
  4. Klasifikácia podľa zásad delenia výhier : družstevné, koaličné na jednej strane a nespolupracujúce, nespolupracujúce na strane druhej. IN nekooperatívna hra , alebo inak - nekooperatívna hra , hráči volia stratégie súčasne bez toho, aby vedeli, ktorú stratégiu zvolí druhý hráč. Komunikácia medzi hráčmi nie je možná. IN kooperatívna hra , alebo inak - koaličná hra , hráči môžu vytvárať koalície a podnikať kolektívne kroky na zvýšenie svojich výhier.
  5. Hra pre dve osoby s konečným nulovým súčtom alebo antagonistická hra je strategická hra s úplnými informáciami, na ktorej sa zúčastňujú strany s opačnými záujmami. Antagonistické hry sú maticové hry.

Klasickým príkladom z teórie hier je väzňova dilema.

Dvaja podozriví sú vzatí do väzby a izolovaní od seba. Okresný prokurátor je presvedčený, že spáchali závažnú trestnú činnosť, no nemá dostatok dôkazov, aby ich na súde obvinil. Každému z väzňov povie, že má dve alternatívy: priznať sa k zločinu, ktorý podľa polície spáchal, alebo nepriznať. Ak sa obaja nepriznajú, tak ich okresný prokurátor obviní z nejakého menšieho trestného činu, ako je drobná krádež alebo nedovolené držanie zbrane, a obaja dostanú malý trest. Ak sa obaja priznajú, budú stíhaní, no nebude si to vyžadovať najprísnejší trest. Ak sa jeden prizná a druhý nie, tak bude mať priznaný zmiernený trest za vydanie spolupáchateľa, zatiaľ čo tvrdohlavý dostane „do sýtosti“.

Ak je táto strategická úloha formulovaná v zmysle záverov, potom sa scvrkáva na nasledovné:

Ak sa teda obaja väzni nepriznajú, dostanú každý 1 rok. Ak sa obaja priznajú, potom každý dostane 8 rokov. A ak sa jeden prizná, druhý nie, tak ten, kto sa prizná, dostane tri mesiace väzenia, a kto sa neprizná, dostane 10 rokov. Uvedená matica správne odráža väzňovu dilemu: každý stojí pred otázkou priznať sa alebo nepriznať. Hra, ktorú okresný prokurátor ponúka väzňom, je nekooperatívna hra alebo inak - nekoaličná hra . Ak by obaja väzni boli schopní spolupracovať (t.j. hra bude kooperatívna alebo inak koaličná hra ), potom sa obaja nepriznali a každý dostal rok väzenia.

Príklady využitia matematických prostriedkov teórie hier

Teraz prejdeme k úvahám o riešeniach príkladov bežných tried hier, pre ktoré existujú metódy skúmania a riešenia v teórii hier.

Príklad formalizácie nekooperatívnej (nekooperatívnej) hry dvoch osôb

V predchádzajúcom odseku sme už uvažovali o príklade nekooperatívnej (nekooperatívnej) hry (väzňova dilema). Upevnime svoje schopnosti. K tomu sa hodí aj klasická zápletka inšpirovaná Dobrodružstvami Sherlocka Holmesa Arthura Conana Doyla. Dá sa, samozrejme, namietať: príklad nie je zo života, ale z literatúry, ale Conan Doyle sa nepresadil ako spisovateľ sci-fi! Klasické aj preto, že úlohu splnil, ako sme už utvrdili, Oscar Morgenstern – jeden zo zakladateľov teórie hier.

Príklad 1 Bude uvedený skrátený úryvok z jedného z Dobrodružstiev Sherlocka Holmesa. Podľa známych pojmov teórie hier vytvorte model konfliktnej situácie a hru formálne zapíšte.

Sherlock Holmes má v úmysle ísť z Londýna do Doveru s ďalším cieľom dostať sa na kontinent (európsky), aby ušiel pred profesorom Moriartym, ktorý ho prenasleduje. Keď nastúpil do vlaku, uvidel profesora Moriartyho na nástupišti stanice. Sherlock Holmes pripúšťa, že Moriarty si vie vybrať špeciálny vlak a predbehnúť ho. Sherlock Holmes má dve alternatívy: pokračovať do Doveru alebo vystúpiť na stanici Canterbury, ktorá je jedinou medzistanicou na jeho trase. Predpokladáme, že jeho protivník je dostatočne inteligentný na to, aby určil Holmesove možnosti, takže má dve rovnaké alternatívy. Obaja súperi si musia vybrať stanicu, v ktorej vystúpia z vlaku, pričom nevedia, aké rozhodnutie každý z nich urobí. Ak v dôsledku rozhodnutia obaja skončia na tej istej stanici, potom môžeme definitívne predpokladať, že Sherlocka Holmesa zabije profesor Moriarty. Ak sa Sherlock Holmes dostane bezpečne do Doveru, bude zachránený.

Riešenie. Hrdinov Conana Doyla možno považovať za účastníkov hry, teda hráčov. K dispozícii každému hráčovi i (i=1,2) dve čisté stratégie:

  • vystúpiť v Doveri (stratégia si1 ( i=1,2) );
  • vystúpiť na medzistanici (stratégia si2 ( i=1,2) )

V závislosti od toho, ktorú z dvoch stratégií si každý z dvoch hráčov vyberie, sa vytvorí špeciálna kombinácia stratégií ako pár s = (s1 , s 2 ) .

Každá kombinácia môže byť spojená s udalosťou – výsledkom pokusu profesora Moriartyho zabiť Sherlocka Holmesa. Vytvárame maticu tejto hry s možnými udalosťami.

Pod každou z udalostí je uvedený index, ktorý znamená získanie profesora Moriartyho a počíta sa v závislosti od spásy Holmesa. Obaja hrdinovia si zvolia stratégiu súčasne, nevediac, čo zvolí súper. Hra je teda nekooperatívna, pretože po prvé sú hráči v rôznych vlakoch a po druhé majú opačné záujmy.

Príklad formalizácie a riešenia kooperatívnej (koaličnej) hry n osôb

Na tomto mieste bude praktickej časti, teda priebehu riešenia príkladovej úlohy, predchádzať teoretická časť, v ktorej sa zoznámime s pojmami teórie hier pre riešenie kooperatívnych (nekooperatívnych) hier. Pre túto úlohu teória hier navrhuje:

  • charakteristická funkcia (zjednodušene povedané, odráža hodnotu výhod spojenia hráčov do koalície);
  • pojem aditivity (vlastnosť veličín, ktorá spočíva v tom, že hodnota množstva zodpovedajúceho celému objektu sa rovná súčtu hodnôt množstva zodpovedajúcich jeho častiam, v určitej triede rozdelenia objektu na časti) a superaditívnosť (hodnota veličiny zodpovedajúcej celému objektu je väčšia ako súčet hodnôt veličín zodpovedajúcich jej častiam) charakteristickej funkcie.

Superaditívnosť charakteristickej funkcie naznačuje, že koalície sú pre hráčov výhodné, keďže v tomto prípade sa s počtom hráčov zvyšuje aj odmena koalície.

Aby sme hru formalizovali, musíme zaviesť formálny zápis pre vyššie uvedené pojmy.

Pre hru n označte množinu všetkých jej hráčov ako N= (1,2,...,n) Akákoľvek neprázdna podmnožina množiny N označené ako T(vrátane seba N a všetky podmnožiny pozostávajúce z jedného prvku). Na stránke prebieha aktivita Množiny a operácie na množinách, ktoré sa po kliknutí na odkaz otvorí v novom okne.

Charakteristická funkcia je označená ako v a jeho doména definície pozostáva z možných podmnožín množiny N. v(T) - hodnota charakteristickej funkcie pre konkrétnu podmnožinu, napríklad príjem, ktorý dostáva koalícia, prípadne pozostávajúca z jedného hráča. Je to dôležité, pretože teória hier vyžaduje kontrolu prítomnosti superaditivity pre hodnoty charakteristickej funkcie všetkých neprekrývajúcich sa koalícií.

Pre dve neprázdne koalície podmnožín T1 A T2 aditívnosť charakteristickej funkcie kooperatívnej (koaličnej) hry sa píše takto:

A superadditivita je takáto:

Príklad 2 Traja študenti hudobnej školy si privyrábajú v rôznych kluboch, výťažok získavajú od návštevníkov klubu. Zistite, či je pre nich výhodné spojiť sily (ak áno, za akých podmienok), pomocou konceptov teórie hier riešiť kooperatívne hry n osôb s nasledujúcimi počiatočnými údajmi.

Ich príjem za večer bol v priemere:

  • huslista má 600 jednotiek;
  • gitarista má 700 jednotiek;
  • spevák má 900 jednotiek.

V snahe zvýšiť príjmy študenti niekoľko mesiacov vytvárali rôzne skupiny. Výsledky ukázali, že spojením by mohli zvýšiť svoje večerné príjmy takto:

  • huslista + gitarista zarobili 1500 jednotiek;
  • huslista + spevák zarobil 1800 jednotiek;
  • gitarista + spevák zarobil 1900 jednotiek;
  • huslista + gitarista + spevák zarobil 3000 jednotiek.

Riešenie. V tomto príklade počet účastníkov hry n= 3 , teda doménu charakteristickej funkcie hry tvorí 2³ = 8 možných podmnožín množiny všetkých hráčov. Vymenujme všetky možné koalície T:

  • koalície jedného prvku, z ktorých každý pozostáva z jedného hráča - hudobníka: T{1} , T{2} , T{3} ;
  • koalície dvoch prvkov: T{1,2} , T{1,3} , T{2,3} ;
  • koalícia troch prvkov: T{1,2,3} .

Každému z hráčov pridelíme sériové číslo:

  • huslista - 1. hráč;
  • gitarista - 2. hráč;
  • spevák je 3. hráč.

Podľa problémových údajov určíme charakteristickú funkciu hry v:

v(T(1)) = 600; v(T(2)) = 700; v(T(3)) = 900; tieto hodnoty charakteristickej funkcie sú určené na základe výplat prvého, druhého a tretieho hráča, keď nie sú zjednotení v koalíciách;

v(T(1,2)) = 1500; v(T(1,3)) = 1800; v(T(2,3)) = 1900; tieto hodnoty charakteristickej funkcie sú určené príjmom každého páru hráčov združených v koalíciách;

v(T(1,2,3)) = 3000; táto hodnota charakteristickej funkcie je určená priemernou tržbou v prípade, keď boli hráči spojení v trojiciach.

Uviedli sme teda všetky možné koalície hráčov, je ich osem, ako sa patrí, keďže doménu definície charakteristickej funkcie hry tvorí práve osem možných podmnožín množiny všetkých hráčov. Čo si vyžaduje teória hier, pretože musíme skontrolovať prítomnosť superaditivity pre hodnoty charakteristickej funkcie všetkých neprekrývajúcich sa koalícií.

Ako sú v tomto príklade splnené podmienky superaditivity? Definujme, ako hráči tvoria neprekrývajúce sa koalície T1 A T2 . Ak sú niektorí hráči v koalícii T1 , potom sú všetci ostatní hráči v koalícii T2 a podľa definície táto koalícia vzniká ako rozdiel medzi celkovou množinou hráčov a množinou T1 . Potom ak T1 - koalícia jedného hráča, potom v koalícii T2 bude druhý a tretí hráč, ak bude v koalícii T1 bude prvým a tretím hráčom, potom koalícia T2 bude pozostávať iba z druhého hráča atď.

Obsah 1 Všeobecné informácie 2 1.1 Hry. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Pohyby. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 Stratégie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4 Maticová hra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 Bod sledovania. Čisté stratégie 7 2.1 Príklady. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Príklad 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Príklad 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3 Zmiešané stratégie 9 3.1 Hra 2×2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.1.1 Príklady. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Príklad 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Príklad 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1.2 Geometrická interpretácia. . . . . . . . . . . . . . . . . . . . 12 3.2 Hry 2×n a m×2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Príklad 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1 1. Všeobecné informácie z teórie hier 1.1. Hry Teória hier je matematická teória konfliktných situácií, t.j. také situácie, v ktorých sa stretávajú záujmy dvoch alebo viacerých strán sledujúcich rôzne ciele. Hra je konfliktná situácia upravená určitými pravidlami, ktoré by mali naznačovať: možné možnosti konania účastníkov, kvantitatívny výsledok hry alebo platbu (výhra, prehra), ku ktorej daný súbor ťahov vedie k výške informácie každej strany o správaní tej druhej. Párová hra – hra, ktorej sa zúčastňujú iba dve strany (dvaja hráči). Párová hra s nulovým súčtom - párová hra, v ktorej je výška platieb nulová, t.j. Strata jedného hráča sa rovná zisku druhého. V závislosti od postoja každého hráča k hodnote výplatnej funkcie sú párové hry rozdelené: Strata jedného hráča sa rovná zisku druhého. Neantagonistická hra je párová hra, v ktorej hráči sledujú rôzne, ale nie priamo opačné ciele. 2 1.2. Ťahy Ťah - výber jednej z akcií stanovených v pravidlách hry, implementácia tejto voľby Existujú dva typy ťahov: Osobný ťah - + vedomá voľba jednej z akcií stanovených pravidlami hry + implementácia tejto voľby Náhodný ťah - Náhodný ťah je výber z množstva možností, ktorý sa neuskutočňuje rozhodnutím hráča, ale nejakým mechanizmom náhodného výberu. Nižšie uvažujeme párové hry s nulovým súčtom, ktoré obsahujú iba osobné ťahy. Každá strana nemá žiadne informácie o správaní tej druhej. 3 1.3. Stratégie Stratégia hráča je súbor pravidiel, ktoré určujú výber akcií pre každý osobný ťah tohto hráča v závislosti od situácie, ktorá sa počas hry vyvinula. Podľa počtu možných stratégií sa hry delia na konečné a nekonečné. Nekonečná hra je hra, v ktorej má aspoň jeden z hráčov nekonečný počet stratégií. Konečná hra je hra, v ktorej má každý hráč len konečný počet stratégií. Počet po sebe nasledujúcich ťahov pre ktoréhokoľvek z hráčov určuje rozdelenie hier na jednoťahové a viacťahové, prípadne pozičné. + V hre na jeden ťah si každý hráč vyberie iba jednu možnosť z možných možností a potom určí výsledok hry. + Viacťahová alebo pozičná hra sa vyvíja v čase, čo predstavuje sériu po sebe nasledujúcich etáp, z ktorých každá prichádza po ťahu jedného z hráčov a zodpovedajúcej zmene situácie. V hre na jeden ťah si každý hráč vyberie len jednu možnosť z možných možností a potom určí výsledok hry. Optimálna stratégia hráča je stratégia, ktorá pri mnohonásobnom opakovaní hry poskytuje danému hráčovi maximálny možný priemerný zisk (alebo ekvivalentne minimálnu možnú priemernú stratu). V teórii hier sa všetky odporúčania robia na základe predpokladu rozumného správania hráčov. Chybné výpočty a chyby hráčov, nevyhnutné v každej konfliktnej situácii, ako aj prvky vzrušenia a rizika v teórii hier sa neberú do úvahy. 4 1.4. Matrix Game Matrix Game je jednoťahová hra s konečným nulovým súčtom. Matrix Game je herno-teoretický model konfliktnej situácie, v ktorej súperi robia jednu voľbu (ťah) z konečného počtu možných spôsobov konania, ako dosiahnuť diametrálne odlišné ciele.V súlade so zvolenými metódami pôsobenia (stratégiou) sa zisťuje dosiahnutý výsledok. Pozrime sa na príklad. Nech sú dvaja hráči A a B, z ktorých jeden si môže vybrať i-tu stratégiu z m svojich možných stratégií A1 , A2 , ...Am , a druhý si vyberie j-tu stratégiu zo svojich možných stratégií B1 , B2 , ... .bm . Výsledkom je, že prvý hráč vyhrá aij a druhý hráč túto hodnotu stratí. Z čísel aij poskladáme maticu   a11 a11 · · · a1n  a21 a22 · · · a2n    A = (aij) =  .. .. .. ..   . . . .  am1 am2 · · · amn Matica A = (aij), i = 1, m, j = 1, n sa nazýva výplatná matica alebo matica hry m × n. V tejto matici sú riadky vždy pre stratégie víťazného (maximalizujúceho) hráča A, teda hráča, ktorý sa snaží maximalizovať svoj zisk. Stĺpce sú vyhradené pre stratégie prehrávajúceho hráča B, teda hráča, ktorý sa snaží minimalizovať kritérium efektivity. Normalizácia hry je proces redukcie pozičnej hry na maticovú hru Hra v normálnej forme je pozičná hra zredukovaná na maticovú hru jednou voľbou (ťahom) z konečného počtu možných spôsobov konania v každej fáze vývoja tohto situáciu. Riešenie hry - hľadanie optimálnych stratégií oboch hráčov a určenie hodnoty hry Hodnotou hry je očakávaný zisk (strata) hráčov. Riešenie hry možno nájsť buď v čistých stratégiách - keď hráč musí postupovať podľa jednej stratégie, alebo v zmiešaných, kedy hráč musí použiť dve alebo viac čistých stratégií s určitou pravdepodobnosťou. Posledne menované sa v tomto prípade nazývajú aktívne. 5 Zmiešaná stratégia jedného hráča je vektor, ktorého každá zložka ukazuje frekvenciu používania zodpovedajúcej čistej stratégie hráčom. Maximin alebo nižšia cena hry - číslo α = max min aij i j Maximin stratégia (string) - stratégia zvolená hráčom, aby maximalizoval svoju minimálnu výplatu. Je zrejmé, že pri výbere najopatrnejšej stratégie maximin si hráč A poskytuje (bez ohľadu na správanie súpera) garantovanú výplatu aspoň α. Maximin alebo horná cena hry - číslo β = min max aij j i Stratégia Minimax (stĺpec) - stratégia zvolená hráčom, aby minimalizoval svoju maximálnu stratu. Je zrejmé, že pri výbere najopatrnejšej stratégie minimaxu hráč B za žiadnych okolností nedovolí hráčovi A vyhrať viac ako β. Nižšia cena hry vždy nepresahuje hornú cenu hry α = max min aij 6 min max aij = β i j j i Veta 1 (hlavná veta teórie maticových hier). Každá konečná hra má aspoň jedno riešenie, možno v oblasti zmiešaných stratégií. 6 2. Hry so sedlovou špičkou. Riešenie v čistých stratégiách Hra so sedlovým bodom je hra, pre ktorú platí α = max min aij = min max aij = β i j j i Pri hrách so sedlovým bodom hľadanie riešenia spočíva vo výbere maximálnej a minimaxovej stratégie, ktoré sú optimálne. , Čistá cena hry je celková hodnota dolnej a hornej ceny hry α=β=ν 2.1. Príklady Príklad 1 Nájdite riešenie v čistých stratégiách hry danej maticou   8 4 7 A= 6 5 9  7 7 8 Riešenie: určte hornú a dolnú cenu hry. Aby sme to dosiahli, nájdeme minimum čísel aij v i-tom riadku αi = min aij j a maximum čísel aij v j-tom stĺpci βj = max aij i Zapíšeme čísla αi (minimálne riadky) vedľa výplatnej matice vpravo ako ďalší stĺpec . Čísla βi (maximá stĺpcov) zapíšeme pod maticu ako ďalší riadok: αi 8 4 7 4 6 5 9 5 7 7 8 7 βj 8 7 9 7 Nájdite maximum čísel αi α = max αi = 7 i a minimum z čísel βj β = min βj = 7 j α = β - hra má sedlový hrot. Optimálna stratégia pre hráča je stratégia A3 a pre hráča B - stratégia B2, čisté náklady na hru ν = 7 Príklad 2 Je daná matica výplaty: 1 1 2   1 2 1 1 2 Nájdite riešenie hry v čistých stratégiách. Riešenie: 2 2 1 1 2 1 0 1 1 1 1 0 1 1 1 1 2 1 1 2 1 1 2 1 βj 2 2 1 1 2 α = β = 1. Hra má šesť sedlových bodov. Optimálne stratégie sú: A1 a B3 alebo B4 A3 a B3 alebo B4 A4 a B3 alebo B4 8 3. Riešenie hry v zmiešaných stratégiách Pre α ̸= β. V prípade, že pri výbere stratégií obaja hráči nemajú informácie o voľbe toho druhého, hra má riešenie v zmiešaných stratégiách. SA = (p1 , p2 , ..., pm) je zmiešaná stratégia hráča A, v ktorej sú stratégie A1 , A2 , ..., Am aplikované s pravdepodobnosťami ∑ m p1 , p2 , ..., pm , pi = 1, pi > 0, i = 1, m i=1 SB = (q1 , q2 , ..., qn) je zmiešaná stratégia hráča B, v ktorej sa stratégie B1 , B2 , ..., Bm uplatňujú s pravdepodobnosťou ∑ n q1, q2, ..., qm, qi = 1, qi > 0, i = 1, n i=1 = aij p∗i qi∗ j=1 i=1 2 × n, m × 2). Ak jeden z hráčov používa optimálnu zmiešanú stratégiu, potom sa jeho výplata rovná cene hry ν, bez ohľadu na pravdepodobnosti, s ktorými druhý hráč použije stratégie zahrnuté v optimálnej (vrátane čistých stratégií). 9 3.1. Hra 2 × 2 Uvažujme hru 2 × 2 s maticou: () a11 a21 a21 a22 Nech hra nemá riešenie v čistých stratégiách. Nájdite optimálne stratégie SA∗ a SB∗ . Najprv definujeme stratégiu SA∗ = (p∗1 , p∗2). Podľa teorému, ak strana A dodrží stratégiu ν, potom bez ohľadu na postup strany B zostane výplata rovná cene hry ν. Ak teda strana A dodrží optimálnu stratégiu SA∗ = (p∗1 , p∗2), potom strana B môže uplatniť ktorúkoľvek zo svojich stratégií bez toho, aby zmenila výplatu. Potom, keď hráč B použije čistú stratégiu B1 alebo B2, hráč dostane priemernú výhru rovnajúcu sa cene hry: a11 p∗1 + a21 p∗2 = ν ← pre stratégiu B1 všimnite si, že p∗1 + p ∗2 = 1: p∗1 = a2 2−a2 1 a11 +a22 −a12 −a21 p∗2 = a1 1−a1 2 a11 +a22 −a12 −a21 Hodnota hry: a22 a11 − a12 a21 a22 = a11 − a12 − a21 Podobne sa nájde optimálna stratégia hráča B: SB∗ = (q1∗ , q2∗). Ak vezmeme do úvahy, že q1∗ + q2∗ = 1: q1∗ = a2 2 − a1 2 a11 + a22 − a12 − a21 q2∗ = a1 1 − a2 1 a11 + a22 − a12 − a21 3.1.1. Príklady Príklad 3 Nájdite riešenie hry s maticou () −1 1 A= 1 −1 10 Riešenie: hra nemá sedlový bod, keďže α= -1, β = 1, α ̸= β. Hľadáme riešenie v zmiešaných stratégiách. Pomocou vzorcov pre p∗ a q ∗ dostaneme p∗1 = p∗2 = 0,5 a q1∗ = q2∗ = 0,5, ν = 0 Teda SA∗ = (0,5, 0,5) SB∗ = (0,5, 0,5) Príklad 4 Nájdite riešenie hry s maticou () 2 5 A= 6 4 Riešenie: hra nemá sedlový bod, pretože α= 4, β = 5, α ̸= β. Hľadáme riešenie v zmiešaných stratégiách. Podľa vzorcov pre p∗ a q 0,8) 11 3.1.2. Geometrická interpretácia Hra 2×2 môže mať jednoduchú geometrickú interpretáciu. Zoberme si jednotkový rez osi x, ku ktorému každému bodu priradíme nejakú zmiešanú stratégiu S = (p1 , p2) = (p1 , 1 − p1) p2 , stratégie A2 - vzdialenosť k ľavému koncu. .y .I .I I .B1′ .N .B1 .a21 .a11 .I I .I .∗ .x .P2 .SA∗ .P1∗ pravý koniec úseku (x = 1) - stratégia A2 Na koncoch úseku sú obnovené dve kolmice na os x: os I − I - výplata sa posúva stratégiou A1 os II − II - výplata sa posúva stratégiou A2 Nechajte hráča B aplikovať stratégiu B1 ; dáva na osiach I − I a II − II body so súradnicami a11 a a21 . Cez tieto body vedieme priamku B1 − B1′. Pre akúkoľvek zmiešanú stratégiu SA = (p1 , p2) je výplata hráča určená bodom N na priamke B1 − B1′ , zodpovedajúcim bodu SA na osi x deliacej segment vzhľadom na p2: p1 . Je zrejmé, že priamka B2 − B2′, ktorá určuje výnos pre stratégiu B2 , môže byť skonštruovaná presne rovnakým spôsobom. 12 .y .I .I I .B2 .N .a21 .B2′ a . 22 .I I .I .∗ .x .P2 .SA∗ .P1∗ Je potrebné nájsť optimálnu stratégiu SA∗ , t.j. taká, že minimálna odmena hráča A (s najhorším správaním hráča B pre neho) by sa zmenila na maximálnu. Na tento účel je pre stratégie B1, B2 skonštruovaná spodná hranica výplaty hráča A, t.j. prerušovaná čiara B1 N B2′ ;. Na tejto hranici bude ležať minimálna odmena hráča A za ktorúkoľvek z jeho zmiešaných stratégií, bod N , v ktorom táto odmena dosiahne maximum a určuje riešenie a cenu hry. .y .I .I I .B2 .B1′ .N .B1 .B2′ .I I .I .∗ .x .P2 . A∗ S . 1∗ P Ordináta bodu N nie je nič iné ako hodnota hry ν, jej súradnica sa rovná ∗2 a vzdialenosť k pravému koncu úsečky sa rovná ∗1, t.j. vzdialenosť od bodu SA∗ po konce segmentu sa rovná pravdepodobnostiam ∗2 a ∗1 stratégií A2 a A1 optimálnej zmiešanej stratégie hráča A. V tomto prípade bolo riešenie hry určené priesečník stratégií B1 a B2 . Nižšie je uvedený prípad, kedy je optimálnou stratégiou hráča čistá stratégia A2 . Tu je stratégia A2 (pre akúkoľvek stratégiu súpera) výnosnejšia ako stratégia A1 , 13 .y .y .I .I I .I I. I .B2′ . 1'B .B1'B. 2.B2'B. 2 .B1 .v = a21 .B1 .v = a21 I. I I. I .I . .x .I . .X 2* P . A∗ S = A2. 2* P . A∗ S = A2 Vpravo je znázornený prípad, keď má hráč B zámerne nerentabilnú stratégiu. Geometrický výklad umožňuje vizualizovať aj nižšiu cenu hry α a vyššiu cenu β .y .I .I I .B2 .B1′ .N .B1 B2′ .β = a21 .α = a22 .I I .I .∗ .x .P2 . A∗ S . 1∗ P Na tom istom grafe možno dať aj geometrickú interpretáciu optimálnych stratégií hráča B . Je ľahké vidieť, že podiel q1∗ stratégie B1 optimálnej zmiešanej stratégie SB∗ = (q1∗ , q2∗) sa rovná pomeru dĺžky segmentu KB2 k súčtu dĺžok segmentov KB1 a KB2 na osi I − I: .y .I .I I .B2 .B1 .N .K .L .B1 .B2 .I I .I .∗ .x .P2 . A∗ S . 1∗ P 14 KB2 q1∗ = KB2 + KB1 alebo LB2′ q1∗ = LB2′ + LB1′ maximum spodnej hranice odmeny uvažujme minimum hornej hranice. .y .I .I I .A2 .A′1 .N .A1 .A′2 .I I .I . .x .q2∗ . B∗ S .q1∗ 15 3.2. Hry 2 × n a m × 2 Riešenie hier 2 × n a m × 2 vychádza z nasledujúcej vety. Veta 3. Každá konečná hra m × n má riešenie, v ktorom počet aktívnych stratégií každej strany nepresahuje najmenšiu z m a n. Podľa tejto vety má hra 2 × n vždy riešenie, v ktorom má každý hráč najviac dve aktívne stratégie. Stačí nájsť tieto stratégie a hra 2 × n sa zmení na hru 2 × 2, ktorá je vyriešená elementárne. Nájdenie aktívnych stratégií je možné vykonať graficky: 1) vytvorí sa grafická interpretácia; 2) určí sa spodná hranica zisku; 3) na spodnej hranici výplaty sa rozlišujú dve stratégie druhého hráča, ktoré zodpovedajú dvom čiaram, ktoré sa pretínajú v bode s maximálnou ordinátou (ak sa v ňom pretínajú viac ako dve čiary, berie sa ľubovoľný pár) - tieto stratégie sú aktívne stratégií hráča B. Hra 2 × n sa teda redukuje na hru 2 × 2. Dá sa vyriešiť aj hra m × 2 s tým rozdielom, že sa nekonštruuje horná hranica výplaty a nie maximálna, ale hľadá sa na ňom minimum. Príklad 5 Nájdite riešenie hry () 7 9 8 A= 10 6 9 Riešenie: geometrickou metódou vyberáme aktívne stratégie. Čiary B1 − B1′ , B2 − B2′ a B3 − B3′ zodpovedajú stratégiám B1 , B2 , B3 . Prerušovaná čiara B1 N B2 je spodná hranica výplaty hráča. Hra má riešenie S∗A = (23 , 31); S*B = (0,5; 0,5; 0); v = 8,16 .y .I .I I . 1'B B. 2 .B3′ .N .B3 .B1 .B2′ .I I .I . .X 2* P . A∗ S . 1∗ P 17 Indexová hra, 2 ťahy, 3 2 × 2, 10 osobných, 3 2 × 2, 9 náhodných, 3 geometria, 12 čistá hodnota hry, 7 príkladov, 10 2 × n, 9, 16 m × 2, 9 , 16 nekonečný, 4 normálna forma, 5 konečný, 4 viaccestný, 4 jednosmerný, 4 maticový, 5 dvojitý, 2 nulový súčet, 2 antagonistické, 2 neantagonistické, 2 riešenie, 5 zmiešaných stratégií, 5, 9 čisté stratégie . 5 teória hier, 2 18

KATEGÓRIE

POPULÁRNE ČLÁNKY

2023 "kingad.ru" - ultrazvukové vyšetrenie ľudských orgánov