Nerede: P 1 , P 2 - sırasıyla A 1 ve A 2 stratejilerinin uygulandığı olasılıklar (frekanslar)

Oyun teorisinden, eğer "A" oyuncusu kendi optimal stratejisini kullanırsa ve "B" oyuncusu aktif stratejileri çerçevesinde kalırsa, ortalama getiri değişmeden kalır ve oyunun maliyetine eşit olur. v"B" oyuncusunun aktif stratejilerini nasıl kullandığına bakılmaksızın. Ve bizim durumumuzda her iki strateji de aktif, aksi takdirde oyunun çözümü saf stratejilerde olacaktı. Bu nedenle, eğer "B" oyuncusunun saf strateji B 1'i kullanacağını varsayarsak, o zaman ortalama getiri v olacak:

k 11 p 1 + k 21 p 2 = v (1)

Nerede: k ij - ödeme matrisinin unsurları.

Öte yandan, eğer "B" oyuncusunun saf strateji B 2'yi kullanacağını varsayarsak, ortalama getiri şu şekilde olacaktır:

k 12 p 1 + k 22 p 2 = v (2)

Denklemlerin (1) ve (2) sol taraflarını eşitleyerek şunu elde ederiz:

k 11 p 1 + k 21 p 2 = k 12 p 1 + k 22 p 2

Ve şu gerçeği dikkate alarak P 1 + P 2 = 1 sahibiz:

k 11 p 1 + k 21 (1 - p 1) = k 12 p 1 + k 22 (1 - p 1)


A 1 stratejisinin optimal sıklığını bulmanın kolay olduğu durumlarda:

Matematiksel oyun teorisi. Hayattan oyunları kaydetme ve çözme örnekleri

Fark etme!Özel sorununuzun çözümü, aşağıda sunulan tüm tablolar, açıklayıcı metinler ve şekiller dahil olmak üzere bu örneğe benzer görünecektir, ancak başlangıç ​​verileriniz de dikkate alınarak...

Görev:
Matris oyunu aşağıdaki kazanç matrisiyle verilir:

Stratejiler "B"
Stratejiler "A" B1B2
1 3 5
bir 2 6
3
2

Matris oyununun çözümünü bulun:
- oyunun en yüksek fiyatını bulun;
- oyunun daha düşük fiyatı;
- oyunun net fiyatı;
- oyuncuların en uygun stratejilerini belirtin;
- gerekirse grafiksel bir çözüm (geometrik yorumlama) sağlayın.

Aşama 1

Oyunun alt fiyatını belirleyelim - α

En düşük oyun fiyatıα, tüm oyun boyunca tek bir strateji kullanırsak makul bir rakibe karşı bir oyunda kendimize garanti edebileceğimiz maksimum kazançtır (bu stratejiye "saf" denir).

Ödeme matrisinin her satırında bulalım minimumöğesini seçin ve bunu ek bir sütuna yazın (sarı renkle vurgulanmıştır, bkz. Tablo 1).

Sonra bulacağız maksimum Ek sütunun öğesi (yıldız işaretiyle işaretlenmiştir), bu oyunun daha düşük fiyatı olacaktır.

tablo 1

Stratejiler "B"
Stratejiler "A" B1B2 Satır Minimumu
1 3 5 3 *
bir 2 6
3
2
3
2

Bizim durumumuzda oyunun düşük fiyatı: a = 3 ve 3'ten daha kötü olmayan bir galibiyeti garanti etmek için A stratejisine sadık kalmalıyız 1

Adım 2

Oyunun üst fiyatını belirleyelim - β

En iyi oyun fiyatıβ, oyun boyunca tek ve tek bir strateji kullanması durumunda B oyuncusunun makul bir rakibe karşı oyunda kendine garanti edebileceği minimum kayıptır.

Ödeme matrisinin her sütununu bulalım maksimumöğesini seçin ve bunu aşağıya ek bir satıra yazın (sarı renkle vurgulanmıştır, bkz. Tablo 2).

Sonra bulacağız minimum Ek çizginin bir unsuru (artı ile işaretlenmiştir), bu oyunun üst fiyatı olacaktır.

Tablo 2

Stratejiler "B"
Stratejiler "A" B1B2 Satır Minimumu
1 3 5 3 *
bir 2 6
3
2

Bizim durumumuzda oyunun üst fiyatı: β = 5 ve 5'ten daha kötü olmayan bir kaybı garanti etmek için rakip ("B oyuncusu") B stratejisine bağlı kalmalıdır 2

Aşama 3
Oyunun alt ve üst fiyatlarını karşılaştıralım; bu problemde farklılar yani. α ≠ β, getiri matrisi bir eyer noktası içermez. Bu, oyunun saf minimax stratejilerinde bir çözümü olmadığı, ancak karma stratejilerde her zaman bir çözümü olduğu anlamına gelir.

Karma strateji Bunlar belirli olasılıklarla (frekanslarla) rastgele değişen saf stratejilerdir.

“A” oyuncusunun karma stratejisini göstereceğiz

S bir=

burada B 1, B 2, “B” oyuncusunun stratejileridir ve q 1, q 2 sırasıyla bu stratejilerin uygulanma olasılıklarıdır ve q 1 + q 2 = 1.

“A” oyuncusu için en uygun karma strateji, ona maksimum getiriyi sağlayan stratejidir. Buna göre “B” için minimum kayıp söz konusudur. Bu stratejiler belirlenmiş S A* ve S B* sırasıyla. Bir çift optimal strateji oyuna bir çözüm oluşturur.

Genel durumda, bir oyuncunun optimal stratejisi tüm başlangıç ​​stratejilerini içermeyebilir, sadece bazılarını içerebilir. Bu tür stratejilere denir aktif stratejiler.

Adım:4

P 1 =
k 22 - k 21
k 11 + k 22 - k 12 - k 21
(3)

Bu görevde:

P 1 =
3
2
- 6
3 +
3
2
- 5 - 6
=
9
13

Olasılık R 2 çıkarma yoluyla bulma R 1 birimden:
P 2 = 1 - P 1 = 1 -
9
13
= + 6 ·

Nerede: Q 1 , Q 2 - sırasıyla B 1 ve B 2 stratejilerinin uygulandığı olasılıklar (frekanslar)

Oyun teorisinden, eğer "B" oyuncusu kendi optimal stratejisini kullanırsa ve "A" oyuncusu aktif stratejileri çerçevesinde kalırsa, ortalama getiri değişmeden kalır ve oyunun maliyetine eşit olur. v A oyuncusunun aktif stratejilerini nasıl kullandığına bakılmaksızın. Bu nedenle, eğer “A” oyuncusunun A 1 saf stratejisini kullanacağını varsayarsak, o zaman ortalama getiri v olacak:

k 11 q 1 + k 12 q 2 = v (4)


Oyunun fiyatından bu yana v zaten biliyoruz ve bunu düşünüyoruz Q 1 + Q 2 = 1 ise B 1 stratejisinin optimal sıklığı şu şekilde bulunabilir:
Q 1 =
v - k 12
k 11 - k 12
(5)

Bu görevde:

Q 1 =
51
13
- 5
3 - 5
=
7
13

Olasılık Q 2 çıkarma yoluyla bulma Q 1 birimden:
Q 2 = 1 - Q 1 = 1 -
7
13
=
6
13

Cevap:

En düşük oyun fiyatı: α = 3
En iyi oyun fiyatı: β = 5
Oyunun fiyatı: v =
51
13
Oyuncu A'nın optimal stratejisi:
S bir*=
1bir 2
9
13
4
13

"B" oyuncusu için en uygun strateji:
S B*=
B1B2
7
13
6
13

Geometrik yorumlama (grafiksel çözüm):

Ele alınan oyuna geometrik bir yorum verelim. Birim uzunlukta apsis ekseninin bir bölümünü alın ve uçlarından dikey düz çizgiler çizin A 1 Ve A 2 A 1 ve A 2 stratejilerimize karşılık geliyor. Şimdi “B” oyuncusunun B 1 stratejisini saf haliyle kullanacağını varsayalım. O halde, eğer biz (oyuncu “A”) A 1 saf stratejisini kullanırsak, o zaman getirimiz 3 olacaktır. Eksen üzerinde karşılık gelen noktayı işaretleyelim. A 1 .
Eğer saf A 2 stratejisini kullanırsak, o zaman getirimiz 6 olacaktır. Eksen üzerinde karşılık gelen noktayı işaretleyelim. A 2
(bkz. Şekil 1). Açıkçası, A 1 ve A 2 stratejilerini farklı oranlarda karıştırarak uygularsak, kazancımız (0, 3) ve (1, 6) koordinatlı noktalardan geçen düz bir çizgi boyunca değişecektir, buna B stratejisi çizgisi diyelim 1 (Şekil .1'de kırmızıyla gösterilmiştir). Belirli bir çizgi üzerindeki herhangi bir noktanın apsisi olasılığa eşittir P 2 A 2 stratejisini uyguladığımız (frekans) ve ordinat - elde edilen kazanç k (bkz. Şekil 1).

Resim 1.
Kazanç grafiği k frekanstan sayfa 2 Düşman stratejiyi kullandığında B1.

Şimdi “B” oyuncusunun B 2 stratejisini saf haliyle kullanacağını varsayalım. O halde, eğer biz (oyuncu “A”) saf strateji A 1 kullanırsak, o zaman getirimiz 5 olacaktır. Eğer saf strateji A 2 kullanırsak, o zaman getirimiz 3/2 olacaktır (bkz. Şekil 2). Benzer şekilde A 1 ve A 2 stratejilerini farklı oranlarda karıştırırsak kazancımız (0, 5) ve (1, 3/2) koordinatlı noktalardan geçen düz bir çizgi boyunca değişecektir, buna strateji çizgisi diyelim B2. Önceki durumda olduğu gibi, bu çizgi üzerindeki herhangi bir noktanın apsisi, A 2 stratejisini uygulama olasılığımıza eşittir ve ordinat, sonuçta ortaya çıkan kazançtır, ancak yalnızca B 2 stratejisi için (bkz. Şekil 2).

Şekil 2.
v ve optimum frekans sayfa 2 oyuncu için "A".

Gerçek bir oyunda, makul bir "B" oyuncusu tüm stratejilerini kullandığında kazancımız, Şekil 2'de kırmızıyla gösterilen kesikli çizgi boyunca değişecektir. Bu çizgi sözde tanımlar kazanç alt limiti. Açıkçası, bu kesikli çizginin en yüksek noktası bizim optimal stratejimize karşılık geliyor. Bu durumda B 1 ve B 2 strateji çizgilerinin kesişme noktası burasıdır. Bir frekans seçerseniz lütfen unutmayın P 2 apsisine eşit olursa kazancımız değişmeden ve eşit kalacaktır v Ayrıca “B” oyuncusunun herhangi bir stratejisi için kendimize garanti edebileceğimiz maksimum miktar olacaktır. Sıklık (olasılık) P 2 bu durumda optimal karma stratejimizin karşılık gelen frekansıdır. Bu arada, Şekil 2'de frekansı görebilirsiniz. P 1 Optimal karma stratejimiz segmentin uzunluğudur [ P 2 ; 1] x ekseni üzerinde. (Çünkü P 1 + P 2 = 1 )

Tamamen benzer bir mantık kullanarak, Şekil 3'te gösterilen "B" oyuncusu için en uygun stratejinin frekanslarını bulabiliriz.

Figür 3.
Oyun fiyatının grafiksel tespiti v ve optimum frekans q 2 oyuncu için "İÇİNDE".

Sadece onun için sözde kaybın üst sınırı(kırmızı kesikli çizgi) ve üzerindeki en alçak noktayı arayın, çünkü "B" oyuncusu için amaç kayıpları en aza indirmektir. Aynı frekans değeri Q 1 , bu parçanın uzunluğudur [ Q 2 ; 1] x ekseni üzerinde.

Oyun Teorisi Yöneylem araştırmasının bir dalı olarak, belirsizlik veya farklı çıkarlara sahip birçok tarafın çatışması koşullarında en uygun kararları almaya yönelik matematiksel modeller teorisidir. Oyun teorisi oyun durumlarında optimal stratejileri inceler. Bunlar, bilimsel ve ekonomik deneyler sistemi için en avantajlı üretim çözümlerinin seçimi, istatistiksel kontrolün organizasyonu ve endüstriyel işletmeler ile diğer endüstriler arasındaki ekonomik ilişkilerle ilgili durumları içerir. Çatışma durumlarını matematiksel olarak formüle ederek ikili, üçlü vb. bir oyun olarak temsil edilebilirler. her biri kendi faydasını en üst düzeye çıkarma hedefinin peşinde koşan oyuncular, kazançlarını diğerinin pahasına.

"Oyun Teorisi" bölümü üç simgeyle temsil edilir çevrimiçi hesap makineleri:

  1. Oyuncuların optimal stratejileri. Bu tür problemlerde bir ödeme matrisi belirtilir. Oyuncuların saf veya karma stratejilerini bulmak gerekir ve, oyun fiyatı. Çözmek için matrisin boyutunu ve çözüm yöntemini belirtmeniz gerekir. Hizmet, iki oyunculu bir oyunu çözmek için aşağıdaki yöntemleri uygular:
    1. Minimaks. Oyuncuların saf stratejisini bulmanız veya bir oyunun eyer noktasıyla ilgili bir soruyu yanıtlamanız gerekiyorsa bu çözüm yöntemini seçin.
    2. Simpleks yöntemi. Doğrusal programlama yöntemlerini kullanarak karma strateji oyunlarını çözmek için kullanılır.
    3. Grafik yöntemi. Karma strateji oyunlarını çözmek için kullanılır. Eyer noktası varsa çözüm durur. Örnek: Bir getiri matrisi verildiğinde, oyunun grafiksel çözüm yöntemini kullanarak oyuncuların en uygun karma stratejilerini ve oyunun fiyatını bulun.
    4. Brown-Robinson yinelemeli yöntemi. Yinelemeli yöntem, grafik yöntemin uygulanamadığı ve cebirsel ve matris yöntemlerinin pratik olarak uygulanamadığı durumlarda kullanılır. Bu yöntem oyunun fiyatının yaklaşık değerini verir ve gerçek değer istenilen doğruluk derecesiyle elde edilebilir. Bu yöntem en uygun stratejileri bulmak için yeterli değildir ancak sıra tabanlı bir oyunun dinamiklerini takip etmenize ve her adımda her oyuncu için oyunun maliyetini belirlemenize olanak tanır.
    Örneğin, görev kulağa “ödül matrisi tarafından verilen oyun için oyuncuların en uygun stratejilerini belirtmek” gibi gelebilir..
    Tüm yöntemler baskın satır ve sütunlar için bir kontrol kullanır.
  2. Bimatris oyunu. Genellikle böyle bir oyunda birinci ve ikinci oyuncuların getirileri aynı büyüklükte iki matris belirlenir. Bu matrislerin satırları birinci oyuncunun stratejilerine, sütunları ise ikinci oyuncunun stratejilerine karşılık gelir. Bu durumda ilk matris birinci oyuncunun kazancını, ikinci matris ise ikinci oyuncunun kazancını temsil eder.
  3. Doğa ile oyunlar. Maximax, Bayes, Laplace, Wald, Savage, Hurwitz kriterlerine göre bir yönetim kararı seçilmesi gerektiğinde kullanılır.
    Bayes kriteri için olayların gerçekleşme olasılıklarının da girilmesi gerekecektir. Belirtilmemişse varsayılan değerleri bırakın (eşdeğer olaylar olacaktır).
    Hurwitz kriteri için iyimserlik düzeyini λ belirtin. Koşullarda bu parametre belirtilmemişse 0, 0,5 ve 1 değerlerini kullanabilirsiniz.

Pek çok sorun bilgisayar kullanarak çözüm bulmayı gerektirir. Yukarıdaki hizmetler ve işlevler araçlardan biridir.

Oyun Teorisi - Çatışma durumlarını (çıkar çatışmaları) çözmek için bir dizi matematiksel yöntem. Oyun teorisinde oyuna oyun denir. Bir çatışma durumunun matematiksel modeli. Oyun teorisinde özellikle ilgi duyulan konu, belirsizlik koşulları altında oyun katılımcılarının karar verme stratejilerinin incelenmesidir. Belirsizlik, iki veya daha fazla tarafın karşıt hedefleri takip etmesinden kaynaklanır ve her bir tarafın herhangi bir eyleminin sonuçları, ortağın hamlelerine bağlıdır. Aynı zamanda her bir taraf, belirlenen hedefleri en üst düzeyde gerçekleştirecek en uygun kararları almaya çalışır.

Oyun teorisi, tedarikçi ile tüketici, alıcı ile satıcı, banka ile müşteri arasındaki ilişkiler gibi çatışma durumlarının ortaya çıktığı ekonomi alanında en tutarlı şekilde uygulanır. Oyun teorisinin uygulamalarına siyasette, sosyolojide, biyolojide ve askeri sanatta da rastlamak mümkündür.

Oyun teorisinin tarihinden

Oyun teorisinin tarihi Bağımsız bir disiplin olarak 1944'te John von Neumann ve Oscar Morgenstern'in "Oyunlar ve Ekonomik Davranış Teorisi" kitabını yayınlamasıyla başladı. Her ne kadar oyun teorisinin örneklerine daha önce de rastlanmış olsa da: Babil Talmud'unun ölen bir kocanın mallarının eşleri arasında paylaştırılmasına ilişkin incelemesi, 18. yüzyılda kart oyunları, 20. yüzyılın başlarında satranç teorisinin gelişimi. yüzyılda, aynı John von Neumann'ın 1928 yılındaki minimax teoreminin kanıtı, onsuz oyun teorisi olmazdı.

20. yüzyılın 50'li yıllarında Melvin Drescher ve Meryl Flood Rand Şirketi Mahkum ikilemini deneysel olarak uygulayan ilk kişi olan John Nash, iki kişilik oyunlarda denge durumu üzerine yaptığı çalışmalarda Nash dengesi kavramını geliştirdi.

Reinhard Salten, 1965 yılında "Oligopolün Talep Üzerine Oyun Teorisinde Tedavisi" ("Spieltheoretische Behandlung eines Oligomodells mit Nachfrageträgheit") kitabını yayınladı ve bununla oyun teorisinin ekonomide uygulanması yeni bir itici güç kazandı. Oyun teorisinin evriminde ileriye doğru bir adım, John Maynard Smith'in "Evrimsel Kararlı Strateji" (1974) adlı çalışmasıyla ilişkilidir. Mahkumun ikilemi, Robert Axelrod'un 1984 tarihli İşbirliğinin Evrimi adlı kitabında popüler hale getirildi. 1994 yılında John Nash, John Harsanyi ve Reinhard Selten oyun teorisine katkılarından dolayı Nobel Ödülü'ne layık görüldü.

Yaşamda ve iş dünyasında oyun teorisi

Yaşam ve iş hayatındaki çeşitli durumların daha fazla modellenmesi için oyun teorisinde anlaşıldığı anlamda bir çatışma durumunun (çıkar çatışması) özü üzerinde daha ayrıntılı olarak duralım. Bir bireyin çeşitli olası sonuçlardan birine yol açan bir konumda olduğunu varsayalım ve bireyin bu sonuçlara ilişkin bazı kişisel tercihleri ​​​​var olsun. Ancak sonucu belirleyen değişkenleri bir dereceye kadar kontrol edebilse de bunlar üzerinde tam bir güce sahip değildir. Bazen kontrol, kendisi gibi olası sonuçlarla ilgili bazı tercihleri ​​olan birkaç kişinin elindedir, ancak genel olarak bu bireylerin çıkarları tutarlı değildir. Diğer durumlarda, nihai sonuç hem şansa (hukuk biliminde bazen doğal afetler olarak adlandırılır) hem de diğer bireylere bağlı olabilir. Oyun teorisi, bu tür durumların gözlemlerini ve bu tür durumlarda akıllı eylemlere rehberlik edecek genel ilkelerin formüle edilmesini sistemleştirir.

Bazı açılardan "oyun teorisi" adı talihsizliktir, çünkü oyun teorisinin yalnızca salon oyunlarında meydana gelen sosyal açıdan önemsiz karşılaşmalarla ilgilendiğini öne sürer, ancak yine de teorinin çok daha geniş bir anlamı vardır.

Aşağıdaki ekonomik durum oyun teorisinin uygulanması konusunda fikir verebilir. Her biri maksimum kar elde etmeye çalışan ancak bu karı belirleyen değişkenler üzerinde yalnızca sınırlı güce sahip olan birkaç girişimcinin olduğunu varsayalım. Bir girişimcinin, diğer bir girişimcinin kontrol ettiği ancak ilkinin gelirini büyük ölçüde etkileyebilecek değişkenler üzerinde hiçbir gücü yoktur. Bu durumu bir oyun gibi ele almak şu itirazı doğurabilir. Oyun modelinde her girişimcinin olası seçenekler arasından bir seçim yaptığı ve bu tek seçimlerin karı belirlediği varsayılmaktadır. Açıkçası, bu gerçekte neredeyse imkansızdır çünkü bu durumda endüstride karmaşık yönetim aygıtlarına ihtiyaç duyulmayacaktır. Ekonomik sistemdeki diğer katılımcıların (oyuncuların) yaptığı seçimlere bağlı olan bir takım kararlar ve bu kararlarda yapılan değişiklikler vardır. Ancak prensip olarak, bazı yöneticilerin her sorunu ortaya çıktıkça çözmek yerine, tüm olası olasılıkları önceden tahmin ettiği ve her durumda gerçekleştirilecek eylemi detaylandırdığı hayal edilebilir.

Tanımı gereği askeri çatışma, bir dizi savaşla kararlaştırılan, sonucu belirleyen değişkenler üzerinde her iki tarafın da tam kontrole sahip olmadığı bir çıkar çatışmasıdır. Sonucu basitçe galibiyet veya mağlubiyet olarak değerlendirebilir ve bunlara 1 ve 0 sayısal değerlerini atayabilirsiniz.

Oyun teorisinde yazılabilecek ve çözülebilecek en basit çatışma durumlarından biri, sırasıyla 1 ve 2 numaralı iki oyuncu arasındaki çatışma olan düellodur. P Ve Qçekimler. Her oyuncu için oyuncunun şutunun gerçekleşme olasılığını belirten bir fonksiyon vardır. Ben zamanın bir noktasında Töldürücü olacak bir vuruş yapacaktır.

Sonuç olarak oyun teorisi belirli bir çıkar çatışması sınıfının aşağıdaki formülasyonuna varır: N Oyuncular, her birinin yüzlerce özel setten birini seçmesi gerekiyor ve bir seçim yaparken oyuncunun diğer oyuncuların seçimleri hakkında hiçbir bilgisi yok. Oyuncunun olası seçim alanı, "maça ası oynamak", "araba yerine tank üretmek" gibi unsurları veya daha genel olarak, olası tüm durumlarda gerçekleştirilecek tüm eylemleri tanımlayan bir stratejiyi içerebilir. Her oyuncu bir görevle karşı karşıyadır: Sonuç üzerindeki özel etkisinin kendisine mümkün olan en büyük kazancı getirmesi için hangi seçimi yapmalıdır?

Oyun teorisinde matematiksel model ve problemlerin formalleştirilmesi

Daha önce de belirttiğimiz gibi, oyun bir çatışma durumunun matematiksel bir modelidir ve aşağıdaki bileşenleri gerektirir:

  1. İlgili taraflar;
  2. her iki tarafta olası eylemler;
  3. tarafların çıkarları.

Oyunla ilgilenen taraflara oyuncu denir , her biri en az iki eylem gerçekleştirebilir (eğer oyuncunun elinde yalnızca bir eylem varsa, o zaman ne yapacağı önceden bilindiği için aslında oyuna katılmaz). Oyunun sonucuna kazanma denir .

Gerçek bir çatışma durumu her zaman olmayabilir, ancak oyun (oyun teorisi kavramında) her zaman şuna göre ilerler: belirli kurallar kesin olarak şunları belirler:

  1. oyuncuların eylemlerine yönelik seçenekler;
  2. her oyuncunun partnerinin davranışları hakkında sahip olduğu bilgi miktarı;
  3. her bir eylem dizisinin yol açtığı kazanç.

Resmileştirilmiş oyunlara örnek olarak futbol, ​​kart oyunları ve satranç verilebilir.

Ancak ekonomide, bir oyuncu davranışı modeli ortaya çıkar; örneğin, birkaç firma piyasada daha avantajlı bir yer almaya çalıştığında, birkaç kişi, herkesin mümkün olduğu kadar fazlasını alması için bazı malları (kaynaklar, finans) kendi aralarında bölmeye çalışır. . Bir oyun olarak modellenebilecek ekonomide çatışma durumlarının oyuncuları firmalar, bankalar, bireyler ve diğer ekonomik aktörlerdir. Buna karşılık, savaş koşullarında oyun modeli, örneğin düşmanı yenmek veya saldırıya karşı korunmak için (mevcut veya potansiyel) en iyi silahın seçiminde kullanılır.

Oyun, sonucun belirsizliği ile karakterize edilir . Belirsizliğin nedenleri aşağıdaki gruplara ayrılabilir:

  1. kombinatoryal (satrançta olduğu gibi);
  2. rastgele faktörlerin etkisi ("tura veya yazı" oyununda, zarlarda, kart oyunlarında olduğu gibi);
  3. stratejik (oyuncu düşmanın hangi eylemi gerçekleştireceğini bilmiyor).

Oyuncu stratejisi mevcut duruma bağlı olarak her hareketteki eylemlerini belirleyen bir kurallar dizisidir.

Oyun teorisinin amacı her oyuncu için en uygun stratejiyi belirlemektir. Böyle bir strateji belirlemek oyunu çözmek anlamına gelir. Stratejinin optimalliği oyunculardan birinin maksimum kazancı elde etmesi, diğerinin ise stratejisine sadık kalmasıyla elde edilir. Ve eğer birinci oyuncu stratejisine sadık kalırsa, ikinci oyuncunun kaybı minimum düzeyde olacaktır.

Oyunların sınıflandırılması

  1. Oyuncu sayısına göre sınıflandırma (iki veya daha fazla kişinin oyunu). İki kişilik oyunlar tüm oyun teorilerinde merkezi bir yere sahiptir. İki kişilik oyunlara yönelik oyun teorisinin temel konsepti, iki kişilik oyunlarda doğal olarak ortaya çıkan çok önemli denge fikrinin genelleştirilmesidir. Oyunlara gelince N bireyler arasında oyun teorisinin bir kısmı, oyuncular arasındaki işbirliğinin yasak olduğu oyunlara ayrılmıştır. Oyun teorisinin başka bir bölümünde N bireyler, oyuncuların karşılıklı yarar için işbirliği yapabileceklerini varsayarlar (bu paragrafın ilerleyen kısımlarında işbirlikçi olmayan ve işbirlikçi oyunlara bakınız).
  2. Oyuncu sayısına ve stratejilerine göre sınıflandırma (Strateji sayısı en az iki, sonsuz olabilir).
  3. Bilgi miktarına göre sınıflandırma geçmiş hamlelere göre: tam bilgi ve eksik bilgi içeren oyunlar. 1. oyuncu - alıcı ve 2. oyuncu - satıcı olsun. Eğer 1. oyuncu, 2. oyuncunun eylemleri hakkında tam bilgiye sahip değilse, o zaman 1. oyuncu, aralarında seçim yapması gereken iki alternatif arasında ayrım yapamayabilir. Örneğin bir ürünün iki türü arasında seçim yapmak ve ürünün bazı özelliklerine göre hangisi olduğunu bilmemek A daha kötü ürün B 1. oyuncu alternatifler arasındaki farkı göremeyebilir.
  4. Kazançların bölüşüm esaslarına göre sınıflandırma : Bir yanda kooperatif, koalisyon ve diğer yanda kooperatif olmayan, koalisyonsuz. İÇİNDE işbirlikçi olmayan oyun , ya da - işbirlikçi olmayan oyun oyuncular, ikinci oyuncunun hangi stratejiyi seçeceğini bilmeden stratejileri aynı anda seçerler. Oyuncular arasında iletişim imkansızdır. İÇİNDE işbirlikçi oyun , ya da - koalisyon oyunu Oyuncular kazançlarını artırmak için koalisyonlar kurabilir ve toplu eylemlerde bulunabilirler.
  5. Sonlu iki kişilik sıfır toplamlı oyun veya düşmanca oyun, karşıt çıkarlara sahip tarafların dahil olduğu, tam bilgi içeren stratejik bir oyundur. Düşmanca oyunlar matris oyunları.

Oyun teorisinin klasik bir örneği mahkumun ikilemidir.

İki şüpheli gözaltına alınarak birbirlerinden ayrılır. Bölge savcısı onların ciddi bir suç işlediklerine inanıyor ancak duruşmada onları suçlayacak yeterli kanıta sahip değil. Her mahkuma iki seçeneği olduğunu söylüyor: polisin işlediğine inandığı suçu itiraf etmek ya da itiraf etmemek. Her ikisi de itiraf etmezse savcı onları küçük hırsızlık veya yasa dışı silah bulundurmak gibi küçük suçlarla suçlayacak ve her ikisi de küçük bir ceza alacak. İkisi de itiraf ederse dava açılacak ama en ağır cezayı talep etmeyecek. Biri itiraf eder ve diğeri etmezse, itiraf edenin cezası suç ortağını iade etmek nedeniyle hafifletilecek, ısrar eden ise "sonuna kadar" ceza alacaktır.

Eğer bu stratejik görev sonuç açısından formüle edilirse, o zaman aşağıdakilere indirgenir:

Böylece her iki mahkum da itirafta bulunmazsa her biri 1'er yıl hapis cezasına çarptırılacak. Her ikisi de itiraf ederse her biri 8 yıl hapis cezası alacak. Ve eğer biri itiraf ederse diğeri itiraf etmezse, itiraf eden üç ay hapis cezasına çarptırılacak, itiraf etmeyen ise 10 yıl hapis cezasına çarptırılacak. Yukarıdaki matris mahkumun ikilemini doğru bir şekilde yansıtıyor: Herkes itiraf edip etmeme sorusuyla karşı karşıya. Bölge savcısının mahkumlara sunduğu oyun işbirlikçi olmayan oyun ya da - işbirlikçi olmayan oyun . Her iki mahkumun da işbirliği yapma fırsatı olsaydı (örn. oyun co-op olacak ya da başka koalisyon oyunu ), o zaman ikisi de itiraf etmeyecek ve her biri bir yıl hapis cezasına çarptırılacaktı.

Oyun teorisinin matematiksel araçlarını kullanma örnekleri

Şimdi oyun teorisinde araştırma ve çözüm yöntemlerinin bulunduğu yaygın oyun sınıflarının örneklerine yönelik çözümleri değerlendirmeye geçiyoruz.

İki kişilik işbirlikçi olmayan (işbirlikçi olmayan) bir oyunun resmileştirilmesine bir örnek

Önceki paragrafta, işbirlikçi olmayan (işbirlikçi olmayan) bir oyun örneğine (mahkum ikilemi) zaten bakmıştık. Becerilerimizi güçlendirelim. Arthur Conan Doyle'un "Sherlock Holmes'un Maceraları" ndan esinlenen klasik olay örgüsü de buna uygundur. Elbette itiraz edilebilir: Örnek hayattan değil, edebiyattan alınmıştır, ancak Conan Doyle kendisini bir bilim kurgu yazarı olarak kanıtlamamıştır! Klasik olmasının nedeni de görevin, daha önce de belirttiğimiz gibi, oyun teorisinin kurucularından biri olan Oskar Morgenstern tarafından tamamlanmış olmasıdır.

Örnek 1.“Sherlock Holmes'un Maceraları”ndan bir kesitin kısaltılmış özeti verilecektir. Oyun teorisinin iyi bilinen kavramlarına göre, bir çatışma durumu modeli oluşturun ve oyunu resmi olarak yazın.

Sherlock Holmes, kendisini takip eden Profesör Moriarty'den kaçmak için kıtaya (Avrupa) ulaşmak amacıyla Londra'dan Dover'a seyahat etmeyi planlıyor. Trene bindikten sonra istasyon platformunda Profesör Moriarty'yi gördü. Sherlock Holmes, Moriarty'nin özel bir tren seçip onu geçebileceğini itiraf ediyor. Sherlock Holmes'un iki alternatifi var: Dover'a doğru yolculuğa devam etmek ya da güzergahındaki tek ara istasyon olan Canterbury istasyonunda inmek. Rakibinin Holmes'un yeteneklerini belirleyecek kadar akıllı olduğunu kabul ediyoruz, dolayısıyla onun da aynı iki alternatifi var. Her iki rakip de, her birinin ne karar vereceğini bilmeden trenden inmek için bir istasyon seçmelidir. Eğer bir karar sonucunda ikisi de aynı istasyona düşerse, o zaman Sherlock Holmes'un Profesör Moriarty tarafından öldürüleceğini kesinlikle varsayabiliriz. Sherlock Holmes, Dover'a güvenli bir şekilde ulaşırsa kurtarılacak.

Çözüm. Conan Doyle'un kahramanlarını oyunun katılımcıları yani oyuncuları olarak düşünebiliriz. Her oyuncunun kullanımına açıktır Ben (Ben=1,2) iki saf strateji:

  • Dover'da inmek (strateji Si1 ( Ben=1,2) );
  • bir ara istasyonda inmek (strateji Si2 ( Ben=1,2) )

İki oyuncunun her birinin iki stratejiden hangisini seçtiğine bağlı olarak, ikili olarak özel bir strateji kombinasyonu oluşturulacaktır. S = (S1 , S 2 ) .

Her kombinasyon bir olayla ilişkilendirilebilir - Sherlock Holmes'un Profesör Moriarty tarafından öldürülmesine teşebbüsün sonucu. Bu oyunun olası olaylarla bir matrisini oluşturuyoruz.

Her olayın altında Profesör Moriarty'nin kazanıldığını gösteren ve Holmes'un kurtuluşuna bağlı olarak hesaplanan bir endeks bulunmaktadır. Her iki kahraman da düşmanın neyi seçeceğini bilmeden aynı anda bir strateji seçiyor. Dolayısıyla oyun işbirlikçi değildir çünkü ilk olarak oyuncular farklı trenlerdedir ve ikinci olarak da karşıt çıkarlara sahiptirler.

İşbirlikçi (koalisyon) bir oyunun resmileştirilmesi ve çözümüne bir örnek N kişiler

Bu noktada pratik kısmın yani örnek problem çözme sürecinin öncesinde, işbirlikçi (işbirlikçi olmayan) oyunların çözümü için oyun teorisi kavramlarına aşina olacağımız teorik kısım gelecektir. Bu görev için oyun teorisi şunu önerir:

  • karakteristik işlev (basitçe söylemek gerekirse, oyuncuları bir koalisyonda birleştirmenin faydasının büyüklüğünü yansıtır);
  • toplanabilirlik kavramı (bir nesnenin tamamına karşılık gelen bir miktarın değerinin, nesnenin belirli bir bölüm sınıfındaki parçalarına karşılık gelen miktarların değerlerinin toplamına eşit olması gerçeğinden oluşan miktarların özelliği) karakteristik fonksiyonun parçalara ayrılması) ve süper toplamsallık (nesnenin tamamına karşılık gelen bir miktarın değeri, parçalarına karşılık gelen miktarların değerlerinin toplamından daha büyüktür).

Karakteristik fonksiyonun süper toplanabilirliği, bir koalisyona katılmanın oyuncular için faydalı olduğunu göstermektedir, çünkü bu durumda koalisyonun getirisinin değeri oyuncu sayısıyla birlikte artar.

Oyunu resmileştirmek için yukarıdaki kavramların resmi gösterimlerini tanıtmamız gerekiyor.

Oyun için N tüm oyuncularının kümesini şu şekilde gösterelim: N= (1,2,...,n) Kümenin boş olmayan herhangi bir alt kümesi N olarak belirtelim T(kendisi dahil) N ve tek bir öğeden oluşan tüm alt kümeler). Sitede ders var" Kümeler ve kümelerdeki işlemler", bağlantıya tıkladığınızda yeni bir pencerede açılır.

Karakteristik fonksiyon şu şekilde gösterilir: v ve tanım alanı kümenin olası alt kümelerinden oluşur N. v(T) - belirli bir alt küme için karakteristik fonksiyonun değeri; örneğin, muhtemelen bir oyuncudan oluşan bir koalisyon tarafından elde edilen gelir. Bu önemlidir çünkü oyun teorisi, tüm ayrık koalisyonların karakteristik fonksiyonunun değerleri için süpertoplamsallığın varlığının kontrol edilmesini gerektirir.

Boş olmayan iki alt küme koalisyonu için T1 Ve T2 İşbirlikçi (koalisyon) bir oyunun karakteristik fonksiyonunun toplanabilirliği şu şekilde yazılır:

Ve süpertoplamsallık şu şekildedir:

Örnek 2.Üç müzik okulu öğrencisi yarı zamanlı olarak farklı kulüplerde çalışıyor, gelirlerini kulüp ziyaretçilerinden alıyorlar. İşbirliğine dayalı oyunları çözmek için oyun teorisi kavramlarını kullanarak güçlerini birleştirmenin onlar için karlı olup olmadığını belirleyin (eğer öyleyse, hangi koşullar altında) N aşağıdaki başlangıç ​​verilerine sahip kişiler.

Ortalama olarak, akşam başına gelirleri şöyleydi:

  • kemancının 600 ünitesi var;
  • gitaristin 700 ünitesi var;
  • şarkıcının 900 birimi var.

Geliri artırmak amacıyla öğrenciler birkaç ay boyunca çeşitli gruplar oluşturdular. Sonuçlar, ekip oluşturarak akşam gelirlerini şu şekilde artırabileceklerini gösterdi:

  • kemancı + gitarist 1500 birim kazandı;
  • kemancı + şarkıcı 1800 birim kazandı;
  • gitarist + şarkıcı 1900 birim kazandı;
  • kemancı + gitarist + şarkıcı 3000 birim kazandı.

Çözüm. Bu örnekte oyundaki oyuncu sayısı N= 3, dolayısıyla oyunun karakteristik fonksiyonunun tanım alanı, tüm oyuncular kümesinin 2³ = 8 olası alt kümesinden oluşur. Olası tüm koalisyonları listeleyelim T:

  • Her biri bir oyuncudan (müzisyen) oluşan, tek unsurun koalisyonları: T{1} , T{2} , T{3} ;
  • iki unsurun koalisyonu: T{1,2} , T{1,3} , T{2,3} ;
  • üç unsurun koalisyonu: T{1,2,3} .

Her oyuncuya bir seri numarası atayacağız:

  • kemancı - 1. oyuncu;
  • gitarist - 2. oyuncu;
  • şarkıcı - 3. oyuncu.

Sorun verilerine dayanarak oyunun karakteristik işlevini belirliyoruz v:

v(T(1)) = 600; v(T(2)) = 700; v(T(3)) = 900; karakteristik fonksiyonun bu değerleri, bir koalisyonda birleşmediklerinde sırasıyla birinci, ikinci ve üçüncü oyuncuların getirilerine göre belirlenir;

v(T(1,2)) = 1500; v(T(1,3)) = 1800; v(T(2,3)) = 1900; karakteristik fonksiyonun bu değerleri, bir koalisyonda birleşen her oyuncu çiftinin gelirine göre belirlenir;

v(T(1,2,3)) = 3000; Karakteristik fonksiyonun bu değeri, oyuncuların üçlü olarak birleştiği durumdaki ortalama gelire göre belirlenir.

Böylece, tüm olası oyuncu koalisyonlarını listeledik; oyunun karakteristik fonksiyonunun tanım alanı tüm oyuncular kümesinin tam olarak sekiz olası alt kümesinden oluştuğu için olması gerektiği gibi bunlardan sekiz tane var. Oyun teorisinin gerektirdiği budur, çünkü tüm ayrık koalisyonların karakteristik fonksiyonunun değerleri için süpertoplamsallığın varlığını kontrol etmemiz gerekir.

Bu örnekte süpertoplamsallık koşulları nasıl sağlanmaktadır? Oyuncuların nasıl ayrık koalisyonlar oluşturduğunu belirleyelim T1 Ve T2 . Bazı oyuncuların bir koalisyonun parçası olması durumunda T1 , o zaman diğer tüm oyuncular koalisyonun parçası olur T2 ve tanım gereği bu koalisyon, tüm oyuncu grubu ile grup arasındaki farktan oluşur. T1 . O zaman eğer T1 - bir oyuncunun koalisyonu, ardından koalisyon T2 Koalisyon halinde ikinci ve üçüncü oyuncular olacak T1 birinci ve üçüncü oyuncular olacak, ardından koalisyon T2 yalnızca ikinci oyuncudan oluşacaktır vb.

İçindekiler 1 Genel bilgiler 2 1.1 Oyunlar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Hareketler. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 Stratejiler. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4 Matris oyunu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 İz noktası. Saf stratejiler 7 2.1 Örnekler. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Örnek 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Örnek 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3 Karma stratejiler 9 3.1 Oyun 2×2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.1.1 Örnekler. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Örnek 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Örnek 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1.2 Geometrik yorumlama. . . . . . . . . . . . . . . . . . . . 12 3.2 Oyunlar 2×n ve m×2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Örnek 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1 1. Oyun teorisinden genel bilgiler 1.1. Oyunlar Oyun teorisi, çatışma durumlarının matematiksel bir teorisidir; Farklı hedefler peşinde koşan iki veya daha fazla tarafın çıkarlarının çatıştığı durumlar. Oyun, belirli kurallarla düzenlenen ve şunları belirtmesi gereken bir çatışma durumudur: katılımcıların eylemleri için olası seçenekler; belirli bir dizi hamlenin yol açtığı oyunun veya ödemenin (kazanma, kaybetme) niceliksel sonucu; bilgi miktarı Her iki tarafın da diğerinin davranışı hakkında. Çiftler oyunu, yalnızca iki tarafın (iki oyuncunun) katıldığı bir oyundur. Sıfır toplamlı eşleştirilmiş oyun, ödemelerin toplamının sıfır olduğu eşleştirilmiş bir oyundur; Bir oyuncunun kaybı ikincinin kazancına eşittir. Her oyuncunun kazanç fonksiyonunun değerine karşı tutumuna bağlı olarak, eşleştirilmiş oyunlar alt bölümlere ayrılır: Sıfır toplamlı eşleştirilmiş oyun (antagonistik) - ödeme miktarının sıfıra eşit olduğu eşleştirilmiş bir oyun, yani. Bir oyuncunun kaybı ikincinin kazancına eşittir. Düşmanca olmayan bir oyun, oyuncuların farklı ancak doğrudan zıt olmayan hedefleri takip ettiği eşleştirilmiş bir oyundur. 2 1.2. Hamleler Hamle - oyunun kuralları tarafından sağlanan eylemlerden birinin seçimi; bu seçimin uygulanması Hamleler iki türdür: Kişisel hamle - + oyun kuralları tarafından sağlanan eylemlerden birinin bilinçli seçimi + uygulama bu seçimin Rastgele hamlesi - Rastgele hamle, bir dizi olasılık arasından yapılan bir seçimdir ve oyuncunun kararıyla değil, bir tür rastgele seçim mekanizmasıyla gerçekleştirilir. Aşağıda yalnızca kişisel hamleler içeren sıfır toplamlı eşli oyunları ele alacağız. Her iki taraf da diğerinin davranışı hakkında bilgiden yoksundur. 3 1.3. Stratejiler Bir oyuncunun stratejisi, oyun sırasında ortaya çıkan duruma bağlı olarak, bu oyuncunun her kişisel hareketi için eylem seçimini belirleyen bir kurallar dizisidir. Olası stratejilerin sayısına bağlı olarak oyunlar sonlu ve sonsuz olarak ikiye ayrılır. Sonsuz oyun, oyunculardan en az birinin sonsuz sayıda stratejiye sahip olduğu bir oyundur. Sonlu oyun, her oyuncunun yalnızca sınırlı sayıda stratejiye sahip olduğu bir oyundur. Herhangi bir oyuncunun ardışık hamle sayısı, oyunların tek hamleli, çok hamleli veya konumsal olarak bölünmesini belirler. + Tek turluk bir oyunda her oyuncu olası seçenekler arasından yalnızca bir seçim yapar ve ardından oyunun sonucunu belirler. + Her biri oyunculardan birinin hareketinden ve durumdaki buna karşılık gelen bir değişiklikten sonra ortaya çıkan bir dizi ardışık aşamayı temsil eden çok hamleli veya konumsal bir oyun zaman içinde gelişir. Tek turlu oyunda her oyuncu olası seçenekler arasından yalnızca bir seçim yapar ve ardından oyunun sonucunu belirler. Bir oyuncunun optimal stratejisi, oyun birçok kez tekrarlandığında bu oyuncuya mümkün olan maksimum ortalama kazancı (veya aynı şekilde, mümkün olan minimum ortalama kaybı) sağlayan bir stratejidir. Oyun teorisinde tüm öneriler oyuncuların makul davranışları varsayımına dayanarak yapılır. Her çatışma durumunda kaçınılmaz olan oyuncuların yanlış hesaplamaları ve hataları ile heyecan ve risk unsurları oyun teorisinde dikkate alınmaz. 4 1.4. Matris oyunu Bir matris oyunu, tek hamleli, sonlu sıfır toplamlı bir oyundur. Bir matris oyunu, rakiplerin taban tabana zıt hedeflere ulaşmak için sonlu bir seçimden (hamleden) bir seçim (hareket) yaptığı bir çatışma durumunun oyun teorik modelidir. olası eylem planı sayısı Seçilen eylem yöntemlerine (stratejilere) uygun olarak, elde edilen sonuç belirlenir. Bir örneğe bakalım. İki oyuncu A ve B olsun, bunlardan biri A1, A2, ...Am olası stratejilerinden m'den i'inci stratejiyi seçebilsin ve ikincisi B1, B2 olası stratejileri arasından j'inci stratejiyi seçsin. , .. .Bm. Sonuç olarak birinci oyuncu aij değerini kazanır, ikinci oyuncu ise bu değeri kaybeder. aij sayılarından bir matris oluşturuyoruz   a11 a11 · · · a1n  a21 a22 · · · a2n    A = (aij) =  .. .. ..   . . . .  am1 am2 · · · amn A = (aij), i = 1, m, j = 1, n matrisine getiri matrisi veya m × n oyun matrisi denir. Bu matristeki satırlar her zaman kazanan (maksimize eden) oyuncu A'nın, yani kazancını maksimize etmeye çalışan oyuncunun stratejileri içindir. Sütunlar, kaybeden B oyuncusunun yani verimlilik kriterini en aza indirmeye çalışan oyuncunun stratejilerine ayrılmıştır. Bir oyunun normalleştirilmesi, konumsal bir oyunu matris oyununa indirgeme sürecidir. Normal formdaki bir oyun, matris oyununa indirgenmiş konumsal bir oyundur. Konumsal çok hamleli oyunun, bir oyunun teorik oyun modeli olduğunu hatırlayalım. Bu durumun gelişiminin her aşamasında, rakiplerin sınırlı sayıda olası eylem planı arasından sırayla bir seçim (hareket) yaptığı çatışma durumu. Oyunun çözümü her iki oyuncunun da optimal stratejilerini bulmak ve oyunun fiyatını belirlemektir.Oyunun fiyatı oyuncuların beklenen kazancı (kayıpıdır). Oyunun çözümü ya saf stratejilerde (oyuncunun tek bir strateji izlemesi gerektiğinde) ya da oyuncunun belirli olasılıklarla iki veya daha fazla saf strateji kullanması gerektiğinde karma stratejilerde bulunabilir. Bu durumda ikincisine aktif denir. 5 Bir oyuncunun karma stratejisi, her bir bileşeni karşılık gelen saf stratejinin oyuncu tarafından kullanılma sıklığını gösteren bir vektördür. Oyunun maksimum veya daha düşük fiyatı - sayı α = maksimum minimum aij i j Maksimum strateji (çizgi) - oyuncunun minimum kazancını maksimuma çıkarmak için seçtiği strateji. Açıkçası, en ihtiyatlı maksimin stratejisini seçerken, A oyuncusu kendisine (rakibin davranışından bağımsız olarak) en az α tutarında garantili bir getiri sağlar. Oyunun maksimum veya üst fiyatı - sayı β = minimum maksimum aij j i Minimax stratejisi (sütun) - oyuncunun maksimum kaybını en aza indirmek için seçtiği strateji. Açıkçası, en dikkatli minimaks stratejisini seçerken, B oyuncusu hiçbir koşulda A oyuncusunun β'dan daha fazla kazanmasına izin vermez. Oyunun alt fiyatı her zaman oyunun üst fiyatını aşmaz α = maksimum min aij 6 dk maksimum aij = β i j j i Teorem 1 (matris oyunları teorisinin ana teoremi). Her sonlu oyunun muhtemelen karma stratejiler alanında en az bir çözümü vardır. 6 2. Eyer noktalı oyunlar. Saf stratejilerde çözüm Eyer noktası olan bir oyun, α = maksimum min aij = min maksimum aij = β i j j i Eyer noktası olan oyunlar için, bir çözüm bulmak, optimal olan maksimum ve minimum stratejilerin seçilmesinden oluşur. , Oyunun net fiyatı - oyunun alt ve üst fiyatının toplam değeri α=β=ν 2.1. Örnekler Örnek 1   8 4 7 A= 6 5 9  7 7 8 matrisiyle verilen oyunun saf stratejilerinde bir çözüm bulun Çözüm: Oyunun üst ve alt fiyatını belirleyin. Bunu yapmak için i. satırdaki aij sayılarının minimumunu αi = min aij j ve j. sütunundaki aij sayılarının maksimumunu βj = max aij i bulacağız. αi (satır) sayılarını yazacağız. minimum) sağdaki ödeme matrisinin yanında ek bir sütun şeklinde. βi (maksimum sütun) sayılarını matrisin altına ek bir satır şeklinde yazıyoruz: αi 8 4 7 4 6 5 9 5 7 7 8 7 βj 8 7 9 7 Sayıların maksimumunu bulun αi α = max αi = 7 i ve sayıların minimumu βj β = min βj = 7 j α = β - oyunda bir eyer noktası vardır. Oyuncu için en uygun strateji A3 stratejisidir ve B oyuncusu için B2 stratejisidir, net oyun fiyatı ν = 7 Örnek 2 Ödeme matrisi verilmiştir:   2 2 1 1 2  0 1 1 1 1  A=  1 1 1 1 2   1 2 1 1 2 Saf stratejilerle oyuna bir çözüm bulun. Çözüm: 2 2 1 1 2 1 0 1 1 1 1 0 1 1 1 1 2 1 1 2 1 1 2 1 βj 2 2 1 1 2 α = β = 1. Oyunda altı eyer noktası vardır. Optimal stratejiler şöyle olacaktır: A1 ve B3 veya B4 A3 ve B3 veya B4 A4 ve B3 veya B4 8 3. Karma stratejilerde oyunun çözümü α = β olduğunda. Stratejilerini seçerken her iki oyuncunun da diğerinin seçimi hakkında bilgisinin olmaması durumunda oyunun karma stratejilerde bir çözümü vardır. SA = (p1, p2, ..., pm) - A oyuncusunun karma stratejisi; burada A1, A2, ..., Am stratejileri ∑ m p1, p2, ..., pm, pi olasılıklarıyla uygulanır 1, pi > 0, i = 1, m i=1 SB = (q1, q2, ..., qn) - B1, B2, ..., Bm stratejilerinin ∑ olasılıklarıyla uygulandığı B oyuncusunun karma stratejisi n q1, q2 , ..., qm , qi = 1, qi > 0, i = 1, n i=1 Eğer: SA∗ A oyuncusunun optimal stratejisiyse, SB∗ B oyuncusunun optimal stratejisiyse, o zaman oyunun maliyeti ∑ n ∑ m ν = aij · p∗i · qi∗ j=1 i=1 Aşağıdaki teorem, 2 × 2, 2 × n, m × oyunlarına nasıl çözüm bulunacağı sorusuna cevap verir. 2 Teorem 2 (2 × 2, 2 × n, m × 2 oyunları için çözüm nasıl bulunur). Eğer oyunculardan biri optimal karma stratejiyi kullanıyorsa, ikinci oyuncunun optimal stratejide yer alan stratejileri (saf stratejiler dahil) kullanma olasılıklarına bakılmaksızın, onun getirisi oyunun maliyetine ν eşittir. 9 3.1. Oyun 2 × 2 Matrisli 2 × 2'lik bir oyun düşünün: () a11 a21 a21 a22 Oyunun saf stratejilerde çözümü olmasın. SA∗ ve SB∗ optimal stratejilerini bulalım. Öncelikle SA∗ = (p∗1 , p∗2) stratejisini tanımlıyoruz. Teoreme göre, eğer A tarafı ν stratejisine bağlı kalırsa, o zaman B tarafının hareket tarzı ne olursa olsun, getirisi ν oynamanın maliyetine eşit kalacaktır. Sonuç olarak, eğer A tarafı SA∗ = (p∗1, p∗2) optimal stratejisine bağlı kalırsa, o zaman B tarafı, getirisini değiştirmeden stratejilerinden herhangi birini uygulayabilir. Daha sonra, B oyuncusu saf strateji B1 veya B2'yi kullandığında, oyuncu oyunun maliyetine eşit bir ortalama getiri alacaktır: a11 p∗1 + a21 p∗2 = ν ← B1 stratejisi için a12 p∗1 + a22 p∗ 2 = ν ← B2 stratejisi için Dikkate alındığında p∗1 + p∗2 = 1: p∗1 = a2 2−a2 1 a11 +a22 −a12 −a21 p∗2 = a1 1−a1 2 a11 +a22 −a12 −a21 Oyun fiyatı: a22 a11 − a12 a21 ν= a11 + a22 − a12 − a21 B oyuncusunun optimal stratejisi benzer şekilde bulunur: SB∗ = (q1∗ , q2∗). q1∗ + q2∗ = 1 olduğunu dikkate alarak: q1∗ = a2 2−a1 2 a11 +a22 −a12 −a21 q2∗ = a1 1−a2 1 a11 +a22 −a12 −a21 3.1.1. Örnekler Örnek 3 () −1 1 A= 1 −1 10 matrisiyle oyunun çözümünü bulun Çözüm: α= -1, β = 1, α ̸= β olduğundan oyunun bir eyer noktası yoktur. Karma stratejilerde çözüm arıyoruz. p∗ ve q∗ formüllerini kullanarak p∗1 = p∗2 = 0,5 ve q1∗ = q2∗ = 0,5, ν = 0 elde ederiz. Böylece, SA∗ = (0,5, 0,5) SB∗ = (0,5, 0,5) ) Örnek 4 Oyunun çözümünü () 2 5 A= 6 4 matrisiyle bulun. Çözüm: α= 4, β = 5, α ̸= β olduğundan oyunun bir eyer noktası yoktur. Karma stratejilerde çözüm arıyoruz. p∗ ve q∗ formüllerini kullanarak p∗1 = 0,4, p∗2 = 0,6 ve q1∗ = 0,2 q2∗ = 0,8, ν = 4,4 elde ederiz. Böylece, SA∗ = (0,4, 0,6) SB∗ = ( 0,2, 0,8) 11 3.1.2. Geometrik Yorumlama 2×2 oyununa basit bir geometrik yorum verilebilir. Her noktasını S = (p1, p2) = (p1, 1 − p1) karma stratejisiyle ilişkilendirdiğimiz apsis ekseninin tek bir bölümünü alalım ve A1 stratejisinin p1 olasılığı, A1 stratejisinden uzaklığa eşit olacaktır. SA noktasını bölümün sağ ucuna ve olasılık p2 , strateji A2 - sol uca olan mesafe. .y .I .I I .B1′ .N .B1 .a21 .a11 .I I .I .∗ .x .P2 .SA∗ .P1∗ Özellikle, bölümün sol ucu (apsis = 0 olan nokta) karşılık gelir A1 stratejisine, parçanın sağ ucu (x = 1) - A2 stratejisi Parçanın uçlarında, x eksenine iki dik nokta yeniden oluşturulur: eksen I − I - A1 stratejisinin getirisi ertelenir; eksen II − II - A2 stratejisinin getirisi ertelendi B oyuncusunun B1 stratejisini uygulamasına izin verin; sırasıyla I - I ve II - II eksenleri üzerinde a11 ve a21 ordinatlarına sahip noktaları verir. Bu noktalardan geçerek B1 – B1′ düz çizgisini çiziyoruz. Herhangi bir karma strateji SA = (p1, p2) için oyuncunun kazancı, parçayı p2:p1 oranında bölen x ekseni üzerindeki SA noktasına karşılık gelen B1 – B1′ düz çizgisi üzerindeki N noktası tarafından belirlenir. Açıkçası, B2 stratejisinin getirisini belirleyen B2 – B2' düz çizgisi de tamamen aynı şekilde oluşturulabilir. 12 .y .I .I I .B2 .N .a21 .B2′ a . 22 .I I .I .∗ .x .P2 .SA∗ .P1∗ En uygun SA∗ stratejisini bulmak gereklidir, yani. Öyle ki A oyuncusunun minimum getirisi (B oyuncusunun kendisi için en kötü davranışı dikkate alındığında) maksimuma dönüşecektir. Bunu yapmak için, B1, B2 stratejileri için A oyuncusunun getirisi için bir alt sınır oluşturun; kesikli çizgi B1 N B2' ;. Bu sınırda, A oyuncusunun karma stratejilerinden herhangi biri için minimum getirisi, N noktası bulunacaktır; bu noktada bu getiri maksimuma ulaşır ve oyunun kararını ve fiyatını belirler. .y .I .I I .B2 .B1′ .N .B1 .B2′ .I I .I .∗ .x .P2 . A∗ S . 1∗ P N noktasının ordinatı ν oyununun maliyetinden başka bir şey değildir, apsisi ∗2'ye eşittir ve parçanın sağ ucuna olan mesafe ∗1'e eşittir, yani. SA∗ noktasından parçanın uçlarına olan mesafe, A oyuncusunun optimal karma stratejisinin A2 ve A1 stratejilerinin ∗2 ve ∗1 olasılıklarına eşittir. bu durumda oyunun çözümü kesişim ile belirlendi. B1 ve B2 stratejilerinin noktası. Aşağıda oyuncunun optimal stratejisinin saf strateji A2 olduğu bir durum görülmektedir. Burada A2 stratejisi (herhangi bir düşman stratejisi için) A1 stratejisinden daha karlıdır, 13 .y .y .I .I I .I I.I .B2′ . 1' B .B1' B . 2 .B2'B . 2 .B1 .ν = a21 .B1 .ν = a21 I. I I. I .I . .x .I . .X. 2∗ P . A∗S = A2. 2∗ P . A∗ S = A2 Sağda, B oyuncusunun açıkça kârsız bir stratejisi olduğu durum gösterilmektedir.Geometrik yorumlama aynı zamanda α oyununun düşük fiyatını ve üst fiyatını β .y .I .I I .B2 görselleştirmeyi de mümkün kılar. .B1′ .N .B1 .B2′ .β = a21 .α = a22 .I I .I .∗ .x .P2 . A∗ S . 1∗ P Aynı grafikte B oyuncusunun optimal stratejilerinin geometrik yorumunu da verebiliriz. Optimum karma strateji SB∗ = (q1∗ , q2∗)'nin B1 stratejisinin q1∗ payının, KB2 bölümünün uzunluğunun KB1 bölümlerinin uzunluklarının toplamına oranına eşit olduğunu doğrulamak kolaydır. ve I – I ekseninde KB2: .y .I .I I .B2 .B1′ .N .K .L .B1 .B2′ .I I .I .∗ .x .P2 . A∗ S . 1∗ P 14 KB2 q1∗ = KB2 + KB1 veya LB2′ q1∗ = LB2′ + LB1′ Optimal strateji SB∗ = (q1∗ , q2∗) başka bir şekilde bulunabilir, eğer B ve B oyuncularını değiştirirsek, ve kazançların alt limitinin maksimumu yerine üst limitin minimumunu dikkate alın. .y .I .I I .A2 .A′1 .N .A1 .A′2 .I I .I . .x .q2∗ . B∗ S .q1∗ 15 3.2. 2 × n ve m × 2 oyunları 2 × n ve m × 2 oyunlarının çözümü aşağıdaki teoreme dayanmaktadır. Teorem 3. Herhangi bir sonlu m × n oyununun, her iki tarafın aktif stratejilerinin sayısının m ve n sayılarından en küçüğünü aşmadığı bir çözümü vardır. Bu teoreme göre 2xn boyutunda bir oyun her zaman her oyuncunun en fazla iki aktif stratejisinin olduğu bir çözüme sahiptir. Bu stratejileri bulduğunuzda 2×n oyunu basit bir şekilde çözülebilen 2×2 oyununa dönüşür. Aktif stratejilerin bulunması grafiksel olarak yapılabilir: 1) grafiksel bir yorum oluşturulur; 2) kazançların alt limiti belirlenir; 3) ikinci oyuncunun iki stratejisi, kazancın alt sınırında belirlenir; bunlar, maksimum koordinatın olduğu noktada kesişen iki çizgiye karşılık gelir (bu noktada ikiden fazla çizgi kesişirse, herhangi bir çift alınır) - bu stratejiler B oyuncusunun aktif stratejilerini temsil eder. Böylece, 2 × n oyunu, 2 × 2 oyununa indirgenir. m × 2 oyunu da çözülebilir, ancak aradaki fark, getirinin alt değil üst sınırıdır. üzerinde maksimum değil, minimum aranır. Örnek 5 Oyunun çözümünü bulun () 7 9 8 A= 10 6 9 Çözüm: geometrik yöntemi kullanarak aktif stratejileri seçiyoruz. B1 − B1', B2 − B2' ve B3 − B3' direkt çizgileri B1, B2, B3 stratejilerine karşılık gelir. Kesikli çizgi B1 N B2 oyuncunun kazancının alt limitidir. Oyunun bir çözümü var: S∗A = (23, 31); S∗B = (0,5; 0,5; 0); v = 8. 16 .y .I .I ben . 1' B B . 2 .B3′ .N .B3 .B1 .B2′ .I I .I . .X. 2∗ P . A∗ S . 1∗ P 17 İndeks oyunu, 2 hamle, 3 2 × 2, 10 kişisel, 3 2 × 2, 9 rastgele, 3 geometri, 12 net oyun fiyatı, 7 örnek, 10 2 × n, 9, 16 m × 2, 9 , 16 sonsuz, 4 normal formda, 5 sonlu, 4 çoklu hareket, 4 tek hareket, 4 matris, 5 eşli, 2 sıfır toplamlı, 2 antagonistik, 2 antagonistik olmayan, 2 çözüm, 5 karma stratejilerde, 5 , 9 saf stratejiler , 5 eyer noktalı, 7 fiyat, 5 üst, 6 alt, 6 saf, 7 maksimum, 6 oyun matrisi, 5 getiri, 5 minimaks, 6 oyun normalleştirme, 5 strateji, 4 maksimum, 6 minimaks, 6 optimal, 4 karma, 5 oyun teorisi, 2 18

KATEGORİLER

POPÜLER MAKALELER

2024 “kingad.ru” - insan organlarının ultrason muayenesi