कहाँ: पी 1 , पी 2 - संभाव्यताएँ (आवृत्तियाँ) जिनके साथ क्रमशः ए 1 और ए 2 रणनीतियाँ लागू की जाती हैं

खेल सिद्धांत से यह ज्ञात होता है कि यदि खिलाड़ी "ए" अपनी इष्टतम रणनीति का उपयोग करता है, और खिलाड़ी "बी" अपनी सक्रिय रणनीतियों के भीतर रहता है, तो औसत भुगतान अपरिवर्तित रहता है और खेल की कीमत के बराबर होता है वीइस बात की परवाह किए बिना कि खिलाड़ी "बी" अपनी सक्रिय रणनीतियों का उपयोग कैसे करता है। और हमारे मामले में, दोनों रणनीतियाँ सक्रिय हैं, अन्यथा खेल का समाधान शुद्ध रणनीतियों में होता। इसलिए, यदि हम मान लें कि खिलाड़ी "बी" शुद्ध रणनीति बी 1 का उपयोग करेगा, तो औसत भुगतान वीहोगा:

के 11 पी 1 + के 21 पी 2 = वी (1)

कहाँ: ij - अदायगी मैट्रिक्स तत्व।

दूसरी ओर, यदि हम मान लें कि खिलाड़ी "बी" शुद्ध रणनीति बी 2 का उपयोग करेगा, तो औसत भुगतान होगा:

के 12 पी 1 + के 22 पी 2 = वी (2)

समीकरण (1) और (2) के बाएँ भाग को बराबर करने पर हमें मिलता है:

के 11 पी 1 + के 21 पी 2 = के 12 पी 1 + के 22 पी 2

और इस तथ्य को ध्यान में रखते हुए पी 1 + पी 2 = 1 अपने पास:

के 11 पी 1 + के 21 (1 - पी 1) = के 12 पी 1 + के 22 (1 - पी 1)


जहां से रणनीति ए 1 की इष्टतम आवृत्ति का पता लगाना आसान है:

गणितीय खेल सिद्धांत. जीवन से खेलों को रिकॉर्ड करने और हल करने के उदाहरण

सूचना!आपकी विशिष्ट समस्या का समाधान इस उदाहरण के समान दिखेगा, जिसमें नीचे दी गई सभी तालिकाएँ, व्याख्यात्मक पाठ और आंकड़े शामिल होंगे, लेकिन आपके प्रारंभिक डेटा को ध्यान में रखते हुए...

काम:
मैट्रिक्स गेम निम्नलिखित भुगतान मैट्रिक्स द्वारा दिया गया है:

"बी" रणनीतियाँ
"ए" रणनीतियाँ बी 1बी2
ए 1 3 5
ए2 6
3
2

मैट्रिक्स गेम का समाधान खोजें, अर्थात्:
- खेल की शीर्ष कीमत का पता लगाएं;
- खेल की कम कीमत;
- खेल का शुद्ध मूल्य;
- खिलाड़ियों की इष्टतम रणनीतियों को इंगित करें;
- यदि आवश्यक हो तो एक ग्राफिकल समाधान (ज्यामितीय व्याख्या) प्रदान करें।

स्टेप 1

आइए खेल की कम कीमत निर्धारित करें - α

खेल की कम कीमतα वह अधिकतम भुगतान है जिसकी हम गारंटी दे सकते हैं, एक खेल में एक उचित प्रतिद्वंद्वी के खिलाफ, यदि हम पूरे खेल में एक और केवल एक रणनीति का उपयोग करते हैं (ऐसी रणनीति को "शुद्ध" कहा जाता है)।

अदायगी मैट्रिक्स की प्रत्येक पंक्ति में खोजें न्यूनतमतत्व और इसे एक अतिरिक्त कॉलम में लिखें (पीले रंग में हाइलाइट किया गया, तालिका 1 देखें)।

फिर हम पाते हैं अधिकतमअतिरिक्त कॉलम का तत्व (तारांकन चिह्न के साथ चिह्नित), यह गेम की कम कीमत होगी।

तालिका नंबर एक

"बी" रणनीतियाँ
"ए" रणनीतियाँ बी 1बी2 पंक्ति न्यूनतम
ए 1 3 5 3 *
ए2 6
3
2
3
2

हमारे मामले में, खेल की कम कीमत इसके बराबर है: α = 3, और खुद को 3 से अधिक खराब भुगतान की गारंटी देने के लिए, हमें रणनीति ए 1 का पालन करना चाहिए

चरण दो

आइए खेल की ऊपरी कीमत निर्धारित करें - β

शीर्ष गेम कीमतβ वह न्यूनतम हानि है जो खिलाड़ी "बी" एक उचित प्रतिद्वंद्वी के खिलाफ खेल में खुद को गारंटी दे सकता है, यदि पूरे खेल में वह एक और केवल एक रणनीति का उपयोग करता है।

अदायगी मैट्रिक्स के प्रत्येक कॉलम में खोजें अधिकतमतत्व और इसे नीचे एक अतिरिक्त पंक्ति में लिखें (पीले रंग में हाइलाइट किया गया, तालिका 2 देखें)।

फिर हम पाते हैं न्यूनतमअतिरिक्त लाइन का तत्व (प्लस के साथ चिह्नित), यह गेम का शीर्ष मूल्य होगा।

तालिका 2

"बी" रणनीतियाँ
"ए" रणनीतियाँ बी 1बी2 पंक्ति न्यूनतम
ए 1 3 5 3 *
ए2 6
3
2

हमारे मामले में, खेल की ऊपरी कीमत इसके बराबर है: β = 5, और अपने आप को 5 से अधिक की हानि की गारंटी देने के लिए, प्रतिद्वंद्वी (खिलाड़ी "बी") को रणनीति बी 2 का पालन करना होगा

चरण 3
आइए खेल की निचली और ऊपरी कीमतों की तुलना करें, इस समस्या में वे भिन्न हैं, यानी। α ≠ β, पेऑफ मैट्रिक्स में सैडल पॉइंट नहीं होता है। इसका मतलब यह है कि गेम का शुद्ध मिनिमैक्स रणनीतियों में कोई समाधान नहीं है, लेकिन मिश्रित रणनीतियों में इसका हमेशा समाधान होता है।

मिश्रित रणनीति, ये कुछ निश्चित संभावनाओं (आवृत्तियों) के साथ, बेतरतीब ढंग से अंतःस्थापित शुद्ध रणनीतियाँ हैं।

खिलाड़ी "ए" की मिश्रित रणनीति को दर्शाया जाएगा

एसए=

जहां बी 1, बी 2 खिलाड़ी "बी" की रणनीतियां हैं, और क्यू 1, क्यू 2 क्रमशः संभावनाएं हैं जिनके साथ इन रणनीतियों को लागू किया जाता है, और क्यू 1 + क्यू 2 = 1।

खिलाड़ी "ए" के लिए इष्टतम मिश्रित रणनीति वह है जो उसे अधिकतम भुगतान प्रदान करती है। तदनुसार, "बी" के लिए - न्यूनतम नुकसान। इन रणनीतियों को लेबल किया गया है एसए* और एसबी* क्रमशः। इष्टतम रणनीतियों की एक जोड़ी खेल का समाधान बनाती है।

सामान्य स्थिति में, खिलाड़ी की इष्टतम रणनीति में सभी प्रारंभिक रणनीतियाँ शामिल नहीं हो सकती हैं, बल्कि उनमें से केवल कुछ ही शामिल हो सकती हैं। ऐसी रणनीतियों को कहा जाता है सक्रिय रणनीतियाँ.

चरण 4

पी 1 =
22 - 21
11 + 22 - 12 - 21
(3)

इस कार्य में:

पी 1 =
3
2
- 6
3 +
3
2
- 5 - 6
=
9
13

संभावना आर 2 घटाव द्वारा ज्ञात करें आर 1 इकाई से:
पी 2 = 1 - पी 1 = 1 -
9
13
= + 6 ·

कहाँ: क्यू 1 , क्यू 2 - संभावनाएँ (आवृत्तियाँ) जिनके साथ रणनीतियाँ बी 1 और बी 2 क्रमशः लागू की जाती हैं

खेल सिद्धांत से यह ज्ञात होता है कि यदि खिलाड़ी "बी" अपनी इष्टतम रणनीति का उपयोग करता है, और खिलाड़ी "ए" अपनी सक्रिय रणनीतियों के भीतर रहता है, तो औसत भुगतान अपरिवर्तित रहता है और खेल की कीमत के बराबर होता है वीइस बात की परवाह किए बिना कि खिलाड़ी "ए" अपनी सक्रिय रणनीतियों का उपयोग कैसे करता है। इसलिए, यदि हम मान लें कि खिलाड़ी "ए" शुद्ध रणनीति ए 1 का उपयोग करेगा, तो औसत भुगतान वीहोगा:

के 11 क्यू 1 + के 12 क्यू 2 = वी (4)


क्योंकि खेल की कीमत वी हम पहले से ही जानते हैं, और यह दिया गया है क्यू 1 + क्यू 2 = 1 , तो रणनीति बी 1 की इष्टतम आवृत्ति इस प्रकार पाई जा सकती है:
क्यू 1 =
वी - 12
11 - 12
(5)

इस कार्य में:

क्यू 1 =
51
13
- 5
3 - 5
=
7
13

संभावना क्यू 2 घटाव द्वारा ज्ञात करें क्यू 1 इकाई से:
क्यू 2 = 1 - क्यू 1 = 1 -
7
13
=
6
13

उत्तर:

खेल की कम कीमत: α = 3
शीर्ष खेल मूल्य: β = 5
गेम की कीमत: वी =
51
13
खिलाड़ी A की इष्टतम रणनीति है:
एसए*=
ए 1ए2
9
13
4
13

खिलाड़ी "बी" की इष्टतम रणनीति :
एसबी*=
बी 1बी2
7
13
6
13

ज्यामितीय व्याख्या (ग्राफिक समाधान):

आइए हम विचाराधीन खेल की एक ज्यामितीय व्याख्या दें। इकाई लंबाई के x-अक्ष का एक खंड लें और उसके सिरों से लंबवत रेखाएँ खींचें 1 और 2 हमारी रणनीतियों ए 1 और ए 2 के अनुरूप। मान लीजिए अब वह खिलाड़ी "बी" रणनीति बी 1 का उपयोग अपने शुद्धतम रूप में करेगा। फिर, यदि हम (खिलाड़ी "ए") शुद्ध रणनीति ए 1 का उपयोग करते हैं, तो हमारा भुगतान 3 होगा। आइए अक्ष पर संबंधित बिंदु को चिह्नित करें 1 .
यदि हम शुद्ध रणनीति ए 2 का उपयोग करते हैं, तो हमारा भुगतान 6 होगा। हम अक्ष पर संबंधित बिंदु को चिह्नित करते हैं 2
(चित्र 1 देखें)। जाहिर है, अगर हम रणनीतियों ए 1 और ए 2 को विभिन्न अनुपातों में मिलाकर लागू करते हैं, तो हमारा भुगतान निर्देशांक (0, 3) ​​और (1, 6) वाले बिंदुओं से गुजरने वाली एक सीधी रेखा के साथ बदल जाएगा, आइए इसे की रेखा कहते हैं रणनीति बी 1 (चित्र 1 में लाल रंग में दिखाया गया है)। किसी दी गई रेखा पर किसी भी बिंदु का भुज प्रायिकता के बराबर होता है पी 2 (आवृत्ति) जिसके साथ हम रणनीति ए 2 लागू करते हैं, और कोटि - परिणामी भुगतान (चित्र 1 देखें)।

चित्र 1।
अदायगी ग्राफ आवृत्ति से पी 2 , जब प्रतिद्वंद्वी रणनीति का उपयोग करता है बी 1.

मान लीजिए अब वह खिलाड़ी "बी" अपने शुद्धतम रूप में रणनीति बी 2 का उपयोग करेगा। फिर, यदि हम (खिलाड़ी "ए") शुद्ध रणनीति ए 1 का उपयोग करते हैं, तो हमारा भुगतान 5 होगा। यदि हम शुद्ध रणनीति ए 2 का उपयोग करते हैं, तो हमारा भुगतान 3/2 होगा (चित्र 2 देखें)। इसी तरह, यदि हम रणनीतियों ए 1 और ए 2 को अलग-अलग अनुपात में मिलाते हैं, तो हमारा भुगतान निर्देशांक (0, 5) और (1, 3/2) वाले बिंदुओं से गुजरने वाली एक सीधी रेखा के साथ बदल जाएगा, आइए इसे रणनीति की रेखा कहते हैं बी 2 . पिछले मामले की तरह, इस रेखा पर किसी भी बिंदु का भुज उस संभावना के बराबर है जिसके साथ हम रणनीति ए 2 लागू करते हैं, और कोटि इस मामले में प्राप्त लाभ के बराबर है, लेकिन केवल रणनीति बी 2 के लिए (देखें) अंक 2)।

चित्र 2।
वी और इष्टतम आवृत्ति पी 2 खिलाड़ी के लिए "ए".

एक वास्तविक खेल में, जब एक उचित खिलाड़ी "बी" अपनी सभी रणनीतियों का उपयोग करता है, तो हमारा भुगतान चित्र 2 में लाल रंग में दिखाई गई टूटी हुई रेखा के साथ बदल जाएगा। यह पंक्ति तथाकथित को परिभाषित करती है लाभ की निचली सीमा. जाहिर है, इस टूटी हुई रेखा का उच्चतम बिंदु हमारी इष्टतम रणनीति से मेल खाता है। इस मामले में, यह रणनीतियों बी 1 और बी 2 की रेखाओं का प्रतिच्छेदन बिंदु है। ध्यान दें कि यदि आप एक आवृत्ति का चयन करते हैं पी 2 इसके भुज के बराबर, तो हमारा भुगतान अपरिवर्तित और बराबर रहेगा वी खिलाड़ी "बी" की किसी भी रणनीति के लिए, यह वह अधिकतम राशि होगी जिसकी हम स्वयं गारंटी दे सकते हैं। आवृत्ति (संभावना) पी 2 इस मामले में, हमारी इष्टतम मिश्रित रणनीति की संगत आवृत्ति है। वैसे, चित्र 2 भी आवृत्ति दिखाता है पी 1 , हमारी इष्टतम मिश्रित रणनीति, खंड की लंबाई है [ पी 2 ; 1] एक्स-अक्ष पर। (ये इसलिए पी 1 + पी 2 = 1 )

पूरी तरह से समान तरीके से तर्क करते हुए, कोई खिलाड़ी "बी" के लिए इष्टतम रणनीति की आवृत्तियों का भी पता लगा सकता है, जिसे चित्र 3 में दिखाया गया है।

चित्र तीन
खेल की कीमत का चित्रमय निर्धारण वी और इष्टतम आवृत्ति प्र2 खिलाड़ी के लिए "में".

केवल उसके लिए तथाकथित का निर्माण करना चाहिए हानि की ऊपरी सीमा(लाल टूटी हुई रेखा) और उस पर सबसे निचले बिंदु की तलाश करें, क्योंकि खिलाड़ी "बी" के लिए लक्ष्य नुकसान को कम करना है। इसी प्रकार, आवृत्ति मान क्यू 1 , खंड की लंबाई है [ क्यू 2 ; 1] एक्स-अक्ष पर।

खेल सिद्धांतसंचालन अनुसंधान की एक शाखा के रूप में, यह विभिन्न हितों वाले कई दलों की अनिश्चितता या संघर्ष की स्थितियों में इष्टतम निर्णय लेने के लिए गणितीय मॉडल का एक सिद्धांत है। गेम थ्योरी खेल प्रकृति की स्थितियों में इष्टतम रणनीतियों की खोज करती है। इनमें वैज्ञानिक और आर्थिक प्रयोगों की एक प्रणाली, सांख्यिकीय नियंत्रण के संगठन और उद्योग और अन्य उद्योगों में उद्यमों के बीच आर्थिक संबंधों के लिए सबसे लाभप्रद उत्पादन समाधानों की पसंद से संबंधित स्थितियां शामिल हैं। संघर्ष की स्थितियों को गणितीय रूप से औपचारिक रूप देकर, उन्हें दो, तीन आदि के खेल के रूप में दर्शाया जा सकता है। खिलाड़ी, जिनमें से प्रत्येक अपने स्वयं के लाभ को अधिकतम करने के लक्ष्य का पीछा करता है, दूसरे की कीमत पर अपना लाभ।

"गेम थ्योरी" खंड को तीन द्वारा दर्शाया गया है ऑनलाइन कैलकुलेटर:

  1. इष्टतम खिलाड़ी रणनीतियाँ। ऐसी समस्याओं में पेऑफ मैट्रिक्स दिया जाता है। खिलाड़ियों की शुद्ध या मिश्रित रणनीतियों को ढूंढना आवश्यक है और, खेल की कीमत. हल करने के लिए, आपको मैट्रिक्स का आयाम और समाधान विधि निर्दिष्ट करनी होगी। सेवा दो-खिलाड़ियों के खेल को हल करने के लिए निम्नलिखित तरीकों को लागू करती है:
    1. मिनिमैक्स। यदि आपको खिलाड़ियों की शुद्ध रणनीति का पता लगाना है या खेल के सैडल पॉइंट के बारे में प्रश्न का उत्तर देना है, तो इस समाधान पद्धति को चुनें।
    2. सिम्प्लेक्स विधि. इसका उपयोग रैखिक प्रोग्रामिंग विधियों का उपयोग करके मिश्रित रणनीतियों में गेम को हल करने के लिए किया जाता है।
    3. ग्राफ़िक विधि. मिश्रित रणनीति गेम को हल करने के लिए उपयोग किया जाता है। यदि कोई काठी बिंदु है, तो समाधान रुक जाता है। उदाहरण: किसी दिए गए भुगतान मैट्रिक्स के लिए, गेम को हल करने की ग्राफिकल पद्धति का उपयोग करके खिलाड़ियों की इष्टतम मिश्रित रणनीतियों और गेम की कीमत का पता लगाएं।
    4. पुनरावृत्तीय ब्राउन-रॉबिन्सन विधि। पुनरावृत्तीय विधि का उपयोग तब किया जाता है जब ग्राफिकल विधि लागू नहीं होती है और जब बीजगणितीय और मैट्रिक्स विधियां व्यावहारिक रूप से लागू नहीं होती हैं। यह विधि खेल के मूल्य का अनुमान देती है, और सटीकता की किसी भी वांछित डिग्री के साथ सही मूल्य प्राप्त किया जा सकता है। यह विधि इष्टतम रणनीतियों को खोजने के लिए पर्याप्त नहीं है, लेकिन यह आपको बारी-आधारित गेम की गतिशीलता को ट्रैक करने और प्रत्येक चरण में प्रत्येक खिलाड़ी के लिए गेम की लागत निर्धारित करने की अनुमति देती है।
    उदाहरण के लिए, कार्य ऐसा लग सकता है जैसे "पेऑफ मैट्रिक्स द्वारा दिए गए खेल के लिए खिलाड़ियों की इष्टतम रणनीतियों को इंगित करें".
    सभी विधियाँ प्रमुख पंक्तियों और स्तंभों की जाँच लागू करती हैं।
  2. बिमैट्रिक्स गेम। आमतौर पर ऐसे खेल में, पहले और दूसरे खिलाड़ियों के भुगतान के समान आकार के दो मैट्रिक्स निर्धारित किए जाते हैं। इन मैट्रिक्स की पंक्तियाँ पहले खिलाड़ी की रणनीतियों के अनुरूप होती हैं, और मैट्रिक्स के कॉलम दूसरे खिलाड़ी की रणनीतियों के अनुरूप होते हैं। इस मामले में, पहला मैट्रिक्स पहले खिलाड़ी के भुगतान को दर्शाता है, और दूसरा मैट्रिक्स दूसरे के भुगतान को दर्शाता है।
  3. प्रकृति के साथ खेल. इसका उपयोग तब किया जाता है जब मैक्सिमैक्स, बेयस, लाप्लास, वाल्ड, सैवेज, हर्विट्ज़ के मानदंडों के अनुसार प्रबंधन निर्णय चुनना आवश्यक होता है।
    बेयस मानदंड के लिए, घटनाओं के घटित होने की संभावनाओं का परिचय देना भी आवश्यक होगा। यदि वे सेट नहीं हैं, तो डिफ़ॉल्ट मान छोड़ दें (समकक्ष घटनाएँ होंगी)।
    हर्विट्ज़ मानदंड के लिए, आशावाद का स्तर निर्दिष्ट करें λ । यदि यह पैरामीटर शर्तों में निर्दिष्ट नहीं है, तो मान 0, 0.5 और 1 का उपयोग किया जा सकता है।

कई समस्याओं में कंप्यूटर के माध्यम से समाधान ढूंढना आवश्यक होता है। उपकरणों में से एक उपरोक्त सेवाएँ और कार्य हैं

खेल सिद्धांत - संघर्ष स्थितियों (रुचि के टकराव) को हल करने के लिए गणितीय तरीकों का एक सेट। गेम थ्योरी में, एक गेम है संघर्ष की स्थिति का गणितीय मॉडल। खेल सिद्धांत में विशेष रुचि का विषय अनिश्चितता की स्थिति में खेल प्रतिभागियों की निर्णय लेने की रणनीतियों का अध्ययन है। अनिश्चितता इस तथ्य के कारण है कि दो या दो से अधिक पक्ष विपरीत लक्ष्यों का पीछा करते हैं, और प्रत्येक पक्ष की किसी भी कार्रवाई के परिणाम साझेदार की चाल पर निर्भर करते हैं। साथ ही, प्रत्येक पक्ष अधिकतम सीमा तक निर्धारित लक्ष्यों को साकार करने वाले इष्टतम निर्णय लेने का प्रयास करता है।

गेम थ्योरी को अर्थव्यवस्था में सबसे अधिक लगातार लागू किया जाता है, जहां संघर्ष की स्थिति उत्पन्न होती है, उदाहरण के लिए, एक आपूर्तिकर्ता और एक उपभोक्ता, एक खरीदार और एक विक्रेता, एक बैंक और एक ग्राहक के बीच संबंधों में। गेम थ्योरी का अनुप्रयोग राजनीति, समाजशास्त्र, जीव विज्ञान और सैन्य कला में भी पाया जा सकता है।

गेम थ्योरी के इतिहास से

गेम थ्योरी का इतिहास एक स्वतंत्र अनुशासन के रूप में 1944 में शुरुआत हुई, जब जॉन वॉन न्यूमैन और ऑस्कर मॉर्गनस्टर्न ने "गेम्स एंड इकोनॉमिक बिहेवियर का सिद्धांत" ("गेम्स एंड इकोनॉमिक बिहेवियर का सिद्धांत") पुस्तक प्रकाशित की। हालाँकि गेम थ्योरी के उदाहरण पहले भी सामने आ चुके हैं: मृत पति की संपत्ति को उसकी पत्नियों के बीच बांटने पर बेबीलोनियाई तल्मूड ग्रंथ, 18वीं सदी में कार्ड गेम, 20वीं सदी की शुरुआत में शतरंज के सिद्धांत का विकास, प्रमाण 1928 वर्ष में उसी जॉन वॉन न्यूमैन के मिनिमैक्स प्रमेय के, जिसके बिना कोई खेल सिद्धांत नहीं होता।

1950 के दशक में, मेल्विन ड्रेशर और मेरिल फ्लड रैंड कॉर्पोरेशनकैदी की दुविधा को प्रयोगात्मक रूप से लागू करने वाले पहले व्यक्ति, जॉन नैश ने दो-व्यक्ति खेलों में संतुलन की स्थिति पर अपने काम में, नैश संतुलन की अवधारणा विकसित की।

1965 में रेइनहार्ड साल्टेन ने "ओलिगोपॉली प्रोसेसिंग इन गेम थ्योरी ऑन डिमांड" ("स्पीलथियोरेटिस बेहंडलुंग ईन्स ओलिगोमोडेल्स मिट नचफ्रागेट्राघेइट") पुस्तक प्रकाशित की, जिसके साथ अर्थशास्त्र में गेम थ्योरी के अनुप्रयोग को एक नई प्रेरणा शक्ति मिली। गेम थ्योरी के विकास में एक कदम आगे जॉन मेनार्ड स्मिथ के काम "इवोल्यूशनरी स्टेबल स्ट्रैटेजी" ("इवोल्यूशनरी स्टेबल स्ट्रैटेजी", 1974) से जुड़ा है। कैदी की दुविधा को 1984 में प्रकाशित रॉबर्ट एक्सेलरोड की पुस्तक द इवोल्यूशन ऑफ कोऑपरेशन में लोकप्रिय बनाया गया था। 1994 में, जॉन नैश, जॉन हरसैनी और रेनहार्ड साल्टेन को गेम थ्योरी में नोबेल पुरस्कार से सम्मानित किया गया था।

जीवन और व्यवसाय में खेल सिद्धांत

आइए हम संघर्ष की स्थिति (हितों के टकराव) के सार पर अधिक विस्तार से ध्यान दें, जैसा कि जीवन और व्यवसाय में विभिन्न स्थितियों के आगे के मॉडलिंग के लिए गेम थ्योरी में समझा जाता है। मान लीजिए कि व्यक्ति ऐसी स्थिति में है जो कई संभावित परिणामों में से एक की ओर ले जाता है, और इन परिणामों के संबंध में व्यक्ति की कुछ व्यक्तिगत प्राथमिकताएँ होती हैं। हालाँकि, वह कुछ हद तक परिणाम निर्धारित करने वाले परिवर्तनशील कारकों को नियंत्रित कर सकता है, लेकिन उसका उन पर पूर्ण नियंत्रण नहीं है। कभी-कभी नियंत्रण कई व्यक्तियों के हाथों में होता है, जो उनके जैसे, संभावित परिणामों के लिए कुछ प्राथमिकता रखते हैं, लेकिन सामान्य तौर पर इन व्यक्तियों के हित सहमत नहीं होते हैं। अन्य मामलों में, अंतिम परिणाम दुर्घटनाओं (कभी-कभी कानूनी विज्ञान में प्राकृतिक आपदाएं कहा जाता है) और अन्य व्यक्तियों पर निर्भर हो सकता है। गेम थ्योरी ऐसी स्थितियों के अवलोकन को व्यवस्थित करती है और ऐसी स्थितियों में उचित कार्रवाई का मार्गदर्शन करने के लिए सामान्य सिद्धांतों का निर्माण करती है।

कुछ मायनों में, "गेम थ्योरी" नाम दुर्भाग्यपूर्ण है, क्योंकि यह बताता है कि गेम थ्योरी केवल पार्लर गेम में होने वाले सामाजिक रूप से महत्वहीन टकराव से संबंधित है, लेकिन फिर भी इस सिद्धांत का बहुत व्यापक अर्थ है।

निम्नलिखित आर्थिक स्थिति गेम थ्योरी के अनुप्रयोग का अंदाजा दे सकती है। मान लीजिए कि कई उद्यमी हैं, जिनमें से प्रत्येक लाभ को अधिकतम करना चाहता है, जबकि इस लाभ को निर्धारित करने वाले चर पर केवल सीमित शक्ति है। उद्यमी का उन चरों पर कोई नियंत्रण नहीं होता है जो दूसरे उद्यमी द्वारा नियंत्रित होते हैं, लेकिन जो पहले की आय को बहुत प्रभावित कर सकते हैं। एक खेल के रूप में इस स्थिति की व्याख्या निम्नलिखित आपत्ति को जन्म दे सकती है। गेम मॉडल मानता है कि प्रत्येक उद्यमी संभावित विकल्पों के क्षेत्र में से एक विकल्प बनाता है, और मुनाफा इन एकल विकल्पों द्वारा निर्धारित होता है। यह स्पष्ट है कि वास्तविकता में यह लगभग असंभव है, क्योंकि इस मामले में उद्योग में जटिल प्रशासनिक तंत्र की आवश्यकता नहीं होगी। इन निर्णयों में बस कई निर्णय और संशोधन होते हैं जो आर्थिक प्रणाली में अन्य प्रतिभागियों (खिलाड़ियों) द्वारा चुने गए विकल्पों पर निर्भर करते हैं। लेकिन सिद्धांत रूप में, कोई कल्पना कर सकता है कि कोई भी प्रशासक सभी संभावित आकस्मिकताओं का अनुमान लगाता है और प्रत्येक कार्य को हल करने के बजाय प्रत्येक मामले में की जाने वाली कार्रवाई का विस्तार से वर्णन करता है।

परिभाषा के अनुसार, एक सैन्य संघर्ष, हितों का टकराव है जिसमें किसी भी पक्ष का परिणाम निर्धारित करने वाले चर पर पूर्ण नियंत्रण नहीं होता है, जो लड़ाई की एक श्रृंखला द्वारा तय किया जाता है। आप परिणाम को केवल जीत या हार के रूप में मान सकते हैं और उन्हें संख्यात्मक मान 1 और 0 निर्दिष्ट कर सकते हैं।

सबसे सरल संघर्ष स्थितियों में से एक, जिसे गेम थ्योरी में लिखा और हल किया जा सकता है, एक द्वंद्व है, जो क्रमशः दो खिलाड़ियों 1 और 2 के बीच का संघर्ष है। पीऔर क्यूशॉट्स. प्रत्येक खिलाड़ी के लिए, खिलाड़ी के शॉट की संभावना को दर्शाने वाला एक फ़ंक्शन होता है मैंउन दिनों टीऐसा प्रहार करेगा जो घातक सिद्ध होगा।

परिणामस्वरूप, खेल सिद्धांत हितों के टकराव के एक निश्चित वर्ग के निम्नलिखित सूत्रीकरण पर आता है: वहाँ हैं एनखिलाड़ियों, और प्रत्येक खिलाड़ी को 100 के एक निश्चित सेट में से एक संभावना चुननी होती है, और विकल्प चुनते समय, खिलाड़ी को अन्य खिलाड़ियों की पसंद के बारे में कोई जानकारी नहीं होती है। खिलाड़ी के संभावित विकल्प क्षेत्र में "हुकुम का इक्का चलाना", "कारों के बजाय टैंक का उत्पादन करना", या सामान्य अर्थ में, एक रणनीति जो सभी संभावित परिस्थितियों में की जाने वाली सभी कार्रवाइयों को परिभाषित करती है, जैसे तत्व शामिल हो सकते हैं। प्रत्येक खिलाड़ी को कार्य का सामना करना पड़ता है: उसे क्या विकल्प चुनना चाहिए ताकि परिणाम पर उसका निजी प्रभाव उसे सबसे बड़ा संभावित लाभ दिला सके?

खेल सिद्धांत और समस्या औपचारिकीकरण में गणितीय मॉडल

जैसा कि हम पहले ही नोट कर चुके हैं, खेल संघर्ष की स्थिति का एक गणितीय मॉडल है और निम्नलिखित घटकों की आवश्यकता है:

  1. इच्छुक पार्टियाँ;
  2. प्रत्येक पक्ष पर संभावित कार्रवाई;
  3. पार्टियों के हित.

खेल में रुचि रखने वाले पक्षों को खिलाड़ी कहा जाता है। , उनमें से प्रत्येक कम से कम दो कार्रवाई कर सकता है (यदि खिलाड़ी के पास केवल एक कार्रवाई है, तो वह वास्तव में खेल में भाग नहीं लेता है, क्योंकि यह पहले से ज्ञात है कि वह क्या करेगा)। खेल के परिणाम को जीत कहा जाता है। .

वास्तविक संघर्ष की स्थिति हमेशा नहीं होती है, लेकिन खेल (गेम थ्योरी की अवधारणा में) - हमेशा - आगे बढ़ता है निश्चित नियम , जो बिल्कुल परिभाषित करता है:

  1. खिलाड़ी विकल्प;
  2. प्रत्येक खिलाड़ी के पास साझेदार के व्यवहार के बारे में कितनी जानकारी है;
  3. कार्यों के प्रत्येक सेट से मिलने वाला प्रतिफल।

औपचारिक खेलों के उदाहरण फुटबॉल, कार्ड गेम, शतरंज हैं।

लेकिन अर्थशास्त्र में, खिलाड़ी के व्यवहार का एक मॉडल उभरता है, उदाहरण के लिए, जब कई कंपनियां बाजार में अधिक लाभप्रद स्थान लेने की कोशिश करती हैं, तो कई व्यक्ति आपस में कुछ अच्छे (संसाधन, वित्त) साझा करने का प्रयास करते हैं ताकि हर किसी को जितना संभव हो सके उतना मिल सके। . अर्थव्यवस्था में संघर्ष की स्थितियों में खिलाड़ी, जिन्हें एक खेल के रूप में प्रस्तुत किया जा सकता है, कंपनियां, बैंक, व्यक्ति और अन्य आर्थिक एजेंट हैं। बदले में, युद्ध की स्थिति में, गेम मॉडल का उपयोग किया जाता है, उदाहरण के लिए, दुश्मन को हराने या हमले से बचाव के लिए सबसे अच्छा हथियार (मौजूदा या संभावित रूप से संभव) चुनने में।

खेल की विशेषता परिणाम की अनिश्चितता है . अनिश्चितता के कारणों को निम्नलिखित समूहों में विभाजित किया जा सकता है:

  1. संयोजक (शतरंज के रूप में);
  2. यादृच्छिक कारकों का प्रभाव (जैसे खेल "हेड्स या टेल्स", पासा, कार्ड गेम में);
  3. रणनीतिक (खिलाड़ी को नहीं पता कि प्रतिद्वंद्वी क्या कार्रवाई करेगा)।

खिलाड़ी की रणनीति नियमों का एक समूह है जो स्थिति के आधार पर प्रत्येक कदम पर उसके कार्यों को निर्धारित करता है।

गेम थ्योरी का लक्ष्य प्रत्येक खिलाड़ी के लिए इष्टतम रणनीति निर्धारित करना है। ऐसी रणनीति निर्धारित करना खेल को हल करना है। रणनीति इष्टतमता यह तब प्राप्त होता है जब एक खिलाड़ी को अधिकतम भुगतान प्राप्त करना होता है, जबकि दूसरा अपनी रणनीति का पालन करता है। और यदि पहला अपनी रणनीति पर कायम रहता है तो दूसरे खिलाड़ी को न्यूनतम नुकसान होना चाहिए।

खेल वर्गीकरण

  1. खिलाड़ियों की संख्या के आधार पर वर्गीकरण (दो या दो से अधिक व्यक्तियों का खेल). दो-व्यक्ति खेल सभी खेल सिद्धांत के केंद्र में हैं। दो-व्यक्ति खेलों के लिए गेम थ्योरी की मूल अवधारणा संतुलन के बहुत आवश्यक विचार का सामान्यीकरण है, जो स्वाभाविक रूप से दो-व्यक्ति खेलों में प्रकट होता है। जहाँ तक खेलों का सवाल है एनव्यक्तियों, तो खेल सिद्धांत का एक भाग उन खेलों के लिए समर्पित है जिनमें खिलाड़ियों के बीच सहयोग निषिद्ध है। गेम थ्योरी के दूसरे भाग में एनव्यक्तियों का यह मानना ​​है कि खिलाड़ी आपसी लाभ के लिए सहयोग कर सकते हैं (असहयोगी और सहकारी खेलों के बारे में इस पैराग्राफ में बाद में देखें)।
  2. खिलाड़ियों की संख्या और उनकी रणनीतियों के आधार पर वर्गीकरण (रणनीतियों की संख्या कम से कम दो है, अनंत हो सकती है)।
  3. जानकारी की मात्रा के आधार पर वर्गीकरण पिछली चालों के संबंध में: पूरी जानकारी और अधूरी जानकारी वाले खेल। माना कि खिलाड़ी 1 - खरीदार और खिलाड़ी 2 - विक्रेता हैं। यदि खिलाड़ी 1 को खिलाड़ी 2 के कार्यों के बारे में पूरी जानकारी नहीं है, तो खिलाड़ी 1 उन दो विकल्पों के बीच अंतर नहीं कर सकता है जिन्हें उसे चुनना है। उदाहरण के लिए, किसी निश्चित उत्पाद के दो प्रकारों के बीच चयन करना और यह न जानना कि, कुछ विशेषताओं के अनुसार, उत्पाद क्या है माल से भी बदतर बी, खिलाड़ी 1 को विकल्पों के बीच अंतर दिखाई नहीं दे सकता है।
  4. जीत के विभाजन के सिद्धांतों के अनुसार वर्गीकरण : एक ओर सहयोगी, गठबंधन और दूसरी ओर असहयोगी, असहयोगी। में असहयोगी खेल , या अन्यथा - असहयोगी खेल , खिलाड़ी यह जाने बिना कि दूसरा खिलाड़ी कौन सी रणनीति चुनेगा, एक साथ रणनीतियाँ चुनते हैं। खिलाड़ियों के बीच संचार संभव नहीं है. में सहकारी खेल , या अन्यथा - गठबंधन का खेल , खिलाड़ी गठबंधन बना सकते हैं और अपनी जीत बढ़ाने के लिए सामूहिक कार्रवाई कर सकते हैं।
  5. दो-व्यक्ति परिमित शून्य-राशि खेल या प्रतिपक्षी खेल संपूर्ण जानकारी वाला एक रणनीति खेल है, जिसमें विपरीत हितों वाले दल भाग लेते हैं। विरोधी खेल हैं मैट्रिक्स खेल.

गेम थ्योरी का एक उत्कृष्ट उदाहरण कैदी की दुविधा है।

दोनों संदिग्धों को हिरासत में ले लिया गया है और एक दूसरे से अलग कर दिया गया है। जिला अटॉर्नी आश्वस्त है कि उन्होंने गंभीर अपराध किया है, लेकिन मुकदमे में उन पर आरोप लगाने के लिए उनके पास पर्याप्त सबूत नहीं हैं। वह प्रत्येक कैदी से कहता है कि उसके पास दो विकल्प हैं: उस अपराध को कबूल करें जिसे पुलिस मानती है कि उसने किया है, या कबूल न करें। यदि दोनों कबूल नहीं करते हैं, तो जिला अटॉर्नी उन पर कुछ छोटे अपराध का आरोप लगाएगी, जैसे छोटी चोरी या हथियार का अवैध कब्ज़ा, और उन दोनों को एक छोटी सी सजा मिलेगी। यदि वे दोनों कबूल करते हैं, तो उन पर मुकदमा चलाया जाएगा, लेकिन इसके लिए सबसे कठोर सजा की आवश्यकता नहीं होगी। यदि एक कबूल करता है और दूसरा नहीं करता है, तो कबूल करने वाले व्यक्ति को एक साथी के प्रत्यर्पण के लिए कम सजा दी जाएगी, जबकि जिद्दी व्यक्ति को "पूरी तरह से" प्राप्त होगा।

यदि इस रणनीतिक कार्य को निष्कर्ष के रूप में तैयार किया जाता है, तो यह निम्नलिखित तक सीमित हो जाता है:

इस प्रकार, यदि दोनों कैदी कबूल नहीं करते हैं, तो उन्हें 1 वर्ष की सजा मिलेगी। यदि दोनों कबूल करते हैं, तो प्रत्येक को 8 वर्ष की सजा होगी। और यदि एक कबूल करता है, और दूसरा नहीं करता है, तो जो कबूल करता है उसे तीन महीने की जेल होगी, और जो नहीं कबूल करेगा उसे 10 साल मिलेंगे। उपरोक्त मैट्रिक्स कैदी की दुविधा को सही ढंग से दर्शाता है: हर किसी को कबूल करने या न कबूल करने के सवाल का सामना करना पड़ता है। जिला अटॉर्नी कैदियों को जो गेम ऑफर करता है वह है असहयोगी खेल या अन्यथा - गैर-गठबंधन खेल . यदि दोनों कैदी सहयोग करने में सक्षम थे (अर्थात् खेल सहयोगी होगा या अन्यथा गठबंधन का खेल ), तो दोनों ने कबूल नहीं किया और प्रत्येक को एक वर्ष की जेल हुई।

गेम थ्योरी के गणितीय साधनों के उपयोग के उदाहरण

अब हम खेलों के सामान्य वर्गों के उदाहरणों के समाधान पर विचार करते हैं जिनके लिए खेल सिद्धांत में जांच और समाधान के तरीके हैं।

दो व्यक्तियों के असहयोगी (गैर-सहकारी) खेल की औपचारिकता का एक उदाहरण

पिछले पैराग्राफ में, हमने पहले से ही एक गैर-सहकारी (गैर-सहकारी) खेल (कैदी की दुविधा) का एक उदाहरण माना है। आइए अपने कौशल को मजबूत करें। आर्थर कॉनन डॉयल की द एडवेंचर्स ऑफ शेरलॉक होम्स से प्रेरित एक क्लासिक कथानक भी इसके लिए उपयुक्त है। बेशक, कोई आपत्ति कर सकता है: उदाहरण जीवन से नहीं, बल्कि साहित्य से है, लेकिन कॉनन डॉयल ने खुद को विज्ञान कथा लेखक के रूप में स्थापित नहीं किया! क्लासिक इसलिए भी क्योंकि यह कार्य ऑस्कर मॉर्गनस्टर्न द्वारा पूरा किया गया था, जैसा कि हम पहले ही स्थापित कर चुके हैं - गेम थ्योरी के संस्थापकों में से एक।

उदाहरण 1शेरलॉक होम्स के कारनामों में से एक का संक्षिप्त अंश दिया जाएगा। गेम थ्योरी की प्रसिद्ध अवधारणाओं के अनुसार, संघर्ष की स्थिति का एक मॉडल बनाएं और गेम को औपचारिक रूप से लिखें।

शेरलॉक होम्स अपने पीछा कर रहे प्रोफेसर मोरियार्टी से बचने के लिए महाद्वीप (यूरोपीय) तक पहुंचने के लक्ष्य के साथ लंदन से डोवर जाने का इरादा रखता है। ट्रेन में चढ़ते हुए, उन्होंने स्टेशन के प्लेटफार्म पर प्रोफेसर मोरियार्टी को देखा। शर्लक होम्स स्वीकार करते हैं कि मोरियार्टी एक विशेष ट्रेन चुन सकते हैं और उससे आगे निकल सकते हैं। शर्लक होम्स के पास दो विकल्प हैं: डोवर की ओर बढ़ते रहें या कैंटरबरी स्टेशन पर उतरें, जो उसके मार्ग का एकमात्र मध्यवर्ती स्टेशन है। हम मानते हैं कि उसका प्रतिद्वंद्वी होम्स के विकल्पों को निर्धारित करने के लिए पर्याप्त बुद्धिमान है, इसलिए उसके पास वही दो विकल्प हैं। दोनों विरोधियों को ट्रेन से उतरने के लिए एक स्टेशन चुनना होगा, बिना यह जाने कि उनमें से प्रत्येक क्या निर्णय लेगा। यदि, निर्णय के परिणामस्वरूप, दोनों एक ही स्टेशन पर समाप्त होते हैं, तो हम निश्चित रूप से मान सकते हैं कि शर्लक होम्स को प्रोफेसर मोरियार्टी द्वारा मार दिया जाएगा। यदि शर्लक होम्स सुरक्षित रूप से डोवर पहुंच जाता है, तो उसे बचा लिया जाएगा।

समाधान। कॉनन डॉयल के नायकों को खेल में भागीदार, यानी खिलाड़ी माना जा सकता है। प्रत्येक खिलाड़ी के निपटान में मैं (मैं=1,2) दो शुद्ध रणनीतियाँ:

  • डोवर पर उतरें (रणनीति एसi1 ( मैं=1,2) );
  • रास्ते के स्टेशन पर उतरें (रणनीति एसi2 ( मैं=1,2) )

दोनों खिलाड़ियों में से प्रत्येक कौन सी रणनीति चुनता है, इसके आधार पर जोड़ी के रूप में रणनीतियों का एक विशेष संयोजन बनाया जाएगा एस = (एस1 , एस 2 ) .

प्रत्येक संयोजन को एक घटना से जोड़ा जा सकता है - प्रोफेसर मोरियार्टी द्वारा शर्लक होम्स को मारने के प्रयास का परिणाम। हम संभावित घटनाओं के साथ इस गेम का एक मैट्रिक्स बनाते हैं।

प्रत्येक घटना के तहत, एक सूचकांक दर्शाया गया है, जिसका अर्थ प्रोफेसर मोरियार्टी का अधिग्रहण है, और इसकी गणना होम्स के उद्धार के आधार पर की जाती है। दोनों नायक एक ही समय में रणनीति चुनते हैं, बिना यह जाने कि प्रतिद्वंद्वी क्या चुनेगा। इस प्रकार, खेल असहयोगी है, क्योंकि, सबसे पहले, खिलाड़ी अलग-अलग ट्रेनों में हैं, और दूसरे, उनकी रुचियां विपरीत हैं।

सहकारी (गठबंधन) खेल की औपचारिकता और समाधान का एक उदाहरण एनव्यक्तियों

इस बिंदु पर, व्यावहारिक भाग, यानी, एक उदाहरण समस्या को हल करने का क्रम, एक सैद्धांतिक भाग से पहले होगा, जिसमें हम सहकारी (गैर-सहकारी) खेलों को हल करने के लिए गेम सिद्धांत की अवधारणाओं से परिचित होंगे। इस कार्य के लिए, गेम थ्योरी सुझाव देती है:

  • विशिष्ट कार्य (सीधे शब्दों में कहें तो, यह खिलाड़ियों को गठबंधन में शामिल करने के लाभों के मूल्य को दर्शाता है);
  • योगात्मकता की अवधारणा (मात्राओं की संपत्ति, इस तथ्य में शामिल है कि संपूर्ण वस्तु के अनुरूप मात्रा का मूल्य वस्तु के विभाजन के एक निश्चित वर्ग में, उसके भागों के अनुरूप मात्राओं के मूल्यों के योग के बराबर है भागों में) और विशेषता फ़ंक्शन की सुपरएडिटिविटी (संपूर्ण वस्तु के अनुरूप मात्रा का मान उसके भागों के अनुरूप मात्राओं के मानों के योग से अधिक है)।

विशेषता फ़ंक्शन की सुपरएडिटिविटी इंगित करती है कि गठबंधन खिलाड़ियों के लिए फायदेमंद है, क्योंकि इस मामले में गठबंधन का भुगतान खिलाड़ियों की संख्या के साथ बढ़ता है।

खेल को औपचारिक बनाने के लिए, हमें उपरोक्त अवधारणाओं के लिए औपचारिक संकेतन शुरू करने की आवश्यकता है।

खेल के लिए एनइसके सभी खिलाड़ियों के सेट को इस प्रकार निरूपित करें एन= (1,2,...,n) समुच्चय का कोई गैर-रिक्त उपसमुच्चय एनइस रूप में घोषित किया गया टी(स्वयं सहित) एनऔर सभी उपसमुच्चय एक तत्व से बने हैं)। साइट पर एक गतिविधि है सेट और सेट पर संचालन, जो लिंक पर क्लिक करने पर एक नई विंडो में खुलता है।

चारित्रिक फलन को इस प्रकार दर्शाया गया है वीऔर इसकी परिभाषा के क्षेत्र में सेट के संभावित उपसमुच्चय शामिल हैं एन. वी(टी) - एक विशेष उपसमुच्चय के लिए विशेषता फ़ंक्शन का मूल्य, उदाहरण के लिए, गठबंधन द्वारा प्राप्त आय, जिसमें संभवतः, एक खिलाड़ी शामिल है। यह महत्वपूर्ण है क्योंकि गेम थ्योरी के लिए सभी गैर-अतिव्यापी गठबंधनों के विशिष्ट कार्य के मूल्यों के लिए सुपरएडिटिविटी की उपस्थिति की जाँच की आवश्यकता होती है।

उपसमुच्चय के दो गैर-रिक्त गठबंधनों के लिए टी1 और टी2 एक सहकारी (गठबंधन) खेल के विशिष्ट कार्य की संवेदनशीलता इस प्रकार लिखी गई है:

और सुपरएडिटिविटी इस प्रकार है:

उदाहरण 2एक संगीत विद्यालय के तीन छात्र विभिन्न क्लबों में अतिरिक्त पैसा कमाते हैं, वे अपनी आय क्लब के आगंतुकों से प्राप्त करते हैं। सहकारी खेलों को हल करने के लिए गेम थ्योरी की अवधारणाओं का उपयोग करके निर्धारित करें कि क्या उनके लिए सेना में शामिल होना लाभदायक है (यदि हां, तो किन परिस्थितियों में)। एननिम्नलिखित प्रारंभिक डेटा वाले व्यक्ति।

औसतन, प्रति शाम उनका राजस्व था:

  • वायलिन वादक के पास 600 इकाइयाँ हैं;
  • गिटारवादक के पास 700 इकाइयाँ हैं;
  • गायक के पास 900 इकाइयाँ हैं।

राजस्व बढ़ाने के प्रयास में, छात्रों ने कई महीनों तक विभिन्न समूह बनाए। परिणामों से पता चला कि, टीम बनाकर, वे अपना शाम का राजस्व इस प्रकार बढ़ा सकते हैं:

  • वायलिन वादक + गिटारवादक ने 1500 इकाइयाँ अर्जित कीं;
  • वायलिन वादक + गायक ने 1800 इकाइयाँ अर्जित कीं;
  • गिटारवादक + गायक ने 1900 इकाइयाँ अर्जित कीं;
  • वायलिन वादक + गिटारवादक + गायक ने 3000 इकाइयाँ अर्जित कीं।

समाधान। इस उदाहरण में, खेल में प्रतिभागियों की संख्या एन= 3, इसलिए, खेल के विशिष्ट फ़ंक्शन के डोमेन में सभी खिलाड़ियों के सेट के 2³ = 8 संभावित उपसमुच्चय शामिल हैं। आइए सभी संभावित गठबंधनों की सूची बनाएं टी:

  • एक तत्व के गठबंधन, जिनमें से प्रत्येक में एक खिलाड़ी होता है - एक संगीतकार: टी{1} , टी{2} , टी{3} ;
  • दो तत्वों का गठबंधन: टी{1,2} , टी{1,3} , टी{2,3} ;
  • तीन तत्वों का गठबंधन: टी{1,2,3} .

हम प्रत्येक खिलाड़ी को एक क्रमांक निर्दिष्ट करते हैं:

  • वायलिन वादक - प्रथम वादक;
  • गिटारवादक - दूसरा खिलाड़ी;
  • गायक तीसरा खिलाड़ी है।

समस्या डेटा के अनुसार, हम खेल के विशिष्ट कार्य का निर्धारण करते हैं वी:

v(T(1)) = 600 ; v(T(2)) = 700 ; v(T(3)) = 900 ; विशेषता फ़ंक्शन के ये मूल्य क्रमशः पहले, दूसरे और तीसरे खिलाड़ियों के भुगतान के आधार पर निर्धारित किए जाते हैं, जब वे गठबंधन में एकजुट नहीं होते हैं;

v(T(1,2)) = 1500 ; v(T(1,3)) = 1800 ; v(T(2,3)) = 1900 ; विशेषता फ़ंक्शन के ये मूल्य गठबंधन में एकजुट खिलाड़ियों की प्रत्येक जोड़ी के राजस्व से निर्धारित होते हैं;

v(T(1,2,3)) = 3000 ; विशेषता फ़ंक्शन का यह मान उस स्थिति में औसत राजस्व द्वारा निर्धारित किया जाता है जब खिलाड़ी ट्रिपल में एकजुट होते थे।

इस प्रकार, हमने खिलाड़ियों के सभी संभावित गठबंधनों को सूचीबद्ध किया है, उनमें से आठ हैं, जैसा कि होना चाहिए, क्योंकि खेल के विशिष्ट कार्य की परिभाषा के क्षेत्र में सभी खिलाड़ियों के सेट के ठीक आठ संभावित उपसमुच्चय शामिल हैं। गेम थ्योरी के लिए यही आवश्यक है, क्योंकि हमें सभी गैर-अतिव्यापी गठबंधनों के विशिष्ट कार्य के मूल्यों के लिए सुपरएडिटिविटी की उपस्थिति की जांच करने की आवश्यकता है।

इस उदाहरण में सुपरएडिटिविटी की शर्तें कैसे पूरी होती हैं? आइए परिभाषित करें कि खिलाड़ी गैर-अतिव्यापी गठबंधन कैसे बनाते हैं टी1 और टी2 . यदि कुछ खिलाड़ी गठबंधन में हैं टी1 , तो अन्य सभी खिलाड़ी गठबंधन में हैं टी2 और परिभाषा के अनुसार यह गठबंधन खिलाड़ियों के कुल सेट और सेट के बीच अंतर के रूप में बनता है टी1 . तो अगर टी1 - एक खिलाड़ी का गठबंधन, फिर गठबंधन में टी2 यदि गठबंधन में हैं तो दूसरे और तीसरे खिलाड़ी होंगे टी1 पहले और तीसरे खिलाड़ी होंगे, फिर गठबंधन टी2 इसमें केवल दूसरा खिलाड़ी शामिल होगा, इत्यादि।

सामग्री 1 सामान्य जानकारी 2 1.1 खेल। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 चालें। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 रणनीतियाँ। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4 मैट्रिक्स गेम। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 ट्रेस प्वाइंट. शुद्ध रणनीतियाँ 7 2.1 उदाहरण। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 उदाहरण 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 उदाहरण 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3 मिश्रित रणनीतियाँ 9 3.1 गेम 2×2। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.1.1 उदाहरण। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 उदाहरण 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 उदाहरण 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1.2 ज्यामितीय व्याख्या। . . . . . . . . . . . . . . . . . . . 12 3.2 गेम्स 2×n और m×2। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 उदाहरण 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1 1. खेल सिद्धांत से सामान्य जानकारी 1.1. गेम्स गेम थ्योरी संघर्ष स्थितियों का एक गणितीय सिद्धांत है, अर्थात। ऐसी स्थितियाँ जिनमें भिन्न लक्ष्य प्राप्त करने वाले दो या दो से अधिक दलों के हित टकराते हैं। एक खेल कुछ नियमों द्वारा विनियमित एक संघर्ष की स्थिति है, जिसे इंगित करना चाहिए: प्रतिभागियों के कार्यों के लिए संभावित विकल्प, खेल का मात्रात्मक परिणाम या भुगतान (जीत, हानि) जिसके लिए चालों का एक सेट सेट की मात्रा की ओर जाता है दूसरे पक्ष के व्यवहार के बारे में प्रत्येक पक्ष की जानकारी। जोड़ियों का खेल - एक ऐसा खेल जिसमें केवल दो पार्टियाँ (दो खिलाड़ी) भाग लेते हैं। शून्य-राशि जोड़ी खेल - एक जोड़ी खेल जिसमें भुगतान की राशि शून्य है, अर्थात। एक खिलाड़ी की हानि दूसरे के लाभ के बराबर होती है। भुगतान फ़ंक्शन के मूल्य के प्रति प्रत्येक खिलाड़ी के रवैये के आधार पर, युग्मित खेलों को उप-विभाजित किया जाता है: एक खिलाड़ी की हानि दूसरे के लाभ के बराबर होती है। एक गैर-विरोधी खेल एक जोड़ी खेल है जिसमें खिलाड़ी अलग-अलग, लेकिन सीधे विपरीत नहीं, लक्ष्यों का पीछा करते हैं। 2 1.2. चालें चाल - खेल के नियमों द्वारा प्रदान की गई क्रियाओं में से एक का चुनाव, इस विकल्प का कार्यान्वयन चालें दो प्रकार की होती हैं: व्यक्तिगत चाल - + खेल के नियमों द्वारा प्रदान की गई क्रियाओं में से एक की सचेत पसंद + इस विकल्प का कार्यान्वयन यादृच्छिक चाल - एक यादृच्छिक चाल कई संभावनाओं में से एक विकल्प है, जो खिलाड़ी के निर्णय से नहीं, बल्कि कुछ यादृच्छिक चयन तंत्र द्वारा किया जाता है। नीचे हम शून्य-राशि युग्मित खेलों पर विचार करते हैं जिनमें केवल व्यक्तिगत चालें होती हैं। प्रत्येक पक्ष को दूसरे के व्यवहार के बारे में कोई जानकारी नहीं है। 3 1.3. रणनीतियाँ एक खिलाड़ी की रणनीति नियमों का एक समूह है जो खेल के दौरान विकसित हुई स्थिति के आधार पर, इस खिलाड़ी की प्रत्येक व्यक्तिगत चाल के लिए कार्यों की पसंद निर्धारित करती है। संभावित रणनीतियों की संख्या के आधार पर, खेलों को सीमित और अनंत में विभाजित किया गया है। अनंत खेल एक ऐसा खेल है जिसमें कम से कम एक खिलाड़ी के पास अनंत संख्या में रणनीतियाँ होती हैं। परिमित खेल वह खेल है जिसमें प्रत्येक खिलाड़ी के पास सीमित संख्या में रणनीतियाँ होती हैं। किसी भी खिलाड़ी के लिए लगातार चालों की संख्या खेल के विभाजन को एक-चाल और बहु-चाल, या स्थितीय में निर्धारित करती है। + एक-चाल वाले खेल में, प्रत्येक खिलाड़ी संभावित विकल्पों में से केवल एक विकल्प चुनता है और फिर खेल का परिणाम निर्धारित करता है। + एक बहु-चाल, या स्थितीय, खेल समय के साथ विकसित होता है, जो क्रमिक चरणों की एक श्रृंखला का प्रतिनिधित्व करता है, जिनमें से प्रत्येक खिलाड़ी की चाल और स्थिति में संबंधित परिवर्तन के बाद आता है। एक-चाल वाले खेल में, प्रत्येक खिलाड़ी संभावित विकल्पों में से केवल एक विकल्प चुनता है और फिर खेल का परिणाम निर्धारित करता है। किसी खिलाड़ी की इष्टतम रणनीति वह रणनीति है, जो खेल को कई बार दोहराए जाने पर, दिए गए खिलाड़ी को अधिकतम संभव औसत लाभ (या, समकक्ष, न्यूनतम संभव औसत हानि) प्रदान करती है। गेम थ्योरी में, सभी सिफारिशें खिलाड़ियों के उचित व्यवहार की धारणा के आधार पर की जाती हैं। प्रत्येक संघर्ष की स्थिति में अपरिहार्य खिलाड़ियों की गलतियाँ और गलतियाँ, साथ ही खेल सिद्धांत में उत्साह और जोखिम के तत्वों को ध्यान में नहीं रखा जाता है। 4 1.4. मैट्रिक्स गेम मैट्रिक्स गेम एक-चाल वाला सीमित शून्य-योग गेम है। मैट्रिक्स गेम एक संघर्ष की स्थिति का गेम-सैद्धांतिक मॉडल है जिसमें प्रतिद्वंद्वी कार्रवाई के संभावित तरीकों की सीमित संख्या में से एक विकल्प (चाल) बनाते हैं। बिल्कुल विपरीत लक्ष्य। कार्रवाई के चुने हुए तरीकों (रणनीतियों) के अनुसार, प्राप्त परिणाम निर्धारित किया जाता है। आइए एक उदाहरण देखें. मान लीजिए कि दो खिलाड़ी A और B हैं, जिनमें से एक अपनी संभावित रणनीतियों A1, A2, ...Am में से i-th रणनीति चुन सकता है, और दूसरा अपनी संभावित रणनीतियों B1, B2 में से j-th रणनीति चुन सकता है। , .. .बीएम . परिणामस्वरूप, पहला खिलाड़ी ऐज़ जीतता है और दूसरा खिलाड़ी यह मान खो देता है। संख्याओं aij से, हम मैट्रिक्स   a11 a11 · · · a1n  a21 a22 · · · a2n    A = (aij) =  .. .. .. ..   बनाते हैं। . . .  am1 am2 · · amn मैट्रिक्स A = (aij), i = 1, m, j = 1, n को पेऑफ मैट्रिक्स या m × n गेम का मैट्रिक्स कहा जाता है। इस मैट्रिक्स में, पंक्तियाँ हमेशा जीतने वाले (अधिकतम करने वाले) खिलाड़ी ए की रणनीतियों के लिए होती हैं, अर्थात, वह खिलाड़ी जो अपने भुगतान को अधिकतम करना चाहता है। कॉलम हारने वाले खिलाड़ी बी की रणनीतियों के लिए आरक्षित हैं, यानी वह खिलाड़ी जो दक्षता मानदंड को कम करना चाहता है। गेम सामान्यीकरण एक स्थितिगत गेम को मैट्रिक्स गेम में बदलने की प्रक्रिया है। सामान्य रूप में एक गेम एक स्थितिगत गेम है जिसे विकास के प्रत्येक चरण में कार्रवाई के संभावित तरीकों की एक सीमित संख्या में से एक विकल्प (चाल) के साथ मैट्रिक्स गेम में बदल दिया जाता है। परिस्थिति। खेल समाधान - दोनों खिलाड़ियों की इष्टतम रणनीतियों का पता लगाना और खेल का मूल्य निर्धारित करना खेल का मूल्य खिलाड़ियों का अपेक्षित लाभ (हानि) है। खेल का समाधान या तो शुद्ध रणनीतियों में पाया जा सकता है - जब खिलाड़ी को एक ही रणनीति का पालन करना होता है, या मिश्रित रणनीतियों में, जब खिलाड़ी को कुछ संभावनाओं के साथ दो या अधिक शुद्ध रणनीतियों का उपयोग करना होता है। इस मामले में उत्तरार्द्ध को सक्रिय कहा जाता है। 5 एक खिलाड़ी की मिश्रित रणनीति एक वेक्टर है, जिसका प्रत्येक घटक खिलाड़ी द्वारा संबंधित शुद्ध रणनीति के उपयोग की आवृत्ति को दर्शाता है। खेल की अधिकतम या कम कीमत - संख्या α = अधिकतम न्यूनतम aij i j अधिकतम रणनीति (स्ट्रिंग) - खिलाड़ी द्वारा अपने न्यूनतम भुगतान को अधिकतम करने के लिए चुनी गई रणनीति। जाहिर है, सबसे सतर्क मैक्सिमम रणनीति चुनते समय, खिलाड़ी ए खुद को (प्रतिद्वंद्वी के व्यवहार की परवाह किए बिना) कम से कम α की गारंटीकृत अदायगी प्रदान करता है। अधिकतम या खेल की ऊपरी लागत - संख्या β = न्यूनतम अधिकतम aij j i मिनीमैक्स रणनीति (कॉलम) - खिलाड़ी द्वारा अपने अधिकतम नुकसान को कम करने के लिए चुनी गई रणनीति। जाहिर है, सबसे सतर्क मिनिमैक्स रणनीति चुनते समय, खिलाड़ी बी किसी भी परिस्थिति में खिलाड़ी ए को β से अधिक जीतने की अनुमति नहीं देता है। गेम की निचली कीमत हमेशा गेम की ऊपरी कीमत से अधिक नहीं होती है α = अधिकतम न्यूनतम aij 6 मिनट अधिकतम aij = β i j j i प्रमेय 1 (मैट्रिक्स गेम के सिद्धांत का मुख्य प्रमेय)। प्रत्येक परिमित खेल में कम से कम एक समाधान होता है, शायद मिश्रित रणनीतियों के दायरे में। 6 2. सैडल पॉइंट वाले खेल। शुद्ध रणनीतियों में समाधान सैडल पॉइंट वाला गेम एक ऐसा गेम है जिसके लिए α = अधिकतम न्यूनतम aij = न्यूनतम अधिकतम aij = β i j j i सैडल पॉइंट वाले गेम के लिए, समाधान ढूंढने में मैक्सिमम और मिनिमैक्स रणनीतियों को चुनना शामिल है जो इष्टतम हैं। , गेम का शुद्ध मूल्य गेम की निचली और ऊपरी कीमतों का कुल मूल्य है α=β=ν 2.1। उदाहरण उदाहरण 1 मैट्रिक्स द्वारा दी गई खेल की शुद्ध रणनीतियों में समाधान खोजें   8 4 7 ए= 6 5 9  7 7 8 समाधान: खेल की ऊपरी और निचली कीमत निर्धारित करें। ऐसा करने के लिए, हम i-वीं पंक्ति में न्यूनतम संख्या aij पाते हैं αi = न्यूनतम aij j और j-वें कॉलम में अधिकतम संख्या aij पाते हैं βj = अधिकतम aij i हम संख्याएँ αi (न्यूनतम पंक्तियाँ) लिखते हैं एक अतिरिक्त कॉलम के रूप में दाईं ओर भुगतान मैट्रिक्स के बगल में। हम मैट्रिक्स के नीचे संख्याओं βi (कॉलम मैक्सिमा) को एक अतिरिक्त पंक्ति के रूप में लिखते हैं: αi 8 4 7 4 6 5 9 5 7 7 7 8 7 βj 8 7 9 7 संख्याओं की अधिकतम संख्या ज्ञात करें αi α = अधिकतम αi = 7 i और संख्याओं का न्यूनतम βj β = न्यूनतम βj = 7 j α = β - खेल में एक सैडल पॉइंट होता है। खिलाड़ी के लिए इष्टतम रणनीति रणनीति A3 है, और खिलाड़ी B के लिए - रणनीति B2, खेल की शुद्ध लागत ν = 7 उदाहरण 2 भुगतान मैट्रिक्स दिया गया है: 1 1 2   1 2 1 1 2 शुद्ध रणनीतियों में खेल का समाधान खोजें। समाधान: 2 2 1 1 2 1 0 1 1 1 1 0 1 1 1 1 1 2 1 1 2 1 1 2 1 βj 2 2 1 1 2 α = β = 1. गेम में छह सैडल पॉइंट हैं। इष्टतम रणनीतियाँ हैं: A1 और B3 या B4 A3 और B3 या B4 A4 और B3 या B4 8 3. मिश्रित रणनीतियों में खेल का समाधान α ̸= β के लिए। ऐसे मामले में, जब अपनी रणनीति चुनते समय, दोनों खिलाड़ियों को दूसरे की पसंद के बारे में जानकारी नहीं होती है, तो खेल में मिश्रित रणनीतियों में समाधान होता है। SA = (p1 , p2 , ..., pm) खिलाड़ी A की मिश्रित रणनीति है जिसमें रणनीतियों A1 , A2 , ..., Am को संभावनाओं ∑ m p1 , p2 , ..., pm , pi के साथ लागू किया जाता है = 1, pi > 0, i = 1, m i=1 SB = (q1 , q2 , ..., qn) खिलाड़ी B की एक मिश्रित रणनीति है जिसमें रणनीतियों B1 , B2 , ..., Bm को संभावनाओं के साथ लागू किया जाता है ∑ n q1 , q2 , ..., qm , qi = 1, qi > 0, i = 1, n i=1 = aij p∗i qi∗ j=1 i=1 2 × n, m × 2). यदि खिलाड़ियों में से कोई एक इष्टतम मिश्रित रणनीति का उपयोग करता है, तो उसका भुगतान खेल की कीमत ν के बराबर होता है, इस संभावना की परवाह किए बिना कि दूसरा खिलाड़ी इष्टतम रणनीति (शुद्ध रणनीतियों सहित) में शामिल रणनीतियों का उपयोग करेगा। 9 3.1. 2 × 2 गेम मैट्रिक्स के साथ 2 × 2 गेम पर विचार करें: () a11 a21 a21 a22 मान लीजिए कि गेम का शुद्ध रणनीतियों में कोई समाधान नहीं है। आइए इष्टतम रणनीतियाँ SA∗ और SB∗ खोजें। सबसे पहले, हम रणनीति SA∗ = (p∗1 , p∗2) को परिभाषित करते हैं। प्रमेय के अनुसार, यदि पार्टी ए रणनीति ν का पालन करती है, तो पार्टी बी की कार्रवाई की परवाह किए बिना, भुगतान खेल की कीमत के बराबर रहेगा। इसलिए, यदि पार्टी A इष्टतम रणनीति SA∗ = (p∗1 , p∗2) का पालन करती है, तो पार्टी B भुगतान में बदलाव किए बिना अपनी किसी भी रणनीति को लागू कर सकती है। फिर, जब खिलाड़ी B एक शुद्ध रणनीति B1 या B2 लागू करता है, तो खिलाड़ी को खेल की कीमत के बराबर औसत भुगतान प्राप्त होगा: a11 p∗1 + a21 p∗2 = ν ← रणनीति B1 के लिए ध्यान दें कि p∗1 + p ∗2 = 1: p∗1 = a2 2−a2 1 a11 +a22 −a12 −a21 p∗2 = a1 1−a1 2 a11 +a22 −a12 −a21 खेल मूल्य: a22 a11 − a12 a21 ν= a11 + a22 − a12 − a21 इसी प्रकार, खिलाड़ी B की इष्टतम रणनीति पाई जाती है: SB∗ = (q1∗ , q2∗). इस बात को ध्यान में रखते हुए कि q1∗ + q2∗ = 1: q1∗ = a2 2 - a1 2 a11 + a22 - a12 - a21 q2∗ = a1 1 - a2 1 a11 + a22 - a12 - a21 3.1.1। उदाहरण उदाहरण 3 मैट्रिक्स के साथ खेल का समाधान खोजें () −1 1 ए= 1 −1 10 समाधान: खेल में कोई सैडल पॉइंट नहीं है, क्योंकि α= -1, β = 1, α ̸= β। हम मिश्रित रणनीतियों में समाधान तलाश रहे हैं। p∗ और q * के सूत्रों का उपयोग करके हम p∗1 = p∗2 = 0.5 और q1∗ = q2∗ = 0.5, ν = 0 प्राप्त करते हैं। इस प्रकार, SA∗ = (0.5, 0.5) SB∗ = (0.5, 0.5) उदाहरण 4 मैट्रिक्स () 2 5 ए = 6 4 समाधान के साथ गेम का समाधान खोजें: गेम में कोई सैडल पॉइंट नहीं है, क्योंकि α = 4, β = 5, α ̸ = β। हम मिश्रित रणनीतियों में समाधान तलाश रहे हैं। p∗ और q 0.8) 11 3.1.2 के सूत्रों द्वारा। ज्यामितीय व्याख्या 2×2 गेम को एक सरल ज्यामितीय व्याख्या दी जा सकती है। आइए हम भुज अक्ष का एक इकाई खंड लें, जिसके प्रत्येक बिंदु पर हम कुछ मिश्रित रणनीति S = (p1, p2) = (p1, 1 - p1) p2, रणनीतियों A2 - बाएं छोर की दूरी को जोड़ते हैं। .y .I .I I .B1′ .N .B1 .a21 .a11 .I I .I .∗ .x .P2 .SA∗ .P1∗ अनुभाग का दायां छोर (x = 1) - रणनीति A2 अंत में अनुभाग के, एब्सिस्सा अक्ष के दो लंबवत बहाल किए जाते हैं: अक्ष I - I - भुगतान रणनीति A1 के साथ स्थगित कर दिया जाता है अक्ष II - II - भुगतान रणनीति A2 के साथ स्थगित कर दिया जाता है खिलाड़ी B को रणनीति B1 लागू करने दें; यह अक्षों I - I और II - II पर क्रमशः a11 और a21 कोटि वाले बिंदु देता है। हम इन बिंदुओं से होकर रेखा B1 - B1' खींचते हैं। किसी भी मिश्रित रणनीति SA = (p1, p2) के लिए, खिलाड़ी का भुगतान रेखा B1 - B1' पर बिंदु N द्वारा निर्धारित किया जाता है, जो कि x-अक्ष पर बिंदु SA के अनुरूप होता है जो खंड को p2: p1 के संबंध में विभाजित करता है। जाहिर है, सीधी रेखा B2 − B2′, जो रणनीति B2 के लिए भुगतान निर्धारित करती है, बिल्कुल उसी तरह से बनाई जा सकती है। 12 .y .I .I I .B2 .N .a21 .B2′ a . 22 .I I .I .∗ .x .P2 .SA∗ .P1∗ इष्टतम रणनीति SA∗ खोजना आवश्यक है, अर्थात, जैसे कि खिलाड़ी ए का न्यूनतम भुगतान (खिलाड़ी बी के सबसे खराब व्यवहार के साथ) अधिकतम में बदल जाएगा। इसके लिए, रणनीति B1, B2, यानी के लिए खिलाड़ी A के भुगतान पर निचली सीमा का निर्माण किया जाता है। टूटी हुई रेखा B1 N B2′ ;. इस सीमा पर खिलाड़ी A की किसी भी मिश्रित रणनीति के लिए न्यूनतम भुगतान, बिंदु N, स्थित होगा, जिस पर यह भुगतान अधिकतम तक पहुंचता है और खेल का समाधान और कीमत निर्धारित करता है। .y .I .I I .B2 .B1′ .N .B1 .B2′ .I I .I .∗ .x .P2 . ए∗ एस . 1∗ P बिंदु N की कोटि कुछ और नहीं बल्कि खेल ν का मान है, इसका भुज ∗2 के बराबर है, और खंड के दाहिने छोर की दूरी ∗1 के बराबर है, अर्थात। बिंदु SA∗ से खंड के अंत तक की दूरी खिलाड़ी A की इष्टतम मिश्रित रणनीति की रणनीतियों A2 और A1 की संभावनाओं ∗2 और ∗1 के बराबर है। इस मामले में, खेल का समाधान किसके द्वारा निर्धारित किया गया था? रणनीतियों B1 और B2 का प्रतिच्छेदन बिंदु। नीचे वह मामला दिखाया गया है जब खिलाड़ी की इष्टतम रणनीति शुद्ध रणनीति A2 है। यहां रणनीति A2 (प्रतिद्वंद्वी की किसी भी रणनीति के लिए) रणनीति A1 , 13 .y .y .I .I I .I I. I .B2′ से अधिक लाभदायक है। 1′ बी .बी1′ बी . 2 .बी2′ बी . 2 .B1 .v = a21 .B1 .v = a21 I. I I. I .I . .x .मैं . ।एक्स 2∗ पी . ए∗ एस = ए2 . 2∗ पी . A∗ S = A2 दाईं ओर उस मामले को दिखाया गया है जब खिलाड़ी B के पास जानबूझकर लाभहीन रणनीति है। ज्यामितीय व्याख्या से खेल α की कम कीमत और ऊपरी β .y .I .I I .B2 की कल्पना करना भी संभव हो जाता है। .B1′ .N .B1 . B2′ .β = a21 .α = a22 .I I .I .∗ .x .P2 . ए∗ एस . 1∗ P उसी ग्राफ़ पर, खिलाड़ी B की इष्टतम रणनीतियों की ज्यामितीय व्याख्या भी दी जा सकती है। यह देखना आसान है कि इष्टतम मिश्रित रणनीति SB∗ = (q1∗ , q2∗) की रणनीति B1 का हिस्सा q1∗ खंड KB2 की लंबाई और खंडों की लंबाई के योग के अनुपात के बराबर है। अक्ष I पर KB1 और KB2 - I: .y .I .I I .B2 . B1′ .N .K .L .B1 .B2′ .I I .I .∗ .x .P2 . ए∗ एस . 1∗ P 14 KB2 q1∗ = KB2 + KB1 या LB2′ q1∗ = LB2′ + LB1′ भुगतान की निचली सीमा की अधिकतम सीमा ऊपरी सीमा के न्यूनतम पर विचार करें। .य .मैं .मैं मैं .ए2 .ए′1 .एन .ए1 .ए′2 .मैं मैं .मैं . .x .q2∗ . B∗ S .q1∗ 15 3.2. 2 × n और m × 2 गेम 2 × n और m × 2 गेम का समाधान निम्नलिखित प्रमेय पर आधारित है। प्रमेय 3. किसी भी परिमित खेल m × n का एक समाधान होता है जिसमें प्रत्येक पक्ष की सक्रिय रणनीतियों की संख्या m और n में से सबसे छोटी से अधिक नहीं होती है। इस प्रमेय के अनुसार, 2 × n गेम में हमेशा एक समाधान होता है जिसमें प्रत्येक खिलाड़ी के पास अधिकतम दो सक्रिय रणनीतियाँ होती हैं। किसी को केवल इन रणनीतियों को ढूंढना है, और 2 × n गेम 2 × 2 गेम में बदल जाता है, जिसे प्राथमिक रूप से हल किया जाता है। सक्रिय रणनीतियों को ढूँढना ग्राफ़िक रूप से किया जा सकता है: 1) एक ग्राफ़िकल व्याख्या बनाई गई है; 2) लाभ की निचली सीमा निर्धारित की जाती है; 3) दूसरे खिलाड़ी की दो रणनीतियों को निचली अदायगी सीमा पर प्रतिष्ठित किया जाता है, जो दो रेखाओं के अनुरूप होती हैं जो अधिकतम कोटि वाले बिंदु पर प्रतिच्छेद करती हैं (यदि दो से अधिक रेखाएं इस पर प्रतिच्छेद करती हैं, तो कोई भी जोड़ी ली जाती है) - ये रणनीतियां सक्रिय हैं खिलाड़ी बी की रणनीतियाँ। इस प्रकार, 2 × एन गेम को 2 × 2 गेम में घटा दिया जाता है। एम × 2 गेम को भी हल किया जा सकता है, इस अंतर के साथ कि ऊपरी भुगतान सीमा का निर्माण नहीं किया जाता है, और अधिकतम नहीं, बल्कि इस पर न्यूनतम मांग की जाती है। उदाहरण 5 खेल का समाधान खोजें () 7 9 8 ए= 10 6 9 समाधान: ज्यामितीय विधि का उपयोग करके, हम सक्रिय रणनीतियों का चयन करते हैं। रेखाएँ B1 − B1′ , B2 − B2′ और B3 − B3′ रणनीतियों B1 , B2 , B3 के अनुरूप हैं। टूटी हुई रेखा B1 N B2 खिलाड़ी के भुगतान की निचली सीमा है। गेम का एक समाधान है S∗A = (23 , 31); एस∗बी = (0.5; 0.5; 0); v = 8.16 .y .I .I I . 1′ बी बी . 2 .B3′ .N .B3 .B1 .B2′ .I I .I . ।एक्स 2∗ पी . ए∗ एस . 1∗ पी 17 इंडेक्स गेम, 2 चाल, 3 2 × 2, 10 व्यक्तिगत, 3 2 × 2, 9 यादृच्छिक, 3 ज्यामिति, 12 शुद्ध गेम मूल्य, 7 उदाहरण, 10 2 × एन, 9, 16 मीटर × 2, 9 , 16 अनंत, 4 सामान्य रूप, 5 परिमित, 4 मल्टी-वे, 4 वन-वे, 4 मैट्रिक्स, 5 डबल, 2 शून्य-योग, 2 विरोधी, 2 गैर-विरोधी, 2 समाधान, 5 मिश्रित रणनीतियाँ, 5, 9 शुद्ध रणनीतियाँ। 5 खेल सिद्धांत, 2 18

श्रेणियाँ

लोकप्रिय लेख

2023 "kingad.ru" - मानव अंगों की अल्ट्रासाउंड जांच