Ігри двох осіб з довільною сумою, страница 4

          За означенням (3.4), якщо гравець А застосує чисту стратегію А1 або А2 то його виграш не перевершить середнього виграшу. Одержимо нерівності:

3q ≤ 3pq+1(1-p)(1-q),  1(1-q) ≤ 3pq+1(1-p)(1-q), або провівши перетворення одержимо

      (3.5)

З системи нерівностей (3.5) одержимо, що якщо р=1, то q≥1/4; якщо р=0, то q≤1/4; якщо 0 < р<1, то q=1/4.

          Аналогічно, провівши такі ж самі міркування для гравця В, одержимо систему нерівностей

       (3.6),

з якої слідує, що якщо q=1, то p≥3/4; якщо q=0, то p≤3/4; якщо

0 < q<1, то p=3/4. Геометрична ілюстрація одержаного результату представлена на рис. 3.1.

Рисунок 3.1. Геометричне представлення рішення.

Одержимо, що гра має три точки РН. Дві з них співпадають з тими, що одержали раніше в чистих стратегіях, РН(А11) з виграшами: К1=1, К2=3; РН(А2, В2) з виграшами : К1=3, К2=1 та знайшлась ще одна рівновага в змішаних стратегіях - РН(3/4,1/4) з виграшами : ЕА=3/4, ЕВ=3/4.

          В одержаних результатах більше питань, чім відповідей. По-перше, РН в чистих стратегіях передбачають узгодженість дій, або поступливість з боку одного з гравців, а при відсутності того і іншого одночасно, ми прийдемо до неоднозначності вибору, що може спричинити до появи ситуацій гри, несприятливим обом гравцям. По-друге, РН в змішаних стратегіях з позицій здобуття гравцями в грі виграшу, як можливо більшого, програє не тільки рівновазі в чистих стратегіях ( порівняйте виграші між собою), а й навіть такому очевидному рішенню гравців з позицій здорового глузду грати з p=q=1/2(тобто при виборі піти на футбол чи оперу кожен з гравців підкидає монетку), яка принесе гравцям виграші ЕА = ЕВ =1. По-третє, якщо гравці зійдуться разом розв’язати проблему куди їм піти і знову будуть це вирішувати за монетою ( проведуть кооперацію своїх дій), тобто герб – сімейство іде на футбол, цифра – балет, виграш збільшиться до  ЕА = ЕВ =2. Але тут же зауважимо, що таке рішення для некооперативних ігор неможливе, бо воно лежить за зоною допустимих рішень ( за межами області ОАВ,  рис. 3.2).

Рисунок 3.2. Відображення області допустимих рішень (p,q) на область виграшів .

3.2.2 Рівновага Парето

            Зауваження. Загалом кажучи, оптимум за Парето – це об’єкт дослідження кооперативної теорії ігор, яка розглядає коаліції гравців та їх виграші. Але для двох гравців оптимум за Парето може бути віднесений до некооперативної теорії ігор.

Користуючись означенням, приведеним в п.1.5 (рівновага Парето (РП) –це така ситуація в грі, з якої не можливо вийти жодному гравцеві з метою збільшити свій виграш, не зменшуючи при цьому виграші інших учасників гри), опишемо знаходження РП для біматричних ігор. Відмінність РП від РН полягає в тому, що при РН жоден з гравців, діючи наодинці, не зможе збільшити свого виграшу. На  відміну від алгоритмів пошуку іншого виду рівноваги, алгоритму знаходження РП, взагалі кажучи, не існує. Можна рекомендувати лише деякі загальні правила, але всі вони, насправді, зводяться до «методу перебору».

          Алгоритм пошуку РП в чистих стратегіях.

Ø Вибираємо певний подвійний елемент матриці (3.1), що задає виграші гравців, і, перебираючи всі інші елементи, порівнюємо значення виграшів гравців між собою. Якщо серед них знайдеться такий, коли обидва гравців поліпшують свої виграші в порівнянні з вибраним, то переходимо до іншого елементу, бо за означенням РП не відбулося. І таким чином перебираємо всі елементи матриці (3.1).

Ø Якщо в матриці (3.1) знайдеться такий подвійний елемент, що у всіх інших поліпшення (збільшення!) виграшу одного із гравців можливе лише тільки за умови погіршення (зменшення!) виграшу іншого гравця,  то ми знайшли стратегії, які задають оптимум Парето. 

? Приклад 3.5. Знайти РП в грі

К

Л

М

А

2,3

-4,-1

-5,4

Б

-1,-3

0,-2

1,-4

В

3,2

-2,-1

-3,1