Основные положения теории принятия решений. Принятие решений в условиях неопределенности природы. Принятие решения при неопределенности целей. Принятие решений в условиях конфликта, страница 28

Как же найти смешанные стратегии игроков?

Если хотя бы у одного игрока число стратегий не превышает двух, то такие игры могут быть решены аналитически.

4.5 Решение игр 2х2

Пусть матрица игры, или платежная матрица А=, и пусть в игре нет седловой точки (иначе она бы решалась очень просто). Тогда решение игры будем искать в смешанных стратегиях: P=(p1,p2) -  для первого игрока и Q=(q1,q2) – для второго. Это значит, что первый игрок будет применять свою первую стратегию х1 с вероятностью р1, а свою вторую стратегию х2 – с вероятностью р2, причем р12=1. Аналогично для второго игрока. Решим эту игру в общем виде с точки зрения второго игрока. Перепишем матрицу игры в следующем виде:

q1

q2

p1

a11

a12

p2

a21

a22

Найдем средний проигрыш второго игрока:

а11×q1+a12×q2=n - при первой стратегии первого игрока,

а21×q1+a22×q2=n, - при второй стратегии первого игрока,-

и решим эту систему, вычитая второе уравнение из первого:

1121)×q1+(a1222)×q2=0,    затем, учитывая, что q2=1-q1,   получим

11211222)×q1+(a1222)=0. 

Отсюда q1=(a2212)/(а11211222). Подставляя это значение q1 в любое из уравнений, получим значение цены игры n.

С точки зрения первого игрока игра решается аналогично, только вычисляется уже средний выигрыш первого игрока:

а11×p1+a21×p2=n - при первой стратегии второго игрока, а12×p1+a22×p2=n,- при второй стратегии второго игрока.

Дальше решаем систему уравнений любым способом.

Вернемся к примеру 2. Матрица игры А=. Составим систему уравнений для второго игрока:

6q1+2q2=n

4q1+8q2=n, - решая совместно, получим  2q1-6(1-q1)=0, или 8q1=6, или q1=3/4.  Отсюда  Q=(3/4,1/4). Цена игры n=6×3/4+2×1/4=5Î[4,6]. Найдем оптимальную стратегию первого игрока. Поскольку цена игры уже известна, то достаточно написать только одно уравнение для среднего выигрыша первого игрока:

6p1+4p2=5, p2=1-p1, после подстановки получим 2p1+4=5, откуда р1=1/2. Следовательно, Р=(1/2,1/2).

Ответ: P=(1/2,1/2), Q=(3/4,1/4), n=5.

Систему уравнений, описывающих средний выигрыш первого игрока или средний проигрыш второго, можно решить также методом Крамера.

В примере 2 матрица А=, ее определитель ½А½=6×8-4×2=40. Тогда q1=, q2==. Поскольку q1+q2=1, то из 8n/40=1 следует n=5, а значит Q={3/4;1/4}. Вероятности P можно найти аналогично, но из транспонированной матрицы А*=, тогда p1==4n/40=1/2, учитывая, что цена игры уже определена (n=5), т.е. P={1/2;1/2}. 

4.6 Решение игр 2´n и m´2

Игры, где хотя бы у одного игрока две стратегии, можно решить аналитически. Если второй игрок имеет больше двух стратегий, то игра решается графо-аналитическим способом.

Рассмотрим игру 2´n: у первого игрока 2 стратегии, у второго игрока - n стратегий. Если в игре нет седловой точки, то будем искать решение игры в смешанных стратегиях. Решаем игру с точки зрения того игрока, у которого две стратегии.

Пусть Р=(р1, р2) – смешанная стратегия 1-го игрока, p1+p2=1;

Q= (q1, q2, ¼, qn) – смешанная стратегия  2-го игрока.

Матрица игры   . Рассмотрим средний выигрыш первого игрока (у него две стратегии):

n1 = a11 p1+a21 p2= a21+(a11-a21)p- при первой стратегии II игрока,

n2 = a12 p1+a22 p2=a22+(a12-a22)p1  -  при второй стратегии II игрока и т.д.

Гарантированный результат первого игрока    n = max min{a2j+(a1j a2j)p1}.

Линейные функции n1, n2,…,nn   отражают зависимость среднего выигрыша первого игрока от вероятности применения им своей первой стратегии при различных стратегиях второго игрока. Поэтому для анализа ситуации необходимо изобразить их графически в осях nI – p1, имея в виду, что областью определения функций n1, n2,…,nn   является интервал [0,1].

Чтобы обеспечить себе гарантированный результат, первый игрок должен выделить нижнюю границу среднего выигрыша при любой стратегии второго игрока. А затем найти максимальное значение среднего результата на этой границе. Соответствующая абсцисса равна вероятности применения первым игроком его первой стратегии, а ордината равна цене игры.