Теория игр и исследование операций. Модели, алгоритмы, сложность: Конспект лекций, страница 17


Посчитаем математическое ожидание выигрыша первого игрока:

Определим  и . Тогда

,

.

Сведение матричной игры к ЛП

Заметим, что .       v   v*=min Aj    Aj                     Тогда

Нахождение v1 является задачей линейного программирования, т.к. ограничения и  линейны относительно переменных  v и pi. Кроме того, задачей ЛП, двойственной к предыдущей, является нахождение v2: Лемма 4: Матричная игра всегда имеет решение в смешанных стратегиях.

Т.к. значения функционалов в прямой и двойственной задачах ЛП совпадают, то в смешанных стратегиях v1=v2, Þ игра имеет решение по Нэшу.

Если pопт найдена (например, графоаналитическим методом), то qопт находят по теореме о доп. нежесткости: pi(Bi(q)-u2)=0, qj(Aj(p)-u1)=0.

Графоаналитический метод решения для  игр 2´n и n´2

Пример:

q1

q2

q3

min

формула

p1: 0   1

p1

3

-6

2

-6

A1(p)=3p1-1p2

A2(p)=-6p1+4p2

A3(p)=2p1-3p2

-1

4

-3

3

-6

2

p2

-1

4

-3

-3

max

3

4

2

v1 < v2

Из графика (шаг сетки =2) видно, что A1(p)>A3(p) (доминирование), максимум нижней огибающей лежит на пересечении прямых А2 и А3, т.е. -6p1+4p2=2p1-3p2 Þ 8p1=7p2.      Но p1+p2=1 Þ pопт= (7/15, 8/15).   Проверим:

A1(pопт) = 13/15 > -2/3 = A2(pопт) = A3(pопт) Þ нижняя огибающая в окрестности pопт в самом деле сформирована прямыми А2(p) и А3(p). Производная огибающей меняет в точке  pопт знак с + на - :  A3'(pопт) = 5, а A2'(pопт) = -10

Þ pопт является точкой max. Цена игры  = A2(pопт) = – 2/3.

Для нахождения qопт графоаналитический метод неприменим: функции Bi(q) и их верхнюю огибающую сложно нарисовать (в равенстве q1+q2+q3=1 две переменные свободны). Воспользуемся ТДН: pi·[Bi(q) - v2] = 0 = qj·[Aj(p) - v1]. A1(pопт) > v1 Þ q1 = 0, но p1, p2 > 0 Þ -6q2 +2q3 = B1(q) = v2 = B2 (q) = 4q2 – 3q3
5q3 = 10 q2, но q2+q3 =1, Þ  qопт = (0, 1/3, 2/3) и v2 = B1(qопт) = – 2/3.

Замечание: Если матрица игры кососимметрична (т.е. квадратная и ƒij=-ƒji), то игроки равносильны и их оптимальные стратегии совпадают.

J !!!   При решении игр размера 2´n алгоритмом Меджидо не нужно предварительно удалять доминируемые строки и столбцы (это требует O(n2) операций, а они удаляются алгоритмом автоматически),  I=Æ для p,  I+= Æ для q, интервал [u1,u2] = [0,1]  сразу.

Пример М3. v1¹v2 Þ Решаем в смешанных стратегиях.

Пример:

Y1

Y2

Y3

Y4

min

X1

7

3

6

5

3

X2

2

4

8

3

2

X3

4

1

5

4

1

max

7

4

8

5

Доминирование: X1 > X3 Þ отбрасываем X3,

3 > Y¢2 Þ отбрасываем Y¢3 (больший проигрыш хуже)

A1(p)=7p1+2p2 ,   Из графика получаем A4= A2,

A2(p)=3p1+4p2,     5p1+3p2=3p1+4p2    2p1=p2 ,     p1+p2 = 1 Þ

A4(p)=5p1+3p2.     p1= 1/3 p2= 2/3.

v=A4(p)=5p1+3p2= 5+6=11/3. A1(p)=7p1+2p2 = v.

Þ Все прямые пересекаются в одной точке.   Ищем q опт по ТДН: p1, p2>0 Þ B1(q)=v=B2(q) Þ7q1+3q2+5q4=2q1+4q2+3q4    q1+q2+q4 =1   q2 =5q1 +2q4 Þ 6q1 +3q4 = 1   2q1 + q4 = 1/3 . q4 = 1/3 - 2q1 , q2=5q1 +2(1/3-2q1) = 2/3+q1.

  qопт= (q1 , 2/3+q1 , 0, 1/3-2q1) ³ 0  Û q1 Î [0, 1/6]

Пример М4: Проверим, можно ли отбросить  Y1 (т.е. q1 =0). Остается игра 2 ´ 3:


Y1

Y2

Y3

Bi (q)

X1

3

5

7

B1=5q2+7q3

X2

2

4

8

B2=4q2+8q3

X3

1

6

2

B3=6q2+2q3.

X4

8

2

1

B4=2q2+q3.