Посчитаем математическое ожидание выигрыша первого игрока:
Определим и . Тогда
,
.
Сведение матричной игры к ЛП
Заметим, что . v v*=min Aj Aj Тогда
Нахождение v1 является задачей линейного программирования, т.к. ограничения и линейны относительно переменных v и pi. Кроме того, задачей ЛП, двойственной к предыдущей, является нахождение v2: Лемма 4: Матричная игра всегда имеет решение в смешанных стратегиях.
Т.к. значения функционалов в прямой и двойственной задачах ЛП совпадают, то в смешанных стратегиях v1=v2, Þ игра имеет решение по Нэшу.
Если pопт найдена (например, графоаналитическим методом), то qопт находят по теореме о доп. нежесткости: pi(Bi(q)-u2)=0, qj(Aj(p)-u1)=0.
Графоаналитический метод решения для игр 2´n и n´2
Пример: |
q1 |
q2 |
q3 |
min |
формула |
p1: 0 1 |
||
p1 |
3 |
-6 |
2 |
-6 |
A1(p)=3p1-1p2 A2(p)=-6p1+4p2 A3(p)=2p1-3p2 |
-1 4 -3 |
3 -6 2 |
|
p2 |
-1 |
4 |
-3 |
-3 |
||||
max |
3 |
4 |
2 |
v1 < v2 |
Из графика (шаг сетки =2) видно, что A1(p)>A3(p) (доминирование), максимум нижней огибающей лежит на пересечении прямых А2 и А3, т.е. -6p1+4p2=2p1-3p2 Þ 8p1=7p2. Но p1+p2=1 Þ pопт= (7/15, 8/15). Проверим:
A1(pопт) = 13/15 > -2/3 = A2(pопт) = A3(pопт) Þ нижняя огибающая в окрестности pопт в самом деле сформирована прямыми А2(p) и А3(p). Производная огибающей меняет в точке pопт знак с + на - : A3'(pопт) = 5, а A2'(pопт) = -10
Þ pопт является точкой max. Цена игры = A2(pопт) = – 2/3.
Для нахождения qопт графоаналитический метод неприменим: функции Bi(q) и их верхнюю огибающую сложно нарисовать (в равенстве q1+q2+q3=1 две переменные свободны). Воспользуемся ТДН: pi·[Bi(q) - v2] = 0 = qj·[Aj(p) - v1]. A1(pопт) > v1 Þ q1 = 0, но p1, p2 > 0 Þ -6q2 +2q3 = B1(q) = v2 = B2 (q) = 4q2 – 3q3.Þ
5q3 = 10 q2, но q2+q3 =1, Þ qопт = (0, 1/3, 2/3)
и v2 = B1(qопт) = – 2/3.
Замечание: Если матрица игры кососимметрична (т.е. квадратная и ƒij=-ƒji), то игроки равносильны и их оптимальные стратегии совпадают.
J !!! При решении игр размера 2´n алгоритмом Меджидо не нужно предварительно удалять доминируемые строки и столбцы (это требует O(n2) операций, а они удаляются алгоритмом автоматически), I–=Æ для p, I+= Æ для q, интервал [u1,u2] = [0,1] сразу.
Пример М3. v1¹v2 Þ Решаем в смешанных стратегиях.
Пример: |
Y1 |
Y2 |
Y3 |
Y4 |
min |
X1 |
7 |
3 |
6 |
5 |
3 |
X2 |
2 |
4 |
8 |
3 |
2 |
X3 |
4 |
1 |
5 |
4 |
1 |
max |
7 |
4 |
8 |
5 |
Доминирование: X1 > X3 Þ отбрасываем X3,
Y¢3 > Y¢2 Þ отбрасываем Y¢3 (больший проигрыш хуже)
A1(p)=7p1+2p2 , Из графика получаем A4= A2,
A2(p)=3p1+4p2, 5p1+3p2=3p1+4p2 2p1=p2 , p1+p2 = 1 Þ
A4(p)=5p1+3p2. p1= 1/3 , p2= 2/3.
v=A4(p)=5p1+3p2= 5+6=11/3. A1(p)=7p1+2p2 = v.
Þ Все прямые пересекаются в одной точке. Ищем q опт по ТДН: p1, p2>0 Þ B1(q)=v=B2(q) Þ7q1+3q2+5q4=2q1+4q2+3q4 q1+q2+q4 =1 q2 =5q1 +2q4 Þ 6q1 +3q4 = 1 2q1 + q4 = 1/3 . q4 = 1/3 - 2q1 , q2=5q1 +2(1/3-2q1) = 2/3+q1.
qопт= (q1 , 2/3+q1 , 0, 1/3-2q1) ³ 0 Û q1 Î [0, 1/6]
Пример М4: Проверим, можно ли отбросить Y1 (т.е. q1 =0). Остается игра 2 ´ 3:
Y1 |
Y2 |
Y3 |
Bi (q) |
|
X1 |
3 |
5 |
7 |
B1=5q2+7q3 |
X2 |
2 |
4 |
8 |
B2=4q2+8q3 |
X3 |
1 |
6 |
2 |
B3=6q2+2q3. |
X4 |
8 |
2 |
1 |
B4=2q2+q3. |
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.