Теория игр и исследование операций. Модели, алгоритмы, сложность: Конспект лекций, страница 16

xопт=argmax{minfx(xi,yj)} = x2                yопт=argmax{minfy(xi,yj)} = y1

xi     yj                                                    yj     xi

2)  оптимальны по Парето только совокупные стратегии {( x2 ,y2), (x3 ,y1)}: в правом верхнем квадранте от них нет других точек.

Точки с максимальными координатами fx и fy всегда оптимальны по Парето.

3)  Нэш. Рассмотрим условные оптимумы:

xопт(y) = argmaxx fx(x,y),  yопт(x) = argmax y fy(x,y). Представим эти функции в виде двудольного орграфа. Оптимуму по Нэшу соответствует неориентированное ребро.

Таких может не быть. У нас – это ребра {( x1 ,y1), (x2 ,y2)} .

Заметим, что оптимумы по Нэшу и по Парето не совпали.

Def: Игра-антагонистическая, если увеличение выигрыша одного из игроков ведет к уменьшению выигрыша другого (интересы противоречивы). Если fx(x,y)+fy(x,y)=const, то игра – с постоянной суммой (в т.ч. с нулевой).

Лемма 1: Пусть "x [ f1(x) £ f2(x) ],  x1=arg max f1, x2=arg min f2.

Þ max f1 (x)= f1 (x1 f2 (x1)£ max f2 (x),   min f1 (x f1 (x2 f2 (x2)= min f2 (x).

Лемма 2: Пусть f1 (x) + f2 (x)=0, т.е. f2 (x) = -f1 (x) "x.

Þ max f2 (x)=max {-f1 (x)}=-min f1  Þ arg max f2=arg min f1.

№13. Матричные игры.

Игра двух лиц с конечными множествами стратегий и нулевой суммой, когда f1+f2=0, задается одной матрицей. Пусть Z* - множество всех совокупных стратегий, оптимальных по Нэшу; Zопт – множество оптимумов по максимину.

1.  Оптимальными по Парето являются все совокупные стратегии.

2.  Zопт¹Æ, т.е оптимум по максимину существует всегда.

3.  Z*¹Æ Û Zопт.= Z*, т.е. оптимум по Нэшу может не существовать, но если он существует, то совпадает с оптимумом по максимину.

Лемма 3: Пусть ,         Þ v1 v2  " f.

Доказательство: Имеем  и по лемме 1 Þ

ÞÑ

Числа v1 и v2 называются нижним и верхним значениями игры.

Теорема: Утверждения Z*¹Æ, v1=v2 и Z* = Zопт эквивалентны, т.е. матричная игра имеет решение по Нэшу тогда и только тогда, когда v1=v2. При этом оптимумы по максимину и по Нэшу совпадают.

Доказательство. 1) Пусть (x*,y*) Î Z*, т.е. Þ т.е. v2<v1. Но по лемме 3  v1<v2 , Þ v2 = v1 и все неравенства суть равенства Þ и , т.е. Z* ÌZопт.

2) Пусть v1=v2 и ,  . Тогда, т.е.  для всех xиy. Полагая сначала x= xопт , а потом y=yопт, получим  ÞZоптÌZ*, т.е. любое решение по максимину оптимально по Нэшу Þ Z*¹Æ.Ñ

5

4

3

3

6

1

2

1

0

5

1

0

6

5

3

Оптимум по Нэшу оптимален по всем критериям рационального поведения и называется решением игры в чистых стратегиях. Условием его существования является равенство v1=v2=v, а само число v называют значением игры.

y1

y2

y3

miny

x1

3

-6

2

-6

x2

-1

4

-3

-3

maxx

3

4

2

Пример1:v1 = v2 = v=3. Решение игры - xопт=x1,yопт=y3. Кстати, цикл  x2 Þ y2 Þ x3 Þ y1 Þ x2,  но x1 Û y3. p=(0,1/2,1/2), q=(2/5,3/5,0)?

Пример2: xопт=x2, yопт=y3 , v1 = -3 ≠ 2= v2.

Þ решения в чистых стратегиях нет, его нужно искать в смешанных стратегиях.

Доминирование: y1>y3 Þ y1 можно отбросить!!

Игра в смешанных стратегиях.

Пусть {fij} - матрица игры размера n´m, т.е. fij=f(xi,yj) – выигрыш игрока

x, если он играет по стратегии xi, а его соперник - по стратегии yj. Смешанными стратегиями игроков назовем векторы p и q, задающие распределение вероятностей на множествах чистых стратегий игроков, т.е. pi, qi³0, åpiqi=1. Разобьем интервал [0,1] на n отрезков с длинами p1,…,pn и датчиком равномерного распределения разыграем точку. Попадание в i-ый отрезок ~ выбору стратегии xi. Þ Стратегия xi выбирается с вероятностью pi, а стратегия yj - с вероятностью qj. Предположим, что соперники выбирают стратегии независимо друг от друга.