xопт=argmax{minfx(xi,yj)} = x2 yопт=argmax{minfy(xi,yj)} = y1
xi yj yj xi
2) оптимальны по Парето только совокупные стратегии {( x2 ,y2), (x3 ,y1)}: в правом верхнем квадранте от них нет других точек.
Точки с максимальными координатами fx и fy всегда оптимальны по Парето.
3) Нэш. Рассмотрим условные оптимумы:
xопт(y) = argmaxx fx(x,y), yопт(x) = argmax y fy(x,y). Представим эти функции в виде двудольного орграфа. Оптимуму по Нэшу соответствует неориентированное ребро.
Таких может не быть. У нас – это ребра {( x1 ,y1), (x2 ,y2)} .
Заметим, что оптимумы по Нэшу и по Парето не совпали.
Def: Игра-антагонистическая, если увеличение выигрыша одного из игроков ведет к уменьшению выигрыша другого (интересы противоречивы). Если fx(x,y)+fy(x,y)=const, то игра – с постоянной суммой (в т.ч. с нулевой).
Лемма 1: Пусть "x [ f1(x) £ f2(x) ], x1=arg max f1, x2=arg min f2.
Þ max f1 (x)= f1 (x1)£ f2 (x1)£ max f2 (x), min f1 (x)£ f1 (x2)£ f2 (x2)= min f2 (x).
Лемма 2: Пусть f1 (x) + f2 (x)=0, т.е. f2 (x) = -f1 (x) "x.
Þ max f2 (x)=max {-f1 (x)}=-min f1 Þ arg max f2=arg min f1.
№13. Матричные игры.
Игра двух лиц с конечными множествами стратегий и нулевой суммой, когда f1+f2=0, задается одной матрицей. Пусть Z* - множество всех совокупных стратегий, оптимальных по Нэшу; Zопт – множество оптимумов по максимину.
1. Оптимальными по Парето являются все совокупные стратегии.
2. Zопт¹Æ, т.е оптимум по максимину существует всегда.
3. Z*¹Æ Û Zопт.= Z*, т.е. оптимум по Нэшу может не существовать, но если он существует, то совпадает с оптимумом по максимину.
Лемма 3: Пусть , Þ v1 ≤ v2 " f.
Доказательство: Имеем и по лемме 1 Þ
ÞÑ
Числа v1 и v2 называются нижним и верхним значениями игры.
Теорема: Утверждения Z*¹Æ, v1=v2 и Z* = Zопт эквивалентны, т.е. матричная игра имеет решение по Нэшу тогда и только тогда, когда v1=v2. При этом оптимумы по максимину и по Нэшу совпадают.
Доказательство. 1) Пусть (x*,y*) Î Z*, т.е. Þ т.е. v2<v1. Но по лемме 3 v1<v2 , Þ v2 = v1 и все неравенства суть равенства Þ и , т.е. Z* ÌZопт.
2) Пусть v1=v2 и , . Тогда, т.е. для всех xиy. Полагая сначала x= xопт , а потом y=yопт, получим ÞZоптÌZ*, т.е. любое решение по максимину оптимально по Нэшу Þ Z*¹Æ.Ñ
5 |
4 |
3 |
3 |
6 |
1 |
2 |
1 |
0 |
5 |
1 |
0 |
6 |
5 |
3 |
Оптимум по Нэшу оптимален по всем критериям рационального поведения и называется решением игры в чистых стратегиях. Условием его существования является равенство v1=v2=v, а само число v называют значением игры.
y1 |
y2 |
y3 |
miny |
|
x1 |
3 |
-6 |
2 |
-6 |
x2 |
-1 |
4 |
-3 |
-3 |
maxx |
3 |
4 |
2 |
Пример1:v1 = v2 = v=3. Решение игры - xопт=x1,yопт=y3. Кстати, цикл x2 Þ y2 Þ x3 Þ y1 Þ x2, но x1 Û y3. p=(0,1/2,1/2), q=(2/5,3/5,0)?
Пример2: xопт=x2, yопт=y3 , v1 = -3 ≠ 2= v2.
Þ решения в чистых стратегиях нет, его нужно искать в смешанных стратегиях.
Доминирование: y1>y3 Þ y1 можно отбросить!!
Игра в смешанных стратегиях.
Пусть {fij} - матрица игры размера n´m, т.е. fij=f(xi,yj) – выигрыш игрока
x, если он играет по стратегии xi, а его соперник - по стратегии yj. Смешанными стратегиями игроков назовем векторы p и q, задающие распределение вероятностей на множествах чистых стратегий игроков, т.е. pi, qi³0, åpi=åqi=1. Разобьем интервал [0,1] на n отрезков с длинами p1,…,pn и датчиком равномерного распределения разыграем точку. Попадание в i-ый отрезок ~ выбору стратегии xi. Þ Стратегия xi выбирается с вероятностью pi, а стратегия yj - с вероятностью qj. Предположим, что соперники выбирают стратегии независимо друг от друга.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.