Метод фиктивных розыгрышей.
Предположим, что игроки уже сыграли N раз, причем игрок x kix раз выбрал свою i-ю стратегию, а игрок y kjy раз выбрал свою j-ю стратегию. å kix=å kjy=N.
Как играть в N+1 раз? В этой ситуации игрок x считает, что y играет по смешанной стратегии q=(k1y/N, k2y/N,…, kmy/N). Тогда математическое ожидание выигрыша 1-ого игрока при условии, что он выберет стратегию i, равно
. Поэтому игрок x выберет свою чистую стратегию . Аналогично, игрок y выберет свою чистую стратегию .
| 
   Пример:  | 
  
   Y1  | 
  
   Y2  | 
  
   Y3  | 
  
   min  | 
  
   Начиная с максиминных стратегий x1 и y2, повторяем в цикле: , [N+1]*Aj(p) = N*Aj(p) + f i*j , [N+1]*Bi(q) = N*Bi(q) + f i*j  | 
 
| 
   X1  | 
  
   3  | 
  
   5  | 
  
   7  | 
  
   3  | 
 |
| 
   X2  | 
  
   2  | 
  
   4  | 
  
   8  | 
  
   2  | 
 |
| 
   X3  | 
  
   1  | 
  
   6  | 
  
   2  | 
  
   1  | 
 |
| 
   X4  | 
  
   8  | 
  
   2  | 
  
   1  | 
  
   1  | 
 |
| 
   max  | 
  
   8  | 
  
   6  | 
  
   8  | 
  
Добавляем в текущие суммы таблицы строку I* и столбец j* матрицы fij.
| 
   NA1(p)  | 
  
   NA2(p)  | 
  
   NA3(p)  | 
  
   Xi*  | 
  
   Yj*  | 
  
   NB1(q)  | 
  
   NB2(q)  | 
  
   NB3(q)  | 
  
   NB4(q)  | 
 
| 
   3 Þy1  | 
  
   5  | 
  
   7  | 
  
   X1  | 
  
   Y2  | 
  
   5  | 
  
   4  | 
  
   6 Þx3  | 
  
   2  | 
 
| 
   +1 =4Þy1  | 
  
   +6 =11  | 
  
   +2 =9  | 
  
   X3  | 
  
   Y1  | 
  
   +3 =8  | 
  
   +2 =6  | 
  
   +1 =7  | 
  
   +8 =10Þx4  | 
 
| 
   +8 =12  | 
  
   +2 =13  | 
  
   +1 =10Þy3  | 
  
   X4  | 
  
   Y1  | 
  
   +3 =11  | 
  
   +2 =8  | 
  
   +1 =8  | 
  
   +8 =18Þx4  | 
 
| 
   +8 =20  | 
  
   +2 =15  | 
  
   +1 =11Þy3  | 
  
   X4  | 
  
   Y3  | 
  
   +7 =18  | 
  
   +8 =16  | 
  
   +2 =10  | 
  
   +1 =19Þx4  | 
 
| 
   +8 =28  | 
  
   +2 =17  | 
  
   +1 =12Þy3  | 
  
   X4  | 
  
   Y3  | 
  
   +7 =25Þx1  | 
  
   +8 =24  | 
  
   +2 =12  | 
  
   +1 =20  | 
 
| 
   +3 =31  | 
  
   +5 =22  | 
  
   +7 =19Þy3  | 
  
   X1  | 
  
   Y3  | 
  
   +7 =32Þx1  | 
  
   +8 =32  | 
  
   +2 =14  | 
  
   +1 =21  | 
 
| 
   +3 =34  | 
  
   +5 =27  | 
  
   +7 =26Þy3  | 
  
   X1  | 
  
   Y3  | 
  
   +7 =39  | 
  
   +8 =40Þx2  | 
  
   +2 =16  | 
  
   +1 =22  | 
 
| 
   +2 =36  | 
  
   +4 31Þy2  | 
  
   +8 =34  | 
  
   X2  | 
  
   Y3  | 
  
   +7 =46  | 
  
   +8 =48Þx2  | 
  
   +2 =18  | 
  
   +1 =23  | 
 
| 
   X2  | 
  
   Y2  | 
  
Посчитаем кратности и относительные частоты стратегий игроков за 9 шагов:
ky =(2, 2, 5) ; kx =(3, 2, 1, 3).Þ p9опт=(3/9, 2/9, 1/9, 3/9), q9опт=(2/9, 2/9, 5/9).
Теорема (Робинсона-Монро) о методе фиктивных розыгрышей:
1) Если рассмотреть последовательности частотных векторов : pN={pNi}={ kix/N }, qN={qNj}={ kjy/N }, то все предельные точки этих последовательностей являются оптимальными стратегиями: pN®p*, qN®q*.
u(pN)-u(qN)®0, где u(pN)-оптимальный выигрыш второго игрока при условии,
что первый играет по стратегии pN, u(qN)-
оптимальный выигрыш первого игрока при условии, что второй играет по стратегии qN.
1,56,3,54,5,52,7,50,9,48,11,46,13,44,15,42,17,40,19,38,21,36,23,34,25,32,27,30
2,55,4,53,6,51,8,49,10,47,12,45,14,43,16,41,18,39,20,37,22,35,24,33,26,31,28,29
1,52,3,50,5,48,7,46,9,44,11,42,13,40,15,38,17,36,19,34,21,32,23,30,25,28
2,51,4,49,6,47,8,45,10,43,12,41,14,39,16,37,18,35,20,33,22,31,24,29,26,27
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.