Определим ход решения (нахождение оптимальной стратегии) для участников А и В. Для А наилучшая стратегия обуславливается достижимым, гарантированным результатом, т. е. пусть А выбирает стратегию поведения SiА максимизирующую ее выигрыш, тогда сторона В дает для А . Таким образом, стратегия для А, обеспечивающая гарантированный результат, – максиминная стратегия: Величина a называется нижней ценой игры или максиминным выигрышем. Для В ситуация противоположная, сторона В должна обеспечить максимальный проигрыш А. Поскольку ПВ = – ПА = – а, то Величина b – минимаксный проигрыш, верхняя цена игры. Поскольку модель дуальна (симметрична), то используется общепринятое название «минимаксная стратегия».
Каждая из сторон ориентирована на худшую с ее точки зрения ситуацию. Простейшим, но редко встречающимся случаем является случай – это равенство означает, что в игровой матрице присутствует элемент apq, который одновременно оказывается минимальным в p – строке и максимальным q-столбце (седловая точка) – их может быть несколько. Такая ситуация называется ситуацией равновесия, т. е. положением, при котором ни одна из сторон не изменяет своей стратегии. Величина apq называется чистой ценой игры, а стратегии – чистыми стратегиями. Применять чистые стратегии имеет смысл только тогда, когда А и В располагают сведениями друг о друге. Отсюда различие – игры с полной информацией и игры с неполной информацией. Для практических задач распространенным является случай. Кроме этого, в условиях непредсказуемости хода противника каждому выбору определенной стратегии Six соответствует некоторая pix, причем. Произвольно взятое распределение называется смешанной стратегией. При выборе стратегий поведения сторон пользуются усреднением, т. е. принцип минимакса сохраняется и в этом случае:
, (9.2)
(9.3)
(9.4)
Теорема об активных стратегиях говорит, что если один из участников игры придерживается своей оптимальной стратегии, то ожидаемый выигрыш остается неизменным и равным независимо от характера действий другого участника в пределах его активных стратегий.
Рассмотрим пример антагонистической игры (2‰2) с заданными коэффициентами аij, и пусть игра не имеет седловой точки. Требуется найти решение, т. е определить .
Согласно теореме об активных стратегиях неизвестные значения могут быть получены из следующих соотно-шений:
(9.5)
Рассмотрим более общий случай игры . При этом применима стратегия против какой либо и стратегия против . Тогда справедливы формулы
(9.6)
Введем в рассмотрение функции
(9.7)
Тогда получаем
(9.8)
где обозначено
Стремление стороны А максимизировать свой выигрыш равносильно требованию минимизации . Вторая сторона конфликта В преследует противоположную цель – достичь максимума , т. е. минимизировать . Задачу (9.8) можно решить с помощью линейного программирования. Постановка задачи линейного программирования в этом случае выглядит так:
· найти , при ограничениях ,
· найти , при ограничениях .
Литература
1. Дегтярев Ю. И. Исследование операций. – М.: Высш. шк., 1986. – 320 с.
2. Волков И. К., Загоруйко Е. А. Исследование операций: Учебник для вузов / Под ред. В. С. Зарубина, А. П. Крищенко. – М.: Изд-во МГТУ им. Н. Э. Баумана, 2000. – 436 с. (Сер. Математика в техническом университете, Вып. ХХ).
3. Исследование операций: В 2-х т.; Под. ред. Дж. Моудера, С. Элмаграби. – М.: Мир,1981. – Т. 1. – 712 с.
4. Кини Р. Л., Райфа Х. Принятие решений при многих критериях: предпочтения и замещения / Под. ред. И. Ф. Шахнова. – М.: Радио и связь,1981. – 560 с.
5. Матвеев Л. А. Компьютерная поддержка решений: Учебник. – СПб.: Специальная литература, 1998. – 472 с.
6. Мину М. Математическое программирование. Теория и алгоритмы. – М.: Наука, 1990. – 488 с.
7. Подиновский В. В., Ногин В. Д. Парето – оптимальные решения многокритериальных задач. – М.: Наука, 1982. – 256 с.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.