Методические указания к практическим занятиям по дисциплине «Методы и алгоритмы принятия решений», страница 22

В нижней строке таблицы представлены априорные вероятности возможных состояний природы. Возможно проведение единичного эксперимента. Он может иметь три возможных исхода с условными вероятностями в соответствующей таблице.

Sij

П1

П2

П3

П4

S1

0.2

0.9

0.4

0.3

S2

0.1

0.1

0.5

0.3

S3

0.7

0

0.1

0.4

Определить при каких расходах на  эксперимент, его проведение целесообразно. Определить байесовское решающее правило.

10. Выбор в условиях статистической неопределенности

(риска).

Конспект

·  Неопределенность – неоднозначность последствий.

Пусть, например, требуется знать высокоточное значение веса некоторого предмета. Неоднократное его взвешивание на аналитических весах даст хотя и близкие, но разные значения, так как на показания весов оказывают влияние не только вес самого взвешиваемого предмета, но и трение, не идеальность геометрической формы опорной призмы, течение струй воздуха, тепловой режим и т.д. В таких задачах возникает нетривиальная проблема выбора, какое именно из значений интересующей нас величины считать истинным - с учетом имеющихся данных.

Во всех таких задачах есть общее - необходимость выбора на основании косвенных или прямых, но обязательно "зашумленных" данных. Основным, центральным, самым важным предположением для формализации решения таких задач является предположение о статистичности экспериментальных данных. Оно состоит в том, что связь между истинной, но неизвестной искомой альтернативой q (будем обозначать этой буквой любую закономерность, отыскиваемую в протоколе наблюдений, считая, что она принадлежит множеству Q возможных закономерностей, на котором и надо сделать выбор) и наблюдаемыми данными x1, x2, …, xN адекватно описывается распределением вероятностей (например, функцией распределения F(x1, x2, …, xN|q) или, если хi, - непрерывные величины, а функция F дифференцируема, - плотностью вероятностей f(x1, x2, …, xN|q). Другими словами, считается, что, во-первых, выборка наблюдений принадлежит статистическому ансамблю всевозможных выборок, на котором задано распределение вероятностей, и, во-вторых, это распределение различно для разных q , что и обеспечивает наличие информации о q  в выборке x1, x2, …, xN . Вопрос состоит в том, как извлечь эту информацию, т.е. как сделать выбор на множестве Q или как принять статистическое решение.

Естественно, напрашивается идея - свести задачу к уже решенной ранее. Такую возможность предоставляет теория "игр против природы": выбор  на Q и действительное состояние q природы можно в совокупности охарактеризовать функцией потерь l(, q), которую и рассматривать как платежную функцию игры.

10.1. Постановка задачи.

Точка q Î {Q} нам неизвестна, ее необходимо определить;

{Q} - множество всех предполагаемых возможностей относительно q.

х Î X -  выборка (протокол наблюдений), х = (x1, x2, …, xN), Х — множество всех возможных выборок.

На реализовавшееся значение выборки оказывает влияние не только искомая закономерность q, но и совокупность случайных факторов, изображен на схеме как результат совместного отображения q и некоторого случайного воздействия п m: х = m (q, п). Зная х, мы должны сделать выбор относительно q , принять решение, какую из множества альтернатив Q мы примем за истинную.

Чтобы не путать принимаемое решение и "истинное" состояние q, обозначим пространство, на котором производится выбор, через Г. Очевидно, что в Г входят все элементы множества {Q}, но могут войти и дополнительные решения (типа отказа от выбора, требования увеличить число наблюдений или провести рандомизацию и т.п.).