В нижней строке таблицы представлены априорные вероятности возможных состояний природы. Возможно проведение единичного эксперимента. Он может иметь три возможных исхода с условными вероятностями в соответствующей таблице.
Si\Пj |
П1 |
П2 |
П3 |
П4 |
S1 |
0.2 |
0.9 |
0.4 |
0.3 |
S2 |
0.1 |
0.1 |
0.5 |
0.3 |
S3 |
0.7 |
0 |
0.1 |
0.4 |
Определить при каких расходах на эксперимент, его проведение целесообразно. Определить байесовское решающее правило.
10. Выбор в условиях статистической неопределенности
(риска).
· Неопределенность – неоднозначность последствий.
Пусть, например, требуется знать высокоточное значение веса некоторого предмета. Неоднократное его взвешивание на аналитических весах даст хотя и близкие, но разные значения, так как на показания весов оказывают влияние не только вес самого взвешиваемого предмета, но и трение, не идеальность геометрической формы опорной призмы, течение струй воздуха, тепловой режим и т.д. В таких задачах возникает нетривиальная проблема выбора, какое именно из значений интересующей нас величины считать истинным - с учетом имеющихся данных.
Во всех таких задачах есть общее - необходимость выбора на основании косвенных или прямых, но обязательно "зашумленных" данных. Основным, центральным, самым важным предположением для формализации решения таких задач является предположение о статистичности экспериментальных данных. Оно состоит в том, что связь между истинной, но неизвестной искомой альтернативой q (будем обозначать этой буквой любую закономерность, отыскиваемую в протоколе наблюдений, считая, что она принадлежит множеству Q возможных закономерностей, на котором и надо сделать выбор) и наблюдаемыми данными x1, x2, …, xN адекватно описывается распределением вероятностей (например, функцией распределения F(x1, x2, …, xN|q) или, если хi, - непрерывные величины, а функция F дифференцируема, - плотностью вероятностей f(x1, x2, …, xN|q). Другими словами, считается, что, во-первых, выборка наблюдений принадлежит статистическому ансамблю всевозможных выборок, на котором задано распределение вероятностей, и, во-вторых, это распределение различно для разных q , что и обеспечивает наличие информации о q в выборке x1, x2, …, xN . Вопрос состоит в том, как извлечь эту информацию, т.е. как сделать выбор на множестве Q или как принять статистическое решение.
Естественно, напрашивается идея - свести задачу к уже решенной ранее. Такую возможность предоставляет теория "игр против природы": выбор на Q и действительное состояние q природы можно в совокупности охарактеризовать функцией потерь l(, q), которую и рассматривать как платежную функцию игры.
10.1. Постановка задачи.
Точка q Î {Q} нам неизвестна, ее необходимо определить;
{Q} - множество всех предполагаемых возможностей относительно q.
х Î X - выборка (протокол наблюдений), х = (x1, x2, …, xN), Х — множество всех возможных выборок.
На реализовавшееся значение выборки оказывает влияние не только искомая закономерность q, но и совокупность случайных факторов, изображен на схеме как результат совместного отображения q и некоторого случайного воздействия п m: х = m (q, п). Зная х, мы должны сделать выбор относительно q , принять решение, какую из множества альтернатив Q мы примем за истинную.
Чтобы не путать принимаемое решение и "истинное" состояние q, обозначим пространство, на котором производится выбор, через Г. Очевидно, что в Г входят все элементы множества {Q}, но могут войти и дополнительные решения (типа отказа от выбора, требования увеличить число наблюдений или провести рандомизацию и т.п.).
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.