Предположим, что известна плотность распределения оценки . Изобразим ее графически (рис.3), полагая, что выдвинутая гипотеза верна, т.е. . Установим две границы и и сформулируем следующее решающее правило: если , то гипотеза принимается; если или , то гипотеза отклоняется.
При этом может быть принято ошибочное решение, причем вероятность ошибки равна
.
Рис. 3.
Рассмотрим другой пример задачи проверки гипотез. Пусть некоторый параметр распределения случайной величины может принимать только одно из двух значений: или . На основании экспериментально полученной оценки необходимо решить, какое значение имело место в эксперименте. В данном случае необходимо проверить гипотезу (так называемую нулевую гипотезу) против альтернативнай гипотезы . На рисунке 4 изображена плотность распределения как при условии справедливости нулевой гипотезы , так и при условии справедливости альтернативной гипотезы .
Рис. 4.
Установим границу и сформулируем решающее правило: если , то принимается нулевая гипотеза ; если , то принимается альтернативная гипотеза .
Обозначим следующие вероятности:
; .
При принятии решения в соответствии с указанным решающим правилом возможны четыре ситуации:
1) нулевая гипотеза верна, но отклоняется. При этом имеет место ошибка 1-го рода (иногда называемая ложной тревогой), вероятность которой равна - уровню значимости;
2) альтернативная гипотеза верна, но отклоняется. При этом имеет место ошибка 2-го рода, вероятность которой равна ;
3) нулевая гипотеза верна и принимается. Вероятность такого события равна ;
4) альтернативная гипотеза верна и принимается. Вероятность этого равна и называется мощностью решающего правила.
Рассмотрим конкретные простейшие задачи проверки статистических гипотез.
Пусть имеется выборка (1) из наблюдений, причем погрешности удовлетворяют предположениям 1) - 4). Положим выборочное среднее (6) равным , а выборочную дисперсию (10) – (см. раздел 2). Выдвигается гипотеза о том, что .
Как известно, величина распределена по закону Стьюдента с степенями свободы [1]. Поэтому условием принятия гипотезы будет выполнение неравенства
. (1)
В случае невыполнения этого неравенства гипотеза отклоняется. Зададимся уровнем значимости . Для вероятности и числа степеней свободы по таблице распределения Стьюдента находят число , подставляют его в (1) и проверяют выполнение этого неравенства. В зависимости от того, выполняется (1) или нет, принимают или отвергают выдвинутую гипотезу.
В условиях предыдущей задачи необходимо проверить гипотезу о равенстве дисперсии (нулевую гипотезу).
Как известно, величина распределена по закону с степенями свободы [1]. Поэтому условием принятия нулевой гипотезы будет выполнение неравенства
, (2)
где и значения величины из таблицы, соответствующие вероятностям и и числу степеней свободы .Задаваясь требуемым уровнем значимости и зная число , по таблице находят величины и и подставляют их в (19). В случае выполнения неравенства нулевая гипотеза о равенстве дисперсии величине принимается; если же (2) не выполняется, то гипотеза отвергается.
Пусть по данным двух независимых выборок наблюдений и получены оценки и дисперсий и соответственно. Необходимо проверить гипотезу, что , т.е. дисперсии наблюдений и равны.
В данном случае выбор критерия основан на том факте, что если величины и распределены по нормальному закону и взаимно независимы, то случайная величина имеет -распределение Фишера, зависящее только от целых констант и [1-3]. Данное распределение затабулировано. По двум входным величинам , и уровню значимости находят величину , которую подставляют в неравенство
, (3)
где индексы и относятся соответственно к большей по величине и меньшей оценкам дисперсий и . Для того, чтобы гипотеза о равенстве дисперсий и была принята с уровнем значимости (доверительной вероятностью ), необходимо выполнение неравенства (3). В противном случае данная гипотеза должна быть отвергнута в пользу альтернативной гипотезы, что . Необходимо помнить, что при использовании (3) с уровнем значимости в таблице распределения Фишера выбирается число, соответствующее значению уровня значимости .
Иногда в рядах наблюдений попадаются данные, которые на глаз резко выделяются среди других. Это может быть случайным обстоятельством, т.к. в последовательности наблюдений теоретически могут быть данные , сильно уклоняющиеся в обе стороны от , но может быть вызвано и грубой ошибкой наблюдателя.
Рассмотрим в ряду наблюдений , распределенных нормально (1) и независимых, например, максимальное . Для того, чтобы решить, нужно ли отбросить наблюдение как грубую ошибку, можно воспользоваться правилом "трех сигм", но более грамотно это следует выяснить с помощью критерия Ф. Грэббса. Для этого нужно сформировать дробь "типа Стьюдента"
, (4)
распределение которой зависит только от объема выборки , и оно было затабулировано Грэббсом. По заданным и доверительной вероятности необходимо найти в таблице Грэббса число . Если окажется , то следует отбросить, как наблюдение, содержащее грубую ошибку; а если , то можно оставить. Если подозрение вызывает минимальное из чисел , то дробь (4) следует видоизменить
.
Измерение эквивалентной электропроводности вещества при нормальной концентрации дали следующие результаты:
76.35 |
79.09 |
72.01 |
70.41 |
71.15 |
68.69 |
71.03 |
74.58 |
74.41 |
77.83 |
При уровнях значимости ; ; проверить гипотезы о равенстве величины эквивалентной электропроводности значениям ; ; .
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.