Выборка и ее анализ. Точечные и интервальные оценки. Проверка статистических гипотез о параметрах нормально распределенной генеральной совокупности, страница 11

.

Ошибка второго рода состоит в том, что будет принята неправильная нулевая гипотеза  с вероятностью :

.

Вероятности ошибок должны быть малыми и выбираться заранее.

При проверке гипотезы возникает одна из следующих четырех ситуаций, приведенных в таблице 1.

Таблица 1. Ошибки первого и второго рода

Результаты проверки гипотезы

Возможные состояния гипотезы

 верна

 неверна

Гипотеза  отклоняется

Ошибка первого рода

Правильный вывод

Гипотеза  принимается

Правильный вывод

Ошибка второго рода

Мощностью критерия называется вероятность попадания статистики  в критическую область  при условии, что справедлива конкурирующая гипотеза . Мощность критерия равна вероятности  правильного отклонения нулевой гипотезы :

=.

Поскольку критическая область  определяется по-разному на заданном уровне значимости , то она выбирается так, чтобы мощность критерия  была возможно большей:

.

Чем больше мощность критерия, тем меньше вероятность принятия неверной гипотезы. Мощность критерия позволяет выбрать оптимальную статистику  для проверки гипотезы среди возможных статистик критерия.

На практике в качестве статистики  чаще всего используются специально подобранные случайные величины, распределения которых известны:

 (стандартизированное нормальное распределение),

 (распределение Стьюдента),

 (закон Пирсона ),

 (распределение Фишера).

Общая схема проверки статистических гипотез.Несмотря на разнообразие гипотез и применяемых статистик, проверка статистических гипотез может быть проведена в виде следующей общей схемы.

1. На основании выборочных данных выдвигаются нулевая гипотеза  и альтернативная ей гипотеза .

2. Выбирается уровень значимости  (в практических задачах пользуются стандартными значениями уровня значимости: 0,1; 0,05; 0,025; 0,01; 0,005; 0,001).

3. Выбирается статистика  для проверки гипотезы , имеющую известный закон распределения.

4. Вычисляется наблюдаемое значение статистики  по выборочным данным.

5. Определяется вид критической области из условия

и область принятия гипнозы в зависимости от формулировки альтернативной гипотезы.

6. Принимается статистическое решение: если  попадает в критическую область, то нулевая гипотеза  отвергается, в противном случае  принимается.

2. Понятие –значения. Наряду с критерием значимости для проверки нулевой гипотезы существует правило, основанное на -значении [1]. Пусть  выборка из генеральной совокупности значений случайной величины ;  – выдвинутая гипотеза;  – выбранная статистика, которая является случайной величиной и при сформулированной гипотезе  имеет известный закон распределения;  – наблюдаемое значение статистики, вычисленное по выборке. Из уравнения

=,

находится неизвестное значение , называемое -значением.

-значение представляет собой максимальный уровень значимости, при котором статистика  еще попадает в критическую область гипотезы, и называется критическим уровнем значимости.

В зависимости от найденного-значения возможен один из  выводов:

– если >0,1, то имеется хорошее согласие с ,

– если =0,05, то есть сомнения в истинности ,

– если =0,02, то имеется довольно сильный довод против гипотезы ,

– если 0,01, то гипотеза  почти наверняка не подтверждается.

В общем случае, если критический уровень меньше заданного уровня значимости , то гипотеза отклоняется.

3. Проверка статистических гипотез. Высказываемые в ходе решения задач гипотезы можно условно подразделяются на следующие типы:

– о виде закона распределения исследуемой случайной величины;

– об однородности двух или нескольких выборок;

– о числовых значениях параметрах исследуемого признака;

– об общем виде зависимости, существующей между компонентами исследуемого многомерного признака.