Проверка гипотез. Представление результатов проверки статистических гипотез в публикациях, страница 4

В нашем примере с интеллектом первенцев проверялась гипотеза типа H0: μ = μ0, где μ0 – параметр, характеризующий генеральную совокупность. С точки зрения теории статистического вывода мир может принимать лишь два состояния: H0 верна и H0 неверна. Исследователь также может принять одно из двух решений: отклонить или не отклонять H0.

Если H0 в действительности верна и исследователь не смог ее отклонить, решение принято правильно. Если H0 верна, но исследователь отклонил ее, он совершил ошибку I  рода (читается «ошибка первого рода», type I error). Вероятность этой ошибки принято обозначать α (альфа). Это тот регион отклонения нуль-гипотезы, который мы в примере с первенцами установили равным 0,05, или 5%. Другими часто используемыми значениями α являются 0,01 (1%) и 0,001 Никакого теоретического обоснования за этими значениями нет. Они приняты по соглашению между статистиками так, чтобы минимизировать ошибку неверного отклонения нуль-гипотезы, и для удобства составления статистических таблиц. (0,1%). Для отклонения нуль-гипотезы на уровне α = 0,01 и особенно 0,001 требуются бóльшие значения разности средних. Чтобы избежать соблазна изменить α, если результат проверки нуль-гипотезы не устраивает исследователя, значение α устанавливают до проверки.

Вообще говоря, ошибка I рода может принимать любые значения, и α, значения которой всегда дискретны ставить не есть вероятность ошибки. Точнее сказать, это (допустимый) уровень ошибки (error level)[2]. Мы вернемся к этому обстоятельству чуть позже.

Ошибка I рода отражает фишеровскую традицию статистического вывода. В подходе Неймана и Пирсона мы можем принять нуль-гипотезу. Если нуль-гипотеза неверна, но исследователь принял ее, он совершил ошибку II рода. Она часто имеет место там, где различия между средними невелики, и небольшие выборки недостаточно убедительны для отклонения нуль-гипотезы. Вероятность ошибки II рода обозначается β. В отличие от α, ее величина зависит не только от решений, принимаемых исследователем. Логическим дополнением ошибки II рода является мощность критерия – вероятность отклонения ложной нуль-гипотезы, т.е. вероятность правильного обнаружения  действительных различий. Мощность (power), равная 1 – β, играет большую роль в современной статистике, и мы подробнее обсудим ее в одном из следующих текстов.

Возможные исходы статистического вывода можно схематически представлены в табл. 1 (для описания исходов проверки нуль-гипотезы мы используем консервативный язык Р.Фишера):

Таблица 1

Возможные исходы статистического вывода

Состояние природы

Решение исследователя

H0 верна

H0 неверна (ложна)

H0 отклонена

Ошибка I рода

p = α

Правильное решение

p = 1 – β = мощность

H0 не отклонена

Правильное решение

p = 1– α

Ошибка II рода

p = β

Односторонние и двусторонние критерии

Превращая в предыдущем разделе сложный мир наблюдений в простой дихотомический мир статистических решений, мы умолчали о том, что нуль-гипотеза имеет естественное дополнение. Отклонение H0 означает решение в пользу какой-то альтернативы. Эту альтернативную гипотезу принято обозначать H1 (иногда HA). Она почти всегда сложнее нулевой. В примере с первенцами она включает множество возможностей: μ = 105, μ = 110, μ = 120 и т.д.

Альтернативные гипотезы могут быть ненаправленными и направленными. В первом случае направление различий между средними не уточняется, как в примере с первенцами: H1: μ ¹ μ0. В этом случае критическая область делится между двумя концами распределения, с каждой стороны по α/2. Если бы мы получили выборочное среднее, значимо меньшее 100, мы все равно отвергли бы нуль-гипотезу. Во втором случае указывается направление различий. Это уместно сделать тогда, когда есть соответствующая содержательная теория. Так, психологическая литература утверждает, что уровень интеллекта первенцев выше уровня интеллекта других детей, поэтому было бы естественно сформулировать альтернативную гипотезу следующим образом: H1: μ > μ0. В этом случае мы не отклонили бы нуль-гипотезу, если бы по каким-то причинам выборочное среднее было равным, например, 90. Поскольку направление разности между средними устанавливается альтернативной гипотезой, критическая область целиком располагается на одном конце распределения выборочной статистики (справа, если H1: μ > μ0 и слева, если H1: μ < μ0). Такая ситуация показана на рис.2.