Проверка гипотез. Представление результатов проверки статистических гипотез в публикациях, страница 3

2. Извлекаем случайную выборку объектов.

3. Формулируем нуль-гипотезу (H0) о том, что выборка извлечена из данной генеральной совокупности, или что выборочный результат существенно не отличается от параметра генеральной совокупности.

4. Высказываются предположения о характере данных, необходимые для построения распределения выборочной статистики. (Для простоты мы пропустили этот шаг, но он может иметь критически важное значение при проверке более сложных гипотез. В нашем примере с первенцами мы предположили, что выборка получена методом случайного отбора, что использовалась относительная шкала измерения и что выборка подчиняется нормальному распределению).

5. Строим распределение выборочной статистики. (Здесь мы воспользовались стандартным результатом центральной предельной теоремы).

6. На выборочном распределении рассчитываем вероятность получения данного выборочного значения при условии, что нуль-гипотеза верна. (Фактически, многие исследователи не рассчитывают точную вероятность получения данного значения статистики, а лишь убеждаются в том, что это значение попадает в 5%-ую область отвержения гипотез).

7. Принимаем решение о том, отклонять нуль-гипотезу или не отклонять.

Эта логика с некоторыми модификациями сохраняется и в решении других статистических задач. Например, вместо того, чтобы сравнивать первенцев с «детьми вообще» (которые включают также и первенцев), мы можем сравнить две выборки (первенцев и «непервенцев»). В этом случае на шаге 2 извлекаются две выборки. На шаге 3 нуль-гипотеза будет сформулирована так: H0: μ1 = μ2 или H0: μ1 - μ2= 0. На шаге 5 распределение выборочной статистики определяется для разности средних.

Решение об отклонении нуль-гипотезы выступает аргументом в пользу исследовательской гипотезы. Тем не менее, мы не можем утверждать, что исследовательская гипотеза «верна», «истинна», «подтверждена» или «доказана». Подобный детерминистский язык неуместен в рассуждениях, основанных на вероятностях.

Ситуация оказывается еще более сложной, когда мы принимаем решения не отклонять нуль-гипотезу. Утверждения вроде «нуль-гипотеза принята» (accepted) или «подтверждена» (proved) с позиций теории статистического вывода нелегитимны. Речь идет о том, что полученные результаты недостаточно убедительны для отвержения нуль-гипотезы, но при этом она может быть ложной! Скажем, первенцы в семье могут действительно иметь более высокий интеллект, чем другие дети, но различие между выборочным средним и средним генеральной совокупности может быть не очень большим. Утверждение о том, что нуль-гипотеза верна, требует демонстрации абсолютного отсутствия различий между средними, при этом выборка должна быть достаточно большой, а измерение должно быть безошибочным.

Строгость в отношении запрета на утверждения вроде «нуль-гипотеза верна» восходят к позиции автора теории статистического вывода – Роберта Фишера. С его точки зрения, невозможность отклонить нуль-гипотезу говорит лишь о недостаточности свидетельств в пользу более определенного заключения.

Иной подход к проверке статистических гипотез разработали Дж. Нейман и Э. Пирсон (1933). С их точки зрения, мы либо отклоняем, либо принимаем нуль-гипотезу. Однако принятие нуль-гипотезы вовсе не означает, что ее истинность доказана. Мы лишь ведем себя так, как если бы она была истинной, пока не появятся опровергающие данные. Позиция Неймана и Пирсона более прагматична, ведь в решении практических задач нам нужна не академическая осторожность, а полная определенность. Допустив решение о принятии нуль-гипотезы, Нейман и Пирсон ввели важные понятия ошибки II рода (см. следующий раздел) и мощности.

Одна из основных проблем современной теории статистического вывода состоит в том, что она является прихотливым сочетанием подходов Фишера и Неймана-Пирсона.

Ошибки I и II рода