Проверка гипотез. Представление результатов проверки статистических гипотез в публикациях

Страницы работы

Содержание работы

ПРОВЕРКА ГИПОТЕЗ

Введение

Как отмечают Дж. Гласс и Дж. Стэнли, первым опубликованным случаем проверки статистической гипотезы стала работа Дж. Арбутнота «Доводы в пользу божественных пророчеств. Выведенные на основе постоянных и систематических наблюдений над рождением обоих полов» (1710). На основании изучения архивных метрик о рождении мальчиков и девочек на протяжении 82 лет Арбутнот сделал статистически безупречный вывод о большей частоте рождения лиц мужского пола, что, конечно, могло быть объяснено лишь вмешательством высших сил. Уже Арбутноту было ясно, что принятие доказательных решений требует существенного упрощения картины мира. Сложные и запутанные обстоятельства заменяются несколькими простыми предположениями и дискретной схемой принятия решения. Обыденные и повседневные суждения несоизмеримо более сложны. Напротив, процедура проверки (testing) статистических гипотез выглядит проще, чем операция включения и выключения компьютера. Однако на формализацию этой процедуры ушло много десятилетий. В разное время терминология устанавливалась и менялась влиятельными статистиками, занимавшими подчас непримиримые позиции. Поэтому так важно не только усвоить технический язык, но и понимать суть разногласий между статистиками.

Логика проверки гипотез

Проверка гипотез – это процедура, которая позволяет определить, насколько существенно результат, полученный на выборке, отклоняется от гипотетического значения (параметра гипотетической генеральной совокупности). Другими словами, это принятие решения о том, отличается ли выборочная статистика от некоторого заданного значения в силу случайных обстоятельств (выборочной ошибки) или за этим различием стоит определенная закономерность.

Рассмотрим пример. Психологические исследования показывают, что первенцы или единственные дети в семье имеют более высокий интеллект. Это может быть связано с тем, что первенцы получают больше родительского внимания и более активно взаимодействуют со взрослыми или с тем, что на них приходится больше материальных и моральных ресурсов[1]. Не задаваясь вопросом о возможных причинах эффекта первенца, мы решили проверить исследовательскую гипотезу о том, что интеллект детей, родившихся первыми, отличается от интеллекта других детей. Случайным образом мы отобрали 36 детей в возрасте 10 лет, о которых известно, что они являются единственными или первыми детьми в родительской семье, и провели диагностику способностей по «Шкалам Векслера для детей» (WISC-III). Среднее арифметическое по шкале общего интеллекта (IQ) на нашей выборке равно 108 пунктов. Отличается ли полученное значение от среднего значения интеллекта для всех десятилетних детей?

Задача облегчается тем, что параметры генеральной совокупности известны. Дело в том, что большинство тестов, предназначенных для измерения общих способностей, стандартизуются так, чтобы среднее (μ0) составляло 100 пунктов, а стандартное отклонение (σ) было равно 15. (Как станет ясно из последующего текста, обозначение μ0 указывает на то, что это ожидаемое значение устанавливается нуль-гипотезой).

Наше выборочное значение (108) – одно из многих, которые могли бы быть получены, если бы мы или кто-то другой извлек другие выборки. Как вы помните из раздела «Распределение выборочной статистики», совокупность всех теоретически возможных значений средних, полученных на выборках объема n, распределено по нормальному закону с параметрами μ и  при условии, что выборки извлечены из генеральной совокупности с параметрами μ и σ. Следовательно, если обследованные дети по уровню интеллекта существенно не отличаются от других своих сверстников, полученный результат (=108) будет вполне вероятным для данного выборочного распределения.

Что означает «вполне вероятное» значение? Как и любое другое теоретическое распределение, нормальное распределение показывает плотность вероятности. Одни значения, находящиеся вблизи центральной тенденции, имеют шанс встречаться чаще, другие – на концах распределения – реже. По соглашению между статистиками, редкими или почти невероятными считаются те значения переменной, которые встречаются с вероятность менее 0,05 (или менее чем в 5% случаев). На рисунках вероятностям соответствуют площади, поэтому мы можем отметить на графике нормального распределения те области, куда попадают эти почти невероятные значения (см. рис. 1). В каждом конце распределения серым цветом выделена площадь, соответствующая 0,025, или 2,5%. В сумме эти две области дадут 0,05. Диапазон значений, вероятность получения которых не превышает 0,05, называется областью отклонения (или отвержения, rejection) нуль-гипотезы или критической областью.

Похожие материалы

Информация о работе