Н0: Fm(x) = F0(x) – простая гипотеза,
Н0: Fm(x)Í F0 ¹ {F0(x)} – сложная гипотеза.
Гипотезы разделяются также на параметрические и непараметрические.
Параметрическиминазывают гипотезы, сформулированные относительно параметров распределения (в примере это 4 и 7), все остальные – непараметрические.
Правило, с помощью которого устанавливается справедливость или несправедливость гипотезы, называется критерием.
Если выборку рассматривать как n-мерный вектор или точку вn-мерном евклидовом пространстве Rn, то каждый из критериев разбивает это пространство на две части, при попадании выборки в одну из которых гипотеза Н0 принимается, а при попадании в другую, принимается альтернативная гипотеза Н1. Первая область – Wд называется допустимой, вторая Wк– критической.
Rn = WдWк и WдWк = Æ.
Теперь, если Wд, то принимается гипотеза Н0, если Wк, то гипотеза Н0 отвергается, т.е. принимается гипотеза альтернативная Н1.
В силу случайности выборки всегда возможны ошибки двух видов. Рассмотрим все возможные ситуации:
1) Справедлива гипотеза Н0, Wд Þ гипотеза Н0 принимается.
2) Справедлива гипотеза Н0, WкÞ гипотеза Н0 отвергается, принимается альтернативная гипотеза Н1.
3) Справедлива гипотеза Н1, Wд Þ принимается гипотеза Н0.
4) Справедлива гипотеза Н1, Wк Þ гипотеза Н0 отвергается, принимается альтернативная гипотеза Н1.
1, 4 – нормальные ситуации. В ситуации 1 принимается справедливая гипотеза, в ситуации 4 отвергается несправедливая гипотеза, принимается справедливая гипо-теза .
В ситуации 2 отвергается справедливая гипотеза и это называется ошибкой первого рода.
В ситуации 3 принимается неверная гипотеза – ошибка второго рода.
Вероятность ошибки первого рода – aназывается уровнем значимости критерия, т.е. по определению
.
Вероятность ошибки второго рода – называется оперативной характеристикой критерия. Здесь по определению
.
В статистике предпочитают иметь дело с мощностью критерия – b:
.
Желание любого исследователя получить такой критерий, при котором вероятности ошибок первого и второго рода были минимальны, в идеале – их не было вообще. Но это невозможно, так как уменьшение вероятности ошибки первого рода приводит к расширению допустимой области (сужению Wк) и, как следствие, к увеличению вероятности ошибки второго рода, а уменьшение вероятности ошибки второго рода приводит к расширению критической области (сужению Wд) и увеличению вероятности ошибки первого рода. В связи с этим, на практике поступают следующим образом: гипотеза проверяется по возможности большим числом критериев и среди них выбирается тот, мощность которого наибольшая. Уровень значимости при a, как правило, выбирается из ряда 0,001; 0,005; 0,01; 0,05; 0,1
Если уровень значимости критерия известен и равен a, то по случайной выборке строится некоторая функция r = r(), характеризующая меру отклонения теоретической функции распределения от эмпирической. При этом допустимая область определяется из условия:
Р(r > с) = a.
В случае справедливости гипотезы , данное равенство будет равносильно следующему:
a = Р(r > с) = 1 – Fr(c), или = 1 – a,
отсюда , т.е. с – квантиль уровня (1 – a), и значит допустимая область определяется неравенством
Величина с называется критическим значением критерия, будем обозначать ее .
Для проверки гипотезы по выборке вычисляется наблюдаемое значение критерия и, если , – принимается гипотеза Н0, если , – принимается гипотеза Н1, соответственно гипотеза Н0 отвергается (рис. 3.1).
Обычно уровень значимости выбирается настолько малым, чтобы событие, вероятность которого равна a, можно было считать практически невозможным.
Если , то это событие происходит (происходит событие, которое считается практически невозможным), значит в этом случае гипотеза Н0 скорее всего несправедлива. В противном случае, когда ,гипотеза Н0 возможно может быть принята.
3.4.2. Простые гипотезы
Предположим, что по выборке сформулированы две простые гипотезы:
H0: Fm(x) = F0(x), H1: Fm(x) = F1(x).
В этом случае, оказывается, существует наиболее мощный критерий, который называется критерием отношения правдоподобия, и имеет следующий вид:
,
где в числителе - функция правдоподобия, вычисленная в предположении справедливости гипотезы Н1, а в знаменателе – Н0.
Если справедлива гипотеза Н0, то это отношение меньше единицы, если справедлива гипотеза Н1, это отношение больше единицы. Критическое отношение определяется по уровню значимости.
Теорема 3.3 (Неймана-Пирсона)
Из всех критериев, проверяющих простые гипотезы, критерий отношения правдоподобия является наиболее мощным.
3.4.3. Критерии согласия
Имеется случайная выборка . Необходимо проверить гипотезу H0: Fm(x) = F0(x), при альтернативной гипотезе H1: Fm(x) ¹ F0(x).
Здесь основная гипотеза является простой, и, в случае ее справедливости мы получаем полную информацию о распределении количественного признака генеральной совокупности. Альтернативная гипотеза - сложная и в случае ее справедливости не дает вообще никакой информации о генеральной совокупности.
Поэтому критерии, проверяющие гипотезу H0 при альтернативной гипотезе H1, называются критериями согласия, так как здесь мы отвечаем на вопрос, согласуются ли результаты наблюдений с выдвинутой гипотезой H0.
Критерий Колмогорова
Здесь критерий строится на основе статистики вида
.
Независимо от предполагаемой функции распределения F0(x) при n ® ¥величина стремится к закону распределения Колмогорова К(х), поэтому
P(r > с) = a, 1 – P(r < с) = a, 1 – K(c) = a, K(c) = 1 – a,
c = (1 – a) = x1-a – квантиль уровня (1 – a) для распределения Колмогорова.
Критерий Колмогорова предписывает принять гипотезу , если
,
и отвергнуть ее в противном случае.
Критерий c2 (Пирсона)
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.