Математика \ Теория вероятностей и математическая статистика

Математическая статистика (Основные задачи и понятия математической статистики. Точечные оценки параметров распределения. Основные методы получения точечных оценок. Проверка статистических гипотез. Линейная регрессия), страница 4

Н₀: F_m(x) = F₀(x) – простая гипотеза,

Н₀: F_m(x)Í F₀¹ {F₀(x)} – сложная гипотеза.

Гипотезы разделяются также на параметрические и непараметрические.

Параметрическиминазывают гипотезы, сформулированные относительно параметров распределения (в примере это 4 и 7), все остальные – непараметрические.

Правило, с помощью которого устанавливается справедливость или несправедливость гипотезы, называется критерием.

Если выборку рассматривать как n-мерный вектор или точку вn-мерном евклидовом пространстве R_n, то каждый из критериев разбивает это пространство на две части, при попадании выборки в одну из которых гипотеза Н₀ принимается, а при попадании в другую, принимается альтернативная гипотеза Н₁. Первая область – W_дназывается допустимой, вторая W_к– критической.

R_n = W_дW_ки W_дW_к = Æ.

Теперь, если W_д,то принимается гипотеза Н₀, если W_к, то гипотеза Н₀отвергается, т.е. принимается гипотеза альтернативная Н₁.

В силу случайности выборки всегда возможны ошибки двух видов. Рассмотрим все возможные ситуации:

1) Справедлива гипотеза Н₀, W_д Þ гипотеза Н₀ принимается.

2) Справедлива гипотеза Н₀, W_кÞ гипотеза Н₀ отвергается, принимается альтернативная гипотеза Н₁.

3) Справедлива гипотеза Н₁, W_д Þ принимается гипотеза Н₀.

4) Справедлива гипотеза Н₁, W_к Þ гипотеза Н₀ отвергается, принимается альтернативная гипотеза Н₁.

1, 4 – нормальные ситуации. В ситуации 1 принимается справедливая гипотеза, в ситуации 4 отвергается несправедливая гипотеза, принимается справедливая гипо-теза .

В ситуации 2 отвергается справедливая гипотеза и это называется ошибкой первого рода.

В ситуации 3 принимается неверная гипотеза – ошибка второго рода.

Вероятность ошибки первого рода – aназывается уровнем значимости критерия, т.е. по определению

Вероятность ошибки второго рода – называется оперативной характеристикой критерия. Здесь по определению

В статистике предпочитают иметь дело с мощностью критерия – b:

Желание любого исследователя получить такой критерий, при котором вероятности ошибок первого и второго рода были минимальны, в идеале – их не было вообще. Но это невозможно, так как уменьшение вероятности ошибки первого рода приводит к расширению допустимой области (сужению W_к) и, как следствие, к увеличению вероятности ошибки второго рода, а уменьшение вероятности ошибки второго рода приводит к расширению критической области (сужению W_д) и увеличению вероятности ошибки первого рода. В связи с этим, на практике поступают следующим образом: гипотеза проверяется по возможности большим числом критериев и среди них выбирается тот, мощность которого наибольшая. Уровень значимости при a, как правило, выбирается из ряда 0,001; 0,005; 0,01; 0,05; 0,1

Если уровень значимости критерия известен и равен a, то по случайной выборке строится некоторая функция r = r(), характеризующая меру отклонения теоретической функции распределения от эмпирической. При этом допустимая область определяется из условия:

Р(r > с) = a.

В случае справедливости гипотезы , данное равенство будет равносильно следующему:

a = Р(r > с) = 1 – F_r(c), или = 1 – a,

отсюда , т.е. с – квантиль уровня (1 – a), и значит допустимая область определяется неравенством

Величина с называется критическим значением критерия, будем обозначать ее .

Для проверки гипотезы по выборке вычисляется наблюдаемое значение критерия и, если , – принимается гипотеза Н₀, если , – принимается гипотеза Н₁, соответственно гипотеза Н₀ отвергается (рис. 3.1).

Обычно уровень значимости выбирается настолько малым, чтобы событие, вероятность которого равна a, можно было считать практически невозможным.

Если , то это событие происходит (происходит событие, которое считается практически невозможным), значит в этом случае гипотеза Н₀ скорее всего несправедлива. В противном случае, когда ,гипотеза Н₀ возможно может быть принята.

3.4.2. Простые гипотезы

Предположим, что по выборке сформулированы две простые гипотезы:

H₀: F_m(x) = F₀(x), H₁: F_m(x) = F₁(x).

В этом случае, оказывается, существует наиболее мощный критерий, который называется критерием отношения правдоподобия, и имеет следующий вид:

где в числителе - функция правдоподобия, вычисленная в предположении справедливости гипотезы Н₁, а в знаменателе – Н_0.

Если справедлива гипотеза Н₀, то это отношение меньше единицы, если справедлива гипотеза Н₁, это отношение больше единицы. Критическое отношение определяется по уровню значимости.

Теорема 3.3 (Неймана-Пирсона)

Из всех критериев, проверяющих простые гипотезы, критерий отношения правдоподобия является наиболее мощным.

3.4.3. Критерии согласия

Имеется случайная выборка . Необходимо проверить гипотезу H₀: F_m(x) = F₀(x), при альтернативной гипотезе H₁: F_m(x) ¹ F₀(x).

Здесь основная гипотеза является простой, и, в случае ее справедливости мы получаем полную информацию о распределении количественного признака генеральной совокупности. Альтернативная гипотеза - сложная и в случае ее справедливости не дает вообще никакой информации о генеральной совокупности.

Поэтому критерии, проверяющие гипотезу H₀ при альтернативной гипотезе H₁, называются критериями согласия, так как здесь мы отвечаем на вопрос, согласуются ли результаты наблюдений с выдвинутой гипотезой H₀.

Критерий Колмогорова

Здесь критерий строится на основе статистики вида

Независимо от предполагаемой функции распределения F₀(x) при n ® ¥величина стремится к закону распределения Колмогорова К(х), поэтому

P(r > с) = a, 1 – P(r < с) = a, 1 – K(c) = a, K(c) = 1 – a,

c = (1 – a) = x_1-_a – квантиль уровня (1 – a) для распределения Колмогорова.

Критерий Колмогорова предписывает принять гипотезу , если

и отвергнуть ее в противном случае.

Критерий c² (Пирсона)

1 2 3 4 5 6

Скачать файл