Вероятностное описание погрешностей измерения, страница 14

Предположим, что известна плотность распределения  оценки . Изобразим ее графически (рис.3), полагая, что выдвинутая гипотеза  верна, т.е. . Установим две границы  и  и сформулируем следующее решающее правило: если , то гипотеза принимается; если  или , то гипотеза отклоняется.

При этом может быть принято ошибочное решение, причем вероятность ошибки равна

.     

Рис. 3.

Рассмотрим другой пример задачи проверки гипотез. Пусть некоторый параметр  распределения случайной величины может принимать только одно из двух значений:  или . На основании экспериментально полученной оценки  необходимо решить, какое значение  имело место в эксперименте. В данном случае необходимо проверить гипотезу  (так называемую нулевую гипотезу) против альтернативнай гипотезы . На рисунке 4 изображена плотность распределения  как при условии справедливости нулевой гипотезы , так и при условии справедливости альтернативной гипотезы .

Рис. 4.

Установим границу  и сформулируем решающее правило: если , то принимается нулевая гипотеза ; если , то принимается альтернативная гипотеза .

Обозначим следующие вероятности:

;                     .         

При принятии решения в соответствии с указанным решающим правилом возможны четыре ситуации:

1)  нулевая гипотеза верна, но отклоняется. При этом имеет место ошибка 1-го рода (иногда называемая ложной тревогой), вероятность которой равна - уровню значимости;

2)  альтернативная гипотеза верна, но отклоняется. При этом имеет место ошибка 2-го рода, вероятность которой равна ;

3)  нулевая гипотеза верна и принимается. Вероятность такого события равна ;

4)  альтернативная гипотеза верна и принимается. Вероятность этого равна  и называется мощностью решающего правила.

Рассмотрим конкретные простейшие задачи проверки статистических гипотез.

1. Проверка гипотезы о равенстве математического ожидания заданному значению

Пусть имеется выборка  (1) из  наблюдений, причем погрешности  удовлетворяют предположениям 1) - 4). Положим выборочное среднее (6) равным , а выборочную дисперсию (10) –  (см. раздел 2). Выдвигается гипотеза о том, что .

Как известно, величина  распределена по закону Стьюдента с  степенями свободы [1]. Поэтому условием принятия гипотезы будет выполнение неравенства

.                               (1)

В случае невыполнения этого неравенства гипотеза отклоняется. Зададимся уровнем значимости . Для вероятности  и числа степеней свободы  по таблице распределения Стьюдента находят число , подставляют его в (1) и проверяют выполнение этого неравенства. В зависимости от того, выполняется (1) или нет, принимают или отвергают выдвинутую гипотезу.

2. Проверка гипотезы о равенстве дисперсии заданному значению

В условиях предыдущей задачи необходимо проверить гипотезу о равенстве дисперсии  (нулевую гипотезу).

Как известно, величина  распределена по закону  с  степенями свободы [1]. Поэтому условием принятия нулевой гипотезы будет выполнение неравенства

,     (2)

где  и  значения величины  из таблицы, соответствующие вероятностям  и  и числу степеней свободы .Задаваясь требуемым уровнем значимости и зная число , по таблице находят величины  и  и подставляют их в (19). В случае выполнения неравенства нулевая гипотеза о равенстве дисперсии величине  принимается; если же (2) не выполняется, то гипотеза отвергается.

3. Проверка гипотезы о равенстве двух дисперсий

Пусть по данным двух независимых выборок наблюдений   и   получены оценки  и  дисперсий  и  соответственно. Необходимо проверить гипотезу, что , т.е. дисперсии наблюдений  и  равны.

В данном случае выбор критерия основан на том факте, что если величины  и  распределены по нормальному закону и взаимно независимы, то случайная величина  имеет -распределение Фишера, зависящее только от целых констант  и  [1-3]. Данное распределение затабулировано. По двум входным величинам ,  и уровню значимости  находят величину , которую подставляют в неравенство

,                              (3)

где индексы  и  относятся соответственно к большей по величине и меньшей оценкам дисперсий  и . Для того, чтобы гипотеза о равенстве дисперсий  и  была принята с уровнем значимости  (доверительной вероятностью ), необходимо выполнение неравенства (3). В противном случае данная гипотеза должна быть отвергнута в пользу альтернативной гипотезы, что . Необходимо помнить, что при использовании (3) с уровнем значимости  в таблице распределения Фишера выбирается число, соответствующее значению уровня значимости .

4. Резко выделяющиеся наблюдения

Иногда в рядах наблюдений попадаются данные, которые на глаз резко выделяются среди других. Это может быть случайным обстоятельством, т.к. в последовательности наблюдений теоретически могут быть данные , сильно уклоняющиеся в обе стороны от , но может быть вызвано и грубой ошибкой наблюдателя.

Рассмотрим в ряду наблюдений , распределенных нормально (1) и независимых, например, максимальное . Для того, чтобы решить, нужно ли отбросить наблюдение  как грубую ошибку, можно воспользоваться правилом "трех сигм", но более грамотно это следует выяснить с помощью критерия Ф. Грэббса. Для этого нужно сформировать дробь "типа Стьюдента"

,                     (4)

распределение которой зависит только от объема выборки , и оно было затабулировано Грэббсом. По заданным  и доверительной вероятности  необходимо найти в таблице Грэббса число . Если окажется , то  следует отбросить, как наблюдение, содержащее грубую ошибку; а если , то  можно оставить. Если подозрение вызывает минимальное из чисел , то дробь (4) следует видоизменить

.                    

5. Примеры решения задач

5.1. Проверка гипотез

Измерение эквивалентной электропроводности  вещества  при нормальной концентрации  дали следующие результаты:

76.35

79.09

72.01

70.41

71.15

68.69

71.03

74.58

74.41

77.83

При уровнях значимости ; ;  проверить гипотезы о равенстве величины эквивалентной электропроводности значениям ; ; .