Пусть эмпирическое распределение задано интервальным статистическим рядом
Интервал |
х 1 – х 2 |
х 2 – х 3 |
… |
х i–1 – х i |
… |
х m –1 – х m |
ni |
n 1 |
n 2 |
… |
n i |
… |
n m |
Объем выборки равен n = n 1+ n 2+…+ n m .
Требуется при заданном уровне значимости a проверить, подчиняется ли генеральная совокупность выбранному теоретическому закону распределения f(x).
Выдвинем гипотезы
Н0: Признак Х подчиняется закону распределения f(x)
Н1: Признак Х не подчиняется закону распределения f(x)
Для проверки сформулированных гипотез при помощи критерия Колмогорова-Смирнова необходимо выполнить ряд расчетов.
а) Определяют по выборке параметры выбранного теоретического распределения f(x). Пусть r - число параметров распределения.
б) Для каждого интервала Х определяют вероятности попадания признака Х в данный интервал. Для этого нужно использовать формулу из теории вероятности
.
Здесь f(x) – дифференциальная функция распределения, F(x) – интегральная функция распределения. Для многих видов распределения имеются таблицы значений f(x) и F(x).
в) Определяют теоретические частоты
.
г) Находят накопленные частоты: для эмпирических частот – n×Fn(x) ; для теоретических частот – n×F(x). Для этого следует для каждого интервала последовательно складывать частоты, начиная с первого интервала и заканчивая текущим интервалом. Результаты расчетов удобно записать в таблицу.
д) Далее вычисляют модуль разности накопленных частот в каждом интервале ôn×Fn(x) – n×F(x)ô = n×ôFn(x) – ×F(x)ô.
е) Находят наибольший из полученных модулей
n ×D = max{n×ôFn(x) – ×F(x)ô}.
ж) Определяют наблюдаемое значение критерия согласия Колмогорова
.
Этот критерий является случайной величиной, которая подчиняется закону распределения Колмогорова.
з) По таблице критических точек (приложение 8), используя заданный уровень значимости a находят критическое значение критерия lкр = l(a).
е) Если в результате сравнения окажется lнабл < lкр, то нет оснований отвергнуть нулевую гипотезу H0; если же lнабл > lкр, то нулевая гипотеза H0 отвергается; принимается гипотеза H1.
Замечание: в критерии Колмогорова рекомендуется брать более “жесткий” уровень значимости a ³ 0,1.
Пример 1.
Предполагается, что применение новой технологии в разработке пластовых месторождений приведет к увеличению качества угля. Результаты контроля по качеству добытого угля двумя бригадами, работающими в аналогичных условиях, но использующими разные технологии, приведены ниже. Замеры велись по проценту засорения угля, вырабатываемого одной бригадой за смену по старой технологии (признак Х1) и новой технологии (признак Х2).
Х1 (в %): 13; 10,5; 11; 12; 20; 18,8; 10
Х2 (в %): 6; 13; 21; 7; 9; 9; 5; 10
Подтверждают ли эти результаты предположение об эффективности применения новой технологии? Принять a = 0,01 .
Предположить, что выборки получены из нормально распределенных генеральных совокупностей.
Проведем первичную обработку статистических данных, используя формулы для несгруппированного ряда данных (раздел 2.2, случай а).
Получим по признаку Х1 : объем выборки n=7;
Выборочная средняя (13+10,5+11+12+20+18,8+10)/7= 13,61
(132+10,52+112+122+202+18,82+102)/7= 199,67
Выборочная дисперсия Dв = 199,67 –13,612 = 14,44
Исправленная СКО S2x1 =14,44×7/6 = 16,84
Параметры признака Х2 рассчитываются аналогично:
n=8; 10; 116,625 ;
Dв = 116,625 – 102 = 16,625 : S2x2 =16,625×8/7 = 19 .
Вопрос эффективности применения новой технологии сводится к проверке статистической гипотезе о равенстве двух средних (математических ожиданий) генеральных совокупностей. Для корректного решения необходимо убедиться в равенстве дисперсий указанных генеральных совокупностей (п. 2.4.1).
Выдвинем основную и альтернативную гипотезы.
Н0: D(Х2) = D(Х1)
Н1: D(Х2) > D(Х1)
Для проверки гипотез по результатам выборок вычисляем наблюдаемое значение критерия (отношение большей дисперсии к меньшей):
Критическая область является правосторонней. Критическая точка находится по таблице критических точек распределения Фишера–Снедекора (приложение 7)
при a =0,01; k1 = 8 –1 = 7; k2 = 7 –1 = 6
Fкр=F(0,01;7;6) = 8,26
В результате сравнения получим Fнабл < Fкр. Значит, нет оснований отвергнуть нулевую гипотезу H0. Следовательно, принимаем гипотезу о равенстве дисперсий двух генеральных совокупностей.
Для выяснения эффективности применения новой технологии проверим статистическую гипотезу о равенстве двух средних генеральных совокупностей (п. 2.4.2).
Выдвинем основную и альтернативную гипотезы.
Н0: M(Х1) = M(Х2)
Н1: M(Х1) > M(Х1)
Принятие нулевой гипотезы Н0 даст основания считать, что новая система технологии добычи угля не приводит к изменению засорения угля.
Принятие гипотезы H1 будет значить, что новая система технологии приводит к уменьшению засорения угля, и, следовательно, она эффективна.
Для проверки гипотез по результатам выборок вычисляем наблюдаемое значение критерия
Этот критерий является случайной величиной, которая подчиняется закону распределения Стьюдента с k =7+8–2=13 степенями свободы.
Критическая область является правосторонней. Критическая точка находится по таблице критических точек распределения Стьюдента (приложение 6, односторонняя критическая область)
tкр = t(0,01;13) = 2,65.
В результате сравнения получим Tнабл < tкр . Значит, нет оснований отвергнуть нулевую гипотезу H0. Следовательно, новая система технологии не приводит к изменению качества угля по засорению. Она не эффективна.
Пример 2
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.