Учебно-справочное руководство по статистическим расчетам в изучении курса "Математическая статистика", страница 10

          Пусть эмпирическое распределение задано интервальным статистическим рядом

Интервал

х  1 – х  2

х  2 – х 3

х i–1 – х i

х m –1 – х m

 ni

n  1

n  2

n  i

n m

Объем выборки равен  n = n  1+ n 2+…+ n m .

Требуется при заданном уровне значимости a проверить, подчиняется ли генеральная совокупность выбранному теоретическому закону распределения f(x).

Выдвинем гипотезы

     Н0:  Признак Х подчиняется закону распределения f(x)            

    Н1:  Признак Х не подчиняется закону распределения f(x)

Для проверки сформулированных  гипотез при помощи критерия Колмогорова-Смирнова необходимо выполнить ряд расчетов.

а) Определяют по выборке параметры выбранного теоретического распределения f(x).  Пусть r - число параметров распределения. 

б) Для каждого интервала Х определяют вероятности попадания признака Х в данный интервал. Для этого нужно использовать формулу из теории вероятности

 .

Здесь f(x) – дифференциальная функция распределения, F(x) – интегральная функция распределения. Для многих видов распределения имеются таблицы значений f(x) и F(x).

в) Определяют теоретические частоты

                          .

г) Находят накопленные частоты: для эмпирических частот – n×Fn(x) ; для теоретических частот – n×F(x). Для этого следует для каждого интервала последовательно складывать частоты, начиная с первого интервала и заканчивая текущим интервалом. Результаты расчетов удобно записать в таблицу.

д) Далее вычисляют модуль разности накопленных частот в каждом интервале  ôn×Fn(x) – n×F(x)ô = n×ôFn(x) – ×F(x)ô.

е) Находят наибольший из полученных модулей

  n ×D = max{n×ôFn(x) – ×F(x)ô}.

 ж) Определяют наблюдаемое значение критерия согласия Колмогорова

                        .                             

Этот критерий является случайной величиной, которая подчиняется закону распределения  Колмогорова.

з) По таблице критических точек (приложение 8), используя заданный уровень значимости a находят критическое значение критерия       lкр =  l(a).

е) Если в результате сравнения окажется lнабл < lкр, то нет оснований отвергнуть нулевую гипотезу H0; если же  lнабл > lкр, то нулевая гипотеза H0 отвергается; принимается гипотеза H1.

Замечание: в критерии Колмогорова рекомендуется брать более “жесткий” уровень значимости  a ³ 0,1. 

4.6  Примеры

Пример 1.

Предполагается, что применение новой технологии в разработке пластовых месторождений  приведет к увеличению качества угля. Результаты контроля по качеству  добытого угля двумя бригадами, работающими в аналогичных условиях, но использующими разные технологии, приведены ниже. Замеры велись по проценту засорения угля, вырабатываемого одной бригадой за смену по старой технологии (признак Х1) и новой технологии (признак Х2).

Х1 (в %): 13; 10,5; 11; 12; 20; 18,8; 10

 Х2 (в %): 6; 13; 21; 7; 9; 9; 5; 10

Подтверждают ли эти результаты предположение об эффективности применения новой технологии?  Принять a = 0,01 .

Предположить, что выборки получены из нормально распределенных генеральных совокупностей. 

Проведем первичную обработку статистических данных, используя формулы для несгруппированного ряда данных (раздел 2.2, случай а).

Получим по признаку Х1 :  объем выборки  n=7; 

Выборочная средняя  (13+10,5+11+12+20+18,8+10)/7= 13,61

(132+10,52+112+122+202+18,82+102)/7= 199,67

Выборочная дисперсия Dв = 199,67 –13,612 = 14,44

Исправленная СКО   S2x1 =14,44×7/6 = 16,84

Параметры признака Х2 рассчитываются аналогично:

n=8;     10;     116,625 ;

Dв = 116,625 – 102 = 16,625 :    S2x2 =16,625×8/7 = 19  .

Вопрос эффективности применения новой технологии сводится к проверке статистической гипотезе о равенстве двух средних (математических ожиданий) генеральных совокупностей. Для корректного решения необходимо убедиться в равенстве дисперсий указанных генеральных совокупностей (п. 2.4.1).

Выдвинем основную и альтернативную гипотезы. 

     Н0: D(Х2) = D(Х1)                                            

     Н1: D(Х2) > D(Х1)                                  

Для проверки гипотез по результатам выборок вычисляем наблюдаемое значение критерия (отношение большей дисперсии к меньшей):

                

Критическая область является правосторонней. Критическая точка находится по таблице критических точек распределения Фишера–Снедекора (приложение 7)

при a =0,01;    k1 = 8 –1 = 7;  k2 = 7 –1 = 6

Fкр=F(0,01;7;6) = 8,26

В результате сравнения получим Fнабл < Fкр. Значит,  нет оснований отвергнуть нулевую гипотезу H0. Следовательно, принимаем гипотезу о равенстве дисперсий двух генеральных совокупностей.

          Для выяснения эффективности применения новой технологии   проверим статистическую гипотезу о равенстве двух средних генеральных совокупностей (п. 2.4.2).

Выдвинем основную и альтернативную гипотезы.

     Н0: M(Х1) = M(Х2)      

     Н1: M(Х1) > M(Х1)           

Принятие нулевой гипотезы Н0  даст основания считать, что новая система технологии добычи угля не приводит к изменению засорения угля.

Принятие гипотезы H1 будет значить, что новая система технологии  приводит к уменьшению засорения угля, и, следовательно, она эффективна.

Для проверки гипотез по результатам выборок вычисляем наблюдаемое значение критерия                 

        

Этот критерий является случайной величиной, которая подчиняется закону распределения Стьюдента с  k =7+8–2=13  степенями свободы.

Критическая область является правосторонней. Критическая точка находится по таблице критических точек распределения Стьюдента (приложение 6, односторонняя критическая область)  

 tкр = t(0,01;13) = 2,65.

В результате сравнения получим Tнабл < tкр . Значит,  нет оснований отвергнуть нулевую гипотезу H0. Следовательно, новая система технологии не приводит к изменению качества угля по засорению. Она не эффективна.


Пример 2