Пусть , , …, – математические ожидания результативного признака соответственно при уровнях , , …, . Если для различных групп фактора математические ожидания не изменяются, то считается, что результативный признак не зависит от фактора , в противном случае такая зависимость имеется.
Поскольку числовые значения математических ожиданий неизвестны, то возникает задача проверки гипотезы
:
в предположении выполнения следующих условий для каждой группы фактора:
1) наблюдения независимы и проводятся в одинаковых условиях,
2) результативный признак имеет нормальный закон распределения с постоянной дисперсией для различных групп.
Поскольку числовые значения дисперсий различных групп неизвестны, то можно установить их равенство, проверив гипотезу о равенстве дисперсий : с помощью статистики Бартлетта [7]:
,
имеющей распределение близкое к -распределению с степенями свободы.
Здесь
,
,
– выборочная дисперсия -ой группы ().
При заданном уровне значимости находится критическая точка =, определяющая правостороннюю критическую область . По выборочным данным вычисляется наблюдаемое значение статистики . Если >, то гипотеза : отвергается, в противном случае принимается.
Если гипотеза : подтверждается, то можно приступать непосредственно к процедуре однофакторного дисперсионного анализа, т.е. проверке гипотезы :.
Общая сумма квадратов отклонений (общая вариация) отдельных наблюдений от общей средней , вызванная влиянием на фактора и случайных неучтенных (остаточных) факторов, вычисляется по формуле
.
Сумма разлагается на сумму
+,
где = – сумма квадратов отклонений между группами (межгрупповая вариация), вызванная влиянием фактора на и характеризующая рассеяние групповых средних около общей средней; = – сумма квадратов отклонений внутри групп (остаточной вариации), вызванная влиянием на остаточных факторов и характеризующая рассеяние отдельных наблюдений группы около ее средней.
По выборке значений результативного признака находятся три несмещенные оценки , , дисперсии случайной величины , причем всегда является несмещенной оценкой, а , только при выполнении гипотезы :, т.е. только в том случае, когда фактор не влияет на результативный признак .
Проверка нулевой гипотезы основывается на сравнении оценок , . Для этого используется статистика
=,
имеющая -распределение с и степенями свободы.
По статистическим данным вычисляется наблюдаемое значение статистики . Для заданного уровня значимости по таблицам критических точек -распределения находится критическая точка статистики = и строится правосторонняя критическая область . Если <, то нулевая гипотеза не отвергается, и в этом случае говорят, что влияние фактора на признак не подтвердилось выборочными наблюдениями.
Если в процессе анализа выявлено влияние фактора на результативный признак , то степень данного влияния измеряется с помощью выборочного коэффициента детерминации
,
показывающего какая доля вариации объясняется зависимостью результативного признака от влияющего фактора .
Работа в Excel. Для анализа данных с помощью Критерия Бартлетта используется статистические функции
ДИСП(число1;число2;…),
ХИ2ОБР(вероятность;степени_свободы).
Таблица 2. Однофакторный дисперсионный анализ: дисперсии групп
ИТОГИ |
||||
Группы |
Счет |
Сумма |
Среднее |
Дисперсия |
Столбец 1 |
||||
Столбец 2 |
||||
Столбец |
Для проведения однофакторного анализа используется Однофакторный дисперсионный анализ из Анализа данных меню Сервис. После заполнения одноименного диалогового окна результат анализа появляется в виде двух таблиц. Формулы, по которым выполняются расчеты в Excel, представлены в таблицах 2 и 3 соответственно.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.