Пусть ,
, …,
–
математические ожидания результативного признака
соответственно
при уровнях
,
, …,
. Если для различных групп фактора
математические ожидания не изменяются, то
считается, что результативный признак
не зависит
от фактора
, в противном случае такая зависимость
имеется.
Поскольку числовые значения математических ожиданий неизвестны, то возникает задача проверки гипотезы
:
в предположении выполнения следующих условий для каждой группы фактора:
1) наблюдения независимы и проводятся в одинаковых условиях,
2) результативный признак имеет нормальный закон
распределения с постоянной дисперсией для различных групп.
Поскольку числовые значения дисперсий различных групп неизвестны, то
можно установить их равенство, проверив гипотезу о равенстве дисперсий :
с помощью статистики
Бартлетта [7]:
,
имеющей
распределение близкое к -распределению с
степенями свободы.
Здесь
,
,
– выборочная дисперсия
-ой группы (
).
При заданном уровне значимости находится
критическая точка
=
,
определяющая правостороннюю критическую область
. По выборочным
данным вычисляется наблюдаемое значение статистики
. Если
>
, то
гипотеза
:
отвергается, в
противном случае принимается.
Если гипотеза :
подтверждается,
то можно приступать непосредственно к процедуре однофакторного дисперсионного
анализа, т.е. проверке гипотезы
:
.
Общая сумма квадратов отклонений (общая вариация) отдельных наблюдений от общей средней
,
вызванная влиянием на
фактора
и
случайных неучтенных (остаточных) факторов, вычисляется по формуле
.
Сумма разлагается на сумму
+
,
где
=
– сумма квадратов
отклонений между группами (межгрупповая вариация), вызванная влиянием фактора
на
и
характеризующая рассеяние групповых средних около общей средней;
=
– сумма квадратов
отклонений внутри групп (остаточной вариации), вызванная влиянием на
остаточных факторов и характеризующая рассеяние
отдельных наблюдений группы около ее средней.
По выборке значений результативного признака находятся
три несмещенные оценки
,
,
дисперсии
случайной величины
,
причем
всегда является несмещенной оценкой, а
,
только
при выполнении гипотезы
:
,
т.е. только в том случае, когда фактор
не
влияет на результативный признак
.
Проверка нулевой гипотезы основывается на
сравнении оценок
,
. Для
этого используется статистика
=
,
имеющая
-распределение с
и
степенями свободы.
По статистическим данным вычисляется наблюдаемое значение статистики . Для заданного уровня значимости
по таблицам критических точек
-распределения находится критическая точка
статистики
=
и строится правосторонняя критическая
область
. Если
<
, то нулевая гипотеза не отвергается, и в этом случае
говорят, что влияние фактора
на признак
не подтвердилось выборочными наблюдениями.
Если в процессе анализа выявлено влияние фактора на результативный признак
, то степень данного влияния измеряется с помощью
выборочного коэффициента детерминации
,
показывающего
какая доля вариации объясняется зависимостью результативного
признака
от влияющего фактора
.
Работа в Excel. Для анализа данных с помощью Критерия Бартлетта используется статистические функции
ДИСП(число1;число2;…),
ХИ2ОБР(вероятность;степени_свободы).
Таблица 2. Однофакторный дисперсионный анализ: дисперсии групп
ИТОГИ |
||||
Группы |
Счет |
Сумма |
Среднее |
Дисперсия |
Столбец 1 |
|
|
|
|
Столбец 2 |
|
|
|
|
|
|
|
|
|
Столбец |
|
|
|
|
Для проведения однофакторного анализа используется Однофакторный дисперсионный анализ из Анализа данных меню Сервис. После заполнения одноименного диалогового окна результат анализа появляется в виде двух таблиц. Формулы, по которым выполняются расчеты в Excel, представлены в таблицах 2 и 3 соответственно.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.