Q – загальна сума квадратів відхилень спостережуваних значень від загального середнього .
Знаючи Q, Q1 , Q2, можна оцінити відповідні дисперсії, тобто загальну, міжгрупову (факторну) і внутрішньогрупову (залишкову):
; ; ;
.
Звичайно розраховують Q і Q1, а потім обчислюють
Q2 = Q-Q1.
Для того, щоб перевірити при заданому рівні значущості α гіпотезу про рівність середніх декількох (m>2) нормальних сукупностей з невідомими, але однаковими дисперсіями, досить перевірити за критерієм Фішера гіпотезу про рівність факторної й залишкової дисперсії S1=S2 .
Якщо вплив всіх рівнів фактора g однаковий, то S1 і S2 – оцінки загальної дисперсії, тому відрізняються незначуще.
Гіпотези:
Н0 : S12 = S22; H1 : S12 > S22.
Розраховуємо Fр = , що має розподіл Фішера з k1= m-1 і k2 = m(n-1) ступенями вільності.
При заданому рівні значення aобчислюють критичне значення Fкр =F(a; k1; k2).
Якщо Fр > Fкр, то Н0 відкидається й робиться висновок про істотний вплив фактора γ.
Якщо Fp < Fкр – немає підстави відкидати гіпотезу Н0 і вважають, що вплив фактора γ несуттєвий.
Для більш повного розуміння, як будується F-статистика для перевірки гіпотези H0 , запишемо
Порівнюючи міжгрупову та залишкову дисперсії, за величиною їх відношення судять, наскільки сильно проявляється вплив фактора.
Однофакторний аналіз зручно подавати у вигляді таблиці.
Компоненти дисперсії |
Сума квадратів, (SS) |
Число ступенів вільності, (DS) |
Дисперсія (MS) |
Міжгрупова |
|
m-1 |
|
Внутрішньо- групова |
|
m(n-1) |
|
Загальна |
|
mn-1 |
Приклад. Необхідно виявити, чи впливає відстань від центра міста на ступінь заповнюваності готелів. Нехай введені 3 рівні відстаней від центра міста: 1) до 3 км, 2) від 3 до 5 км і 3) понад 5 км. Дані заповнюваності представлені в таблиці.
Відстань |
Заповнюваність |
||||||
До 3 км |
|
||||||
Від 3 до 5 км |
|
||||||
Понад 5 км |
|
Розв’язання.
Число вибірок m=3, число досліджених готелів для кожної вибірки n=6, загальна кількість спостережень mn=18.
Обчислимо середні значення для кожної вибірки і загальне середнє :
=93,333 = 86 =79,167 =86, 167.
Після чого знайдемо значення Q, Q1, Q2:
=904,5, =602,33,
Q2 = Q – Q1=302,167.
Обчислюємо міжгрупову дисперсію S1 та залишкову S2:
= =301,167,
==20,444.
Висуваємо гіпотези:
Н0 : S12 = S22; H1 : S12 > S22.
Розраховуємо Fр = =14,95, та при заданому рівні значення a=0,05 обчислюємо критичне значення Fкр =FРАСПОБР(0,05; 3-1; 3×(6-1))= 3,682.
Оскільки Fр > Fкр, то гіпотезу Н0 відкидаємо і робимо висновок про істотний вплив фактора, тобто фактор відстані від центра міста значуще впливає на ефективність заповнення готелів.
В Excel для проведення дисперсійного аналізу можна скористатися Сервис –Анализ данных – Однофакторный дисперсионныйанализ.
1 Досліджувані дані введіть у робочу таблицю Excel (діапазон А1:F3).
2 Виберіть пункт меню Сервис – Анализ данных. У діалоговому вікні Анализ данных у списку Инструменты анализа виберіть процедуру Однофакторный дисперсионныйанализ. Натисніть кнопку ОК. На екрані з’явиться вікно
3 В діалоговому вікні Однофакторный дисперсионный анализ у полі Входной интервал задайте А1:F3.
4 У розділі Группирование перемикач встановіть в положення по строкам.
5 Зазначте Выходной интервал і натисніть Ок.
У результаті буде отримана така таблиця:
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.