Індекс детермінації одержуємо шляхом ділення SSu на SSy :
.
Отриманий результат показує, що близько 59% мінливості y можна пояснити наявністю кореляційного зв’язку y по x.
Для порівняння методик зробимо аналогічні статистичні висновки про значущість спряженого кореляційного зв’язку x по y за готовими формулами без використання таблиці дисперсійного аналізу. Раніш при угрупованні даних на l = 9 груп по змінній y були отримані такі значення оцінок дисперсій:
.
Тут vj – середні інтервальні (середні групові).
Обчислимо індекс детермінації:
.
Таким чином, спряженою кореляційною залежністю пояснюється 67% загальної мінливості x , тобто спряжена залежність виявилася більш тісною.
Дисперсійне відношення Фішера
треба порівнювати з табличними значеннями F0,05(8, 51)=2,10 і F0,01(8, 51)= 2,82. Оскільки F=13,0 майже в 5 разів перевищує верхню межу F0,01 , то “нуль-гіпотеза” відхиляється; спряжена кореляційна залежність визнається значущою.
Тіснота і значущість одновимірної лінійної моделі не залежить від напрямку причинно-наслідкових зв’язків. Для обох залежностей мірою тісноти зв’язку буде коефіцієнт кореляції:
.
Обчислюємо коефіцієнт детермінації:
(тобто близько 45% загальної мінливості пояснюється лінійним зв’язком).
Дисперсійне відношення Фішера:
порівнюємо з табличними значеннями F0,05(1, 58)=4 і F0,01(1, 58)=7. Оскільки Fr>F0,01 , робимо висновок про значущість лінійної моделі.
Наведемо також таблицю дисперсійного аналізу (II) для перевірки значущості лінійної моделі (y по x). Нижній рядок нової таблиці (для загальної мінливості) такий же, як у табл. 5. Суми квадратів SSp і SSe обчислюємо за допомогою коефіцієнта детермінації :
ЧСС залишків моделі дорівнює ne = n - 2 = 60 - 2 = 58, оскільки на залишки накладено два зв’язки – два рівняння нормальної системи; останнє ЧСС одержуємо як різницю: np = ny - np = 59 – 5 = 1.
Таблиця 6
Дисперсійний аналіз (II)
для перевірки значущості лінійної моделі
Джерело |
Суми |
|
Середні |
Дисперсійне відношення |
Табличні значення |
|
SS |
n |
MS |
F |
F0,05 |
F0,01 |
|
Модель (yp) |
508,35 |
1 |
508,35 |
47,07 |
4,00 |
7,00 |
Залишок (e) |
626,36 |
58 |
10,80 |
|||
Загальне (y) |
1134,72 |
59 |
19,23 |
Інші елементи табл. 6 – такі самі, як і для табл. 5.
За таблицею дисперсійного аналізу отримано попереднє значення дисперсійного відношення Fr = 47,07, і зроблений той самий висновок про значущість моделі, що і при використанні готової формули.
Отже, встановлено факт наявності значущого кореляційного зв’язку y по x, що пояснює 58,9% усієї мінливості результативної ознаки. Для опису цього зв’язку прийнято лінійну модель. Вона також виявилася значущою, але пояснила лише 44,8% повної мінливості. Різниця (h2 ‑ r2)´100% = 58,9 – 44,8 = 14,1% обумовлюється систематичними похибками (похибками специфікації, неадекватністю моделі).
Чи істотний цей чи ефект, чи не можна ним знехтувати? Перевірку адекватності лінійної моделі також робимо в таблиці дисперсійного аналізу.
Таблиця 7
Дисперсійний аналіз (III)
для перевірки адекватності лінійної моделі.
Джерело |
Суми |
|
Середні квадрати |
Дисперсійне відношення |
Табличні значення |
|
SS |
n |
MS |
F |
F0,05 |
F0,01 |
|
Неадекватність (А) |
159,80 |
1 |
39,95 |
4,62 |
2,52 |
3,65 |
Випадковість (e) |
466,56 |
54 |
8,64 |
|||
Залишок (e) |
626,36 |
58 |
10,80 |
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.