Основи кореляційно-регресійного аналізу: Методичні вказівки для вивчення теми курсів “Теорія ймовірностей та математична статистика”, “Економетріка” і “Математика для економістів”, страница 7

Індекс детермінації одержуємо шляхом ділення  SSu   на  SSy :

  .

Отриманий результат показує, що близько 59% мінливості  y  можна пояснити наявністю кореляційного зв’язку   y  по  x.

Для порівняння методик зробимо аналогічні статистичні висновки про значущість спряженого кореляційного зв’язку  x по y за готовими формулами без використання таблиці дисперсійного аналізу. Раніш при угрупованні даних на  l = 9  груп по змінній  y  були отримані такі значення оцінок дисперсій:

 .

Тут  vj – середні інтервальні (середні групові).

Обчислимо індекс детермінації:

 .

Таким чином, спряженою кореляційною залежністю пояснюється 67% загальної мінливості  x , тобто спряжена залежність виявилася більш тісною.

Дисперсійне відношення Фішера

треба порівнювати з табличними значеннями F0,05(851)=2,10 і F0,01(851)= 2,82. Оскільки F=13,0 майже в 5 разів перевищує верхню межу F0,01 , то “нуль-гіпотеза” відхиляється; спряжена кореляційна залежність визнається значущою.

Тіснота і значущість одновимірної лінійної моделі не залежить від напрямку причинно-наслідкових зв’язків. Для обох залежностей мірою тісноти зв’язку буде коефіцієнт кореляції:

 .

Обчислюємо коефіцієнт детермінації:

(тобто близько 45% загальної мінливості пояснюється лінійним зв’язком).

Дисперсійне відношення Фішера:

порівнюємо з табличними значеннями F0,05(1, 58)=4  і  F0,01(1, 58)=7. Оскільки Fr>F0,01 , робимо висновок про значущість лінійної моделі.

Наведемо також таблицю дисперсійного аналізу (II) для перевірки значущості лінійної моделі (y по x). Нижній рядок нової таблиці (для загальної мінливості) такий же, як у табл. 5. Суми квадратів  SSp  і  SSe  обчислюємо за допомогою коефіцієнта детермінації   :

ЧСС залишків моделі дорівнює  ne = n - 2 = 60 - 2 = 58, оскільки на залишки накладено два зв’язки – два рівняння нормальної системи; останнє ЧСС одержуємо як різницю:  np = ny - np = 59 – 5 = 1.

Таблиця 6

Дисперсійний аналіз (II)
для перевірки значущості лінійної моделі

Джерело
мінливості

Суми
 квадратів


ЧСС

Середні
квадрати

Дисперсійне відношення

Табличні

значення

SS

n

MS

F

F0,05

F0,01

Модель (yp)

508,35

1

508,35

47,07

4,00

7,00

Залишок (e)

626,36

58

10,80

Загальне (y)

1134,72

59

19,23

Інші елементи табл. 6 – такі самі, як і для табл. 5.

За таблицею дисперсійного аналізу отримано попереднє значення дисперсійного відношення Fr = 47,07, і зроблений той самий висновок про значущість моделі, що і при використанні готової формули.

Отже, встановлено факт наявності значущого кореляційного зв’язку  y по x, що пояснює 58,9% усієї мінливості результативної ознаки. Для опису цього зв’язку прийнято лінійну модель. Вона також виявилася значущою, але пояснила лише 44,8% повної мінливості. Різниця (h r2100% = 58,9 – 44,8 = 14,1%  обумовлюється систематичними похибками (похибками специфікації, неадекватністю моделі).

Чи істотний цей чи ефект, чи не можна ним знехтувати?  Перевірку адекватності лінійної моделі також робимо в таблиці дисперсійного аналізу.

Таблиця 7

Дисперсійний аналіз (III)
для перевірки адекватності лінійної моделі.

Джерело
мінливості

Суми
 квадратів


 ЧСС

Середні квадрати

Дисперсійне відношення

Табличні

значення

SS

n

MS

F

F0,05

F0,01

Неадекватність (А)

159,80

1

39,95

4,62

2,52

3,65

Випадковість (e)

466,56

54

8,64

Залишок (e)

626,36

58

10,80