Основи кореляційно-регресійного аналізу: Методичні вказівки для вивчення теми курсів “Теорія ймовірностей та математична статистика”, “Економетріка” і “Математика для економістів”, страница 14

Безпосередньою підстановкою переконуємося, що розв’язком системи нормальних рівнянь є такі значення параметрів b0 = 0,6245b1 = 1,3057, що істотно відрізняються від параметрів породжуючої залежностіb0 = b1 = 1.

Розрахункові значення

наведені в останніх двох стовпцях табл. 11, графіки ліній регресії зображені пунктирними лініями на рис. 13. При  х= 0  замість очікуваного значення h=1 (з похибкою порядку e =0,05) отримане  yp=1,6 , що нікуди не годиться. Зовнішній вигляд графіка на рис. 13 б  і його розташування щодо емпіричних точок викликає сумніви в правильності вибору самої форми зв’язку.

Зробимо ж основний висновок з цього повчального прикладу: не можна відноситися до справи так, неначе метод найменших квадратів – сам по собі, а вихідні передумови – самі по собі. Пора усвідомити, що будь–які порушення вихідних гіпотез аналізу призводять до помилок у розв’язку, причому до помилок, які можна усунути шляхом деякої модернізації стандартної процедури оцінювання.

Для усунення гетероскедастичності помножимо обидві частини рівняння

Y = bX0 + bX1

на вагову функцію g. Форма зв’язку при цьому не зміниться. Вагову функцію підбираємо так, що б надійні спостереження з малим розкидом мали найбільшу вагу, а вплив викидів, по можливості, був виключений. Якщо ми бажаємо усунути погані наслідки функціонального перетворення результативної ознаки Y=F(y), то вагову функцію треба ввести так (нагадуємо, що  е = e..F', де e – вихідні похибки):

g =1 / F'  .

Для нашого прикладу  1 / y , F'1 / y, y2  (знак не важливий).

Множимо обидві частини рівняння

1 / y = b0 + bx + e

на  g = y2  і одержуємо (e  = e×y2):

y = by2 + bxy2 + e  .

Для цієї моделі (а модель – це не тільки форма зв’язку) система нормальних рівнянь має вигляд:

[y3] = b0 [y4] + b1 [x y4] ;

[x y3] = b0 [x y4] + b1 [x2 y4] .

(умови ортогональності похибок до кожного члена моделі [e y2]=0,
[e x y2]=0 ). Необхідні суми підраховані в табл. 12, звідки одержуємо:

1,330 = b0 ×1,284 + b1×0,105 ;

0,298 = b0 ×0,105 + b1×0,209 .

Таблиця 12

Розрахунок сум з урахуванням вагової функції  g=y2

n

x

y

y3

y4

xy3

xy4

x2y4

1 / yp

yp

h

1

0

0,105

1,1576

1,2155

0

0

0

0,959

1,043

1

2

1

0,50

0,0911

0,0410

0,0911

0,0410

0,0410

1,901

0,526

0,5

3

2

0,383

0,0562

0,0215

0,1124

0,0430

0,0861

2,843

0,352

0,333

4

3

0,200

0,0080

0,0016

0,0240

0,480

0,0144

3,786

0,264

0,25

5

4

0,250

0,0156

0,0039

0,0624

0,0156

0,0624

4,728

0,212

0,2

6

5

0,117

0,0016

0,0002

0,0080

0,0010

0,0050

5,670

0,176

0167

Суми

1,3301

1,2837

0,2979

0,1054

0,2089

Розв’язком нової системи нормальних рівнянь є значення параметрів b= 0,959,  b1 = 0,942, що дуже близькі до очікуваних b0 = b1 = 1 (параметрів породжуючої залежності).

В останніх колонках табл. 12 обчислені розрахункові значення 1 / yp і yp ; для порівняння наведені ординати породжуючої залежності. Відповідність між заданою (h) і відновленої методом зважених НК залежностями дуже добра. Таким чином, заміна стандартної процедури МНК на більш загальну процедуру зважених НК забезпечила виконання передумови регресійного аналізу щодо рівноточності спостережень.