Другий крок складається з двох подшагов. На першому з них, що виконується, якщо число регрессоров уже більше двох, робиться спроба виключити один з регрессоров. Шукається той регрессор Xs, видалення якого приводить до найменшого зменшення коефіцієнта детермінації. Потім порівнюється значення F-статистики для перевірки гіпотези Але про незначимість цього регрессора з деяким заздалегідь заданим граничним значенням (див. (4.3)). Якщо F < , то Xs віддаляється зі списку регрессоров. Помітимо, що гіпотеза Але про рівність коефіцієнта при Xs нулю еквівалентний гіпотезі про рівність коефіцієнтів детермінації до і після видалення регрессора, а також гіпотезі про те, що коефіцієнт приватної кореляції X, і Y дорівнює 0. Другий подшаг складається в спробі включення нового регрессора з вихідного набору предсказывающих перемінних. Шукаємо перемінну Хр із найбільшим по модулі приватним коефіцієнтом кореляції (виключається вплив раніше включених у рівняння регрессоров) і порівнюємо значення F-статистики для перевірки гіпотези Але про незначимість цього регрессора з деяким заздалегідь заданим граничним значенням . Якщо F > то Хр включається в список регрессоров. Другий крок повторюється доти, поки відбувається зміна списку регрессоров. Звичайно, жодна з покрокових процедур не гарантує одержання оптимального за яким-небудь критерієм набору регрессоров.
Одне з припущень класичної регресійної моделі полягає в тому, що випадкові помилки некоррелированы між собою і мають постійну дисперсію. У тих випадках, об'єкти, що коли спостерігаються, досить однорідні, не сильно відрізняються друг від друга, таке допущення виправдане. Однак у багатьох ситуаціях таке припущення нереалістичне. Наприклад, якщо досліджується залежність витрат на харчування в родині від її загального доходу, те природно очікувати, що розкид виданих буде вище для родин з більш високим доходом. Це означає, що дисперсії залежних величин (а, отже, і випадкових помилок) не постійні. Це явище в эконометрике називається гетероскедастичностью (на відміну від гомоскедастичности — рівності дисперсій). Крім того, при аналізі тимчасових рядів у досить рідких випадках можна вважати, що спостереження некоррелированы в часі. Як правило, значення досліджуваної величини в сучасний момент часу статистично залежить від її значень у минулому, що означає наявність кореляції між помилками. Тому природно вивчати моделі регресії без припущення, що (див. роздягнув 5.1 формула (5.6)).
У даному розділі ми будемо розглядатитак називануузагальнену регресійну модель
, (6.4)
де — n×1 вектор залежних перемінних, Х — n×k матриця незалежних перемінних, — k×1 вектор невідомих параметрів, — вектор випадкових помилок, причому:
1) матриця Х невипадкова і має повний ранг k;
2) ;
3) і матриця позитивно визначена.
Іншими словами, узагальнена модель відрізняється від класичної тільки умовою 3).
До системи (6.4) можна застосувати звичайний метод найменших квадратів. Але оцінка матриці ковариаций вектора , одержувана при використанні звичайного методу найменших квадратів, є зміщеної.
Для одержання ефективної оцінки треба скористатися так називаним узагальненим методом найменших квадратів (ОМНК).
Сутність узагальненого методу найменших квадратів. Відповідь на питання про ефективну лінійну незміщену оцінку вектора для моделі (6.4) дає наступна теорема.
Теорема Айткена. У класі лінійних незміщених оцінок вектора для узагальненої регресійної моделі оцінка
(6.5)
має найменшу матрицю ковариаций.
Підкреслимо, що для застосування ОМНК необхідно знати матрицю , що на практиці буває вкрай рідко. Тому цілком природним здається такий спосіб: оцінити (яким-небудь образом) матрицю , а потім використовувати цю оцінку у формулі (6.5) замість . Викладений підхід складає суть так називаного доступного узагальненого методу найменших квадратів.
Цей розділ присвячений вивченню двох важливих класів узагальнених регресійних моделей. Перший складають моделі з гетероскедастичностью. Термін «гетероскедастичность» застосовується в ситуації, коли матриця ковариаций вектора помилок є діагональної, але елементи головної діагоналі, узагалі говорячи, різні. Іншими словами, помилки в різних спостереженнях некоррелированы, але їхньої дисперсії — різні. Моделі другого класу, як правило, використовуються при аналізі даних, що мають характер тимчасових рядів. У цих випадках часто приходиться брати до уваги та обставина, що спостереження в різні моменти часу статистично залежний (типовий приклад — щоденний обмінний курс долара стосовно гривні). Отже, помилки, що відносяться до різних спостережень (різним моментам часу), можуть бути коррелированы, і ковариационная матриця вектора помилок не є діагональної. Формально проблему оцінювання невідомих параметрів вирішує узагальнений метод найменших квадратів, розглянутий у попередній главі. Однак, як там відзначалося, його застосування вимагає знання матриці ковариаций , вектора помилок, що буває вкрай рідко. Тому, крім теоретичних питань, у даній главі будуть порушені деякі аспекти практичного використання ОМНК.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.