4. Спецификация эконометрической модели
Метод оптимального выбора объясняющих переменных
Заметим,
что возрастает при добавлении еще
одного регрессора, что не всегда означает улучшение качества модели. Чтобы
устранить этот эффект, используется скорректированный
:
. (1)
В нашем случае:
Отметим, что
, (2)
Наилучшей
считается модель с наибольшим .
Строятся модели вида:
, где
,
.
Алгоритм выбора .
1-й шаг
Рассматриваются модели вида:
при
всевозможных .
Находится
независимая переменная , для которой
максимально.
Обозначим
индекс этой переменной через .
Обозначим:
,
Обозначим
через значение показателя
для оптимальной модели,
полученной на первом шаге.
k-й шаг
Рассматриваются модели вида:
при
всевозможных .
Находится
независимая переменная , для которой
максимально.
Обозначим
индекс этой переменной через .
Обозначим:
Обозначим
через значение показателя
для оптимальной модели,
полученной на данном шаге.
Далее
сравнивается c
.
В
случае :
1)
модель считается лучшей, чем модель
, и полагается
;
2)
если (т.е. не все переменные включены
в модель
), осуществляется переход к
следующему шагу (т.е. значение
увеличивается
на единицу)
3)
если , то на этом заканчивается процесс
выбора оптимальной модели; в этом случае все переменные включены в оптимальную
модель.
В
случае , оптимальной считается модель
и на этом заканчивается процесс
выбора оптимальной модели.
Пример 5
Данные о рыночной цене коттеджей, а также об их площади, вместимости гаража и количестве комнат приведены в табл. 3. Требуется построить линейную регрессионную модель для оценки рыночной стоимости коттеджей.
Наблюдения |
Площадь |
Гараж |
Спальни |
Цена |
1 |
1 |
0 |
2 |
65 |
2 |
1,1 |
0 |
2 |
73 |
3 |
1,15 |
1 |
2 |
85 |
4 |
1,4 |
0 |
3 |
87 |
5 |
1,7 |
1 |
3 |
98 |
6 |
1,8 |
1 |
4 |
105 |
7 |
1,9 |
0 |
3 |
95 |
8 |
1,9 |
1 |
4 |
125 |
9 |
2,1 |
2 |
4 |
125 |
10 |
2,1 |
2 |
4 |
137 |
11 |
2,3 |
2 |
4 |
150 |
1-й шаг
Строим
модели: ,
,
и для них находим
.
|
|
1 |
0,8554 |
2 |
0,7317 |
3 |
0,7703 |
Максимальное
значение на 1-м шаге 0,8554 при
.
Итак,
,
,
На первом шаге выбрана модель:
и
полагается
2-й шаг
Строим
модели: ,
,
и для них находим
.
|
|
2 |
0,9239 |
3 |
0,8466 |
Максимальное
значение на 2-м шаге 0,9239 при
.
Итак,
,
,
Сравниваем
и
.
Поскольку
, модель
лучше модели
.
Следовательно,
на втором шаге выбирается модель :
и
полагается
3-й шаг
Строим
модель: и для нее находим
|
|
3 |
0,9179 |
Значение
на 2-м шаге 0,9179 при
.
Итак,
,
,
Сравниваем
и
.
Поскольку
, модель, полученная на 2-м шаге,
считается лучше модели, полученной на 3-м шаге.
Следовательно,
в качестве оптимальной выбирается модель :
.
Методы выбора вида зависимости
В общем случае регрессионная модель имеет вид:
,
(3)
где
.
Функция
не обязательно линейна
относительно
, и зависит от вектора параметров
. Следовательно,
,
(4)
Заметим,
что часто число параметров совпадает с
числом объясняющих факторов
, т.е.
. (Если
, можно считать, что
.)
Для
получения оценок коэффициентов
можно использовать МНК:
(5)
(6)
Затем можно рассчитать скорректированный коэффициент детерминации в соответствии с формулой (1):
(7)
и
на основе этого коэффициента выбрать оптимальный вид модели и произвести
оптимальный отбор значимых объясняющих факторов. (Вначале рассмотреть несколько
видов функции , для них произвести
оптимальный отбор объясняющих факторов, и выбрать вид функции
с наибольшим
.)
Отметим, что одним из способов решения оптимизационной задачи (6) является использование условий первого порядка:
,
(8)
т.е. решение системы вообще говоря нелинейных уравнений (8).
Сведение нелинейной регрессии к линейной
Часто представляется возможным свести нелинейную регрессию вида:
(9)
к линейной.
Логарифмическая (лог-линейная) модель
Пусть исходная модель – показательная:
(10)
Экономический смысл.
Из (10):
(11)
Отсюда:
. (12)
В
силу (12) – эластичность фактора
по фактору
, т.е.
показывает
процентное изменение
при увеличении
в расчете на 1%.
Следовательно,
модель (10) целесообразно использовать, если есть основания полагать, что
эластичности постоянны, т.е. при равных
относительных изменениях фактора
относительные
изменения фактора
также (приблизительно)
равны.
Прологарифмировав соотношение (10), получим:
, (13)
или:
. (14)
Модель (14) – это так называемая двойная логарифмическая модель (и зависимая, и объясняющие переменные заданы в логарифмическом виде).
Введя
обозначения: ,
,
получим линейную модель:
(15)
относительно
новых переменных и
.
Полулогарифмические модели
Пусть
(16)
Из (16):
(17)
Отсюда:
(18)
Следовательно,
показывает относительное
изменение фактора
при увеличении фактора
в расчете на одну единицу.
(Умножив
на 100 получим процентное изменение
при увеличении
в расчете на одну единицу.)
Эту
модель целесообразно использовать, если есть основания считать, что при равных
абсолютных изменениях фактора относительные
изменения фактора
также (приблизительно)
равны.
Прологарифмировав (16), получим:
(19)
или
, (20)
где
.
Пусть
(21)
Из (21):
(22)
Отсюда:
(23)
Следовательно,
показывает абсолютное изменение
фактора
при увеличении фактора
в расчете на 1%.
Эту модель целесообразно использовать, если есть основания считать
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.