Стохастические регрессоры и инструментальные переменные. Метод инструментальных переменных

Страницы работы

Содержание работы

ЛЕКЦИЯ 6

Стохастические регрессоры и инструментальные переменные

В практике статистических исследований и эконометрического моделирования очень часто довольно трудно определить, можно ли считать объясняющие переменные неслучайными. К тому же существует весьма широкий спектр реальных задач регрессионного анализа, в которых объясняющие переменные имеют явно стохастическую природу.

Разобьем описание регрессионного анализа линейных моделей  со стохастическими объясняющими переменными на три случая:

1)  объясняющие переменные независимы от регрессионных остатков  и их распределение не зависит от оцениваемых параметров модели  и ;

2)  объясняющие переменные Х коррелирован с регрессионными остатками ;

3)  объясняющие переменные могут быть измерены только со случайными ошибками.

Природу регрессионных остатков  определим в достаточно общем виде:

                                                 ,                                                              

                                                 .                                                

1. Случайные остатки не зависят от регрессоров  и оцениваемых коэффициентов регрессии . В данном случае к нашей модели применимы все методы и результаты, полученные при КЛММР () и ОЛММР (при произвольной симметричной и положительно определенной матрице ). Правда, интерпретация этих результатов при стохастических регрессорах  базируется на понятии условного распределения регрессионных остатков , в котором в качестве условия используется фиксированность матрицы  наблюдаемых значений объясняющих переменных.

2. Стохастические регрессоры Х коррелированны. Если хотя бы одна из объясняющих переменных Х асимптотически (по ) коррелирует с регрессионными остатками , то  не стремится (по вероятности) к нулевому вектору и, следовательно, МНК- оценки  уже не будут состоятельными. При этом всего один ненулевой элемент вектора  может приводить к несостоятельности всех компонент МНК- оценки . Действительно,

                     .

Мы видим, что корреляция между объясняющими переменными и регрессионными остатками является серьёзным препятствием к использованию обыкновенного метода наименьших квадратов. Поэтому для анализа моделей такого типа используется альтернативный метод, называемый методом инструментальных переменных.

Метод инструментальных переменных

В качестве основного инструмента метода используются вспомогательные переменные , которые требуется подобрать так, чтобы:

1. имелась бы принципиальная возможность измерять их значения на тех же объектах (или в те же “моменты времени”), на которых мы располагаем значениями исходных объясняющих переменных ;

2. переменные  должны быть асимптотически (по ) некоррелированы с регрессионными остатками , т.е.

                                         ;                                                     (1)

3. перекрестные (смешанные) вторые моменты переменных  и  в пределе (по ) не все равны нулю и образуют невырожденную (положительно определенную) -матрицу , т.е.

                                          ;                                              (2)

4. должна существовать положительно определенная матрица  такая, что

                                           .                                              (3)

Отметим, что если некоторые из исходных объясняющих переменных  можно считать некоррелированными с регрессионными остатками , то их можно использовать для формирования столбцов матрицы  и находить дополнительно вспомогательные переменные только для оставшихся столбцов.

Найденные в соответствии с условиями (1)-(4) переменные  называют инструментальными, а оценки неизвестных параметров  находятся по формуле

                                                 .                                                  (4)

Оценка  будет состоятельной, но, вообще говоря, не оптимальной. Оценка для ее условной ковариационной матрицы  может быть вычислена по формуле

                            ,                                         (5)

где

                                       .                                  (6)

Анализ правой части (5) приводит к выводу, что чем выше корреляция между  и , тем точнее будут оценки метода инструментальных переменных . И, наоборот, при слабой коррелированности инструментальных переменных  с исходными объясняющими переменными Х среднеквадратические ошибки оценок оказываются чрезмерно большими, устремляясь в бесконечность при приближении всех ковариаций между  и  к нулевым значениям. Так, например, в случае единственной объясняющей переменной  “инструментальная” оценка коэффициента  наклона линии регрессии будет равна:

                                          ,

а ее выборочная дисперсия

                                               .

Так что, если  и  слабо коррелированы, то знаменатель в выражении для  будет близок к нулю и, следовательно, выборочная дисперсия оценки  окажется чрезмерно большой.

3. Случайные ошибки в измерении значений объясняющих переменных. Прежде всего отметим, что случайные ошибки в измерении результирующего показателя  (при условии их нулевых средних значений и некоррелированности с объясняющими переменными  и регрессионными остатками ) приводят лишь к увеличению остаточной дисперсии (или дисперсии остатка), но не влияют ни на несмещенность, ни на состоятельность МНК- оценок. Действительно, пусть  - вектор-столбец (высоты ) случайных ошибок измерения анализируемого результирующего показателя , так что в качестве его наблюденных значений мы располагаем вектор- столбцом

                                        .

Получаем модель:

                                   .

Анализ (по стандартной схеме) полученных по наблюдениям  МНК- оценок

                 ,

проведенный с учетом свойств вектора случайных ошибок  (, подтверждает, что МНК- оценки остаются несмещенными, состоятельными и оптимальными.

Теперь проанализируем , как влияют случайные ошибки в измерении значений объясняющих переменных на МНК- оценки параметров классической ЛММР. При этом мы будем предполагать:

                       

Здесь  - вектор случайных ошибок в измерении объясняющих переменных --матрица искаженных наблюденных значений объясняющих переменных, а  - вектор наблюдаемых (искаженных) значений объясняющих переменных.

В рамках КЛММР получаем:

                                                    .

МНК- оценка для  будет

                                           

                                                     .

Проанализируем поведение правой части при :

            1) ;   2) :   3) .

Переходя к пределу (по вероятности) при , имеем:

            .                  (7)

Отсюда видно, что оценка  в данном случае не является ни состоятельной, ни несмещенной (ее асимптотически неустранимое смещение оказывается равным величине ). Степень смещения оценки определяется истинным значением параметра, структурой матрицы наблюденных значений объясняющих переменных и ковариационной матрицей ошибок измерения.

Как же поступают при анализе подобных моделей? Это зависит от априорной информации, которой располагает исследователь. Если из предыстории или с помощью специальных экспертных опросов мы можем оценить матрицы   и , то на основании (7) можно построить “подправленную МНК- оценку”

                                           .

В остальных случаях, как правило, обращаются к методу инструментальных переменных.

Тест Хаусмана

Как определить, следует ли использовать инструментальные переменные или достаточно применять обычный метод наименьших квадратов? Ответ на этот вопрос равносилен тестированию гипотезы  против альтернативной гипотезы . Предположим, что наряду с обычной МНК-оценкой  есть оценка , полученная с помощью некоторых инструментальных переменных. При гипотезе  оценка  является состоятельной и эффективной, а при альтернативной гипотезе  - несостоятельной. Оценка  состоятельна как при нулевой, так и при альтернативной гипотезах. Таким образом, при нулевой гипотезе разность  стремится к нулю, и естественно ожидать, что при соответствующей нормировке распределение этой разности будет асимптотически совпадать с каким-нибудь известным распределением.

Хаусман (Hausman, 1978) доказал, что асимптотически

                                    

и величина

                                           

асимптотически имеет распределение хи-квадрат с  степенями свободы.

Двухшаговый метод наименьших квадратов

Метод оценивания с помощью инструментальных переменных является обобщением обычного метода наименьших квадратов. Нахождение нужных инструментальных переменных является нелегкой задачей, решение которой зависит от конкретной ситуации.

Совпадение числа инструментальных переменных с числом исходных переменных не является обязательным условием. Достаточно потребовать, чтобы число инструментальных переменных было не меньше, чем число независимых переменных. Выведем формулу для  в этом случае. Пусть  - -матрица, столбцы которой линейно независимы, причем .

Воспользуемся геометрической интерпретацией МНК. Рассмотрим каждый столбец , матрицы  как -мерный вектор и спроектируем его на -мерное подпространство, порожденное столбцами матрицы , получив векторы . Это эквивалентно тому, что мы осуществляем регрессию  на  и находим прогнозные значения . Их мы теперь будем считать новыми независимыми переменными, и оценка  вектора параметров  строится с помощью обычной регрессии  на . Таким образом МНК применяется дважды – сначала для построения регрессоров , а затем для нахождения оценки . Эта процедура носит название двухшагового метода наименьших квадратов.

Похожие материалы

Информация о работе