ЛЕКЦИЯ 6
Стохастические регрессоры и инструментальные переменные
В практике статистических исследований и эконометрического моделирования очень часто довольно трудно определить, можно ли считать объясняющие переменные неслучайными. К тому же существует весьма широкий спектр реальных задач регрессионного анализа, в которых объясняющие переменные имеют явно стохастическую природу.
Разобьем описание регрессионного анализа линейных моделей со стохастическими объясняющими переменными на три случая:
1) объясняющие переменные независимы от регрессионных остатков и их распределение не зависит от оцениваемых параметров модели и ;
2) объясняющие переменные Х коррелирован с регрессионными остатками ;
3) объясняющие переменные могут быть измерены только со случайными ошибками.
Природу регрессионных остатков определим в достаточно общем виде:
,
.
1. Случайные остатки не зависят от регрессоров и оцениваемых коэффициентов регрессии . В данном случае к нашей модели применимы все методы и результаты, полученные при КЛММР () и ОЛММР (при произвольной симметричной и положительно определенной матрице ). Правда, интерпретация этих результатов при стохастических регрессорах базируется на понятии условного распределения регрессионных остатков , в котором в качестве условия используется фиксированность матрицы наблюдаемых значений объясняющих переменных.
2. Стохастические регрессоры Х коррелированны. Если хотя бы одна из объясняющих переменных Х асимптотически (по ) коррелирует с регрессионными остатками , то не стремится (по вероятности) к нулевому вектору и, следовательно, МНК- оценки уже не будут состоятельными. При этом всего один ненулевой элемент вектора может приводить к несостоятельности всех компонент МНК- оценки . Действительно,
.
Мы видим, что корреляция между объясняющими переменными и регрессионными остатками является серьёзным препятствием к использованию обыкновенного метода наименьших квадратов. Поэтому для анализа моделей такого типа используется альтернативный метод, называемый методом инструментальных переменных.
В качестве основного инструмента метода используются вспомогательные переменные , которые требуется подобрать так, чтобы:
1. имелась бы принципиальная возможность измерять их значения на тех же объектах (или в те же “моменты времени”), на которых мы располагаем значениями исходных объясняющих переменных ;
2. переменные должны быть асимптотически (по ) некоррелированы с регрессионными остатками , т.е.
; (1)
3. перекрестные (смешанные) вторые моменты переменных и в пределе (по ) не все равны нулю и образуют невырожденную (положительно определенную) -матрицу , т.е.
; (2)
4. должна существовать положительно определенная матрица такая, что
. (3)
Отметим, что если некоторые из исходных объясняющих переменных можно считать некоррелированными с регрессионными остатками , то их можно использовать для формирования столбцов матрицы и находить дополнительно вспомогательные переменные только для оставшихся столбцов.
Найденные в соответствии с условиями (1)-(4) переменные называют инструментальными, а оценки неизвестных параметров находятся по формуле
. (4)
Оценка будет состоятельной, но, вообще говоря, не оптимальной. Оценка для ее условной ковариационной матрицы может быть вычислена по формуле
, (5)
где
. (6)
Анализ правой части (5) приводит к выводу, что чем выше корреляция между и , тем точнее будут оценки метода инструментальных переменных . И, наоборот, при слабой коррелированности инструментальных переменных с исходными объясняющими переменными Х среднеквадратические ошибки оценок оказываются чрезмерно большими, устремляясь в бесконечность при приближении всех ковариаций между и к нулевым значениям. Так, например, в случае единственной объясняющей переменной “инструментальная” оценка коэффициента наклона линии регрессии будет равна:
,
а ее выборочная дисперсия
.
Так что, если и слабо коррелированы, то знаменатель в выражении для будет близок к нулю и, следовательно, выборочная дисперсия оценки окажется чрезмерно большой.
3. Случайные ошибки в измерении значений объясняющих переменных. Прежде всего отметим, что случайные ошибки в измерении результирующего показателя (при условии их нулевых средних значений и некоррелированности с объясняющими переменными и регрессионными остатками ) приводят лишь к увеличению остаточной дисперсии (или дисперсии остатка), но не влияют ни на несмещенность, ни на состоятельность МНК- оценок. Действительно, пусть - вектор-столбец (высоты ) случайных ошибок измерения анализируемого результирующего показателя , так что в качестве его наблюденных значений мы располагаем вектор- столбцом
.
Получаем модель:
.
Анализ (по стандартной схеме) полученных по наблюдениям МНК- оценок
,
проведенный с учетом свойств вектора случайных ошибок (, подтверждает, что МНК- оценки остаются несмещенными, состоятельными и оптимальными.
Теперь проанализируем , как влияют случайные ошибки в измерении значений объясняющих переменных на МНК- оценки параметров классической ЛММР. При этом мы будем предполагать:
Здесь - вектор случайных ошибок в измерении объясняющих переменных --матрица искаженных наблюденных значений объясняющих переменных, а - вектор наблюдаемых (искаженных) значений объясняющих переменных.
В рамках КЛММР получаем:
.
МНК- оценка для будет
.
Проанализируем поведение правой части при :
1) ; 2) : 3) .
Переходя к пределу (по вероятности) при , имеем:
. (7)
Отсюда видно, что оценка в данном случае не является ни состоятельной, ни несмещенной (ее асимптотически неустранимое смещение оказывается равным величине ). Степень смещения оценки определяется истинным значением параметра, структурой матрицы наблюденных значений объясняющих переменных и ковариационной матрицей ошибок измерения.
Как же поступают при анализе подобных моделей? Это зависит от априорной информации, которой располагает исследователь. Если из предыстории или с помощью специальных экспертных опросов мы можем оценить матрицы и , то на основании (7) можно построить “подправленную МНК- оценку”
.
В остальных случаях, как правило, обращаются к методу инструментальных переменных.
Тест Хаусмана
Как определить, следует ли использовать инструментальные переменные или достаточно применять обычный метод наименьших квадратов? Ответ на этот вопрос равносилен тестированию гипотезы против альтернативной гипотезы . Предположим, что наряду с обычной МНК-оценкой есть оценка , полученная с помощью некоторых инструментальных переменных. При гипотезе оценка является состоятельной и эффективной, а при альтернативной гипотезе - несостоятельной. Оценка состоятельна как при нулевой, так и при альтернативной гипотезах. Таким образом, при нулевой гипотезе разность стремится к нулю, и естественно ожидать, что при соответствующей нормировке распределение этой разности будет асимптотически совпадать с каким-нибудь известным распределением.
Хаусман (Hausman, 1978) доказал, что асимптотически
и величина
асимптотически имеет распределение хи-квадрат с степенями свободы.
Двухшаговый метод наименьших квадратов
Метод оценивания с помощью инструментальных переменных является обобщением обычного метода наименьших квадратов. Нахождение нужных инструментальных переменных является нелегкой задачей, решение которой зависит от конкретной ситуации.
Совпадение числа инструментальных переменных с числом исходных переменных не является обязательным условием. Достаточно потребовать, чтобы число инструментальных переменных было не меньше, чем число независимых переменных. Выведем формулу для в этом случае. Пусть - -матрица, столбцы которой линейно независимы, причем .
Воспользуемся геометрической интерпретацией МНК. Рассмотрим каждый столбец , матрицы как -мерный вектор и спроектируем его на -мерное подпространство, порожденное столбцами матрицы , получив векторы . Это эквивалентно тому, что мы осуществляем регрессию на и находим прогнозные значения . Их мы теперь будем считать новыми независимыми переменными, и оценка вектора параметров строится с помощью обычной регрессии на . Таким образом МНК применяется дважды – сначала для построения регрессоров , а затем для нахождения оценки . Эта процедура носит название двухшагового метода наименьших квадратов.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.