5.1. Введение. Предположения
Рассмотрение простейшей двухфакторной модели, методов исследования, свойств охватывает лишь элементарные экономические ситуации. Более реальными являются эконометрические модели, включающие несколько факторов.
Будем исходить из того, что с целью исследования линейной связи между результирующим фактором Y и объясняющими k-1 факторами X2, …, Xk было выполнено статистическое наблюдение. В результате наблюдения зарегистрирована выборка объема n, которую представим таблицей вида (табл. 5.1)
Таблица 5.1
№ п/п |
Y |
X2 |
X3 |
… |
Xk |
1 |
Y1 |
X12 |
X13 |
… |
X1k |
2 |
Y2 |
X22 |
X23 |
… |
X2k |
… |
… |
… |
… |
… |
… |
n |
Yn |
Xn2 |
Xn3 |
… |
Xnk |
Предположим, что существует линейная связь между Y и факторами X2, …, Xkвида:
,
(5.1)
где слагаемое U отражает влияние на других факторов, ошибки измерений, ошибки выбора типа модели. Это предположение назовем гипотезой линейности. Тогда для наблюденных величин (табл. 5.1) можно записать
(5.2)
В системе
уравнений (5.2) коэффициенты и параметры
распределения для случайных величин Ui
неизвестны
и должны быть оценены. В этом состоит одна из задач, которые необходимо решать.
Систему (5.2) запишем в матричной форме:
,
(5.3)
где
.
(5.4)
В обозначениях (5.4) матрица
наблюдений X содержит столбец, состоящий из единиц.
Этот столбец относится к свободному члену .
Для получения оценок вектора примем ряд предположений относительно способа получения наблюдений. В зависимости от сделанных предположений разрабатываются или подбираются методы оценивания.
Основные и наиболее простые гипотезы наряду с гипотезой линейности (5.1) следующие:
;
(5.5)
;
(5.6)
- матрица
фиксированных чисел; (5.7)
(5.8)
.
(5.9)
Гипотеза
(5.5) означает, что для всех i , т.е. что
случайные переменные Ui имеют нулевое математическое
ожидание.
Гипотеза
(5.6) очень важна в том смысле, что она отражает совокупность свойств
ковариационной матрицы In - единичная матрица размерности n. В этой
гипотезе выражены свойства, выполнение которых мы требуем. Первое: - это свойство некоррелированности случайных
величин ; второе:
для
всех i - свойство постоянства дисперсии случайных величин
Ui , называемое гомоскедастичностью.
Гипотеза (5.7) является обобщением на случай нескольких факторов аналогичного предположения о постоянстве фактора X в случае линейной двухфакторной модели.
Тем самым
оказывается, что у вектора единственным источником возмущений является
случайный вектор . В этом случае говорят, что свойства искомых
оценок и критериев обусловлены матрицей
наблюдений X.
Гипотеза
(5.8) характеризует, во-первых, отсутствие строгой линейной зависимости между
объясняющими переменными и, во-вторых, что число наблюдений n больше числа объясняющих переменных k.
В
соотношении (5.8) обозначение
выражает
ранг матрицы X.
Принадлежность
вектора возмущений множеству нормально распределенных векторных
случайных величин, выраженная в (5.9), фактически объединяет предположения
(5.5) и (5.6).
5.2.
Нахождение оценки вектора
методом наименьших квадратов
Обозначим через -
вектор-столбец, оценивающий вектор
. Можем
записать:
(5.10)
где
через обозначен вектор-столбец остатков
.
Критерий - сумма квадратов компонент вектора остатков - имеет вид
. (5.11)
Для
нахождения значения , минимизирующего эту сумму
квадратов отклонений, продифференцируем (5.11) по
.
Приравнивая полученное выражение нулевому вектору, получаем систему нормальных
уравнений в векторно-матричной форме (сравни с (3.14)):
.
(5.12)
На основе гипотезы (5.8) получаем основной результат:
.
(5.13)
Оценка
вектора параметров
найдена.
Подставляя
(5.3) в (5.13), можно получить следующее важное представление для оценки :
. (5.14)
Отсюда сразу следует, что
.
(5.15)
Результат (5.15) означает, что
вектор оценок является
несмещенным.
Можно
показать, что ковариационная матрица вектора оценок имеет вид:
.
(5.16)
Равенство
(5.16) означает, что дисперсия компоненты вектора
может быть
оценена путем перемножения i-го элемента главной
диагонали матрицы
на дисперсию случайного
возмущения
. Аналогично ковариация пары оценок
и
определяется
умножением (i,j)-го
элемента матрицы
на
.
Подытоживая
рассмотрение свойств оценок , отметим, что в силу предположения
(5.9) элементы вектора
удовлетворяют многомерному нормальному
распределению, т.е.
.
(5.17)
Если
дисперсия возмущений Uизвестна, то
факты, представленные соотношениями (5.13), (5.14), (5.16) могут быть непосредственно
использованы для проверки значимости компонент вектора
и построения
доверительных интервалов. В случае незнания
можно
поступить следующим образом. Так как
и
есть линейные комбинации нормально
распределенных случайных величин, то они тоже распределены нормально. Можно
показать, что
, где
– нулевая матрица из n строк и k столбцов.
Последнее означает, что они распределены независимо друг от друга.
Этот
результат позволяет использовать t-распределение
для проверки гипотез относительно каждого из регрессионных коэффициентов . Величина
имеет
независимое от
распределение
с
степенями
свободы. Отсюда по определению t-распределения
величина
(5.18)
удовлетворяет t-распределению
с степенями свободы.
Гипотеза о
значимости проверяется следующим образом. В
(5.18) подставляем интересующее нас гипотетическое значение
и рассчитываем t. Значение t сравниваем
с критическим
, соответствующим
степеням свободы и
%-му уровню доверия. Если окажется,
что выполнено неравенство
,
то гипотеза о значимости отбрасывается.
Примером
проверки отсутствия линейной зависимости Y от X является
проверка гипотезы H0 : .
Соотношение
(5.18) дает %-ный доверительный интервал для
вида
Рассмотрим
подход к совместной проверке гипотез относительно нескольких или всех .
Выдвинем нулевую гипотезу
против
альтернативной , состоящей в том, что не
все
равны нулю. Вектор
. Нулевая гипотеза предполагает, что
отсутствует влияние всех
факторов
на
.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.