Модель парной линейной регрессии. Точечное и интегральное прогнозирование, страница 11

Таблица 1 Таблица дисперсионного анализа

Источник дисперсии

Число степеней свободы

Сумма квадратов

Средняя сумма квадратов

Fстатистика

Fкритическое

Значимость

Регрессия

1

RSS

RSS

 

1

F

Fêð

Да / Нет

Ошибка

N − 2

ESS

ESS

 

N − 2

Итог

N −1

TSS

TSS

 

N −1

В эту таблицу включены все основные результаты расчетов, проводимых при проверке значимости регрессионной модели, а именно: TSS , RSS и ESS – элементы из разложения (35); F – статистика Фишера, вычисляемая по формуле (42); Fêð – критическое значение статистики Фишера для соответствующего уровня доверительной вероятности. Кроме этого, в таблице дисперсионного анализа часто присутствует ответ на вопрос: «Значимо ли уравнение регрессии?» (иногда последний столбец таблицы дисперсионного анализа может опускаться).

3.11. Прогнозирование в регрессионных моделях

Если после проверки уравнения регрессии на значимость было установлено, что оно является пригодным для практического использования, то оно может применяться для построения различных прогнозов. Следует отметить, что обычно термин «прогнозирование» используется в тех случаях, когда требуется предсказать состояние наблюдаемого объекта в будущем. Для регрессионных моделей он имеет более широкое значение. Здесь может возникнуть потребность оценить значение зависимой переменной для некоторого заданного, часто отсутствующего в исходных данных, значения независимой переменной. Именно в этом смысле – как построение оценки зависимой переменной – и следует понимать прогнозирование в эконометрике.

Обычно различают точечное и интервальное прогнозирование. В первом случае требуется вычислить конкретное число – ожидаемое значение зависимой переменной, во втором случае требуется указать интервал, в котором с известной доверительной вероятностью находится истинное значение зависимой переменной. Выделяют также безусловное и условное прогнозирование в зависимости от того, задано ли интересующее нас значение объясняющей переменной точно или с погрешностью.

Допустим, нам задано известное значение независимой переменной xÏ и при таком значении требуется спрогнозировать значение зависимой переменной. Точечный прогноз может быть очень просто вычислен по уравнению регрессии путем подстановки xÏ вместо независимой переменной:

                                                          yˆÏ =θ θˆ0 + ˆ1xÏ .

В силу того что вероятность попадания в любую точку равна нулю, фактическое значение зависимой переменной yÏ при заданном значении xÏ никогда в точности не совпадет с точечным прогнозом yˆÏ . Поэтому на практике точечный прогноз всегда следует дополнять расчетом стандартной

ошибки прогноза σyˆÏ и интервальным прогнозом.

Для заданного уровня доверительной вероятности (1−α) при известной стандартной ошибке σyˆÏ истинное значение зависимой переменной будет находиться в интервале

                                                 yˆÏ têðσyˆÏ yÏ yˆÏ + têðσyˆÏ ,                     (43) 

где têð критическое значение, найденное по таблицам квантилей распределения Стьюдента.

Для оценки стандартной ошибки прогноза подставим оценку (14) в уравнение регрессии и получим

   yˆÏ = y −θ θˆ1x + ˆ1xÏ  или

                                                        yˆÏ = y ˆ1(xÏ x).

Нетрудно заметить, что дисперсия прогноза может быть выражена следующим образом

                                                     σ σ σyÏ = y2 + θ2ˆ1 (xÏ x)2.                 (44) 

Из математической статистики известно, что 

2 σ2         σy =  .

N

Заменяя неизвестное значение σ2 на ее оценку S2 , получим

2