Модель парной линейной регрессии. Точечное и интегральное прогнозирование, страница 8

Как уже отмечалось выше, найденное значение t является реализацией случайной величины, распределенной по закону Стьюдента с (N − 2) степенями свободы. Как и раньше, гипотеза H0 отвергается, если t > têð ((1−α),N − 2), где têð ((1−α),N − 2) – критическое значение, найденное по таблицам квантилей распределения Стьюдента. Если t têð ((1−α),N − 2), то гипотеза H0 не отвергается. 

Нетрудно заметить, что при проверке гипотезы о незначимости параметра θ1, малые абсолютные значения t-статистики соответствуют отсутствию достоверной статистической связи между регрессором и откликом.

Проверка гипотез для параметра θ0 проводится аналогично, с той разницей, что вместо статистики (30) используется статистика (31).

Часто в задачу исследования может входить не только проверка соответствия найденных оценок параметров некоторым заданным значениям, но и определения с заданной вероятностью (1−α) диапазона, в котором эти параметры могут изменяться. Для этого достаточно разрешить относительно θ1 неравенство


θ θˆ1 − 1

                                                P

 Sθˆ1

В результате получим

 < têð  = (1−α).




                                   Pˆ1 têðSθˆ1 <θ θ1 < ˆ1 + têðSθˆ1} = (1−α),

т.е. с вероятностью (1−α) истинное значение параметра θ1 находится в

интервале θˆ1 −têðSθˆ1 ; θˆ1 + têðSθˆ1.

При построении доверительного интервала получаем намного больше информации, чем при проверке гипотез о значении. Любая гипотеза на равенство значению, лежащему внутри интервала, не будет отвергаться, и наоборот – гипотеза о значении, лежащем вне интервала, будет всегда отвергаться.

В продолжение нашего примера допустим, что для параметра θ1 был получен 95 %-й доверительный интервал [1.9; 3.7]. Этот факт позволяет говорить о том, что при увеличении рекламных расходов на одну тысячу рублей ожидаемый прирост оборота с вероятностью 0.95 может принимать любые значения в диапазоне от 1.9 млн. руб. до 3.7 млн. руб. 

3.9. Разложение суммы квадратов и проверка значимости уравнения регрессии

После того как найдено уравнение парной регрессии, необходимо провести оценку его адекватности исследуемому процессу. Проверить на адекватность (на значимость) уравнение регрессии – это значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, наблюдаемым процессам или явлениям. Оценка значимости уравнения регрессии может проводиться с помощью F-критерия Фишера [14, 20]. Непосредственному расчету F-критерия предшествует анализ дисперсии. При этом основная роль отводится разложению общей суммы квадратов отклонений переменной y от среднего значения y на две части –

«объясненную» и «необъясненную (остаточную)». 

Общая сумма квадратов 

N

                                                               ∑(yiy)2  

i=1

характеризует величину разброса значений зависимой переменной. Этот разброс может быть вызван, с одной стороны, изменениями входных факторов, а с другой – случайными воздействиями или неучтенными в модели факторами. Если неучтенных факторов нет, и случайные воздействия отсутствуют, то все изменения отклика должны объясняться моделью. 

Для того чтобы выделить объясненную и необъясненную части, подставим в общую сумму квадратов очевидное тождество

                                               yi y = ( yi yˆi ) + ( yˆi y).

В результате получим

                             N                              N                               N                                  N

 ∑( yiy)2 = ∑(yiyˆi )2 + ∑( yˆi y)2 + 2∑( yiyˆi )( yˆi y).

                            i=1                           i=1                           i=1                              i=1

В силу специфических свойств вектора остатков [14] последнее слагаемое обращается в ноль, т.е.

N

                                                  2∑( yiyˆi )( yˆi y) = 0.

i=1

Поэтому справедливо следующее равенство: