Модель парной линейной регрессии. Точечное и интегральное прогнозирование, страница 7

                                                          ~ t N(                     − 2),                        (28) 

S σ

где t N( − 2) – распределение Стьюдента с (N − 2) степенями свободы.

Выражение (28) является основой для построения процедур проверки статистических гипотез относительно параметров регрессионной модели. Если в (28) заменить неизвестные истинные значения дисперсий их оценками, получим

(θ θˆ1 1)

                                                                      ~ t N( − 2).                           (29) 

Sθˆ1

Величина 

(θ θˆ1 1)

                                                               t =                                                (30) 

Sθˆ1

известна в математической статистике как «статистика Стьюдента»

[9,14,20,21].

Аналогичным образом можно показать, что величина 

(θ θˆ0 0)

                                                              t =                                                 (31) 

Sθˆ0

также распределена по закону Стьюдента t N( − 2).

Следует отметить такой важный факт, что при выполнении условий регулярности исходных данных и при большом количестве наблюдений, введенные t-статистики (30), (31) будут распределены по закону Стьюдента

t N(    − 2) и без предположения о нормальности случайных ошибок [14].

3.8. Проверка статистических гипотез о параметрах. Доверительные интервалы

Относительно параметров θ0 и θ1 линейной модели можно проверять некоторые утверждения, оформленные в виде статистических гипотез.

Основные гипотезы регрессионного анализа относительно параметров θ0 и θ1 линейной модели можно условно разделить на два типа. К первому типу будем относить гипотезы о значении параметров. Для параметра θ1 в общем случае эта гипотеза записывается в виде

                                                              H0 :θ θ1 = 10,                                 (32) 

где θ10 – некоторое заданное значение. 

Если вернуться к примеру из п.3.4, то при исследовании зависимости величины оборота от затрат на рекламу нас может интересовать вопрос: «Можно ли считать эффективность рекламной кампании такой, что каждая вложенная тысяча средств дает прирост оборота на 3 млн. рублей?» В виде гипотезы это можно записать следующим образом:

                                                                H0 1 = 3.

Для остальных параметров гипотезы о значении записываются аналогичным образом.

Ко второму типу гипотез будем относить гипотезы о незначимости параметров, которые позволяют оценить факт влияния отдельных факторов на зависимую переменную. По своей сути гипотеза о незначимости является частным случаем гипотезы о значении, в которой идет проверка на равенство нулевому значению. 

Например, для параметра θ1 в общем случае эта гипотеза записывается в виде

                                                                H0 1 = 0.                                   (33) 

Если эта гипотеза не отвергается, то можно считать, что независимая переменная не оказывает существенного (значимого) влияния на отклик. Другими словами, при справедливости гипотезы (33) независимая переменная исключается из модели. Графически это означает, что  линия регрессии лишь случайно отклоняется от линии, параллельной оси x. В этом случае можно смело записать, что E y( ) =θ0 .

Проверка гипотез о значении и о незначимости параметров проводится по одной и той же схеме с помощью критерия Стьюдента [14, 20]. Поэтому рассмотрим процедуру проверки только для гипотезы (32).

Пусть заданы гипотезы H0 и ее альтернатива H1:

                                                              H0 :θ θ1 = 10,

                                                              H1 :θ θ1 10.

Предположим, что верна гипотеза H0 и, исходя из этого, вычислим значение t-статистики, подставив в (30) вместо истинного значения θ1 гипотетическое значение θ10:

(θ θˆ1 − 10)       t = .

Sθˆ1