Как уже отмечалось выше, найденное значение t является реализацией случайной величины, распределенной по закону Стьюдента с (N − 2) степенями свободы. Как и раньше, гипотеза H0 отвергается, если t > têð ((1−α),N − 2), где têð ((1−α),N − 2) – критическое значение, найденное по таблицам квантилей распределения Стьюдента. Если t ≤ têð ((1−α),N − 2), то гипотеза H0 не отвергается.
Нетрудно заметить, что при проверке гипотезы о незначимости параметра θ1, малые абсолютные значения t-статистики соответствуют отсутствию достоверной статистической связи между регрессором и откликом.
Проверка гипотез для параметра θ0 проводится аналогично, с той разницей, что вместо статистики (30) используется статистика (31).
Часто в задачу исследования может входить не только проверка соответствия найденных оценок параметров некоторым заданным значениям, но и определения с заданной вероятностью (1−α) диапазона, в котором эти параметры могут изменяться. Для этого достаточно разрешить относительно θ1 неравенство
θ θˆ1 − 1
P
Sθˆ1
В результате получим
< têð = (1−α).
P{θˆ1 −têðSθˆ1 <θ θ1 < ˆ1 + têðSθˆ1} = (1−α),
т.е. с вероятностью (1−α) истинное значение параметра θ1 находится в
интервале θˆ1 −têðSθˆ1 ; θˆ1 + têðSθˆ1.
При построении доверительного интервала получаем намного больше информации, чем при проверке гипотез о значении. Любая гипотеза на равенство значению, лежащему внутри интервала, не будет отвергаться, и наоборот – гипотеза о значении, лежащем вне интервала, будет всегда отвергаться.
В продолжение нашего примера допустим, что для параметра θ1 был получен 95 %-й доверительный интервал [1.9; 3.7]. Этот факт позволяет говорить о том, что при увеличении рекламных расходов на одну тысячу рублей ожидаемый прирост оборота с вероятностью 0.95 может принимать любые значения в диапазоне от 1.9 млн. руб. до 3.7 млн. руб.
3.9. Разложение суммы квадратов и проверка значимости уравнения регрессии
После того как найдено уравнение парной регрессии, необходимо провести оценку его адекватности исследуемому процессу. Проверить на адекватность (на значимость) уравнение регрессии – это значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, наблюдаемым процессам или явлениям. Оценка значимости уравнения регрессии может проводиться с помощью F-критерия Фишера [14, 20]. Непосредственному расчету F-критерия предшествует анализ дисперсии. При этом основная роль отводится разложению общей суммы квадратов отклонений переменной y от среднего значения y на две части –
«объясненную» и «необъясненную (остаточную)».
Общая сумма квадратов
N
∑(yi−y)2
i=1
характеризует величину разброса значений зависимой переменной. Этот разброс может быть вызван, с одной стороны, изменениями входных факторов, а с другой – случайными воздействиями или неучтенными в модели факторами. Если неучтенных факторов нет, и случайные воздействия отсутствуют, то все изменения отклика должны объясняться моделью.
Для того чтобы выделить объясненную и необъясненную части, подставим в общую сумму квадратов очевидное тождество
yi − y = ( yi − yˆi ) + ( yˆi − y).
В результате получим
N N N N
∑( yi−y)2 = ∑(yi−yˆi )2 + ∑( yˆi − y)2 + 2∑( yi−yˆi )( yˆi − y).
i=1 i=1 i=1 i=1
В силу специфических свойств вектора остатков [14] последнее слагаемое обращается в ноль, т.е.
N
2∑( yi−yˆi )( yˆi − y) = 0.
i=1
Поэтому справедливо следующее равенство:
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.