Как уже отмечалось выше,
найденное значение t является реализацией случайной величины, распределенной
по закону Стьюдента с (N −
2) степенями свободы. Как и раньше, гипотеза H0 отвергается,
если t > têð
((1−α),N
− 2),
где têð ((1−α),N − 2)
– критическое значение, найденное по таблицам квантилей распределения Стьюдента.
Если t ≤ têð
((1−α),N
− 2),
то гипотеза H0 не отвергается.
Нетрудно заметить, что при проверке гипотезы о незначимости параметра θ1, малые абсолютные значения t-статистики соответствуют отсутствию достоверной статистической связи между регрессором и откликом.
Проверка гипотез для параметра θ0 проводится аналогично, с той разницей, что вместо статистики (30) используется статистика (31).
Часто в задачу исследования может входить не только проверка соответствия найденных оценок параметров некоторым заданным значениям, но и определения с заданной вероятностью (1−α) диапазона, в котором эти параметры могут изменяться. Для этого достаточно разрешить относительно θ1 неравенство
θ θˆ1 − 1
P
Sθˆ1
В результате получим
< têð = (1−α).
P{θˆ1 −têðSθˆ1 <θ θ1 < ˆ1 + têðSθˆ1} = (1−α),
т.е. с вероятностью (1−α) истинное значение параметра θ1 находится в
интервале θˆ1 −têðSθˆ1 ; θˆ1 + têðSθˆ1.
При построении доверительного интервала получаем намного больше информации, чем при проверке гипотез о значении. Любая гипотеза на равенство значению, лежащему внутри интервала, не будет отвергаться, и наоборот – гипотеза о значении, лежащем вне интервала, будет всегда отвергаться.
В продолжение нашего примера допустим, что для параметра θ1 был получен 95 %-й доверительный интервал [1.9; 3.7]. Этот факт позволяет говорить о том, что при увеличении рекламных расходов на одну тысячу рублей ожидаемый прирост оборота с вероятностью 0.95 может принимать любые значения в диапазоне от 1.9 млн. руб. до 3.7 млн. руб.
3.9. Разложение суммы квадратов и проверка значимости уравнения регрессии
После того как найдено уравнение
парной регрессии, необходимо провести оценку его адекватности исследуемому процессу.
Проверить на адекватность (на значимость) уравнение регрессии – это значит установить,
соответствует ли математическая модель, выражающая зависимость между переменными,
наблюдаемым процессам или явлениям. Оценка значимости уравнения регрессии может
проводиться с помощью F-критерия Фишера [14, 20]. Непосредственному расчету
F-критерия предшествует анализ дисперсии. При этом основная роль отводится
разложению общей суммы квадратов отклонений переменной y от среднего значения
y на две части –
«объясненную» и «необъясненную (остаточную)».
Общая сумма квадратов
N
∑(yi−y)2
i=1
характеризует величину разброса значений зависимой переменной. Этот разброс может быть вызван, с одной стороны, изменениями входных факторов, а с другой – случайными воздействиями или неучтенными в модели факторами. Если неучтенных факторов нет, и случайные воздействия отсутствуют, то все изменения отклика должны объясняться моделью.
Для того чтобы выделить объясненную и необъясненную части, подставим в общую сумму квадратов очевидное тождество
yi
− y = (
yi −
yˆi
)
+ (
yˆi
− y).
В результате получим
N N N N
∑(
yi−y)2
= ∑(yi−yˆi )2
+ ∑(
yˆi −
y)2
+ 2∑(
yi−yˆi
)(
yˆi −
y).
i=1 i=1 i=1 i=1
В силу специфических свойств вектора остатков [14] последнее слагаемое обращается в ноль, т.е.
N
2∑(
yi−yˆi
)(
yˆi −
y)
= 0.
i=1
Поэтому справедливо следующее равенство:
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.