Проверку на значимость регрессионного уравнения можно проводить с помощью статистической гипотезы, например, относительно величины коэффициента детерминации:
H0 : R2 = 0, (37)
H1 : R2 ≠ 0.
Проверка этой гипотезы может проводиться с помощью F-критерия. Этот критерий опирается на тот факт, что отношение объясненной дисперсии зависимой переменной к остаточной дисперсии подчиняется распределению Фишера. Поскольку на практике истинные значения этих дисперсий остаются неизвестными, то приходится их оценивать с помощью соответствующих сумм квадратов отклонений.
Из разложения сумм квадратов (34) может быть получено разложение для дисперсий [21]:
D y( ) = D y( )ˆ + D y( − yˆ),
где D y( ) – полная дисперсия зависимой переменной y , D y( )ˆ – объясненная дисперсия или дисперсия расчетных значений yˆ , D y( − yˆ) – остаточная или необъясненная дисперсия.
В качестве оценок полной, остаточной и объясненной дисперсий используются отношения соответствующих сумм квадратов к своим числам степеней свободы:
N
2 TSS , (38)
N
D yˆ( − yˆ) = S2 = ESS = , (39)
N
RSS i 1 . (40)
= = =
1 1
Если сравнить соотношения (18) и (39), то можно заметить, что дисперсия случайной ошибки и остаточная дисперсия оцениваются одинаковым образом.
Из математической статистики известно [20, 21], что величина
Sy2ˆ
F = 2 (41)
S
подчиняется распределению Фишера с 1 и (N − 2) степенями свободы. При проверке гипотезы (37) вычисленное по формуле (41) значение F-статистики сравнивают с критическим значением Fêð ((1−α),1,(N − 2)). Критическое значение F-статистики – это максимальная величина отношения дисперсий, которая для заданного уровня доверительной вероятности (1−α) может иметь место при случайном отклонении от нулевой гипотезы. Это значение определяется по специальным статистическим таблицам [4].
Если оказывается, что F > Fêð ((1−α),1,(N − 2)), то гипотеза (37) отвергается и уравнение регрессии признается значимым, т.е. пригодным для практического использования.
Если оказывается, что F ≤ Fêð ((1−α),1,(N − 2)), то гипотеза (37) не отвергается и уравнение регрессии не признается значимым.
В случае парной линейной регрессии коэффициент детерминации равен квадрату парного коэффициента корреляции R2 = rxy2 . Это позволяет установить связь между статистикой Фишера и R2 [20]:
R2
F = (N − 2) 2 . (42) 1− R
3.10. Таблица дисперсионного анализа
Результаты проведенного регрессионного анализа в компактной форме можно представить в виде так называемой «Таблицы дисперсионного анализа». Исторически эта таблица была разработана для представления результатов дисперсионного анализа наблюдений [8, 19]. Однако такая форма представления результатов оказалась очень удачной и стала использоваться также в регрессионном и ковариационном анализах. В настоящее время представление результатов в виде таблицы дисперсионного анализа является общепринятым для большинства статистических и эконометрических пакетов прикладных программ (Statistica, SAS, SPSS, Econometric Views и др.) [14, 18]. Стандартная таблица дисперсионного анализа выглядит следующим образом (табл.1).
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.