Модель парной линейной регрессии. Точечное и интегральное прогнозирование, страница 10

Проверку на значимость регрессионного уравнения можно проводить с помощью статистической гипотезы, например, относительно величины коэффициента детерминации:

                                                               H0 : R2 = 0,                                   (37) 

                                                               H1 : R2 ≠ 0.

Проверка этой гипотезы может проводиться с помощью F-критерия. Этот критерий опирается на тот факт, что отношение объясненной дисперсии зависимой переменной к остаточной дисперсии подчиняется распределению Фишера. Поскольку на практике истинные значения этих дисперсий остаются неизвестными, то приходится их оценивать с помощью соответствующих сумм квадратов отклонений.

Из разложения сумм квадратов (34) может быть получено разложение для дисперсий [21]:

                                                 D y( ) = D y( )ˆ + D y( − yˆ),

где D y( ) – полная дисперсия зависимой переменной y , D y( )ˆ – объясненная дисперсия или дисперсия расчетных значений yˆ , D y( − yˆ) – остаточная или необъясненная дисперсия.

В качестве оценок полной, остаточной и объясненной дисперсий используются отношения соответствующих сумм квадратов к своим числам степеней свободы:

N

                                            2     TSS                                               ,     (38) 

N

                                       D yˆ( − yˆ) = S2 = ESS           = ,                (39) 

N

                                                                                              RSS      i 1                       .                  (40) 

                                                       =     =         =

                                                                                                 1               1

Если сравнить соотношения (18) и (39), то можно заметить, что дисперсия случайной ошибки и остаточная дисперсия оцениваются одинаковым образом.

Из математической статистики известно [20, 21], что величина 

Sy

                                                                 F = 2                                      (41) 

S

подчиняется распределению Фишера с 1 и (N − 2) степенями свободы. При проверке гипотезы (37) вычисленное по формуле (41) значение F-статистики сравнивают с критическим значением Fêð ((1−α),1,(N − 2)). Критическое значение F-статистики – это максимальная величина отношения дисперсий, которая для заданного уровня доверительной вероятности (1−α) может иметь место при случайном отклонении от нулевой гипотезы. Это значение определяется по специальным статистическим таблицам [4].

Если оказывается, что F > Fêð ((1−α),1,(N − 2)), то гипотеза (37) отвергается и уравнение регрессии признается значимым, т.е. пригодным для практического использования.

Если оказывается, что F Fêð ((1−α),1,(N − 2)), то гипотеза (37) не отвергается и уравнение регрессии не признается значимым.

В случае парной линейной регрессии коэффициент детерминации равен квадрату парного коэффициента корреляции R2 = rxy2 . Это позволяет установить связь между статистикой Фишера и R2 [20]:

R2

 F = (N − 2) 2 . (42)  1− R

3.10. Таблица дисперсионного анализа

Результаты проведенного регрессионного анализа в компактной форме можно представить в виде так называемой «Таблицы дисперсионного анализа». Исторически эта таблица была разработана для представления результатов дисперсионного анализа наблюдений [8, 19]. Однако такая форма представления результатов оказалась очень удачной и стала использоваться также в регрессионном и ковариационном анализах. В настоящее время представление результатов в виде таблицы дисперсионного анализа является общепринятым для большинства статистических и эконометрических пакетов прикладных программ (Statistica, SAS, SPSS, Econometric Views и др.) [14, 18]. Стандартная таблица дисперсионного анализа выглядит следующим образом (табл.1).