Обычно предполагается, что случайная величина (Y)
имеет нормальный закон распределения с условным математическим ожиданием 
 и постоянной, не
зависящей от аргументов дисперсией 
.
В анализе чаще всего используются уравнения регрессии линейного вида
.
Коэффициенты регрессии 
 показывают, на какую
величину в среднем изменяется результативный признак Y, если независимая переменная 
изменяется на единицу ее
измерения.
В матричной форме регрессионная модель имеет вид
, где Y — случайный вектор-столбец размерности 
 наблюдаемых значений результативного
признака 
; Х — матрица
размерности 
 наблюдаемых значений
аргументов. Элемент матрицы 
 рассматривается
как неслучайная величина (i= 1, 2,…n;  j=
0, 1, 2,…m; 
); 
 — вектор-столбец
размерности 
 неизвестных параметров,
подлежащих оценке в ходе регрессионного анализа (вектор коэффициентов
регрессии); 
 — случайный
вектор-столбец размерности 
 —
вектор остатков, которые являются независимыми нормально распределенными
случайными величинами с нулевым математическим ожиданием (
) и неизвестной
дисперсией 
. На практике рекомендуется,
чтобы число наблюдений (n)  превышало число анализируемых признаков 
(m) не менее, чем в пять-шесть раз.
Для расчета вектора оценок коэффициентов регрессии А = (a0, a1,…am) по методу наименьших квадратов используется формула
,                                               
(3.4)
где

 —
транспонированная матрица Х; 
 —
матрица, обратная матрице 
.
Для устранения влияния различия дисперсий и единиц
измерения отдельных переменных на результаты регрессионного анализа в ряде
случаев целесообразно вместо исходных значений переменных 
 использовать
стандартизованные значения  zij =(xij –xj)/σj.
В этом случае уравнение множественной линейной регрессии будет иметь следующий
вид:
                              
(3.5)
где  
 — стандартизованные
значения отклика  Y; Zj  —
стандартизованные значения предикторов (независимых переменных — Xj); βj —
стандартизованные коэффициенты регрессии, которые могут быть вычислены исходя
из следующей системы уравнений:

Если решать данную систему по правилу Крамера, то βjравно
βj =|Rj|/|R|, (3.6)
где |R| — определитель матрицы системы уравнений; |Rj| — определитель матрицы системы линейных уравнений, в которой j-й столбец заменен столбцом свободных членов уравнений системы (r01, r02 ,…r0m).
Когда уравнение построено в стандартизованном масштабе, коэффициенты регрессии β1 , β2, …βm показывают, на сколько стандартных отклонений изменится Yпри изменении каждой из Xj на одно стандартное отклонение. Между коэффициентами аj и βj существует следующая зависимость:
                                                  
(3.7)
Кроме того, при помощи коэффициентов βj можно рассчитать частные (r2ij) и множественный (R20/1,2, …m) коэффициенты детерминации

После того как рассчитано само уравнение регрессии и перечисленные выше характеристики корреляционных связей, необходимо убедиться в адекватности полученных результатов.
Значимость уравнения регрессии в целом, т.е. нулевая
гипотеза 
, проверяется по F-критерию
Фишера. Его наблюдаемое значение определяется по формуле
                                   
(3.8)
где 
.
По таблице распределения значений F-критерия
Фишера, при заданных 
, находят 
. Гипотеза 
 отклоняется с вероятностью 
, если  
. Из этого следует, что
уравнение является значимым, т.е.  хотя бы один из коэффициентов регрессии
существенно отличен от нуля.
Для проверки значимости отдельных коэффициентов
регрессии, т.е. гипотез 
, где
j= 1,2,…,m,
используют t-критерий Стьюдента, фактическое значение которого
вычисляют следующим образом: 
   (3.9)
где Ŝ²aj — средняя ошибка коэффициента регрессии aj; Ŝ²ост — оценка среднего квадрата ошибки; сjj — соответствующие коэффициенту aj диагональные элементы матрицы (XTX)–1.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.