Обычно предполагается, что случайная величина (Y)
имеет нормальный закон распределения с условным математическим ожиданием и постоянной, не
зависящей от аргументов дисперсией
.
В анализе чаще всего используются уравнения регрессии линейного вида
.
Коэффициенты регрессии показывают, на какую
величину в среднем изменяется результативный признак Y, если независимая переменная
изменяется на единицу ее
измерения.
В матричной форме регрессионная модель имеет вид
, где Y — случайный вектор-столбец размерности
наблюдаемых значений результативного
признака
; Х — матрица
размерности
наблюдаемых значений
аргументов. Элемент матрицы
рассматривается
как неслучайная величина (i= 1, 2,…n; j=
0, 1, 2,…m;
);
— вектор-столбец
размерности
неизвестных параметров,
подлежащих оценке в ходе регрессионного анализа (вектор коэффициентов
регрессии);
— случайный
вектор-столбец размерности
—
вектор остатков, которые являются независимыми нормально распределенными
случайными величинами с нулевым математическим ожиданием (
) и неизвестной
дисперсией
. На практике рекомендуется,
чтобы число наблюдений (n) превышало число анализируемых признаков
(m) не менее, чем в пять-шесть раз.
Для расчета вектора оценок коэффициентов регрессии А = (a0, a1,…am) по методу наименьших квадратов используется формула
,
(3.4)
где
—
транспонированная матрица Х;
—
матрица, обратная матрице
.
Для устранения влияния различия дисперсий и единиц
измерения отдельных переменных на результаты регрессионного анализа в ряде
случаев целесообразно вместо исходных значений переменных использовать
стандартизованные значения zij =(xij –xj)/σj.
В этом случае уравнение множественной линейной регрессии будет иметь следующий
вид:
(3.5)
где — стандартизованные
значения отклика Y; Zj —
стандартизованные значения предикторов (независимых переменных — Xj); βj —
стандартизованные коэффициенты регрессии, которые могут быть вычислены исходя
из следующей системы уравнений:
Если решать данную систему по правилу Крамера, то βjравно
βj =|Rj|/|R|, (3.6)
где |R| — определитель матрицы системы уравнений; |Rj| — определитель матрицы системы линейных уравнений, в которой j-й столбец заменен столбцом свободных членов уравнений системы (r01, r02 ,…r0m).
Когда уравнение построено в стандартизованном масштабе, коэффициенты регрессии β1 , β2, …βm показывают, на сколько стандартных отклонений изменится Yпри изменении каждой из Xj на одно стандартное отклонение. Между коэффициентами аj и βj существует следующая зависимость:
(3.7)
Кроме того, при помощи коэффициентов βj можно рассчитать частные (r2ij) и множественный (R20/1,2, …m) коэффициенты детерминации
После того как рассчитано само уравнение регрессии и перечисленные выше характеристики корреляционных связей, необходимо убедиться в адекватности полученных результатов.
Значимость уравнения регрессии в целом, т.е. нулевая
гипотеза , проверяется по F-критерию
Фишера. Его наблюдаемое значение определяется по формуле
(3.8)
где .
По таблице распределения значений F-критерия
Фишера, при заданных , находят
. Гипотеза
отклоняется с вероятностью
, если
. Из этого следует, что
уравнение является значимым, т.е. хотя бы один из коэффициентов регрессии
существенно отличен от нуля.
Для проверки значимости отдельных коэффициентов
регрессии, т.е. гипотез , где
j= 1,2,…,m,
используют t-критерий Стьюдента, фактическое значение которого
вычисляют следующим образом:
(3.9)
где Ŝ²aj — средняя ошибка коэффициента регрессии aj; Ŝ²ост — оценка среднего квадрата ошибки; сjj — соответствующие коэффициенту aj диагональные элементы матрицы (XTX)–1.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.