Обычно предполагается, что случайная величина (Y) имеет нормальный закон распределения с условным математическим ожиданием и постоянной, не зависящей от аргументов дисперсией .
В анализе чаще всего используются уравнения регрессии линейного вида
.
Коэффициенты регрессии показывают, на какую величину в среднем изменяется результативный признак Y, если независимая переменная изменяется на единицу ее измерения.
В матричной форме регрессионная модель имеет вид
, где Y — случайный вектор-столбец размерности наблюдаемых значений результативного признака ; Х — матрица размерности наблюдаемых значений аргументов. Элемент матрицы рассматривается как неслучайная величина (i= 1, 2,…n; j= 0, 1, 2,…m; ); — вектор-столбец размерности неизвестных параметров, подлежащих оценке в ходе регрессионного анализа (вектор коэффициентов регрессии); — случайный вектор-столбец размерности — вектор остатков, которые являются независимыми нормально распределенными случайными величинами с нулевым математическим ожиданием () и неизвестной дисперсией . На практике рекомендуется, чтобы число наблюдений (n) превышало число анализируемых признаков (m) не менее, чем в пять-шесть раз.
Для расчета вектора оценок коэффициентов регрессии А = (a0, a1,…am) по методу наименьших квадратов используется формула
, (3.4)
где
— транспонированная матрица Х; — матрица, обратная матрице .
Для устранения влияния различия дисперсий и единиц измерения отдельных переменных на результаты регрессионного анализа в ряде случаев целесообразно вместо исходных значений переменных использовать стандартизованные значения zij =(xij –xj)/σj. В этом случае уравнение множественной линейной регрессии будет иметь следующий вид:
(3.5)
где — стандартизованные значения отклика Y; Zj — стандартизованные значения предикторов (независимых переменных — Xj); βj — стандартизованные коэффициенты регрессии, которые могут быть вычислены исходя из следующей системы уравнений:
Если решать данную систему по правилу Крамера, то βjравно
βj =|Rj|/|R|, (3.6)
где |R| — определитель матрицы системы уравнений; |Rj| — определитель матрицы системы линейных уравнений, в которой j-й столбец заменен столбцом свободных членов уравнений системы (r01, r02 ,…r0m).
Когда уравнение построено в стандартизованном масштабе, коэффициенты регрессии β1 , β2, …βm показывают, на сколько стандартных отклонений изменится Yпри изменении каждой из Xj на одно стандартное отклонение. Между коэффициентами аj и βj существует следующая зависимость:
(3.7)
Кроме того, при помощи коэффициентов βj можно рассчитать частные (r2ij) и множественный (R20/1,2, …m) коэффициенты детерминации
После того как рассчитано само уравнение регрессии и перечисленные выше характеристики корреляционных связей, необходимо убедиться в адекватности полученных результатов.
Значимость уравнения регрессии в целом, т.е. нулевая гипотеза , проверяется по F-критерию Фишера. Его наблюдаемое значение определяется по формуле
(3.8)
где .
По таблице распределения значений F-критерия Фишера, при заданных , находят . Гипотеза отклоняется с вероятностью , если . Из этого следует, что уравнение является значимым, т.е. хотя бы один из коэффициентов регрессии существенно отличен от нуля.
Для проверки значимости отдельных коэффициентов регрессии, т.е. гипотез , где j= 1,2,…,m, используют t-критерий Стьюдента, фактическое значение которого вычисляют следующим образом:
(3.9)
где Ŝ²aj — средняя ошибка коэффициента регрессии aj; Ŝ²ост — оценка среднего квадрата ошибки; сjj — соответствующие коэффициенту aj диагональные элементы матрицы (XTX)–1.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.