Параметры уравнения
регрессии определяются с помощью метода наименьших квадратов. Сущность данного
метода заключается в нахождении параметров модели ,
, …,
, при
которых минимизируется сумма квадратов отклонений эмпирических (фактических)
значений
,
, результативного признака от теоретических
,
, полученных по уравнению регрессии:
.
Здесь –
выборка из генеральной совокупности случайной величины
,
.
Функция является функцией переменных
,
, …,
, т.е.
. Исследование на экстремум данной функции
проводится методами дифференциального исчисления. После несложных математических преобразований получается система
нормальных уравнений (по числу параметров)
из которой находятся
неизвестные ,
, …,
–
коэффициенты уравнения регрессии. Здесь
– число
наблюдений.
Этап 3. Определение степени связи результативного признака и фактора. Для определения величины степени стохастической
взаимосвязи результативного признака и факторов
,
, …,
необходимо знать
следующие дисперсии:
·
общую дисперсию результативного признака ,
отображающую влияние как основных, так и остаточных факторов:
,
где
– выборочное среднее значение
результативного признака
по выборке
;
·
факторную дисперсию результативного признака , отображающую влияние только основных
факторов:
;
·
остаточную дисперсию результативного признака , отображающую влияние только остаточных
факторов:
.
При корреляционной связи результативного признака и факторов выполняется соотношение:
,
при этом
=
+
.
Этап 4. Проверка общего качества уравнения регрессии. Для анализа общего качества уравнения линейной
регрессии обычно используется множественный коэффициент
детерминации , называемый также квадратом
коэффициента множественной корреляции. Множественный коэффициент детерминации
рассчитывается по формуле
=
,
и определяет долю разброса результативного признака, обусловленную изменением факторных признаков, входящих в многофакторную модель. Чем теснее линейная связь между признаками, тем ближе коэффициент детерминации к единице. Однако, при достаточно близком к единице коэффициенте детерминации не всегда наблюдается тесная взаимосвязь между случайными величинами. Поэтому необходимы дополнительные исследования.
В большинстве
случаев уравнение регрессии строится на основе выборочных данных. Поэтому возникает
вопрос о согласованности построенного уравнения генеральной совокупности
случайного вектора . Для ответа на этот вопрос
выдвигается гипотеза о незначимости множественного коэффициента детерминации:
:
=0
при альтернативной гипотезе:
:
0.
При проверке нулевой гипотезы используется -статистика
=
,
имеющая распределение Фишера ,
– число
наблюдений,
– число факторов в уравнении регрессии.
По
выборочным данным вычисляется наблюдаемое значение статистики . По таблицам
критических точек
-распределения находится
критическое значение статистики
= =
. Если
попадает
в критическую область, т. е.
,
то нулевая гипотеза отвергается, что говорит о
соответствии теоретического уравнения регрессии выборочным данным.
Для оценки адекватности уравнения регрессии также используется показатель средней ошибки аппроксимации:
.
Этап 5. Проверка статистической значимости каждого коэффициента
уравнения регрессии и определение их доверительных интервалов. Возможна ситуация, когда часть вычисленных коэффициентов регрессии не
обладает необходимой степенью значимости, т.е. значения данных коэффициентов
будут меньше их стандартной ошибки. В этом случае такие коэффициенты должны
быть исключены из уравнения регрессии. Поэтому проверка адекватности
построенного уравнения регрессии наряду с проверкой значимости коэффициента
детерминации включает в себя также и проверку
значимости каждого коэффициента регрессии.
Для этого
выдвигаются нулевые гипотезы о незначимости коэффициентов ,
:
:
,
,
при альтернативных гипотезах
:
,
.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.