Решение типовых задач по теме: "Регрессионный анализ", страница 2

то для нахождения оценок коэффициентов bi следует минимизировать оценку математического ожидания, т.е. среднее значение.

 где n– объем выборки.

Чтобы найти минимум (1), надо приравнять нулю частные производные:

. Получим систему нормальных уравнений метода наименьших квадратов.

Система имеет следующее решение:

Введём матрицу, столбцы которой определяются видом уравнения регрессии: столбец состоит из тех значений элементов выборки, на которые умножается коэффициент регрессии с этим номером. При этом свободный член умножается на 1. Число строк матрицы равно объему выборки. Так, для уравнения   z=b1x+b2xy+b3y первый коэффициент умножается на x , следовательно, в первом столбце стоят значения xi, а второй коэффициент умножается на xy – во втором столбце стоят произведения xiyi и соответственно в третьем столбце  столбце yiМатрица будет иметь следующий вид: Введем  матрицу – столбец отклика  и матрицу – столбец неизвестных параметров

Тогда система нормальных уравнений МНК примет следующий вид:

Для условий задачи заполним матрицу X и транспонированную XT.

Очевидно, что обратная матрица будет также диагональной, причем на главной диагонали будут стоять обратные числа, т.е.

В табл. П9 приведены фактические и расчетные по уравнению z = 0,783x + 1,200xy + 2,850y значения функции z , обозначенные Zф и Zр соответственно. Фактические значения. Тогда сумма квадратов отклонений расчетных от фактических значений будет равна S = 0,2791. n = 9, l = 3 и v = 9 – 3 =  6. Для уровня значимости 0,05 и числа степеней свободы равной v = 6 (n – объем выборки; l - число оценок коэффициентов регрессии; v = n - l) по таблицам распределения Стьюдента находим t0,05 = 2,447.

Таблица П9 (Zф - Zр)2

Zф

Zр

(Zф - Zр)2

-2,1

-2,43

0,1089

-2,9

-2,85

0,0025

-3,1

-3,26

0,0256

-0,9

-0,783

0,0137

0

0

0

1

0,783

0,0471

1,1

0,867

0,0543

3

2,85

0,0225

4,9

4,833

0,0045

Сумма

0,2791

Для оценки значимости коэффициентов регрессии определим для

каждого коэффициента bi случайную ошибку

где сii – i-й диагональный элемент матрицы С;

S – сумма квадратов отклонений расчетных значений y от фактических;

n – объем выборки;

l - число оценок коэффициентов регрессии;

ta - параметр Стьюдента, найденный по таблицам по уровню значимости a и числу степеней свободы        v = n - l.

 Критерий значимости, т.е. проверка нулевой гипотезы Н0: bi = 0, состоит в следующем: если , то коэффициент регрессии значим, т.е. гипотеза Н0 отвергается, в противном случае нет оснований отвергнуть гипотезу Н0 и коэффициент регрессии незначим, т.е. его можно в уравнении считать равным нулю. При этом можно сказать, что с надежностью 1-a

                                  (18.2)

Тогда

и можно утверждать, что все три коэффициента значимы при уровне значимости 0,05, и записать, что

 и

с надежностью 1 – 0,05 = 0,95.

ЗАДАЧА 5 (41-50)

Пример 10. Дана выборка объема n = 6 системы случайных величин (X, Y, Z): (1; 1; -1,1), (2; 1; 0,9), (3; 3; -3,1), (1; 2; -4,1), (2; 2; -2,9), (3; 1; 3,1). Найти и исследовать линейное уравнение средней квадратической регрессии z = a0 + a1x + a2y. Найти матрицу парных коэффициентов корреляции и вектор множественных коэффициентов корреляции. Указать значимые коэффициенты при уровне значимости α=0,05. Очевидно, система нормальных уравнений имеет вид:

Для вычислений коэффициентов этой системы составим табл. П10, в последней строке которой приведены соответствующие суммы.

Таблица П10 X2

X

Y

Z

X2

Y2

XY

XZ

YZ

1

1

-1,1

1

1

1

-1,1

-1,1

2

1

0,9

4

1

2

1,8

0,9

3

3

-3,1

9

9

9

-9,3

-9,3

1

2

-4,1

1

4

2

-4,1

-8,2

2

2

-2,9

4

4

4

-5,8

-5,8

3

1

3,1

9

1

3

9,3

3,1

12

10

-7,2

28

20

21

-9,2

-20,4