При правильному включенні факторів у регресійну модель величина індексу множинної кореляції буде істотно відрізнятися від індексу кореляції парної залежності. Якщо ж додатково включені в рівняння множинної регресії фактори третьорядні, то індекс множинної кореляції може практично збігатися з індексом парної кореляції (розбіжності в третьому, четвертому знаках). Звідси зрозуміло, що, порівнюючи індекси множинної й парної кореляції, можна зробити висновок про доцільність включення в рівняння регресії того чи іншого фактора.
Приклад. Нехай є наступні дані (умовні) про змінний видобуток вугілля на одного робітника y, (т); потужності шару x1, (м); і рівні механізації робіт x2,(%); що характеризують процес видобутку вугілля в 10 шахтах.
№ шахти |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
X1 |
8 |
11 |
12 |
9 |
8 |
8 |
9 |
9 |
8 |
12 |
X2 |
5 |
8 |
8 |
5 |
7 |
8 |
6 |
4 |
4 |
7 |
Y |
5 |
11 |
10 |
6 |
6 |
7 |
6 |
5 |
5 |
11 |
Необхідно:
1 обчислити парні і часткові коефіцієнти кореляції, провести їх аналіз;
2 знайти параметри лінійної множинної регресії =a0+a1x1+a2x2 матричним способом;
3 знайти параметри лінійної множинної регресії =a0+a1x1+a2x2 за допомогою функції ЛИНЕЙН;
4 перевірити значущість параметрів регресії;
5 знайти коефіцієнт детермінації, оцінити якість моделі;
6 оцінити адекватність моделі за критерієм Фішера при рівні значущості α=0,05.
Розв’язання.
1 Обчислимо парні коефіцієнти кореляції.
Використовуємо Сервис – Анализ данных – Корреляция.
Одержимо кореляційну матрицю
X1 |
X2 |
Y |
||
Строка 1 |
Строка 2 |
Строка 3 |
||
X1 |
Строка 1 |
1 |
||
X2 |
Строка 2 |
0,508 |
1 |
|
Y |
Строка 3 |
0,901 |
0,7619 |
1 |
Отже відповідні коефіцієнти парної кореляції такі:
rY1=0,901; rY2= 0,7619; r12=0,508.
Обчислимо коефіцієнти часткової кореляції за формулами
, ,
Отримаємо такі данні:
ry1,2 |
= |
0,921637 |
ry2,1 |
= |
0,814348 |
r12,y |
= |
-0,63603 |
Проведемо аналіз отриманих коефіцієнтів парної та часткової кореляції.
Додатне значення ry1 свідчить про прямий зв'язок між Y та X1, ry1=0,901, отже вплив потужності шару X1 на видобуток вугілля сильний. Усунення X2 збільшує кореляційний зв'язок (ry1,2 = 0,921637).
Додатне значення ry2 свідчить про прямий зв'язок між Y та X2, оскільки ry2=0,7619 – зв'язок обсягу видобутку вугілля й рівня механізації робіт X2 суттєвий. Усунення Х1 цей зв'язок підсилює (ry2,1 = 0,814348).
r12=0,508 свідчить про те, що X1 і X2 практично не корелюють. Це важливо в регресійних моделях. Однак усунення Y не послабляє кореляцію (r12,y = -0,63603).
2 Оцінимо невідомі параметри множинної лінійної регресії.
Рівняння регресії має вигляд =a0+a1x1+a2x2. Для визначення невідомих параметрів регресії (а0, а1 , а2) необхідно записати систему рівнянь у матричній формі.
.
Запишемо матриці X таY .
X |
Y |
||
1 |
8 |
5 |
5 |
1 |
11 |
8 |
11 |
1 |
12 |
8 |
10 |
1 |
9 |
5 |
6 |
1 |
8 |
7 |
6 |
1 |
8 |
8 |
7 |
1 |
9 |
6 |
6 |
1 |
9 |
4 |
5 |
1 |
8 |
5 |
5 |
1 |
12 |
7 |
11 |
Обчислимо XТ за допомогою функції Excel ТРАНСП( <масив>).
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.