– називають непоясненими відхиленнями, тобто відхиленнями, які не можна пояснити за допомогою регресійної прямої.
Зведемо (7.8) у квадрат і обчислимо суму за всіма значеннями і:
;
Розділимо на n:
;
.
Оскільки модель відображає вплив на результативну ознаку лише частину реальних факторів, регресійний аналіз пояснює тільки частину дисперсії відгуку (загальної дисперсії).
Загальна дисперсія = дисперсія, що пояснюється регресійним аналізом + залишкова дисперсія.
,
,
де s2заг – загальна дисперсія;
s2регр – дисперсія, що пояснюється регресією;
s2зал – дисперсія помилок.
Для оцінки якості моделі вводиться коефіцієнт детермінації, що показує, яка частина варіації пояснюється за допомогою регресійної залежності
,
або
.
Оскільки
,
тобто
,
то, остаточно,
.
Коефіцієнт детермінації показує, яка частина варіації результативної ознаки Y враховується в моделі й обумовлена впливом на неї незалежних факторів, врахованих у моделі. Можливі значення коефіцієнта детермінації належать відрізку [0;1]. Чим ближче R2 до 1, тим краща якість моделі. Якість моделі вважається прийнятною, якщо коефіцієнт детермінації не нижче 0,96.
h – індекс кореляції. Він, як і R2, відображає точність моделі й може використовуватися при будь-якій формі зв'язку. При прямолінійному зв'язку індекс кореляції дорівнює коефіцієнту кореляції.
, .
Чим ближче h до 1, тим краще регресійна залежність описує експериментальні дані.
Побудуємо випадкову величину
,
де , k – кількість параметрів моделі. Для парної лінійної регресії k=2, ( k-1)=1;
, n –кількість спостережень.
Обчислюємо F кр, для заданого рівня значущості α, використовуючи функцію FРАСПОБР пакету Excel:
F кр = FРАСПОБР(a; k-1; n-k).
Якщо, то модель адекватна.
Для перевірки значущості коефіцієнтів регресії застосовуємо t – критерій Стьюдента, за допомогою якого перевіряють, чи значуще ai відрізняється від нуля. Висуваємо гіпотези:
Н0: ; Н1: ;
Обчислюємо критеріальне значення , яке має розподіл Стьюдента з n-k ступенями вільності,
де; ; ;
n – кількість спостережень; k – кількість параметрів регресії.
Обчислюємо для заданого рівня значущості α критичне значення .
Якщо , ai – статистично незначуще, а якщо , ai - статистично значуще.
Якщо виникає ситуація, що ai статистично незначуще відрізняється від нуля, то це означає, що вплив i-го фактору на досліджувану змінну нестабільний.
В Excel для знаходження кращої залежності необхідно побудувати лінію тренда.
1 Будується графік.
2 На графіку виводимо контекстне меню – Додати лінію тренда.
3 Обираємо тип лінії тренда (лінійна, логарифмічна, експонентна, степенева).
4 У закладці Параметры обираємо:
- показывать уравнение на диаграмме;
- поместить на диаграмму величину достоверности аппроксимации (R^2).
В Excel для побудови лінійної регресії використовується функція линейн, що дає рівняння лінійної регресії (=a1х+a0) і статистику. Цю функцію можна також використовувати для множинної регресії = amхm+…+ a2х2+ a1х+a0 (m змінних впливають на досліджуваний фактор).
= amхm+…+ a2х2+ a1х+a0 в графі Конст ставимо 1 (истина),
якщо = amхm+…+ a2х2+ a1х в графі Конст ставимо 0 (ложь).
· Статистика — логічне значення, що вказує, чи потрібно повернути додаткову статистику для регресії. Якщо аргумент статистика має значення ИСТИНА, то функція ЛИНЕЙН повертає додаткову регресійну статистику.
Натиснути CTRL+Shift+Enter для введення значень масиву.
Отримаємо таблицю результатів:
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.