Використання дисперсійного аналізу для перевірки адекватності регресійної моделі. Побудова класичної множинної моделі лінійної регресії, страница 7

Рис.7.7. Діалогове вікно параметрів опції Регрессия

  Для проведення регресійного аналізу необхідно ввести такі  параметри:

Входной интервал Y – посилання на стовпчик середніх значень результативної ознаки.

Входной интервал Х –  посилання на матрицю регресорів.

Уровень надёжности – довірча імовірність, яку використовують при перевірці статистичних гіпотез в регресійному аналізі.

Метки – визначають, якщо посилання на Х та Y, містять назву змінних.

  Для виведення інформації рекомендується задати «Новый рабочий лист». Для подальшого аналізу слід відзначити: «Остатки», «Стандартизированные остатки», «График остатков», «График подбора». Програма дає можливість отримати чотири таблиці: «Регрессионная статистика», «Дисперсионный анализ», «Вывод остатка», таблицю коефіцієнтів регресії та їх статистичних характеристик.

На рис. 7.8 показано результати виконання програми Регрессияза розділами регресійна статистика та дисперсійний аналіз.


Рис. 7.8. Результат використання інструмента Регрессия

На рис. 7.8 подано значення величин стандартної помилки регресії:  та стандартної помилки коефіцієнтів рівняння регресії:

,

що відображають значення якої характеристики сформовано під впливом випадкових факторів. Отримані значення стандартних помилок використовуються для обчислення -статистики Стьюдента:

.

За результатами -статистики Стьюдента можна стверджувати, що статистично значущими є  та , а величина  сформувалася під впливом випадкових причин. Тому фактор  можна виключити як неінформативний.

Також це підтверджує показник імовірності випадкових значень параметрів регресії: якщо  менш ніж прийнятий рівень (звичайний  або , що відповідає 10%, 5% або 1% імовірності), то робиться висновок про невипадкову природу даного значення параметра, тобто його статистичну значущість і надійність. В протилежному випадку приймається гіпотеза про випадковість значень коефіцієнтів рівняння (в наведеному прикладі , що дозволяє розглядати фактор  як неінформативний).

На підставі проведених досліджень взаємозв’язку обраних показників можна обґрунтувати доцільність використання рівняння парної регресії – . За допомогою функції ЛИНЕЙН отримуємо параметри лінійної парної регресії (табл. 7.2).

Таблиця 7.2

Результат виконання функції ЛИНЕЙН для парної регресії

1,2297

1,98839

0,0728

0,47109

0,9407

0,61514

285,39

18,00000

107,99

6,81108

Таким чином, маємо модель залежності .

Для обчислення величини , яка є прогнозним значенням  для     -го об’єкта (спостереження), можна скористатися функцією ТЕНДЕНЦИЯ.

ТЕНДЕНЦИЯ  обчислює та повертає масив прогнозних значень залежної змінної , які відповідають значенням незалежних змінних на основі рівняння лінійної регресії. Робота з функцією ТЕНДЕНЦИЯ аналогічна роботі з функцією ЛИНЕЙН. Властивості та призначення аргументів аналогічні функції ЛИНЕЙН.

Розвязання типового завдання 7.3.2

Розв’язання типового завдання 7.3.2 завдання передбачає виконання дій за наступним алгоритмом:

1)  викликати файл с даними;

2)  переписати дані у свій файл на третій аркуш;

3)  сформувати дані для обробки на другому аркуші (при цьому, першій стовпчик повинен бути залежною змінною);

4)  на першому аркуші відилити поле розміром  та натиснути клавішу «=»;

5)  викликати функцію «ЛИНЕЙН» та заповнити відповідні поля (при цьому слід пам'ятати, що у друге поле записуються регресори у вигляді однієї матриці, у трете та четверте поля слід записати одиниці);

6)  замість «ОК» слід натиснути «Ctrl+Shift+Enter».

          На рис.7.9 представлено результат реалізації наведеного вище алгоритму.

Виконнання дій дозволило отримати повне рішення двохфакторної регресії, яке з'являється поруч з даними.        У виділеному полі розміром  наведено:

     у першій стрічці коефіцієнти регресії по зростанню справа вліво;

     у другій стрічці скореговані помилки коефіцієнтів регресії;

     у третій стрічці, зліва вправо, коефіцієнт детермінації та стандартна помилка обчислених значень;

     у четвертій стрічці, зліва вправо, спостережене значення критерію Фішера та число ступенів свободи;

     у п'ятій стрічці, зліва вправо, сума квадратів відхилень обчислених значень та сума квадратів відхилень залишкової похибки.

На основі цих даних перевіряємо модель на значущість.

Обчислимо функцію рентабельності власного капіталу в залежності від показника термінової ліквідності та оборотності оборотного капіталу відповідно лінійної моделі та перевіримо її на значущість по критерію Фішера.

Рис. 7.9. Демонстрація розв’язання завдання

Для цього знаходимо критичне значення критерію Фішера по таблиці порівнюємо з отриманим у четвертої стрічці  спостереженим значенням критерію.

З наведених даних беремо значення спостережуваного значення критерію Фішера  і порівнюємо з критичним значенням яке приведено у таблиці відсоткових точок - розподілу або за допомогою функції FРАСПОБР.

Так, в нашому випадку    і  .

Отже, пояснююча дисперсія суттєво більш ніж залишкова дисперсія, тому рівняння регресії неякісно відображає динаміку змін залежної змінної.

З цього виходить, що регресійна модель не значуща.

Аналогічні результати можна отримати за допомогою пакета Анализ данных/ Регрессия (рис. 7.10).

Рис. 7.10. Результат використання інструмента Регрессия

На підставі отриманих результатів можна запропонувати для подальшого дослідження використати рівняння парних лінійних регресій  та . На рис. 7.11 подано варіанти параметрів можливих рівнянь.

Рис. 7.11. Параметри рівнянь парних регресій

Для оцінки значущості рівнянь парної лінійної регресії за даними рис. 7.11 маємо фактичні значення  і . За допомогою функції FРАСПОБР знаходимотабличні значення  , які значно перевищують фактичні значення.

З цього виходить, що побудовані лінійні моделі парної регресії не значущі і тому їх не слід використовувати.