Гіпотеза (5.7) є узагальненням на випадок декількох факторів аналогічного припущення про сталість фактора X у випадку лінійної двухфакторной моделі.
Тим самим виявляється, що у вектора єдиним джерелом збурювань є випадковий вектор . У цьому випадку говорять, що властивості шуканих оцінок і критеріїв обумовлені матрицею спостережень X.
Гіпотеза (5.8) характеризує, по-перше, відсутність строгої лінійної залежності між пояснюючими перемінними і, по-друге, що число спостережень n більше числа пояснюючих перемінних k. У співвідношенні (5.8) позначення виражає ранг матриці X.
Приналежність вектора збурювань безлічі нормально розподілених векторних випадкових величин, виражена в (5.9), фактично поєднує припущення (5.5) і (5.6).
Позначимо через - вектор-стовпець, що оцінює вектор . Можемо записати:
(5.10)
де через позначений вектор-стовпець залишків .
Критерій - сума квадратів компонент вектора залишків - має вид
. (5.11)
Для перебування значення , минимизирующего цю суму квадратів відхилень, продифференцируем (5.11) по . Дорівнюючи отримане вираження нульовому вектору, одержуємо систему нормальних рівнянь у векторно-матричной формі (порівняй з (3.14)):
. (5.12)
На основі гіпотези (5.8) одержуємо основний результат:
. (5.13)
Оцінка вектора параметрів знайдена.
Підставляючи (5.3) у (5.13), можна одержати наступне важливе представлення для оцінки :
. (5.14)
Звідси відразу випливає, що
. (5.15)
Результат (5.15) означає, що вектор оцінок є незміщеним.
Можна показати, що ковариационная матриця вектора оцінок має вид:
. (5.16)
Рівність (5.16) означає, що дисперсія компонента вектора може бути оцінена шляхом перемножування i-го елемента головної діагоналі матриці на дисперсію випадкового збурювання . Аналогічно ковариация пари оцінок і визначається множенням (i,j)-го елемента матриці на .
Підсумовуючи розгляд властивостей оцінок , відзначимо, що в силу припущення (5.9) вектор має багатомірний нормальний розподіл, тобто
. (5.17)
Якщо дисперсія збурювань U відома, то факти, представлені співвідношеннями (5.13), (5.14), (5.16) можуть бути безпосередньо використані для перевірки значимості компонент вектора і побудови довірчих інтервалів. У випадку незнання можна надійти в такий спосіб. Тому що і є лінійні комбінації нормально розподілених випадкових величин, то вони теж розподілені нормально. Можна показати, що , де – нульова матриця з n рядків і k стовпців. Останнє означає, що вони розподілені незалежно друг від друга.
Цей результат дозволяє використовувати t-розподіл для перевірки гіпотез щодо кожного з регресійних коефіцієнтів . Величина має незалежне від розподіл з ( ) ступенями волі. Звідси по визначенню t-розподілу величина
(5.18)
задовольняє t-розподілу зі ступенями волі.
Гіпотеза про значимість перевіряється в такий спосіб. У (5.18) підставляємо цікавляче нас гіпотетичне значення і розраховуємо t. Значення t порівнюємо з критичним , відповідним ступеням волі і %-му рівню довіри. Якщо виявиться, що виконано нерівність
,
те гіпотеза про значимість відкидається.
Прикладом перевірки відсутності лінійної залежності Y від є перевірка гіпотези H0 : .
Співвідношення (5.18) дає %-ный довірчий інтервал для виду
Розглянемо підхід до спільної перевірки гіпотез щодо декількох чи усіх .
Висунемо нульову гіпотезу
(5.19)
проти альтернативної , що складається в тім, що не усі дорівнюють нулю. Вектор . Нульова гіпотеза припускає, що отсутствует вплив усіх факторів на .
Можна показати, що для перевірки нульової гіпотези (5.19) застосуємо F-критерій виду
, (5.20)
де – коефіцієнт детермінації (квадрат коефіцієнта множинної кореляції).
Гіпотеза (5.19) при 100 %-ном рівні значимості відхиляється, якщо виконана нерівність
, (5.21)
де F розраховується по формулі (5.20), а визначається з таблиці теоретичних значень F-критерію при 100 %-ном рівні значимості і (k-1), (n-k) ступенях волі. Це значення можна визначити за допомогою функції EXCEL FРАСПОБР( , k-1, n-k) Відхилення гіпотези змістовно означає, що між фактором Y і усіма факторами мається лінійний статистичний зв'язок. Про силу зв'язку можна судити по величині коефіцієнта детермінації .
Використовуючи результати сьогодення роздягнула, можна ставити і вирішувати задачі чи додавання виключення одного і/чи декількох факторів . Докладніше про це див. у [4, стор. 144-147].
Подальше використання співвідношень типу (5.1) зв'язано з одержанням інформації про очікуване значення фактора Y, що повинне відповідати деякому сполученню значень факторів , що не наблюдались у вибірці. Якщо ототожнити номера спостережень 1,2,…,nс номерами тимчасових періодів, то конкретизація задачі прогнозування може виглядати так: по очікуваним у періоді n+1 значенням вектора
потрібно побудувати прогноз очікуваного значення , тобто M(Yn+1| ). З урахуванням співвідношення (5.2) одержимо
Можна побудувати або крапковий, або интервальный прогноз.
Найкращий лінійний незміщений прогноз для має вид . Тому шуканий крапковий прогноз є
. (5.22)
Відповідний 100 %-ный довірчий інтервал для крапкового прогнозу має вид
. (5.23)
У нерівностях (5.23) .
Таким чином, очікуване значення M(Yn+1|C) величини Yn+1 з імовірністю (1- ) накривається інтервалом (5.23).
Задача интервального прогнозування складається в побудові довірчого інтервалу не для середнього M(Yn+1|C), а для ізольованого значення Yn+1, що повинне асоціюватися з вектором .
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.