Нормально распределенные величины. Единичная матрица. Стандартная нормальная случайная величина, страница 2

формулу (59) можно привести к виду:

                                           (64)

В условиях нашего примера:

.

Следовательно, нулевая гипотеза:  отвергается

Рассмотрим случай, когда нулевая гипотеза имеет вид:

,                                  (65)

где  – некоторое подмножество значений множества   индекса коэффициентов .

В этом случае матрица  будет состоять из строк, в которых j-я компонента равна 1, а остальные – нули. Вектор  состоит из нулей.

Например, в случае модели:

                                      (66)

и нулевой гипотезы:

                                         (67)

матрица  и вектор  равны:

,           

В рассматриваемом нами случае F-статистику (59) можно найти также следующим способом.

Наряду с исходной «длинной» моделью:

                                 (68)

рассмотрим «короткую» модель:

                                           (69)

Например, в случае «длинной» модели (66) и нулевой гипотезы (67) «короткая» модель (69) имеет вид:

                         (70)

Обозначим через  и  остаточную сумму квадратов и коэффициент детерминации для «длинной» регрессии, а через  и  – эти же величины для короткой регрессии.

Можно показать, что для F-статистики (59) справедливы формулы:

.                                        (71)

Напомним, что количество степеней свободы F-статистики равно , где  – число равенств в нулевой гипотезе.

Доверительная область для коэффициентов регрессии.

Рассмотрим случай, когда .

Тогда равенство (58)  примет вид:

Заменив  на  и  на  в формуле (59), получим:

                          (72)

В силу (62) -доверительная область для вектора  задается условием:

                        (73)

и является эллипсоидом в m-мерном пространстве.

Доверительные интервалы для зависимой переменной

Пусть .

Например,

.

Будем считать, что в соответствии с зависимостью (5), имеет место равенство:

                                         (74)

и для  выполняются основные гипотезы линейной регрессии:

1) ;

2) ;

3)   .  

В силу гипотезы (1):

                                                      (75)

Прогнозное значение  находится в соответствии с формулой (11):

                                                   (76)

В условиях нашего примера при :

(При этом реальное значение  может не известно.)

Заметим, что

.    (77)

В силу (20), (75), (76), прогнозное значение  является несмещенной оценкой величины ..

Для получения доверительных интервалов ниже будем считать, что условное распределение случайной величины  нормально (при фиксированных значениях случайных величин и ).

Тогда в силу формулы (76) из того, что условное распределение оценки  нормально, вытекает, что условное распределение прогноза  также нормально.

При этом в силу (63):

      (78)

Итак,

        (79)

Подставив формулу (24) в (79), получим:

                          (80)

Подставив вместо  ее выборочную несмещенную оценку  , получим несмещенную оценку для :

.                          (81)

В условиях нашего примера:

Обозначим:

                                           (82)

В нашем случае:

Можно доказать, что статистика

                                      (83)

имеет распределение Стъюдента с числом степеней свободы .

Следовательно, при уровне значимости :

,                                       (84)

где  – двусторонняя квантиль распределения Стъюдента для уровня значимости  и числа степеней свободы .

Из (84) в результате несложных алгебраических преобразований имеем:

             (85)

Это соотношение определяет доверительный интервал для ожидаемого значения :

,                           (86)

в который с вероятностью  попадает .

В нашем случае 95%-й доверительный интервал для :

.

Доверительный интервал для

Будем считать, что значение  не известно.

Из равенств (75), (77):

                                       (87)

Используя формулу (24), получим:

Итак,

                   (88)

Следовательно,

                   (89)

является несмещенной оценкой для .

В нашем случае:

Обозначим:

                                       (90)

В нашем случае:

Можно показать, что величина

                                                                            (91)

имеет распределение Стъюдента с числом степеней свободы .

Следовательно, при уровне значимости :

,                                         (92)

где  – двусторонняя квантиль распределения Стъюдента для уровня значимости  и числа степеней свободы .

Из (92) в результате несложных алгебраических преобразований имеем:

            (93)

Это соотношения определяет доверительный интервал для значения :

,                    (94)

в который с вероятностью  попадает .

В нашем случае доверительный интервал для значения :

.