Прикладные методы в теории вероятности, страница 7

При , откуда , т.е. если согласны на ошибку в 3 случаях из 1000, то можем использовать «правило ».

Поскольку в (1.46') входит, как правило, заранее неизвестная величина , то она заменяется несмещенной статистической оценкой , причем

         

                                                                                       (1.50)

Из общих соотношений (1.46') можно получить формулы для одномерной линейной модели , а именно:

                      ,                               (1.51)

где

                     .

1.2) Интервальная оценка линейной регрессии .

Учитывая, что  и , получим

                             ,                                       (1.52)

а тогда дисперсия  может быть рассчитана по формуле

                            (1.53)

В частном случае, когда , можно получить

                                                                                       (1.54)

Границы доверительного интервала находятся аналогичным образом

где при расчете  по формуле (1.53) или (1.54) вместо  подставляется (1.50).

2) Малые выборки

2.1) Интервальные оценки параметров модели .

При формировании интервальных оценок приходится иметь дело со случайной величиной

Зная распределение  и задавшись надежностью оценок, т.е. доверительной вероятностью , можно с помощью соотношений типа (1.47) – (1.49) определить доверительный интервал для оценок .

При большой выборке (ориентировочно ) оценка  близка к константе , поэтому распределение  близко к нормальному. При малой выборке распределение  существенно отличается от нормального, и это должно учитываться при формировании интервальных оценок. Чтобы найти распределение , рассмотрим предварительно два вспомогательных, но широко используемых в статистике, типа случайных величин и их распределений.

а) –распределение.

Пусть  — независимые случайные величины со стандартным нормальным распределением. Рассмотрим случайную величину

                                                                                                  (1.55)

Тогда можно показать, что плотность вероятности случайной величины , называемая –распределением с  степенями свободы, имеет вид

                       для. f  > 1,                     (1.56)

где , причем .

Кривая –распределения одновершинная, ассиметричная и асимптотически приближается к оси абсцисс. С ростом  вершина сдвигается вправо и –распределение стремится к нормальному. Поскольку , то максимум в районе f.

б) Распределение Стьюдента (псевдоним английского статистика Госсета) или –распределение.

Пусть случайная величина  имеет стандартное нормальное распределение, т.е. , а случайная величина  — –распределение с  степенями свободы, т.е. , причем  и  независимы. Тогда можно показать, что плотность вероятности случайной величины

                                                                                                       (1.57)

называемая распределением Стьюдента с  степенями свободы, имеет вид

                                         .                                 (1.58)

Функция  четная. При малых  она более плоская, чем кривая стандартного нормального распределения, но с ростом  приближается к распределению .

Распределению Стьюдента подчинено, например, отношение

где , , …,  — взаимно независимые нормально распределенные центрированные случайные величины с дисперсией .

Это становится очевидным, если представить  в виде

где

Возвращаясь к вопросу о распределении случайной величины

представим ее в виде

Ясно, что случайная величина в числителе подчиняется стандартному нормальному распределению . С учетом (1.46') случайную величину в знаменателе можно записать в форме

,

а значит

Можно доказать, что случайные величины в числителе и знаменателе  и  взаимно независимы, причем , а , а тогда .

Следовательно, выполняется соотношение