Математическая статистика (Основные задачи и понятия математической статистики. Точечные оценки параметров распределения. Основные методы получения точечных оценок. Проверка статистических гипотез. Линейная регрессия), страница 5

Все возможные значения случайной величины m разбиваются на l обычно равных интервалов: , покрывающих всю выборку …

            Строится величина

n,

где  – вероятность попадания варианты в k-й интервал,  – предполагаемая теоретическая функция распределения.

Независимо от F0(x) случайная величина имеет -распределение с (l – 1) степенями свободы. Если F0(x) зависит от одного или нескольких параметров и эти параметры оцениваются по данным случайной выборки, то число степеней свободы уменьшается на число этих параметров. Поэтому число степеней свободы определяется по формуле , где r – число параметров распределения, оцененных по выборке.

            Критерий (Мизеса)

            Критерий Мизеса строится на основе статистики

 = ,

здесь . При n ® ¥ величина r =  распределена по закону

rнабл = .

3.5. Доверительные интервалы

По результатам случайной выборки  всегда можно построить точечную оценку . При точечном оценивании мы не застрахованы от сколь угодно больших ошибок. Требуется определить промежуток или интервал, которому принадлежит истинное значение параметра q. Как правило, с вероятностью равной единице, можно утверждать лишь, что q может быть любым из множества возможных значений, поэтому при построении промежутков изменения параметра qзадаются некоторой вероятностью – доверительной вероятностью, близкой к единице, и границы интервала () выбирают из условия:

Р() = g,

где g – доверительная вероятность (уровень доверия), () – доверительный интервал вероятности g. Доверительная вероятность выбирается так, чтобы событие с вероятностью появления g можно было считать практически невозможным. В математической статистике обычно используются доверительные вероятности из ряда: 0,9; 0,95; 0,99; 0,995; 0,999. Выбор доверительной вероятности полностью зависит от исследователя, но с учетом физической сути изучаемого явления. Так, например, степень доверия авиапассажира к надежности самолета или парашютиста к надежности парашюта, несомненно, должна быть выше степени доверия покупателя к надежности электрической лампочки или даже утюга.

Границы доверительных интервалов будем определять, опираясь на точечные оценки. По построенной точечной оценке доверительные интервалы можно определять различными способами. Наиболее часто на практике встречаются симметричные и односторонние доверительные интервалы:

Рассмотрим схему построения симметричных доверительных интервалов, односторонние получаются аналогично.

По данным выборки вычисляется "хорошая" точечная оценка , которая является случайной величиной. Для нее можно построить функцию распределения .

Найдем t1 = t1(q) и t2 = t2(q) из уравнений:

,     . (3.4)

Таким образом, t1 и t2 – квантили уровней   и   (рис. 3.2).

При этом

;

.

Таким образом, при заданном  оценка  с вероятностью  заключена в интервале , причем вероятности попадания случайной величины , как левее, так и правее, одинаковы и равны  (отсюда происходит название – симметричный интервал, рис. 3.3). Так как , то, в силу принципа практической достоверности события , все возможные пары  будут принадлежать области D между кривыми t1 = t1(q) и t2 = t2(q). Для окончания построения доверительного интервала остается заметить, что, получив по выборке оценку , мы вправе сделать вывод, что неизвестный параметр должен лежать внутри интервала (), где   определяются из уравнений:

– для возрастающих функций

,         (3.5)

формально  .

– для убывающих функций

,

формально  .

            Схема построения доверительного интервала, геометрическая интерпретация уравнений (3.5) и их решений приведена на рис. 3.4.

            Пример 3.9. Построить доверительный интервал доверительной вероятности  для среднего  нормального распределения с известной дисперсией .

            Решение. "Хорошая" оценка для параметра  выборное среднее . Известно, что эта оценка распределена по нормальному закону с параметрами:  . Значит , где  – функция стандартного нормального распределения, которая, в свою очередь, выражается через интегральную функцию Лапласа .

Решим уравнения (3.4):

         ,

где  – квантиль уровня  стандартного нормального распределения, т.е. функция t1 = t1(q) здесь является линейной. Аналогично

        ,

т.е. t2 = t2(q) тоже линейная функция. Теперь из первого уравнения (3.5) находим :

,

а из второго уравнения (3.5) – :

.

Для стандартного нормального распределения

.

Квантиль  определяется из уравнения

,

где, при заданной доверительной вероятности , значение  находится по таблице интегральной функции Лапласа (приложение 2). Окончательно доверительный интервал имеет вид

.                                             (3.6)

            Пример 3.10. Построить доверительный интервал доверительной вероятности  для дисперсии  нормального распределения с известным средним .

            Решение. Рассмотрим оценку для дисперсии вида . Тогда случайная величина  имеет -распределение с  степенями свободы (см. подразд. 2.14) и значит

Þ        ,

где  – квантиль уровня  -распределения с  степенями свободы.

Аналогично

      ,

где  – квантиль уровня  -распределения с  степенями свободы. Теперь из первого уравнения (3.5) находим :   ,

а из второго уравнения (3.5) – :   . Доверительный интервал имеет вид

.

            Пример 3.11. Построить доверительный интервал доверительной вероятности  для параметров нормального распределения ,  (оба параметра неизвестны).

Решение. В качестве оценок неизвестных параметров выбираем ,  (исправленная выборочная дисперсия), тогда случайная величина  имеет распределение Стьюдента с  степенями свободы (см. подразд. 2.14), т.е.

.

Далее доверительный интервал для  строится, как в примере 3.9, и имеет вид

,

только теперь здесь  квантиль уровня  распределения Стьюдента с  степенями свободы. Доверительный интервал для  строится так же, как в примере 3.10, но с использованием -распределения с  степенями свободы