Значения данного интеграла для разных t вычислил Лаплас и представил их в виде таблицы. Эту таблицу можно найти в любом математическом справочнике. Поскольку значения этого интеграла зависят от предела t, то интеграл от функции Гаусса стали называть функцией Лапласа и обозначать как . Таким образом, вероятность нахождения неизвестного значения оцениваемого параметра генеральной совокупности можно найти по формуле:
Р=2Ф(t).
Если интервал несимметричен P=Ф(t2) – Ф(t1)
Рис. 10.2
Пусть генеральная совокупность Х распределена по нормальному закону N(a,σ), причем, параметр σ известен, а параметр a требуется оценить с надежностью P, т.е. найти P(– ∆x < a < + ∆x).
Тогда P( – ∆x < a < + ∆x)= 2Ф(t), но величина t в данном случае определяется по другой формуле. Т.к. величина t по смыслу – относительное отклонение, т.е. отношение фактического отклонения к стандартному, а для отклонения средних значений от математического ожидания стандартным отклонением является величина (стандартная ошибка), тогда .
Мы построили для параметра a доверительный интервал (интервальную оценку), левая граница которого , правая – , а точность – . Центр этого интервала находится в точке с координатой , а длина интервала .
Варианты задачи интервального оценивания при известном σ
Вариант 1
Пусть необходимо найти доверительный интервал х в котором заключено математическое ожидание a, для заданной доверительной вероятности Р, если стандартное отклонение σ известно.
· По условию задачи определить .
· По заданной вероятности, следует найти функцию Лапласа Ф(t)=Р/2 (вероятность нужно выражать не в процентах, а в виде десятичного числа: 0,95; 0,90 и т.д.).
· По таблице Лапласа для данного значения Ф(t) выбирается t.
· Определить полуширину доверительного интервала по формуле: .
· Определить границы доверительного интервала: α=–х, β=+х.
Вариант 2
Пусть необходимо найти доверительную вероятность Р того, что математическое ожидание a заключено в доверительном интервале х , при известном значении σ.
· По условию задачи определить .
· По известному значению х определить параметр t по формуле: .
· По таблице Лапласа для данного значения t выбирается Ф(t).
· Определить доверительную вероятность по формуле: Р=2Ф(t).
Вариант 3
Необходимо оценить доверительный интервал для самих значений измеряемого признака. В этом случае или .
Смысл сигмового, двухсигмового и трехсигмового интервалов.
Найдем вероятность того, что нормально распределенная величина будет отклоняться от математического ожидания на величину:
· стандартного отклонения, т.е. х=σ
P()=2Ф()=2Ф(1)=2·0,3413=0,6826.
· двойного стандартного отклонения, т.е. х=2σ
P()=2Ф()= 2Ф(2)=2·0,4772=0,9544
· тройного стандартного отклонения, т.е. х=3σ
P()=2Ф()= 2Ф(3)=2·0,49865=0,9973
Из данных уравнений мы делаем вывод, что при нормальном распределении СВ 68% всех значений СВ лежит в пределах стандартного отклонения. Если отклонение равно двум стандартным отклонениям, то в пределах такого интервала лежит 95% значений СВ. И, наконец, при трехсигмовом интервале 99% всех значений СВ. Обычно доверительный интервал значений определяют как выборочное среднее плюс-минус два стандартных отклонения.
Определим теперь интервальную оценку для математического ожидания a, нормально распределенной генеральной совокупности Х в том случае, когда дисперсия генеральная Dнеизвестна, т.е. построим доверительный интервал для параметра a, если σ неизвестно.
Когда σнеизвестно нельзя пользоваться формулой . При больших выборках выборочное стандартное отклонение близко к σ и, в принципе, может быть использовано вместо него, но при малых выборках (n<30) этого сделать нельзя, поэтому вместо случайной величины t используют величину tp,k, т.е. критерий который зависит не только от величины вероятности Р, но и от количества опытов n. , где k=n-1. Данный параметр не зависит от σ!
Разработка теории малой выборки была начата английским статистиком В. С. Госсетом (печатавшимся под псевдонимом Стьюдент) в 1908 г. Он доказал, что в малой выборке действует особый закон распределения. При оценке результатов малой выборки величина генеральной дисперсии в расчетах не используется. Для определения возможных пределов ошибки пользуются так называемым критерием Стьюдента. Согласно распределению Стьюдента, доверительный интервал зависит как от величины t, а значит, от вероятности Р, так и от объема выборки n. Чем меньше объем выборки, тем более случайным образом, а значит, менее надежно располагается в данном интервале неизвестный параметр.
Распределение таких выборок описывается формулой Госсета
Значения этой функции как видно, зависят от t и k.
k называется числом степеней свободы. Эта величина мало отличается от числа опытов n. Для разных задач k=n-1, k=n-2, k=2(n-1). При увеличении k, а значит, числа опытов n значения функции Госсета приближается к значениям функции Гаусса, а график распределения Стьюдента стремится принять вид графика
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.