Значения
данного интеграла для разных t вычислил
Лаплас и представил их в виде таблицы. Эту таблицу можно найти в любом
математическом справочнике. Поскольку значения этого интеграла зависят от
предела t, то интеграл от функции Гаусса
стали называть функцией Лапласа и обозначать как . Таким образом, вероятность нахождения
неизвестного значения оцениваемого параметра генеральной совокупности можно
найти по формуле:
Р=2Ф(t).
Если интервал несимметричен P=Ф(t2) – Ф(t1)
Рис. 10.2
Пусть генеральная совокупность Х
распределена по нормальному закону N(a,σ), причем,
параметр σ известен, а параметр a требуется
оценить с надежностью P, т.е. найти P(– ∆x < a <
+ ∆x).
Тогда P( – ∆x < a <
+ ∆x)= 2Ф(t), но
величина t в данном случае определяется по
другой формуле. Т.к. величина t по
смыслу – относительное отклонение, т.е. отношение фактического отклонения к
стандартному, а для отклонения средних значений от математического ожидания
стандартным отклонением является величина
(стандартная
ошибка), тогда
.
Мы
построили для параметра a доверительный интервал
(интервальную оценку), левая граница которого ,
правая –
, а точность –
. Центр этого интервала находится в точке с координатой
, а длина интервала
.
Варианты задачи интервального оценивания при известном σ
Вариант 1
Пусть
необходимо найти доверительный интервал х в котором заключено математическое ожидание a, для заданной доверительной вероятности Р, если
стандартное отклонение σ известно.
·
По условию задачи
определить .
· По заданной вероятности, следует найти функцию Лапласа Ф(t)=Р/2 (вероятность нужно выражать не в процентах, а в виде десятичного числа: 0,95; 0,90 и т.д.).
· По таблице Лапласа для данного значения Ф(t) выбирается t.
·
Определить полуширину доверительного интервала по формуле: .
·
Определить границы доверительного интервала: α=–
х, β=
+
х.
Вариант 2
Пусть
необходимо найти доверительную вероятность Р того, что математическое ожидание a заключено в доверительном интервале
х , при известном значении σ.
·
По условию задачи
определить .
·
По известному
значению х определить параметр t по формуле:
.
· По таблице Лапласа для данного значения t выбирается Ф(t).
· Определить доверительную вероятность по формуле: Р=2Ф(t).
Вариант 3
Необходимо
оценить доверительный интервал для самих значений измеряемого признака. В этом
случае или
.
Смысл сигмового, двухсигмового и трехсигмового интервалов.
Найдем вероятность того, что нормально распределенная величина будет отклоняться от математического ожидания на величину:
·
стандартного
отклонения, т.е. х=σ
P()=2Ф(
)=2Ф(1)=2·0,3413=0,6826.
·
двойного
стандартного отклонения, т.е. х=2σ
P()=2Ф(
)= 2Ф(2)=2·0,4772=0,9544
·
тройного
стандартного отклонения, т.е. х=3σ
P()=2Ф(
)= 2Ф(3)=2·0,49865=0,9973
Из данных уравнений мы делаем вывод, что при нормальном распределении СВ 68% всех значений СВ лежит в пределах стандартного отклонения. Если отклонение равно двум стандартным отклонениям, то в пределах такого интервала лежит 95% значений СВ. И, наконец, при трехсигмовом интервале 99% всех значений СВ. Обычно доверительный интервал значений определяют как выборочное среднее плюс-минус два стандартных отклонения.
Определим теперь интервальную оценку для математического ожидания a, нормально распределенной генеральной совокупности Х в том случае, когда дисперсия генеральная Dнеизвестна, т.е. построим доверительный интервал для параметра a, если σ неизвестно.
Когда σнеизвестно нельзя
пользоваться формулой . При больших выборках
выборочное стандартное отклонение
близко к σ и, в
принципе, может быть использовано вместо него, но при малых выборках (n<30) этого сделать нельзя, поэтому
вместо случайной величины t
используют величину tp,k, т.е. критерий который зависит не
только от величины вероятности Р, но и от количества опытов n.
, где k=n-1. Данный параметр не зависит от σ!
Разработка теории малой выборки была начата английским статистиком В. С. Госсетом (печатавшимся под псевдонимом Стьюдент) в 1908 г. Он доказал, что в малой выборке действует особый закон распределения. При оценке результатов малой выборки величина генеральной дисперсии в расчетах не используется. Для определения возможных пределов ошибки пользуются так называемым критерием Стьюдента. Согласно распределению Стьюдента, доверительный интервал зависит как от величины t, а значит, от вероятности Р, так и от объема выборки n. Чем меньше объем выборки, тем более случайным образом, а значит, менее надежно располагается в данном интервале неизвестный параметр.
Распределение таких выборок описывается формулой Госсета
Значения этой функции как видно, зависят от t и k.
k называется
числом степеней свободы. Эта величина мало отличается от числа опытов n. Для разных задач k=n-1, k=n-2, k=2(n-1).
При увеличении k, а значит, числа опытов n
значения функции Госсета приближается к значениям функции Гаусса, а
график распределения Стьюдента стремится принять вид графика
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.