По определению функция распределения случайной величины есть вероятность случайного события:
.
Пусть в качестве её оценки используется частота статистического аналога xi < x события < x в серии n испытаний:
. (4.3.4)
Поскольку (4.3.4) является оценкой вероятности случайного события < x, то её качество должно исследоваться методами, рассмотренными в § 3.3.
Если объём выборки достаточно велик, то закон распределения оценки функции может быть аппроксимирован нормальным законом аналогично (3.3.4):
(4.3.5)
С учётом (4.3.5) по аналогии с формулами (3.3.5) – (3.3.7) получим
(4.3.6)
; (4.3.7)
. (4.3.8)
При исследовании качества оценки возникает проблема, связанная с незнанием истинной функции распределения . При большом объёме выборки эта функция заменяется её оценкой и формулы (4.3.6) – (4.3.8) приобретают вид:
(4.3.9)
; (4.3.10)
. (4.3.11)
Из соотношений (4.3.6) – (4.3.11) видно, что все показатели качества оценивания функции распределения зависят от её аргумента x. Так, при фиксированных доверительной вероятности b = const и объёме выборки n = const доверительные границы для будут функциями:
.
П р и м е р 4.4. Пусть признак массива экспериментальных данных распределён нормально, т.е.
.
По результатам ста наблюдений (n = 100) построена статистическая функция распределения
.
Требуется построить для функции распределения 95-процентный доверительный интервал (b = 0,95).
▼ По формулам (4.3.7) и (4.3.8) получим
;
.
На рис.4.6 изображена доверительная область для функции , границы которой даны пунктиром. График функции – сплошная линия. ▲
Рис.4.6. Доверительная область функции распределения (к примеру 4.4)
Поскольку является оценкой вероятности случайного события < x, то объём n выборки, потребный для оценивания функции распределения с необходимыми точностью e и надёжностью b, определяется выражением, аналогичным (3.3.8):
. (4.3.12)
Как видно из рис.4.6, доверительная область для зависит от x и имеет наибольшую ширину при . Это означает, что наибольшее число наблюдений потребуется для оценивания значения (см. табл.3.1). Согласно формуле (4.3.12) и табл.3.1. при x ® ¥ потребное число n экспериментальных точек снижается, однако при этом уменьшается правомерность предположения о нормальном распределении оценки . Поэтому при оценивании функции распределения объём выборки берётся максимальным, обеспечивающим требуемые точность и надёжность оценки при всех x Î {x}. Указанный объём определяется соотношением
. (4.3.13)
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.