Методы статистического оценивания. Постановка задачи оценивания законов и параметров распределения случайных величин (Раздел 3 учебного пособия "Статистические методы обработки экспериментальных данных"), страница 3

Раскроем существо задачи исследования точности и надёжности статистического оценивания. Пусть по результатам n наблюдений случайной величины  получена точечная оценка . Возникает вопрос: насколько эта оценка точна и надёжна.

Точность статистического оценивания характеризуется абсолютной погрешностью (ошибкой)

                                                     .                                 

Истинную погрешность Da определить невозможно даже при известной оценке . Это объясняется тем, что исследователь не знает истинное значение параметра a. Поэтому вводится понятие вероятной погрешности статистической оценки параметра a.

Максимальной вероятной погрешностью статистической оценки называется её максимально возможное отклонение eb > 0 от оцениваемой характеристики случайного объекта, гарантируемое с вероятностью не менее b. Данная величина (eb) имеет также эквивалентное название - максимальная с вероятностью b погрешность оценки какой – либо характеристики.

Если оценка несмещённая, то её математическое ожидание равно оцениваемой характеристике, т.е. справедливо равенство (3.1.5). Тогда при симметричном распределении оценки  относительно математического ожидания имеет место следующее соотношение:

    ,    (3.2.1)

где  – максимальная с вероятностью b погрешность оценки  параметра a.

Соотношение (3.2.1) введено в предположении, что параметр a известен. Но тогда задача его оценивания теряет смысл, её просто не существует. На практике дело обстоит иначе. На основе экспериментальных данных определяется оценка параметра, истинное значение которого остаётся неизвестным. Затем вводится соотношение

            .                                                         (3.2.2)

Следует подчеркнуть, что похожие на первый взгляд выражения (3.2.1) и (3.2.2) имеют различный вероятностный смысл. Так, (3.2.1) определяет вероятность того, что случайная величина  попадает в неслучайный интервал , а (3.2.2) – вероятность того, что неслучайное (хотя и неизвестное) значение a оцениваемого параметра окажется в пределах случайного интервала . Данный интервал является случайным как по величине, так и по расположению на вещественной оси, т.е. он накрывает точку a.

Интервал  называется доверительным интервалом, соответствующим доверительной вероятности b, или 100b-про­центным доверительным интервалом. Его границы называются доверительными границами для параметра a.

Очевидно, чем у́же доверительный интервал, тем меньше максимальная с вероятностью b погрешность eb оценки параметра, тем она точнее. С другой стороны, чем больше доверительная вероятность, тем более надёжна (достоверна) оценка, тем с бо́льшим доверием можно к ней относиться.

Абсолютная достоверность оценивания характеризуется доверительной вероятностью b = 1. В условиях воздействия случайных факторов такая достоверность не достижима, поэтому реальная доверительная вероятность определяется на основе принципа практической уверенности. Согласно этому принципу события, имеющие вероятности, близкие к единице, считаются практически достоверными, а имеющие вероятности, близкие к нулю, – практически невозможными. Иначе говоря, если вероятность случайного события близка к единице (к нулю), то практически можно быть уверенным, что при однократном проведении опыта это событие произойдёт (не произойдёт).

Вероятность практически достоверного события определяется сущностью решаемой задачи. При анализе качества статистического оценивания обычно принимают b Î [0,8;  0,99].

Как было показано в § 3.1 [см. формулу (3.1.4)], доверительные границы представляют собой статистики, т.е. некоторые функции элементов выборки   (x1,  x2,…, xn)Т = X<n>.  В случае одномерного параметра a  соотношение (3.1.4) принимает вид