Циклический алгоритм исследования. Типы измерений и характер ошибок в них, страница 7

Выборка – конечный набор значений случайной величины, полученый в результате наблюдений. Число элементов выборки называют её объёмом и обычно обозначают N. Выборки подразделяются на повторные и безповторные. Повторной называют выборку, при которой отобранный объект возвращается в генеральную совокупность, а безповторной – выборку, при которой отобранный объект в генеральную совокупность не возвращается.

Смысл статистических методов заключается в том, чтобы по выборке ограниченного объема N, т.е. лишь по некоторой части генеральной совокупности, высказать обоснованное суждение о её свойствах в целом. Подобное суждение может быть получено путем построения эмпирических (выборочных) аналогов  вероятностных характеристик исследуемой величины, иначе говоря, путём оценивания параметров (характеристик) генеральной совокупности с помощью некоторых подходящих функций от результатов наблюдений – оценок.

Если перефразировать последнее предложение получим определение оценки.

Оценка – эмпирический аналог вероятностной характеристики генеральной совокупности, рассчитываемый как функция от результатов наблюдений.

Таким образом, теперь мы можем ответить на вопрос, в чём же разница между mх и и sx и Sx: mх и sx – теоретические, вероятностные характеристики совокупности, а  и  Sx – их оценки (или иначе выборочные, эмпирические аналоги).

Возникает следующий вопрос. На каком основании мы можем их заменять (mх на  и sx на Sx)?

Теоретическое обоснование выборочного метода(или, иначе, применимость оценок) дают две теоремы: Чебышева и Ляпунова.

Согласно теореме Чебышева при достаточно большом объеме выборки разность между выборочной характеристикой (оценкой) и генеральной характеристикой совокупности будет сколь угодно малой с вероятностью близкой к единице.

А при определенном объеме выборки (n) работает теорема Ляпунова, по которой можно рассчитать эту разницу Δ (между параметром генеральной совокупности  и ее оценкой), которая определяет ошибку выборки.

где  - есть среднеквадратическое отклонение выборки,

n  - объем выборки(число измерений) ;

 - выборочная средняя, т.е. среднее арифметическое значение;

t  - коэффициент Стьюдента, который меняется в зависимости от вероятности α  и величины k=n-1.

Из формулы следует , что с увеличением объема выборки ошибка выборки Δ уменьшается.

С точки зрения практики к свойствам оценок предъявляются требования:

1.Состоятельность. Оценка называется состоятельной, если при неограниченном увеличении объема выборки (n→∞), значение оценки стремится к своему теоретическому значению ( → mx).

2.Несмещенность. Она означает отсутствие систематической погрешности при оценивании параметра.

3.Эффективность. Она предполагает минимальную дисперсию; следовательно, эффективная оценка имеет минимальную случайную ошибку.

Классификация оценок

Оценки могут быть: (1) точечными  и  (2)  интервальными.

1. Точечная оценка задается одним числом, получаемым путем подстановки выборочных значений  X1 , X2 , … , Xn  в формулу для оценки искомого параметра.

Например, (как уже отмечалось ранее) математическое ожидание mx и дисперсия sx оцениваются по формулам:

;

Использование в знаменателе формулы дисперсии величины ν = N-1 (ν- число степеней свободы) вместо очевидного на первый взгляд значения N продиктовано необходимостью достижения свойства несмещенности. Поправка    λ = N/(N-1) называется мультипликативной поправкой Бесселя.

Однако точечные оценки не дают информации о степени близости оценки к соответствующему теоретическому параметру. Поэтому более информативной является интервальная оценка, дающая представление о степени точности и надежности оценки для параметра.

2. Интервальная или доверительная оценка – это интервал, который с определённой вероятностью γ охватывает оцениваемое значение  Х.

Таким образом интервальная (доверительная) оценка характеризуется двумя величинами:

(1). Шириной доверительного интервала  Δ, которая является мерой точности оцениваемого параметра (чем меньше  Δ для данного γ, тем точнее оценка).