Устойчивые оценки подразделяют на три класса: L-, R- и M-оценки [7, 12]. Рассмотрим их более подробно.
L-оценки. Ранее уже упоминалось медиана выборки, которая представляет собой центральный элемент упорядоченной выборки
, (11)
если NS – нечетное, и полусумму NS /2-го и (NS/2)+1-го элементов, если NS – четное.
При этом обозначение X(j) используется для так называемой j-й порядковой статистики. Таким образом, Х(1) – минимальное значение, а – максимальное в данной выборке.
Тогда L-оценка имеет вид [7, 12]
, (12)
где aj, j = 1,…,NS – весовые коэффициенты. В соответствии с такой записью для медианы все коэффициенты aj равны 0, кроме a(Ns+1)/2=1, если NS – нечетное, или aNs/2 = a(Ns/2)+1 = 0,5, если NS – четное. Более того, среднее выборки также является частным случаем L-оценки, для которой все aj = 1/ NS.
Если в выборке имеется выброс, то в упорядоченной выборке вида (11) соответствующий элемент занимает либо первую, либо последнюю позицию, то есть является первой или NS-й порядковой статистикой. Если же для используемой L-оценки соответствующий весовой коэффициент aj равен нулю, то очевидно, что выброс не оказывает влияния на XL. Именно за счет выбора равными нулю некоторого количества Na1 первых весовых коэффициентов aj, j = 1,…,Na1 и Na2 последних весовых коэффициентов aj, j = n-Na2+1,…,n обеспечиваются робастные свойства L-оценок, причем чем больше Na1 и Na2, тем выше устойчивость, т.е. способность оценки быть слабочувствительной к наличию грубых погрешностей в обрабатываемой выборке. Остальные ненулевые коэффициенты aj, j = Na1+1,…,n-Na2 при этом могут быть выбраны таким образом, чтобы обеспечивать несмещенность L-оценки и минимизировать ее дисперсию.
Частным случаем L-оценки является a-урезанное среднее
, (13)
для которой aj = 1/(n-Na1-Na2), j=Na1+1,…,n-Na2, а остальные aj равны 0.
Варьируя Na1 и Na2 или соотношения a1 = Na1/n и a2 = Na2/n, можно изменять характеристики Xa, делая эту оценку более устойчивой при увеличении параметров урезания (усечения). Предельным случаем a-урезанного среднего является медиана выборки при a1 = a2®0,5 или определенная порядковая статистика при неравных a1 и a2.
Отметим, что L-оценки полезны не только для обеспечения устойчивости. Для многих распределений при Ро = 0 к классу L-оценок принадлежат и эффективные, т.е. обеспечивающие минимальную дисперсию, оценки, которые также иногда называют оптимальными. Так, медиана является оптимальной (точнее, квазиоптимальной) оценкой для лапласовского распределения, оценка (+)/2 – для равномерного распределения, а L-оценка, коэффициенты которой aj медленно возрастают при увеличении j, – для релеевского [14].
R-оценки. Эти оценки основываются на ранговых критериях. Под рангом понимают номер элемента исходной выборки в полученном для нее вариационном ряду , то есть ранг элемента представляет собой натуральное число от 1 до NS. Например, если исходная выборка состоит из семи элементов: 11, 5, 2, 8, -13, 4, 6, то упорядоченная выборка (вариационный ряд) будет иметь вид -13, 2, 4, 5, 6, 8, 11. Следовательно, ранги будут: R1 = 7, R2 = 4, R3 = 2, R4 = 6, R5 = 1, R6 = 3, R7 = 5.
Одним из примеров R-оценки является оценка Вилкоксона [2]
где med{ } означает расчет медианы. Иными словами, XW есть медиана расширенной выборки размером , сформированной из элементов исходной выборки и всех возможных попарных средних.
Оценка Вилкоксона способна ²устранять² до NB » (0,25…0,3)NS выбросов одного знака, то есть измерений, существенно отличающихся от истинного значения параметра либо в меньшую, либо в большую сторону. Вообще, величина e* = NB/NS является одной из основных характеристик устойчивости оценки и для медианы при n®¥ e* стремится к 0,5 для Xa при a1 = a2 e* = a1 = a2 .
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.