Здесь необходимо пояснить, что под термином "нормальные" измерения понимают не только измерения, для которых закон распределения является нормальным (гауссовым). В общем случае pосн(x) – это закон распределения оценок в ситуациях, когда аномальные измерения отсутствуют (P0 = 0), и это может быть, например, релеевский, пуассоновский или равномерный закон.
Соответственно под терминами ²грубая погрешность², ²аномальное измерение² и ²выброс² понимают такой результат измерения или оценку параметра, которая существенно отличается от истинного значения, а также от большинства других оценок в выборке X1, X2,…, XNs. Термин ²существенно² в этой ситуации нуждается в пояснении или более строгом определении. Ведь если, например, росн(х) – гауссов закон распределения с математическим ожиданием (МО) mx и дисперсией , то по определению росн(х)¹0 для хÎ[-¥; +¥] и, следовательно, область определения росн(х) пересекается с областью определения рзагр(х), каким бы ни было рзагр(х).
Поэтому абсолютно корректное разделение оценок на ²нормальное² измерение и ²грубую погрешность² возможно лишь тогда, когда ПРВ росн(х) определена на некотором интервале xÎ[a, b], а рзагр(х) = 0 при xÎ[a, b]. В остальных же случаях деление оценок на «нормальные» и «аномальные» весьма условно. В частности, для рассмотренного выше примера гауссовой ПРВ росн(х) «аномальными» могут считаться такие оценки Xi, для которых >, где .
При моделировании выборок, содержащих выбросы, используют различные ПРВ рзагр(х), например:
1) рзагр(х) – гауссова с СКО sзагр>>sх и математическим ожиданием, которое может быть как равным, так и не равным mx [12] ;
2) рзагр(х)=1/(b-a), где xÎ[a; b] и выполняется условие (b-a)>>sx;
3), где pmax+pmin=1, d(.) – дельта-функция, Xmax и Xmin – фиксированные значения, существенно отличающиеся от истинного значения измеряемой величины; при этом Xmin меньше (отрицательный выброс), а Xmax соответственно больше (положительный выброс) истинного значения; такие модели рзагр(х) используются при анализе эффективности методов обработки изображений [2, 3].
Таким образом, р(х) (10) может быть как симметричной, так и несимметричной относительно математического ожидания распределения росн(х). Однако в любом случае при Ро¹0 возможное наличие в выборке X1, X2,…, XNs элементов, принадлежащих рзагр(х), приводит к снижению точности оценок параметров ПРВ росн(х) (отметим, что в конкретных выборках X1, X2,…, XNs может быть различное число «грубых погрешностей» при некотором Ро, задаваемом для генеральной совокупности).
Снижение точности оценок при использовании заданного метода или алгоритма обработки выборки может проявляться:
1) в появлении смещенности оценки параметров ПРВ росн(х) или увеличении смещенности для случая Ро¹0 по сравнению со случаем Ро = 0;
2) в увеличении дисперсии оценок параметров росн(х) и т.д.
Мотивируя целесообразность применения устойчивых методов оценивания, П. Хьюбер в своей книге [12] приводит конкретный пример, когда присутствие в выборке малого числа аномальных измерений (Ро порядка сотых или тысячных) резко ухудшает характеристики точности оценок. Отметим также, что если относительно плотности росн(х) (вида распределения, примерного диапазона возможного изменения МО и дисперсии этого распределения) на практике еще можно сделать какие-то априорные, основанные на каких-то теоретических или эмпирических данных, предположения и допущения, то относительно вида и характеристик рзагр(х) сделать это обычно сложнее. В связи с этими особенностями формируются общие требования к процедуре устойчивого (робастного) оценивания, суть которых состоит в следующем [12]:
1. Для выбранной модели процедура должна иметь достаточно хорошую (оптимальную или почти оптимальную) эффективность.
2. Процедура обязана быть робастной (устойчивой), иначе говоря, малые отклонения от предположений о модели должны ухудшать качество процедуры лишь в малой степени, а несколько большие отклонения от допущений модели не должны приводить к катастрофическим последствиям.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.