Проблема статистической обработки экспериментальных данных (Раздел 1 учебного пособия "Статистические методы обработки экспериментальных данных"), страница 3

Множество {} всех значений , которые могут быть реализованы при всех возможных значениях E и , составляет пространство наблюдений. Информация о параметре E из вектора  получается при обработке последнего. Статистическую процедуру преобразования над вектором  обозначим через R(). Величина I характеризует всю совокупность априорной информации, которая используется в статистической процедуре совместно с результатами наблюдений . Следует подчеркнуть, что эта информация известна до начала эксперимента. Результатом преобразования величин  и I является принятие решения о параметре E. Поэтому функцию R можно назвать решающей функцией.

Как видно из рис.1.1 (пунктирные линии), априорная информация I1, I2, I3, I4, I5, I6   может отражать определённые свойства пространства ситуаций, источника стохастичности, оператора N, пространства наблюдений, пространства решений и требований лица, принимающего решение.

Множество всех решений  образует пространство решений . Идеальный исход обработки экспериментальных данных сводится к тождеству . Однако на практике это тождество оказывается нереализуемым. Решение  является случайной величиной (вектором, функцией), с помощью которой экспериментатор оценивает интересующую его величину E. При этом степень близости данной оценки к истинному значению E определяется как характером априорной информации об условиях эксперимента и о задаче обработки данных, так и особенностями процедуры принятия решений.

Выше указывалось, что помехи и регистрируемые в процессе наблюдения сигналы представляют собой случайные объекты (величины, векторы, функции). Из теории вероятностей известно, что самой полной характеристикой случайного объекта является закон распределения. Наиболее употребительны формы закона распределения в виде функции распределения  и плотности распределения . В рассматриваемом случае принципиальное влияние на выбор способов обработки и качества обработки имеют законы распределения на пространствах {} и {}, а также оператор . Обычно  предполагается известным. Наиболее распространён случай, когда по отношению к помехе  оператор N является оператором суммирования (помеха аддитивная).

В зависимости от того, известны законы распределений на пространствах {} и {} или нет, статистические методы обработки экспериментальных данных подразделяются на параметрические (классические) и непараметрические.

Параметрические методы используются тогда, когда законы распределений на указанных пространствах  известны. Однако, на практике они не всегда априори известны. При постановке экспериментов для исследования новых явлений и процессов истинные законы распределений могут быть неизвестны вообще. В других случаях условия эксперимента и характер помех настолько сложны и нестабильны, что трудно говорить о конкретных законах непосредственно в период проведения экспериментальных работ. Так, например, в задачах приёма и обработки телеметрической информации о техническом состоянии бортовых уст­ройств космических аппаратов характер помех меняется в зависимости от времени суток, взаимного расположения пункта приёма и аппарата на орбите, наличия целенаправленных возмущающих воздействий. В настоящее время проблема обработки экспериментальных данных при неизвестных законах распределений решается двумя путями.

Во-первых, используется минимаксный подход. При этом решаемая задача фактически сводится к параметрической, так как данный подход приводит к нахождению закона распределения на {}, в некотором смысле «наилучшего среди плохих» (максимин) или «наихудшего среди хороших» (минимакс).

Во-вторых, применяются методы непараметрической статистики.

Во многих научных дисциплинах (исследование операций, теория принятия решений, теория игр и т.д.) по информированности специалиста, решающего задачу, различают три уровня – детерминированный, статистический и неопределённый.

Наиболее простым является первый уровень – детерминированный, когда условия решения задачи известны полностью и случайные факторы отсутствуют. Применительно к обобщённой модели на рис.1.1 это означает, что операторы N и R точно известны, Z – неслучайная величина, все измерения проводятся абсолютно точно. Крайний случай этой ситуации – достоверно известно значение параметра E. Говорят, что решение задачи на детерминированном уровне производится в условиях определённости.