На втором, стохастическом уровне известны множество возможных ситуаций и априорное вероятностное распределение случайных факторов и этих ситуаций. В обобщённой модели обработки экспериментальных данных (см. рис.1.1) это касается законов распределений величин и . На стохастическом уровне информированности специалист находится в «условиях риска».
Наконец, на уровне неопределённости известно множество ситуаций, но отсутствует априорная информация о распределениях. Принято говорить, что задача решается в условиях неопределённости.
Последние два уровня обобщаются термином «условия неполной информации». Статистические методы обработки экспериментальных данных используются именно в условиях неполной информации.
При этом параметрические методы в основном используются на стохастическом уровне, а непараметрические – на уроне неопределённости. Утверждение «в основном» подчёркивает, что в принципе и параметрические и непараметрические методы при необходимости могут быть использованы на обоих рассматриваемых уровнях неполной информации.
Многие задачи обработки данных решаются в условиях, когда относительно исходной информации (характеристик исследуемого объекта, ошибок измерений и т.д.) выдвигаются определённые гипотезы. В действительности эти гипотезы могут отличаться от фактических, реально существующих характеристик. Иначе говоря, модель может оказаться неадекватной реальным процессам. В связи с этим необходимо отметить, что различные статистические процедуры обладают различной чувствительностью к такой неадекватности. Чувствительность означает степень влияния экспериментальных данных на результаты их обработки. Поскольку непараметрические методы требуют наименьшего объёма априорной информации, то очевидно, что они и менее чувствительны к искажениям исходных данных.
Выше отмечалось, что экспериментальная информация может моделироваться с помощью случайных величин, векторов или функций. Случайная функция представляет собой наиболее общую модель наблюдаемого сигнала. Если аргументом случайной функции является время, то для неё используется термин «случайный процесс». Значительная часть результатов экспериментов описывается случайными процессами.
При наиболее распространённой аддитивной ошибке модель непрерывного сигнала имеет вид
,
где – полезная составляющая наблюдаемого сигнала; A<m> - вектор оцениваемых параметров.
Характер полезной составляющей может быть использован как один из признаков для классификации моделей наблюдения. При этом можно выделить следующие типы полезных сигналов: детерминированный сигнал с неизвестными параметрами, случайный сигнал с известной функцией распределения (с точностью до параметров) и случайный сигнал с неизвестной функцией распределения (функция распределения может быть задана только классом распределений).
При рассмотрении обобщённой модели обработки экспериментальных данных отмечалось, что пространство наблюдений {} представляет собой множество реализаций вектора , или выборочное множество. Остановимся подробнее на понятии выборки, так как оно играет фундаментальную роль в статистических методах обработки информации как параметрических, так и непараметрических.
При экспериментальных исследованиях закономерностей в массовых случайных явлениях предполагается, что опыты могут быть повторены большое число раз при одинаковых условиях. В каждом опыте регистрируется определённый признак изучаемого объекта. Различают общий и основной признаки. Общим признакомназывается свойство, по которому объекты объединяются в однородные совокупности, а основным признаком – свойство объектов, исследуемое в данном эксперименте. Под однородной будем понимать совокупность, все элементы которой являются реализациями одной и той же случайной величины (функции) с одним и тем же законом распределения.
Если производится исследование веса совокупности однотипных деталей (например, гаек), то тип деталей (гайки) характеризует их общий признак, а вес деталей – основной признак.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.