В предыдущих разделах были рассмотрены методы определения характеристик, описывающих свойства случайных объектов (величин, векторов, функций). Однако цель обработки экспериментальных данных в конечном счёте состоит в выявлении причинно-следственных связей, определяющих состояние и развитие изучаемого явления. Установление этих связей позволяет не только глубоко анализировать различные процессы, но и определять оптимальные пути управления ими.
Решение указанной задачи осуществляется с помощью ряда методов, объединяемых единым названием – методы статистического анализа экспериментальных данных. В число этих методов входят методы дисперсионного, корреляционного, регрессионного, компонентного и факторного анализов, метод наименьших квадратов.
Все эти методы целесообразно разделить на две группы:
- методы статического статистического анализа (ССА), в которых фактор времени в явном виде не учитывается;
- методы динамического статистического анализа (ДСА), в которых экспериментальные данные представляются в форме динамических или временных рядов.
Из всего многообразия методов статистического анализа ниже будут изложены широко распространённые методы – наименьших квадратов и регрессионного анализа. Они рассматриваются как методы ССА.
В методах ССА признак, характеризующий причины, принято называть факторным признаком или для краткости – фактором. Признак, характеризующий следствия, принято называть результативным признаком или для краткости – результатом (результатом наблюдений).
При получении и обработке данных предполагается, что результат наблюдения y зависит от одного или нескольких факторов x1, x2,…, xm, и фиксируется по отношению к данным факторам. В процессе обработки решается ряд вопросов.
1. Справедливо ли предположение о зависимости результата y от факторов x1, x2,…,xm?
2. Как оценить степень этой зависимости?
3. Как выделить среди факторов наиболее существенные?
4. Нельзя ли сократить число факторов, используемых при анализе?
5. Какой вид имеет причинно-следственная зависимость между факторами и результатом?
Прежде чем приступить к рассмотрению данных вопросов, остановимся на процедуре формального представления причинно-следственных связей между результатом y и факторами x1, x2,…,xm. Указанная процедура сводится к определению зависимости
y = f(x1, x2,…,xm).
Подход к решению данной задачи различен в зависимости от свойств факторов X<m>, функции f и, наконец, свойств результатов наблюдений. По этой причине постановка задачи анализа и методы её решения могут быть существенно различными. Для описания данной задачи будем обозначать символом f функциональную (детерминированную), а символом – стохастическую зависимость между X<m> и y.
Напомним, что детерминированная – это зависимость величины y или её некоторой характеристики, например математического ожидания, от факторов X<m>. Зависимость закона распределения результата y от факторов X<m> является стохастической.
Тогда могут иметь место следующие виды зависимостей результата y от факторов X<m>.
1. Функциональная зависимость от неслучайных факторов
, (8.1.1)
при которой случайный характер результата y обусловливается только ошибками при наблюдении данного результата.
2. Стохастическая зависимость от неслучайных факторов
, (8.1.2)
при которой случайный характер результата y обусловливается стохастическим характером зависимости .
3. Функциональная зависимость от случайных факторов
, (8.1.3)
при которой случайный характер результата y обусловливается случайным характером факторов.
4. Полная стохастическая зависимость
. (8.1.4)
Решение задачи анализа для зависимостей типа (8.1.1) и (8.1.3) опирается на метод наименьших квадратов, а для (8.1.2) и (8.1.4) – на методы регрессионного и корреляционного анализов.
Метод наименьших квадратов (МНК) получил широкое распространение при обработке экспериментальных данных в целях исследования различных функциональных зависимостей, определения параметров распределений и т.д.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.