Введение в математическую статистику. Свойства точечных оценок. Способ скользящей средней, страница 3

Функцией в данном случае называется признак, зависящий от другого признака — аргумента.

Если исследуется действие одного аргумента    (фактора), функция называется простой, а модель влияния — однофакторной:

Если исследуется действие нескольких   аргументов    (факторов), функция называется множественной, а модель — многофакторной:



МЕТОДЫ РЕГРЕССИОННОГО, КОРРЕЛЯЦИОННОГО и ДИСПЕРСИОННОГО АНАЛИЗА

Предположим, что мы имеем п наблюдений или измерений. В математических моделях наблюдения рассматриваются как п случайных величин y1,…,yn, которые являются линейными комбинациями с р неизвестными постояннымиплюс ошибки:

        (*)

где {xji} —известные постоянные коэффициенты*).

Наименьшие предположения о случайных величинах { еi } состоят в том, что их математические ожидания равны нулю, т. е.

 

Кроме того, будем обычно предполагать, что

 

где s2— неизвестная постоянная, dij (символ Кронекера),;- равно 0 или 1 при соответственно i¹jи i= j. Эти условия эквивалентны тому, что случайные величины нескоррелированы (т. е. их коэффициенты корреляции равны 0) и имеют одинаковые дисперсии, равные s2.


Определения.

дисперсионный анализ — это статистический метод анализа результатов наблюдений, зависящих от различных одновременно действующих факторов, выбор наиболее важных факторов и оценка их влияния. Теория анализа результатов измерений подсказывает, как планировать проведение опыта или наблюдения, т. е. приводит к планированию эксперимента. Исторически современный метод дисперсионного анализа развивался главным образом в связи с приложениями к задачам сельского хозяйства.

Строгое определение: дисперсионный анализ— это система статистических методов обработки наблюдений, допускающих представление (*), где коэффициенты {xji}  являются целыми числами, равными обычно 0 и 1. Для того чтобы внести ясность в это определение, нужно не только указать возможные числовые значения {xji}, а нужно понять, какое место они занимают в описании задач, встречающихся в исследованиях. Эти .величины {xji}  имеют смысл «переменных-счетчиков», или «переменных-указателей», которые указывают присутствие или отсутствие влияний различных факторов {bi } в условиях проводящихся наблюдений; xjiобычно равно 0 или 1.

Величины {bi} являются более или менее идеализированным -отражением некоторых сторон наблюдаемого явления, представляющих интерес для исследователя. Целью дисперсионного анализа является получение выводов относительно {еi} и некоторых {bi }, выводов, остающихся справедливыми независимо от значений других {bi }, «исключить», которые было бы более желательно чем «оценивать».


Если {xji} не являются «переменными-указателями», а пробегают непрерывные множества значений, как, например, время t, температура (такие переменные называются независимыми, и тогда говорят, что {yi}  являются наблюдениями зависимой переменной у), то мы получим регрессионный анализ. В случае, когда среди {xji} есть переменные двух видов, мы получаем ковариационный анализ.

Анализ на наличие связи между {xji} и {yi}   называют корреляционным анализом.


РЕГРЕССИОННЫЙ АНАЛИЗ

Регрессией называется изменение функции в зависимости от изменений одного или нескольких аргументов. Для изображения регрессии используется: ряд регрессий (эмпирический и теоретический), линия регрессии, коэффициент регрессии и уравнение регрессии.

Рис. 1.   Эмпирическая   линия  

Графическое изображение течения функции в зависимости oт изменений аргумента называется линией регрессии.