Остаток случайной величины. Свойство коэффициентов корреляции. Система n случайных величин

Страницы работы

Содержание работы

                                                                  (10.2)

Решив эту систему , получим

                                                                     (10.3)

Тогда линейное уравнение средней квадратической регрессии будет иметь вид

                                                а приближение случайной величины Y в виде линейной функции X по методу наименьших квадратов

                                

(Отметим, что уравнение средней квадратической регрессии (10.4) совпадает с уравнением регрессии Y на X для нормального закона (7.9), что естественно должно быть в силу сказанного выше о решении задачи минимизации (9.1)).

Из (10.5) следует еще два свойства коэффициента корреляции.

6-е свойство коэффициента корреляции. Если -1<r<0, то с возрастанием значения одной величины, другая – имеет тенденцию к убыванию.

Действительно, если -1<r<0, то с возрастанием величины X в силу (10.5) Y* убывает. Но Y* является линейным приближением случайной величины  Y, следовательно эта величина имеет тенденцию к убыванию.

7-е свойство коэффициента корреляции. Если 0<r<1, то с возрастанием значения одной величины, другая – имеет тенденцию к возрастанию.

Действительно в этом случае Y* возрастает с увеличением значения X в силу (10.5), и Y, приближением которого является Y*, имеет тенденцию к возрастанию. Это не означает, что если имеется  два значения системы (X,Y) (x1,y1) и (x2,y2), то при x1>x2 обязательно y1>y2 , но более вероятно, что при x1>x2 мы будем наблюдать y1>y2, чем наоборот. Если же провести достаточно большое число испытаний этой системы, то точки (x,y) в основном расположатся вблизи прямой (10.5) , как это показано на рис. 3, т.е. с достаточно высокой вероятностью случайные точки попадут в выделенную область, чем за ее пределы, даже если область возможных значений системы – вся координатная плоскость.

Y

 


Выноска-облако:  

                               Y*                                            

X

                              Рис. 3.

11.  Остаток случайной величины.      

Пусть система случайных величин (X,Y) имеет числовые характеристики mX, mY,  и r. Y* - линейное приближение Y как функции X (10.5). Тогда случайная величина

Z=Y-Y*                                            (11.1)

Называется остатком случайной величины Y после исключения линейного (главного) влияния на нее случайной величины X  или просто остатком величины Y. Вариация остатка может быть обусловлена как нелинейным влиянием X, так и влиянием других случайных величин, несвязанных с X.

Исследуем остаток

Z=Y-Y= Y-mY-r         (11.2)

Найдем числовые характеристики, т.е. его математическое ожидание и дисперсию остатка.

M(Z) =M(Y- mY)- r                

D(Z) =M(Z2) = M ((Y-mY)2-2r ) + r2) =D(Y) – 2r).

Пусть |r| = 1 . Тогда D=(Z) =0 , таким образом Z не имеет вариации, т.е. является величиной постоянной. Но M(Z) =0 и, следовательно, Z=0 или Y = Y* , т.е. Y есть линейная функция X. Отсюда следует еще два свойства коэффициента корреляции.

8-е свойство коэффициента корреляции. Если r=-1, то Y есть линейная убывающая функция X

Y = mr -).

9-е свойство коэффициента корреляции. Если r=1, то Y есть линейная возрастающая функция X              

Y = mr +).

Рассмотрим дисперсию остатка и найдем из этого равенства r2

  

Числитель этой дроби можно рассматривать как характеристику линейного влияния X и Y. Действительно, из дисперсии Y вычитается дисперсия как бы всего кроме линейного влияния, т.е. остается часть дисперсии связанная с линейным влиянием X, а в знаменателе полная дисперсия Y. Поэтому квадрат коэффициента корреляции показывает, какая  доля общей вариации Y вызвана линейным влиянием X. Обычно определяют не долю, а процент вариации Y.

Похожие материалы

Информация о работе

Тип:
Конспекты лекций
Размер файла:
120 Kb
Скачали:
0