Поэтому, если окажется что это равенство не выполняется, то это является первым признаком наличия стохастической зависимости между X и Y. Часть стохастической связи между X и Y, которая сказывается на отличии левой части от правой, называется корреляция. Необходимым и достаточным условием корреляции служит неравенство:
Коэффициент корреляции определяется по формуле:
, а числитель этой дроби
называется корреляционным моментом.
Рассмотрим основные свойства коэффициента корреляции:
1.
2.
Связь между величинами X, Y можно
описать линейной функцией. Если модуль описывается
квадратной функцией
. Если
,
то величины X, Y не описываются удовлетворительно максимальной
зависимостью. Если
, то эти величины являются
независимы.
Для системы двух СВ X иY измеренные данные можно представить в виде корреляционной таблицы.
Таблица 1
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
В этой таблице значение - значение, которое принимает СВ x;
- значения, которые принимает СВ y. Один опыт характеризуется изменением величин X и
Y
. Не исключается, что в некоторых опытах
будут встречаться те же самые значения X и Y. Величины
описывают частоты
встреч ситуации, когда X и Y принимают определенное значение;
- описывает сколько раз среди всех
проводимых опытов встретилась ситуация, когда
. В
последнем столбце
- сумма по всем величинам
Сумма всех частот
Таким образом, каждому
значению соответствует распределение значений
с некоторыми частотами
.
Пример Исследуется пассажиропоток для определенного маршрута троллейбуса
x - номер остановки,
y – количество пассажиров в троллейбусе на этой остановке.
Цель расчета: построить теоретическую зависимость y и x , чтобы обосновать необходимость строительства на некотором промежутке остановки. По результатам измерений получены значения.
Таблица 2
|
0 |
1 |
… |
60 |
|
1 |
10 |
15 |
… |
2 |
|
2 |
7 |
10 |
… |
1 |
|
|
|
|
|
|
|
10 |
2 |
4 |
… |
7 |
|
|
|
|
… |
|
n |
Подсчет ведется в течение одного дня. За это время троллейбус много раз проезжает по кольцу. Числа в таблице означают, что на 2 остановке пассажир 1 встречается 10 раз. В результате расчетов будет найдена зависимость Y(X). Эта зависимость позволяет получить данные по тем областям, где отсутствует эксперимент и выполнить аппроксимацию.
Берем среднее значение для каждого X.
Таблица 3
X |
X1 |
X2 |
… |
Xk |
|
|
|
… |
|
частота |
|
|
… |
|
Среднее значение вычисляется по строке. Для X2:
Таким образом, между X и
средним значением Y среднее по X существует
функциональная зависимость (*)
Аналогично вычисляя по столбцу можно построить таблицу
Y |
|
|
… |
|
|
|
|
… |
|
частота |
|
|
… |
|
Для :
Если между величиной Y и
имеется некоторая зависимость, то имеет
место стохастическая или корреляционная связь между X и
:
(**)
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.