В статистике изучаются наблюденные данные случайных величин, поэтому стохастическая зависимость называется статистической или корреляционной.
Задачами корреляционного анализа являются:
- измерение степени связи;
- отбор факторов, оказывающих наибольшее влияние на результативный признак на основании степени связности между признаками;
- обнаружение неизвестных причинных связей.
Для оценки тесноты и вида связи между случайными величинами используются показатели ковариации и корреляции.
Пусть ,
, …,
выборка из генеральной совокупности двумерной случайной величиной
,
описывающей случайный эксперимент.
Выборочной
ковариацией называется
среднее произведений отклонений значений выборок
и
от их средних
,
:
.
Ковариация
характеризует рассеивание значений выборок и
, а также линейную связь между ними.
Выборочной ковариационной матрицей называется матрица вида
.
Очевидно, что =
,
=
.
Выборочная
ковариационная матрица устанавливает взаимосвязь между выборками и
из
генеральных совокупностей значений случайных величин
и
по величине:
– при большим значениям выборки
соответствуют
большие значения выборки
;
– при большим значениям выборки
соответствуют
меньшие значения выборки
(или наоборот);
– при данные
выборок
и
не связаны.
Выборочным
коэффициентом корреляции
случайных
величин
и
, между которыми предполагается линейная
корреляционная связь, называется величина, определяемая по формуле
.
Качественная оценка тесноты связи между величинами выявляется по шкале Чеддока (таблица 1) [7].
Таблица 1. Шкала Чеддока
Теснота связи |
Значение коэффициента корреляции при наличии |
|
прямой связи |
обратной связи |
|
Слабая |
0,1–0,3 |
(-0,1)–(-0,3) |
Умеренная |
0,3–0,5 |
(-0,3)–(-0,5) |
Заметная |
0,5–0,7 |
(-0,5)–(-0,7) |
Высокая |
0,7–0,9 |
(-0,7)–(-0,9) |
Весьма высокая |
0,9–0,99 |
(-0,9)–(-0,99) |
Выборочной корреляционной матрицей называется матрица вида
.
Выборочная корреляционная матрица также устанавливает взаимосвязь наборов выборочных данных по величине:
1) при большим значениям
выборки
соответствуют большие значения выборки
;
2) при большим значениям
выборки
соответствуют меньшие значения выборки
(или наоборот);
3) при данные
двух диапазонов некоррелированы;
4) при существует линейная
функциональная зависимость между выборочными значениями
и
.
Для нахождения выборочного коэффициентакорреляции используются формулы
,
.
При исследовании
связи между несколькими случайными величинами находятся выборочные коэффициенты
ковариации и корреляции между парами всех исследуемых величин и строятся соответствующие
ковариационные и корреляционные матрицы. Например, ковариационная матрица для
трех выборок ,
,
имеет вид:
.
Работа в Excel. Для нахождения ковариационной матрицы используется режим Ковариация из Анализа данных меню Сервис (Приложение 2). Результат анализа представлен в виде таблицы. Формулы и функции Excel, по которым рассчитываются соответствующие числовые характеристики, приводятся в таблице 2.
Таблица 2. Ковариационная матрица
Столбец 1 |
Столбец 2 |
|
Столбец 1 |
КОВАР |
|
Столбец 2 |
КОВАР |
КОВАР |
Для нахождения корреляционной матрицы используется режим Корреляция из Анализа данных меню Сервис (Приложение 2). Результат анализа представлен в виде таблицы. Формулы и функции Excel, по которым рассчитываются соответствующие числовые характеристики, приводятся в таблице 3.
Таблица 3. Корреляционная матрица
Столбец 1 |
Столбец 2 |
|
Столбец 1 |
КОРРЕЛ |
|
Столбец 2 |
КОРРЕЛ |
КОРРЕЛ |
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.