В статистике изучаются наблюденные данные случайных величин, поэтому стохастическая зависимость называется статистической или корреляционной.
Задачами корреляционного анализа являются:
- измерение степени связи;
- отбор факторов, оказывающих наибольшее влияние на результативный признак на основании степени связности между признаками;
- обнаружение неизвестных причинных связей.
Для оценки тесноты и вида связи между случайными величинами используются показатели ковариации и корреляции.
Пусть
,
, …,
выборка из генеральной совокупности двумерной случайной величиной
,
описывающей случайный эксперимент.
Выборочной
ковариацией
называется
среднее произведений отклонений значений выборок
и
от их средних
,
:
![]()
![]()
.
Ковариация
характеризует рассеивание значений выборок
и
, а также линейную связь между ними.
Выборочной ковариационной матрицей называется матрица вида
.
Очевидно, что
=
,
=
.
Выборочная
ковариационная матрица устанавливает взаимосвязь между выборками
и
из
генеральных совокупностей значений случайных величин
и
по величине:
– при
большим значениям выборки
соответствуют
большие значения выборки
;
– при
большим значениям выборки
соответствуют
меньшие значения выборки
(или наоборот);
– при
данные
выборок
и
не связаны.
Выборочным
коэффициентом корреляции
случайных
величин
и
, между которыми предполагается линейная
корреляционная связь, называется величина, определяемая по формуле
.
Качественная оценка тесноты связи между величинами выявляется по шкале Чеддока (таблица 1) [7].
Таблица 1. Шкала Чеддока
|
Теснота связи |
Значение коэффициента корреляции при наличии |
|
|
прямой связи |
обратной связи |
|
|
Слабая |
0,1–0,3 |
(-0,1)–(-0,3) |
|
Умеренная |
0,3–0,5 |
(-0,3)–(-0,5) |
|
Заметная |
0,5–0,7 |
(-0,5)–(-0,7) |
|
Высокая |
0,7–0,9 |
(-0,7)–(-0,9) |
|
Весьма высокая |
0,9–0,99 |
(-0,9)–(-0,99) |
Выборочной корреляционной матрицей называется матрица вида
.
Выборочная корреляционная матрица также устанавливает взаимосвязь наборов выборочных данных по величине:
1) при
большим значениям
выборки
соответствуют большие значения выборки
;
2) при
большим значениям
выборки
соответствуют меньшие значения выборки
(или наоборот);
3) при
данные
двух диапазонов некоррелированы;
4) при
существует линейная
функциональная зависимость между выборочными значениями
и
.
Для нахождения выборочного коэффициентакорреляции используются формулы
,
.
При исследовании
связи между несколькими случайными величинами находятся выборочные коэффициенты
ковариации и корреляции между парами всех исследуемых величин и строятся соответствующие
ковариационные и корреляционные матрицы. Например, ковариационная матрица для
трех выборок
,
,
имеет вид:
.
Работа в Excel. Для нахождения ковариационной матрицы используется режим Ковариация из Анализа данных меню Сервис (Приложение 2). Результат анализа представлен в виде таблицы. Формулы и функции Excel, по которым рассчитываются соответствующие числовые характеристики, приводятся в таблице 2.
Таблица 2. Ковариационная матрица
|
Столбец 1 |
Столбец 2 |
|
|
Столбец 1 |
КОВАР |
|
|
Столбец 2 |
КОВАР |
КОВАР |
Для нахождения корреляционной матрицы используется режим Корреляция из Анализа данных меню Сервис (Приложение 2). Результат анализа представлен в виде таблицы. Формулы и функции Excel, по которым рассчитываются соответствующие числовые характеристики, приводятся в таблице 3.
Таблица 3. Корреляционная матрица
|
Столбец 1 |
Столбец 2 |
|
|
Столбец 1 |
КОРРЕЛ |
|
|
Столбец 2 |
КОРРЕЛ |
КОРРЕЛ |
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.