Корреляционный и регрессионный анализ (Лабораторная работа № 5), страница 2

Эксперимент А

Эксперимент Б

Эксперимент В

Х

Y

X

Y

X

Y

4

4,26

4

3,10

4

5,39

5

5,68

5

4,74

5

5,73

7

4,82

7

7,26

7

6,42

6

7,24

6

6,13

6

6,08

8

6,95

8

8,14

8

6,77

9

8,81

9

8,77

9

7,11

10

8,04

10

9,14

10

7,46

11

8,33

11

9,26

11

7,81

12

10,84

12

9,13

12

8,15

13

7,58

13

8,74

13

12,74

14

9,96

14

8,10

14

8,84

2. Коэффициент корреляции Пирсона

Нас интересует характеристика тесноты связи между двумя переменными, выраженная одним числом. Эта характеристика называется коэффициентом корреляции, обычно его обозначают r. Он может принимать значения от –1 до 1. Знак показывает направление связи (прямая – при положительном значении коэффициента или обратная – при отрицательном), а абсолютная величина – тесноту. В отсутствие связи коэффициент корреляции равен нулю. Чем ближе абсолютное значение r к единице, тем теснее связь.

Коэффициент корреляции Пирсона предназначен для описания линейной связи количественных признаков. Он требует нормального распределения.

Коэффициент корреляции Пирсона вычисляется по формуле:

.

Для оценки статистической значимости отличия коэффициента корреляции r можно воспользоваться критерием Стьюдента. При этом значение t вычисляется по следующей формуле:

;  ν = n-2.

Пример. Рассчитать коэффициенты корреляции по выборкам, для которых строили уравнения регрессии в предыдущем разделе (можно использовать функцию КОРРЕЛ).  Оценить статистическую значимость рассчитанных коэффициентов.

\Задание 1. Рассчитайте коэффициент корреляции для выборки из задания 1 раздела 1. Как повлияло увеличение объема выборки на тесноту корреляционной связи и статистическую значимость коэффициента корреляции?

Задание 2. Рассчитайте коэффициент корреляции между поглощенной дозой облучения и долей аберрантных клеток костного мозга (задание 4 раздела 1). Оцените статистическую значимость коэффициента корреляции.

3. Коэффициент корреляции Спирмена

Коэффициент ранговой корреляции Спирмена не требует нормальности распределения и линейной зависимости, может применяться как к количественным, так и к порядковым переменным. 

          Для вычисления коэффициента корреляции Спирмена необходимо упорядочить данные по возрастанию и заменить их реальные значения рангами. Рангом значения называется его номер в упорядоченном ряду. Если в ряду встречаются одинаковые значения, то им следует присвоить ранг, равный среднему значению занимаемых ими мест.

Коэффициент корреляции Спирмена можно рассчитать по формуле:

,

где d – разность рангов каждого члена выборки.

Существуют таблицы критических значений коэффициента ранговой корреляции Спирмена для разных уровней значимости и объемов выборки (Таблица 4 Приложения). Если объем выборки больше 50, можно применить критерий Стьюдента: