Кореляційний аналіз у соціології. Двовимірний розподіл двох ознак: наочне зображення, коефіцієнти кореляції. Способи візуалізації дво/тривимірних розподілів, страница 2

400px-Corr-example2

Найбільш поширені способи візуалізації двовимірних розподілів:

•  • Для метричних шкал − діаграми розсіювання;

•  • Для порядкових шкал − діаграми розсіювання та середні значення, стовпчасті діаграми;

•  • Для номінальних шкал − стовпчасті діаграми.

Найбільш поширеним способом візуалізації двовимірних розподілів для метричних шкал є діаграми розсіювання.

http://slovari.yandex.ru/dict/sociology/article/soc/soc-0315.htm

soc-14

Приклади діаграм розсіювання (джерело: http://www.intellectus.su/lib/00045.htm)

00045a

Приклади діаграм розсіювання (джерело: http://www.ict.nsc.ru/ws/elpub2001/1812/). Діаграма розсіювання документів дослідженого массиву: / / www.intellectus .su/lib/00045.htm)

Диаграмма рассеяния

Приклади діаграм розсіювання (джерело: http://www.polit.ru/research/2006/08/23/corruption.html).
Діаграма розсіювання інтенсивності хабарів (Ось Х) та середнього розміру хабарів (долари США, ось Y) для спеціальних ринків корупційних послуг за даними опитування громадян 2001 р. Точка вгорі діаграми - суди .

corruption_1

Приклади діаграм розсіювання (джерело: Сатаров Г. Проржавевшее правосудие / / http://www.strana-oz.ru/?numid=11&article=444).

•  Це діаграма розсіювання індексу дисфункції суддів як розвитку бізнесу (горизонтальна вісь) й індексу захоплення держави в комерційних судах (вертикальна вісь); чим більше значення індексу, тим більшими є перешкоди чи корупція. Точки-країни позначені стандартними трилітерними кодами.

11_3

Приклади діаграм розсіювання
(джерело: http://in.online.kherson.ua/excel_ra.htm).


Зв'язок між обсягом продажу (в одиницях продукції) і витратами на рекламу.

image3

Найбільш поширені способи візуалізації двовимірних розподілів для порядкових шкал:

1.  Діаграми розсіювання

2. Середні значення для кожного інтервалу

Найбільш поширені способи візуалізації двовимірних розподілів для номінальних шкал – стовпчасті діаграми.

 


Кореляційний аналіз трьох ознак

Виявивши наявність взаємозв'язку між двома змінними та оцінивши інтенсивність цього зв'язку за допомогою коефіцієнтів, дослідник прагне проінтерпретувати цей взаємозв'язок у термінах причина-наслідок.

Кінцевою метою вимірювання взаємозв'язку між змінними є підтвердження (або спростування) певних змістовних припущень про причинний механізм, який породжує  цей взаємозв'язок.


Однак, наявність зв'язку між двома змінними не доводить, що цей зв'язок може бути описаний моделлю "причина - наслідок".

(А нульовий коефіцієнт сполучення - ще не свідчення відсутності будь-якої причинної залежності.)

Опосередковані та помилкові взаємозв'язки.

Способи візуалізації тривимірних розподілів:

•  Згруповані діаграми;

•  Графіки поверхонь;

•  Тривимірні діаграми розсіювання.

Способи візуалізації тривимірних розподілів:

Візуалізація розподілу ознак «соціальна сходинка, на яку б хотіли потрапити» і «соціальний щабель батьків» у 7-ми кластерах.

Згрупована

діаграма

Способи візуалізації тривимірних розподілів: Графік поверхні, що візуалізуює взаємозв'язок ознак «соціальна сходинка, на яку б хотіли потрапити», «соціальний щабель батьків» і «матеріальне становище».

Графік поверхні

Способи візуалізації тривимірних розподілів: тривимірні діаграми розсіювання.

Тривимірна діаграма розсіювання

Кореляційний аналіз чотирьох і більше ознак (багатовимірний кореляційний аналіз) - графи взаємозв'язку ознак.

Аналіз багатовимірних взаємозв'язків і взаємозалежностей - типове завдання в соціології.

Як правило, такі залежності не вдається "схопити" відразу єдиним математичним методом. Використовують різні засоби аналізу в пошуках найбільш "наочного", переконливого відображення. Один з таких способів  - метод відображення взаємозв'язків у вигляді кореляційного графу.

(Одним з прикладів застосування графів в соціології є соціограмми.)

Граф - це фігура, що складається з точок (їх називають вершинами графу) і відрізків, що з'єднують деякі з цих точок (ребра графу).

Щоб побудувати кореляційний граф, вимірюють парні зв'язки між усіма змінними, що позначені  на графі як його вершини. Наприклад, маючи п'ять змінних А, В, С, D і Е, зобразимо, яким чином пов'язана кожна з них з кожною іншою в матриці інтеркореляцій.

Матрица інтеркореляцій п'яти змінних (А, В, С, D, Е)

А

В

С

D

Е

А

1,00

0,96

0,90

0,01

0,06

В

0,96

1,00

0,15

0,85

0,95

С

0,90

0,15

1,00

0,02

0,14

D

0,01

0,85

0,02

1,00

0,60

Е

0,00

0,95

0,14

0,60

1,00

Кореляційний граф і кореляційна матриця, на основі якої цей граф побудовано.

А

В

С

D

Е

А

1,0

0,96

0,90

0,01

0,06

В

0,96

1,0

0,15

0,85

0,95

С

0,90

0,15

1,0

0,02

0,14

D

0,01

0,85

0,02

1,0

0,60

Е

0,00

0,95

0,14

0,60

1,0

Приклади кореляційних графів. Червоним кольором зображені ознаки, які мають коефіцієнт кореляції r менший, ніж 0,87. При збільшенні коефіцієнта кореляції r до 0,9 додатково виключаються ознаки, що виділені зеленим кольором на малюнку.

plead

Висновки

•  Найпростішим прийомом виявлення зв'язку між двома ознаками є побудова кореляційної таблиці (тобто двовимірного розподілу);

•  Під час аналізу двовимірного розподілу використовують коефіцієнти кореляції, що відрізняються в залежності від типу шкал;

•  Існує широкий діапазон способів візуалізації двовимірних розподілів (діаграми, методи інтелектуального аналізу даних) та тривимірних розподілів (графіки поверхні).

Рекомендована література

1.  Благовещенский Ю.Н. Тайны корреляционных связей в статистике. – М.: Научная Книга, 2009. – 158 с.

2.  Паніотто В.І., Максименко В.С., Марченко Н.М. Статистичний аналіз соціологічних даних. – К.: КМ Академія, 2004. – С. 65-143.

3.  Ядов В.А. Стратегия социологического исследования. Описание, объяснение, понимание социальной реальности / В.А. Ядов. – М.: Добросвет, 1998. – С. 334-349.

4.  Ядов В.А. Стратегия социологического исследования : Описание, объяснение, понимание социал. реальности : учеб. пособие / В.А. Ядов. - 3-е изд., испр. - М.: Омега-Л, 2007.  – Доступно на: http://www.isras.ru/publ.html?id=585

5.  Толстова Ю.Н. Анализ социологических данных. Методология, дескриптивная статистика, изучение связей между номинальными признаками. – М.: Научный мир, 2003. – С. 164-319. – Доступно на: http://www.ecsocman.edu.ru/db/msg/65788