Чем сильнее связь между признаками, тем теснее будут располагаться точки корреляционного поля вокруг определенной линии, выражающей форму связи (рис. 1).
Основные понятия и задачи корреляционного анализа
Корреляционный анализ – метод математической статистики, изучающий корреляционные (статистические) связи.
В статистике различают следующие варианты корреляционных связей.
1. Парная корреляция, т.е. зависимость между двумя признаками – результатным и факторным (или двумя факторными).
2. Частная корреляция – зависимость между результатным и одним из факторных признаков при фиксированном значении других факторных.
3. Множественная корреляция – зависимость между результатным и двумя и более факторными признаками.
Необходимо отметить, что при изучении корреляционных связей статистика, наряду с корреляционным, использует и регрессионный анализ. Поэтому корректней было бы сказать о применении методов КРА в изучении корреляционных связей, но для краткости говорят просто – корреляционный анализ.
Наиболее сложным и ответственным этапом КРА является подбор уравнения, характеризующего сущность связи. При парной корреляции уравнение связи может быть установлено при помощи построения корреляционного поля, составления корреляционных таблиц, пересмотра различных функций.
– линейная форма уравнением прямой линии:
;
– нелинейная форма уравнениями различного рода кривых линий:
· параболы 2-го порядка или высших порядков,
· гиперболы ,
· показательной функции и др.
Подобранное уравнение называется уравнением регрессии или корреляционным уравнением. Его основная задача – установление количественной взаимосвязи между признаками.
Неизвестные параметры уравнения и
определяют
способом наименьших квадратов из системы нормальных уравнений.
.
Система нормальных уравнений для парной линейной связи имеет вид:
,
де – количество элементов
факторного признака
.
Параметры и
искомой прямой можно определить и
по другим формулам:
,
.
Оценка тесноты связи между признаками предполагает определение меры соответствия вариации результатного признака и факторного (или нескольких факторных при множественной корреляции).
В случае линейной зависимости тесноту связи можно измерить при помощи линейного коэффициента корреляции:
,
где – коэффициент регрессии;
– среднее
квадратическое отклонение факторного признака;
– среднее
квадратическое отклонение результатного признака;
;
.
Линейный коэффициент корреляции можно определить и по иной формуле:
или
.
Линейный коэффициент корреляции может принимать значения от 0 ± 1 (знак (+) при прямой зависимости, (-) при обратной).
На практике руководствуются следующими оценками тесноты связи:
При < 0,3 – связь слабая;
= 0,3 ¸ 0,7 – средняя;
> 0,7 – сильная;
=
0 – связь отсутствует;
=
1 – связь функциональная.
Значимость ЛКК проверяется на достоверность (надежность). Считается, что корреляционная связь является достоверной лишь при достаточном числе наблюдений (не менее 20 – 30). Проверка надежности коэффициента корреляции осуществляется с помощью критерия надежности по формуле:
,
где – среднеквадратическая
ошибка коэффициента корреляции:
,
где – число наблюдений.
Если ³ 3, то
считается надежным, а связь
доказанной с вероятностью 0,997.
Если < 3, связь нельзя
считать достоверной.
Из формулы средней квадратической ошибки видно, что эта ошибка находится в обратной зависимости от числа наблюдений.
Для всех иных форм связи теснота ее может быть определена с помощью теоретического корреляционного отношения:
,
где – дисперсия выравненных
значений результатного признака (
);
– дисперсия фактических
значений результатного признака (
).
Если , значит
и вариация
полностью
зависит от вариации
.
Если , значит вариация
никак не влияет на вариацию
и в этом случае
.
То есть, чем ближе
к 1, тем связь теснее, а чем
ближе к нулю, тем слабее.
ТЕМА 7. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ДИНАМИКИ СОЦИАЛЬНО–ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ И ПРОЦЕССОВ
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.