Предмет, метод и задачи статистики. Статистическое наблюдение. Статистическая сводка и группировка. Средние величины и показатели вариации, страница 6

Чем сильнее связь между признаками, тем теснее будут располагаться точки корреляционного поля вокруг определенной линии, выражающей форму связи (рис. 1).

 Основные понятия и задачи корреляционного анализа

Корреляционный анализ – метод математической статистики, изучающий корреляционные (статистические) связи.

В статистике различают следующие варианты корреляционных связей.

1.  Парная корреляция, т.е. зависимость между двумя признаками – результатным и факторным (или двумя факторными).

2.  Частная корреляция – зависимость между результатным и одним из факторных признаков при фиксированном значении других факторных.

3.  Множественная корреляция – зависимость между результатным и двумя и более факторными признаками.

Необходимо отметить, что при изучении корреляционных связей статистика, наряду с корреляционным, использует и регрессионный анализ. Поэтому корректней было бы сказать о применении методов КРА в изучении корреляционных связей, но для краткости говорят просто – корреляционный анализ.

Наиболее сложным и ответственным этапом КРА является подбор уравнения, характеризующего сущность связи. При парной корреляции уравнение связи может быть установлено при помощи построения корреляционного поля, составления корреляционных таблиц, пересмотра различных функций.

–  линейная форма уравнением прямой линии:

;

–  нелинейная форма уравнениями различного рода кривых линий:

· параболы 2-го порядка    или высших порядков,

· гиперболы   ,

·  показательной функции    и др.

Подобранное уравнение называется уравнением регрессии или корреляционным уравнением. Его основная задача – установление количественной взаимосвязи между признаками.

Неизвестные параметры уравнения  и * определяют способом наименьших квадратов из системы нормальных уравнений.

.

Система нормальных уравнений для парной линейной связи имеет вид:

,

де  – количество элементов факторного признака .

Параметры   и * искомой прямой можно определить и по другим формулам:

,     .

Оценка тесноты связи между признаками предполагает определение меры соответствия вариации результатного признака и факторного (или нескольких факторных при множественной корреляции).

В случае линейной зависимости тесноту связи можно измерить при помощи линейного коэффициента корреляции:

,

где – коэффициент регрессии;

       – среднее квадратическое отклонение факторного признака;

        – среднее квадратическое отклонение результатного признака;

         ;       .

Линейный коэффициент корреляции можно определить и по иной формуле:

   или  .

Линейный коэффициент корреляции может принимать значения от 0 ± 1 (знак (+) при прямой зависимости, (-) при обратной).

На практике руководствуются следующими оценками тесноты связи:

При < 0,3 – связь слабая;

             *= 0,3 ¸ 0,7 – средняя;

        > 0,7 – сильная;

 *= 0 – связь отсутствует;

 *= 1 – связь функциональная.

Значимость ЛКК проверяется на достоверность (надежность). Считается, что корреляционная связь является достоверной лишь при достаточном числе наблюдений (не менее 20 – 30). Проверка надежности коэффициента корреляции осуществляется с помощью критерия надежности по формуле:

      ,

где  – среднеквадратическая ошибка коэффициента корреляции: ,

где      – число наблюдений.

Если ³ 3, то  считается надежным, а связь доказанной с вероятностью 0,997.

Если   < 3, связь нельзя считать достоверной.

Из формулы средней квадратической ошибки видно, что эта ошибка находится в обратной зависимости от числа наблюдений.

Для всех иных форм связи теснота ее может быть определена с помощью теоретического корреляционного отношения:

,

где – дисперсия выравненных значений результатного признака ();

      – дисперсия фактических значений результатного признака ().

Если , значит и вариация полностью зависит от вариации .

Если , значит вариация  никак не влияет на вариацию  и в этом случае . То есть, чем ближе  к 1, тем связь теснее, а чем ближе к нулю, тем слабее.

ТЕМА 7. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ДИНАМИКИ СОЦИАЛЬНО–ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ И ПРОЦЕССОВ