2. Оценка
тесноты связи. Пусть дана
выборка ,
, …,
из генеральной совокупности двумерной
случайной величины
. Оценка тесноты связи между случайными
величинами
и
на основе выборочных данных проводится
согласно следующему алгоритму.
1. Рассчитывается выборочный коэффициент корреляции по одной из приведенных в пункте 1 формул.
2. Проверяется значимость (существенность)
коэффициента корреляции, т.е. существенно ли отличается
от нуля или это отличие можно приписать влиянию случайности, связанной с выборкой.
Для этого выдвигается нулевая гипотеза о равенстве нулю коэффициента корреляции
двумерной случайной величины
:
:
=0
при альтернативной гипотезе:
:
0.
При проверке нулевой гипотезы используется -статистика
,
имеющая распределение Стьюдента с степенями свободы. По выборке находиться
наблюдаемое значение статистики
. Для заданного уровня
значимости
по таблице критических точек Стьюдента
определяется критическая точка
. Если
,
то нулевая гипотеза об отсутствии корреляционной зависимости случайных величин
и
отвергается, т.е. линейный коэффициент
корреляции значим, существует статистическая зависимость между случайными величинами
и
.
3. Для значимого коэффициента корреляции доверительный интервал при уровне
значимости
имеет вид:
–
+
.
4. Рассчитывается стандартная ошибка выборочного коэффициента корреляции по формуле
.
Работа в Excel. Для вычисления выборочного коэффициента корреляции используется статистическая функция (Приложение 1)
Для вычисления
критического значения -статистики при построении
доверительного интервала для коэффициента корреляции используется функция Excel
(Приложение 1):
3. Регрессия.Наряду с
корреляционным анализом проводится регрессионный анализ, который заключается
в определении формы связи зависимой случайной величины с
независимыми случайными величинами
,
, …,
.
Форма связи
результативного признака с факторами
,
, …,
называется уравнением регрессии.
В зависимости от типа выбранного уравнения различают линейную и нелинейную
регрессию (квадратичная, экспоненциальная, логарифмическая и т. д.).
В зависимости от числа взаимосвязанных признаков различают парную и множественную регрессии. Если исследуется связь между двумя признаками (результативным и факторным), то регрессия называется парной, если между тремя и более признаками – множественной (многофакторной) регрессией.
При изучении регрессии следует придерживаться определенной последовательности этапов.
Этап 1. Установление формы зависимости. Пусть в результате наблюдений двумерной случайной величины получены данные, представляющие собой
совокупность точек
,
, …,
. Графическое изображение этих точек в
плоскости
представляет собой корреляционное поле
(диаграмму рассеяния). Диаграмма рассеяния позволяет произвести визуальный
анализ эмпирических данных и графически определить вид функции регрессии
. При
диаграмму
рассеивания случайного вектора
достаточно сложно
изобразить графически. В этом случае регрессионная зависимость имеет вид
.
Этап 2. Определение вида уравнения
регрессии и его параметров (коэффициентов). Пусть результативный признак линейно зависит от факторов
,
, …,
. В общем виде теоретическая линейная
регрессия представима в виде
,
где ,
, …,
–
неизвестные коэффициенты,
– случайные отклонения.
Для определения
значений неизвестных коэффициентов необходимо знать и использовать все значения
переменных ,
, …,
и
генеральной совокупности, что практически
невозможно. Поэтому по выборке ограниченного объема строится эмпирическое уравнение
регрессии:
,
где – теоретические
значения результативного признака, полученные путем подстановки соответствующих
значений факторных признаков в уравнение регрессии;
,
, …,
–
оценки неизвестных коэффициентов уравнения регрессии.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.