2. Оценка тесноты связи. Пусть дана выборка , , …, из генеральной совокупности двумерной случайной величины . Оценка тесноты связи между случайными величинами и на основе выборочных данных проводится согласно следующему алгоритму.
1. Рассчитывается выборочный коэффициент корреляции по одной из приведенных в пункте 1 формул.
2. Проверяется значимость (существенность) коэффициента корреляции, т.е. существенно ли отличается от нуля или это отличие можно приписать влиянию случайности, связанной с выборкой. Для этого выдвигается нулевая гипотеза о равенстве нулю коэффициента корреляции двумерной случайной величины :
:=0
при альтернативной гипотезе:
:0.
При проверке нулевой гипотезы используется -статистика
,
имеющая распределение Стьюдента с степенями свободы. По выборке находиться наблюдаемое значение статистики . Для заданного уровня значимости по таблице критических точек Стьюдента определяется критическая точка . Если , то нулевая гипотеза об отсутствии корреляционной зависимости случайных величин и отвергается, т.е. линейный коэффициент корреляции значим, существует статистическая зависимость между случайными величинами и .
3. Для значимого коэффициента корреляции доверительный интервал при уровне значимости имеет вид:
–+.
4. Рассчитывается стандартная ошибка выборочного коэффициента корреляции по формуле
.
Работа в Excel. Для вычисления выборочного коэффициента корреляции используется статистическая функция (Приложение 1)
Для вычисления критического значения -статистики при построении доверительного интервала для коэффициента корреляции используется функция Excel (Приложение 1):
3. Регрессия.Наряду с корреляционным анализом проводится регрессионный анализ, который заключается в определении формы связи зависимой случайной величины с независимыми случайными величинами , , …,.
Форма связи результативного признака с факторами , , …, называется уравнением регрессии. В зависимости от типа выбранного уравнения различают линейную и нелинейную регрессию (квадратичная, экспоненциальная, логарифмическая и т. д.).
В зависимости от числа взаимосвязанных признаков различают парную и множественную регрессии. Если исследуется связь между двумя признаками (результативным и факторным), то регрессия называется парной, если между тремя и более признаками – множественной (многофакторной) регрессией.
При изучении регрессии следует придерживаться определенной последовательности этапов.
Этап 1. Установление формы зависимости. Пусть в результате наблюдений двумерной случайной величины получены данные, представляющие собой совокупность точек , , …, . Графическое изображение этих точек в плоскости представляет собой корреляционное поле (диаграмму рассеяния). Диаграмма рассеяния позволяет произвести визуальный анализ эмпирических данных и графически определить вид функции регрессии . При диаграмму рассеивания случайного вектора достаточно сложно изобразить графически. В этом случае регрессионная зависимость имеет вид .
Этап 2. Определение вида уравнения регрессии и его параметров (коэффициентов). Пусть результативный признак линейно зависит от факторов , , …,. В общем виде теоретическая линейная регрессия представима в виде
,
где , , …, – неизвестные коэффициенты, – случайные отклонения.
Для определения значений неизвестных коэффициентов необходимо знать и использовать все значения переменных , , …, и генеральной совокупности, что практически невозможно. Поэтому по выборке ограниченного объема строится эмпирическое уравнение регрессии:
,
где – теоретические значения результативного признака, полученные путем подстановки соответствующих значений факторных признаков в уравнение регрессии; , , …, – оценки неизвестных коэффициентов уравнения регрессии.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.