Методико-практический путеводитель по темам курса "Теория статистики", страница 23

Коэффициент регрессии в небольших по объему совокупностях подвержен случайным колебаниям. Поэтому необходима проверка его существенности с помощью t-критерия (Стьюдента):

где b — коэффициент регрессии; mb — стандартная ошибка, рассчитываемая по формуле

 — остаточная дисперсия;  — дисперсия факторного признака; n — объем совокупности.

По данным табл. 6.3  = 26,75,  = 46,5, n = 8, тогда

что значительно выше критического значения t0,95 (6) =2,54.

Следовательно, с вероятностью 0,95 влияние продолжительности отдыха на суточную стоимость путевок признается существенным. Для коэффициента регрессии также определяются доверительные границы b ± tmb. С вероятностью 0,95 доверительные границы коэффициента регрессии составляют

-4,34 ± 2,54 • 0,54, или -4,34 ± 1,37 усл. ден. ед.

Характеристикой относительного изменения у за счет х является коэффициент эластичности

который показывает, на сколько процентов в среднем изменяется результативный признак с изменением факторного на 1%. По данным табл. 6.3

следовательно, с увеличением продолжительности отдыха на 1% суточная стоимость путевок уменьшается в среднем на 0,9%.

На основании уравнения регрессии определяются теоретические значения Y, т. е. значения результативного признака при условии, что на него влияет только фактор х, а другие факторы остаются на неизменном уровне. В приведенном примере Y — это ожидаемая стоимость путевок за счет влияния только продолжительности отдыха. Так, для х = 5 дней суточная стоимость путевки составит Y = 113,25 - 4,34 • 5 = 91,6 усл. ден. ед., что несколько отклоняется от фактического значения.

Отклонения эмпирических значений у от теоретических Y называют остаточными. Они характеризуют влияние на результативный признак всех других факторов, кроме х. Средний размер этих отклонений определяет остаточная дисперсия

Вариацию у, обусловленную влиянием только фактора х, измеряет факторная дисперсия:

Доля факторной дисперсии в общей характеризует тесноту связи и называется коэффициентом, детерминации:

Он имеет такое же содержание, интерпретацию и цифровые границы, что и h2. По данным табл. 6.3

следовательно, по правилу сложения дисперсий:

 = 549,5 - 46,5 = 503,

или по другой формуле

(113,25 × 472 - 4,34 × 4972) - 592 =503

Тогда R2 = 503 : 549,5 = 0,915, т.е. 91,5% вариации суточной стоимости путевок линейно связаны с вариацией продолжительности отдыха, а 8,5.% вариации приходится на остальные факторы. Следовательно, связь очень тесная.

Тесноту связи можно оценить также индексом корреляции R = , однако интерпретируется только R2. Для линейной связи используется линейный коэффициент корреляции (Пирсона) r:

который принимает значения в пределах ±1, поэтому характеризует не только тесноту, на и направление связи. Положительное значение свидетельствует о прямой связи, а отрицательное — об обратной. В рассмотренном примере

где . Следовательно, связь между суточной стоимостью туристических путевок и продолжительностью отдыха является тесной и обратной. Абсолютное значение r равно индексу корреляции:

Однако для интерпретации г необходимо перейти к R2= r2.

Проверка существенности связи осуществляется таким же образом, как и в модели аналитической группировки, путем сравнения R2 и . Отличия касаются только определения k1 и k2 в которых m — число параметров уравнения регрессии. В нашем примере k1 =2 – 1 = 1, а k2 = 8 – 2 = 6, критическое значение R20,95(1,6) = 0,500 значительно меньше фактического R2 = 0,915.

Пример. По данным табл. 6.4 оценим тесноту связи между уровнем эффективности экономики и надежностью делового партнерства для семи стран Восточной Европы. Поскольку информация представлена в форме интегральных показателей (оценки в баллах), необходимо провести ранжирование стран. Наименьшему значению интегрального показателя придается ранг 1, наибольшему — ранг 7. Сумма квадратов отклонений рангов составляет

а коэффициент ранговой корреляции