Номинальные переменные – переменные, позволяющие разбивать исследуемые объекты на некоторые классы, например, профессия работника, отрасль промышленности.
2.1.Статистические характеристики, устанавливающие связь между числовыми переменными (при линейной связи x и y).
Обычно статистическая связь между случайными величинами x и y может характеризоваться с помощью:
α11 = М[XY] – корреляционного момента.
= M[(X-mx)(Y-my)] - ковариационного момента..
При статистическом анализе обычно пользуются нормированной характеристикой, называемой коэффициентом корреляции r.
Если статистическая связь полная, то
Если статистическая связь отсутствует, то r = 0.
Строго говоря, коэффициент корреляции r позволяет судить о степени статистической связи только при линейной связи X и Y(рис.5.а). Поэтому при r= 0 говорят об отсутствии корреляции между X и Y (а не об отсутствии статистической связи). Для оценки коэффициента корреляции используют следующее соотношение:
, где
Коэффициент корреляции – представляет собой случайную величину, которая при больших n имеет распределение, близкое к нормальному,
с дисперсией
и математическим ожиданием
Таким образом, доверительный интервал , где Z0,975 – 97,5 процентиль нормального [N(0,1)] распределения.
Проверка гипотезы об отсутствии статистической связи между x и y осуществляется как обычно:
Н0 : при
Н1 : при
где
2.2.Установление связи между числовыми переменными при нелинейной связи X и Y (корреляционное отношение).
Если зависимость выходной переменной от входной характеризуется некоторой нелинейной зависимостью, то даже при вполне очевидной связи x и y коэффициент корреляции может равняться нулю, что свидетельствует как-будто об отсутствии статистической связи (рис.5.в).
В этих случаях возникает необходимость использования не коэффициента корреляции, а так называемого корреляционного отношения. Для нахождения корреляционного отношения разбивают ось x на ряд участков (разрядов).
рис.6.
Выделение к разрядов для переменной x
Если число точек, определяющих результаты эксперимента на каждом из разрядов равно mi, то частное среднее для каждого из соответствующих разрядов определяется:
Дисперсия средних равна:
где - полное среднее
Для характеристики статистической связи используется корреляционное отношение:
где .
Найденное т.о. корреляционное отношение оказывается близким к нулю при отсутствии статистической связи. = 1 при полной статистической связи между переменными x и y.
Для установления факта отсутствия статистической связи используют соотношение:
Эта величина имеет распределение Фишера с (к – 1) степенями свободы числителя и (n – k) степенями свободы знаменателя. Таким образом, для решения вопроса об отсутствии статистической связи (Н0: = 0) используется 95 процентиль этого распределения W0,95 (к – 1, n – к). При W0 < W0,95 (k – 1, n – k) статистическая связь отсутствует. В противном случае выполняется альтернативная гипотеза Н1.
2.3.Множественный коэффициент корреляции.
Если рассматривать связь между несколькими входными величинами х и одной выходной величиной y (рис.7), то y = j( х1,х2,...,хn )
рис.7.
Многомерная система
При линейной зависимости, эта связь определяется следующей регрессионной зависимостью:
Определим, существует ли связь между входными величинами xi и выходной величиной y.
Это осуществляется с помощью множественного коэффициента корреляции. Представим дисперсию вышеприведенного условного математического ожидания
в виде :
где - множественный коэффициент корреляции.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.