задача решается на таком материале, где эти прочие аргументы на самом деле изменяются и своей изменчивостью затушевывают и искажают интересующую нас зависимость.
Второй основной задачей измерения связи является:
- определение степени искажающего влияния прочих факторов на интересующую нас зависимость или в определении силы, с которой данная зависимость проявляется среди многообразия нарушающих ее воздействий.
Первая задача измерения связи включает определение формы связи функции с определяющим аргументом и заключается в нахождении так называемой теоретической линии регрессии. Процесс нахождения теоретической линии регрессии заключается в выборе и обосновании типа кривой, связывающей функцию и определяющий аргумент и расчете параметров ее уравнения.
Чаще всего для рассматриваемых целей используют кривые, выражающиеся многочленами целых положительных степеней
`yx = a + bx
`` yx = a + bx + cx2 и т.д., где yx – ордината теоретической линии регрессии
Многочлен первой степени выражает равномерный рост или уменьшение функции, второй – степени – равнозамедленное или равноускоренное изменение yx с одним экстремумом.
Выбор аналитического вида получаемой зависимости зависит от профессиональной подготовки исследователя. Наиболее часто (в 80% случаев из 100%) предполагают наличие линейной зависимости. После того как выбран и обоснован тип уравнения регрессии, необходимо определить параметры, от которых зависит это уравнение.
Допустим, характер расположения точек на корреляционном поле и интуиция подсказывает нам, что теоретическая линия регрессии является прямой линией, т.е. выражается уравнением
`ух = a + bx, где a и b - неизвестные параметры.
Для нахождения неизвестных a и b в уравнении прямой линии воспользуемся методом наименьших квадратов (МНК).
S(yi - `yx)2 = min (2.33)
т.е. потребуем, чтобы сумма отклонений фактических ординат от ординат, вычисленных по уравнению прямой была наименьшей.
Заменим в (2.33) `yx через (a + bx) и обозначим левую часть формулы через f
f = S(yi - a - bx)2 ® min
Значения a и b, удовлетворяющие условию миниума функции найдутся из выражений
¶f/¶a = 0, ¶f/¶b =0
Произведя соответствующие преобразования, получим
¶f/¶a = - 2å(yi - a – bxi) = 0 Þ åyi = n×a + båxi
¶f/¶b = - 2å(yi - a – bxi) xi = 0 Þ åyi xi= aåxi + båxi2 получаем систему т.н. нормальных уравнений
åyi = n×a + båxi
åyi xi= aåxi + båxi2 (2.34)
Решая систему (2.34), отыскиваем коэффициенты a и b.
Если отыскивается по методу МНК зависимость `yx = a + bx + cx2,
То соответствующая система нормальных уравнений будет следующей
åyi = a n + båxi + сåxi2
åyi xi= aåxi + båxi2 + сåxi3 (2.35)
åyi xi2= aåxi2 + båxi3 + сåxi4
Следующей задачей (корреляционного) анализа является измерение тесноты связи. Поясним это на схематическом примере (рис.2.11).
Рассмотрим два корреляционных поля “а” и “б”. Пусть линии регрессии Y по X в обоих полях расположены одинаково. Однако, точки поля “б” значительно ближе примыкают к линии регрессии, чем точки поля “а”. Отклонения точек поля от линии регрессии объясняются, очевидно, влиянием прочих факторов. Если бы Y полностью определялся аргументом X, то все точки поля находились бы на линии регрессии ; чем сильнее влияние всех прочих факторов, тем больше отклоняются от линии регрессии точки корреляционного поля.
Очевидно, что в случае “б” влияние аргумента X в меньшей степени осложняется действием прочих факторов, чем в случае “а”, и зависимость между Y и X является более тесной. Степень тесноты связи – весьма важное свойство, определяющее научное и практическое значение данной корреляционной зависимости.
Если теснота связи велика, то, зная аргумент, мы по уравнению регрессии достаточно точно предсказываем значение функции; воздействуя на аргумент, если он является причиной изменения функции, можно управлять функцией. Если теснота связи мала, то влияние аргумента X на функцию обнаруживается лишь в среднем по уравнению регрессии. В каждом же отдельном случае оно перекрывается действием побочных факторов.
Измерение тесноты корреляционной зависимости – вторая основная проблема теории корреляции. Рассмотрим пути ее решения.
Действие какого-либо фактора на функцию проявляется в изменчивости функции под влиянием изменчивости данного фактора. Поэтому показатель изменчивости функции – дисперсия – является одновременно показателем влияния на функцию изменчивости различных ее факторов.
Для того, чтобы выяснить степень влияния какого-либо одного из этих
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.