Методы прикладной статистики. Случайная величина, ее распределения и характеристики. Дифференциальная и интегральная функции распределения

Страницы работы

28 страниц (Word-файл)

Фрагмент текста работы

задача решается на таком материале, где эти прочие аргументы на самом деле изменяются и своей изменчивостью затушевывают и искажают интересующую нас зависимость.

Второй основной задачей измерения связи является:

-  определение степени искажающего влияния прочих факторов на интересующую нас зависимость или в определении силы, с которой данная зависимость проявляется среди многообразия нарушающих ее воздействий.

Первая задача измерения связи включает определение формы связи функции с определяющим аргументом и заключается в нахождении так называемой теоретической линии регрессии. Процесс нахождения  теоретической линии регрессии заключается в выборе и обосновании типа кривой, связывающей функцию и определяющий аргумент и расчете параметров ее уравнения.

Чаще всего для рассматриваемых целей используют кривые, выражающиеся многочленами целых положительных степеней

`yx = a + bx

``  yx = a + bx + cx2 и т.д., где  yx – ордината теоретической линии регрессии

Многочлен первой степени выражает равномерный рост или уменьшение функции, второй – степени – равнозамедленное или равноускоренное изменение yx с одним экстремумом.

Выбор аналитического вида получаемой зависимости зависит от профессиональной подготовки исследователя. Наиболее часто (в 80% случаев из 100%) предполагают наличие линейной зависимости. После того как выбран и обоснован тип уравнения регрессии, необходимо определить параметры, от которых зависит это уравнение.

Допустим, характер расположения точек на корреляционном поле и интуиция подсказывает нам, что теоретическая линия регрессии является прямой линией, т.е. выражается уравнением

х = a + bx, где  a  и  b  - неизвестные параметры.

Для нахождения неизвестных a  и  b в уравнении прямой линии воспользуемся методом наименьших квадратов (МНК).

S(yi - `yx)2 = min                                  (2.33)

т.е. потребуем, чтобы сумма отклонений фактических ординат от ординат, вычисленных по уравнению прямой была наименьшей.

Заменим в (2.33) `yx  через (a + bx) и обозначим левую часть формулы через f

f = S(yi - a - bx)2 ® min

Значения   a и b,  удовлетворяющие условию миниума функции найдутся из выражений

¶f/¶a = 0,       ¶f/¶b =0

Произведя соответствующие преобразования, получим

¶f/¶a = - 2å(yi - a – bxi) = 0 Þ åyi = n×a + båxi

¶f/¶b = - 2å(yi - a – bxi) xi = 0 Þ åyi xi= aåxi + båxi2 получаем систему т.н. нормальных уравнений

åyi = n×a + båxi

åyi xi= aåxi + båxi2                            (2.34)

Решая  систему (2.34), отыскиваем коэффициенты   a и  b.

Если отыскивается по методу МНК зависимость `yx = a + bx + cx2,

То соответствующая система нормальных уравнений будет следующей

åyi = a n + båxi + сåxi2

                                 åyi xi= aåxi + båxi2 + сåxi3                              (2.35)

   åyi xi2= aåxi2 + båxi3 + сåxi4

Следующей задачей (корреляционного) анализа является измерение тесноты связи. Поясним это на схематическом примере (рис.2.11).


Рассмотрим два корреляционных поля “а” и “б”. Пусть линии регрессии  Y по X  в обоих полях расположены одинаково. Однако, точки поля “б” значительно ближе примыкают к линии регрессии, чем точки поля “а”. Отклонения точек поля от линии регрессии объясняются, очевидно, влиянием прочих факторов. Если бы Y полностью определялся аргументом  X, то все точки поля находились бы на линии регрессии ; чем сильнее влияние всех прочих факторов, тем больше отклоняются от линии регрессии точки корреляционного поля.

Очевидно, что в случае “б” влияние аргумента X в меньшей степени осложняется действием прочих факторов, чем  в случае “а”, и зависимость между  Y и X является более тесной. Степень тесноты связи – весьма важное свойство, определяющее научное и практическое значение данной корреляционной зависимости.

Если теснота связи велика, то, зная аргумент, мы по уравнению регрессии достаточно точно предсказываем значение функции; воздействуя на аргумент, если он является причиной изменения функции, можно управлять функцией. Если теснота связи мала, то влияние аргумента  X  на функцию обнаруживается лишь в среднем по уравнению регрессии. В каждом же отдельном случае оно перекрывается действием побочных факторов.

Измерение тесноты корреляционной зависимости – вторая основная проблема теории корреляции. Рассмотрим пути ее решения.

Действие какого-либо фактора на функцию проявляется в изменчивости функции под влиянием изменчивости данного фактора. Поэтому показатель изменчивости функции – дисперсия – является одновременно показателем влияния на функцию изменчивости различных ее факторов.

Для того, чтобы выяснить степень влияния какого-либо одного из этих

Похожие материалы

Информация о работе