Простая и множественная регрессии (Лабораторная работа № 5), страница 2

Включение  в  правую  часть   только  этих  переменных  обусловлено  тем,  что  лишь  эти  признаки  имеют  значение  вероятности   р  меньше,  чем  0,05  (см.  четвертый  столбец  табл.3).  Такое  значение  вероятности  принято  при  вычислении  доверительных  интервалов  на  коэффициенты  регрессии

 Величина  коэффициентов  Beta  позволяет  сравнить  относительный  вклад  каждой  независимой  переменной  в  предсказание  зависимой  переменной.   Как  видно  из  таблицы,  переменные  Pop_Chng, Pt_Rural, (Изменение  населения   за           1960-1970 гг.,  процент  сельского  населения)  являются  наиболее  важными  предикторами:  обладают  статистической   значимостью   (выделены  красным  цветом). Регрессионный  коэффициент  для  Pop_Chngотрицательный,  что  означает:  чем  меньше  увеличение  населения,  тем  больше  число  семей,  живущих  ниже  черты  бедности  в соответствующей  стране. Тот  же  коэффициент  для  переменной  Pt_Rural  -  положительный:  чем  больше  процент  сельского  населения,  тем выше  уровень  бедности.

8. Для  анализа  остатков  следует  в окне  диалога   GLMResults  нажать  кнопку  Moreresults,  после  чего  выделить  закладку  Residuals 1 для  рассмотрения  различных  видов  представления  остатков.  Обычно  оцениваются  стандартизированные  остатки   с  целью  выявления  выбросов,  превышающих  ± 3 sigmaДля  этого  необходимо  выбрать  опцию   Standardized  в  поле   Residsfordefaultplots  и  нажать  кнопку  Caseno. & res  для  построения  графика,  аналогичного  показанному  на  рис.7.

В  этом диалоге  имеется  много  возможностей  построения различных  графиков.  Большинство  из  них  интерпретируются достаточно  просто,  в  частности,  гистограмма  распределения  остатков,  однако  графики   нормального  распределения  требуют  отдельных  комментариев.   Как  известно,  множественная  линейная  регрессия  допускает  линейные  соотношения  между  переменными  уравнения  и  нормальность остатков.  Если эти  допущения  нарушены,  то  окончательное  заключение  может  быть  неверным.  График  нормального  распределения  представляет   собой  индикатор  того,  являются  или  нет отклонения  от  допущений  значительными.  Для  построения  графика  нажать  кнопку   Normalв  поле  Probab. plots ofresides.

Рис.7.  График  остатков

Если  наблюдаемые остатки  нормально  распределены,  то  все  значения  должны  укладываться на  прямой  линии  (или  близко  от  нее)  приведенного  графика (рис.8). В  противном  случае  точки,  изображающие  остатки,  будут отклоняться от  прямой  линии.

Рис.8. Индикатор  нормальности   остатков

         Пакет  Statgraphics 5.1

1.Простая  регрессия

1.Открыть  через  меню  FileOpenOpenDataFile  файл  данных  Carsales  (Продажа  машин).  Данные  представляют  собой  количество  продаваемых  машин  (в  тыс.  шт.)  по  месяцам  на  протяжении  6  лет.  В  табл.4  приведена  часть  этих  данных.

Таблица  4. Исходные  данные

2. Через  меню  RelateSimpleRegression  (Общность  -  Простая  регрессия)  перейти  к  окну простой  регрессии. Выбрать  в  качестве  независимой  переменной  параметр  sales  (продажи),  независимой  -  переменную  ADJUSTED  (отрегулированные)  и  указать  в  поле  Selectfirst(20)  для  ограничения объема  данных первыми  двадцатью  строками.  Результат   -  на  рис.9.

Рис.9.  Окно  простой  регрессии

Затем  нажать  ОК. На экране  монитора  появится  окно  результатов  регрессионного  анализа.