Нарушения основных гипотез регрессионной модели (Семинар 8)

Страницы работы

Уважаемые коллеги! Предлагаем вам разработку программного обеспечения под ключ.

Опытные программисты сделают для вас мобильное приложение, нейронную сеть, систему искусственного интеллекта, SaaS-сервис, производственную систему, внедрят или разработают ERP/CRM, запустят стартап.

Сферы - промышленность, ритейл, производственные компании, стартапы, финансы и другие направления.

Языки программирования: Java, PHP, Ruby, C++, .NET, Python, Go, Kotlin, Swift, React Native, Flutter и многие другие.

Всегда на связи. Соблюдаем сроки. Предложим адекватную конкурентную цену.

Заходите к нам на сайт и пишите, с удовольствием вам во всем поможем.

Содержание работы

Семинар 8 .

План

Задача №K8_1

По наблюдениям за объясняемой переменной  и за объясняющими переменными  оценить параметры регрессии, построить доверительный интервал для параметров регрессии, проверить значимость фактора и уравнения регрессии в целом.

Задача №K8_2

Оценка  регрессии   на основе N=30 наблюдений дали следующие результаты:

Заполните пропуски.

Задача №K8_3

Проведите интервальную оценку прогнозного значения переменной Y в точке XT+1=14с вероятностью 95 %, если регрессионная модель Y=220+3*X построена по 25 наблюдениям, а остаточная дисперсия равна 25, средняя по X равна 14 и значения квантилей распределения Стьюдента для 5 % уровня ошибки таковы:

Ст. свободы

22

23

24

25

Квантили

2.074

2.069

2.064

2.060

II.  Выборрегрессоров : R2 , R2adj ,t- статистика, F-статистика,  AIC,  BIC  МультиколлинеарностьКорр. матрица регрессоров R2

1.  На основе данных файла CARS93.mat  оцените множественную регрессию зависимости (rice) цены автомобиля от  (city) расход горючего в городе, (highway) расход горючего на шоссе, (engine)  объем двигателя, ( power) мощность, (fuel) объем бака, (weight) вес. 

         Добыча угля в Великобритании

Обозначения:

     X - общая добыча угля (млн тонн)

     L - общая занятость в добыче угля (тыс. чел.)

     K - основные фонды в угледобывающей отрасли

         (восстановительная стоимость в ценах 1975 г., млн фунтов)

     D - потери рабочих дней в угледобывающей отрасли из-за

            забастовок (млн дней)

    Данные в файле   coal.dat.    

III .  Нарушения основных гипотиз регрессионной модели

Задание: (результаты расчетов записываются в файл, туда же

           пишутся комментарии)

    1) Импортировать файл coal.dat в формат данных пакета Matrixer

    2) Оценить уравнения регрессии X=cosnt+b*K+c*D.

    3) Сохранить расчетные значения X (=fit) и вектор остатков (=res).

       Создать переменную res1:=res[-1] - остатки с лагом в 1 год,

       первое наблюдение заменить на ноль

       Посмотреть графики расчетных и фактических значений X

    4) Провести тесты:

                        Тест на автокорреляцию остатков

                        Тест на гетероскедастичность ошибок

                        тест на функциональную форму

      Проанализировать диагностику, выдаваемую программой после

        оценивания регрессии

      Проверить правильность модели "на глаз" (графически)

        * Автокорреляция       -  график остатков по времени

        *  Гетероскедастичность-  график остатков по регрессорам

        * Функциональная форма - график остатков по расчетным

         значениям (fit)

      Рассчитать те же статистики вручную с помощью соответсствующих

          регрессий

        * Автокорреляция - тест на добавление res1 в исходную регрессию

           (первое наблюдение заменить на 0 командой >edit res1 )

        * Функциональная форма - тест на добавление fit^2 в исходную

         регрессию

    5) Провести тест на добавление фактора L

    6) Оценить уравнения регрессии X=const+b*K+c*D+a*L

      - Убедиться, что функциональная форма регрессии все еще плохая.

    8) Создать переменные k2=k^2 и L2=L^2

    Добавить в качестве регресоров  L^2, если функциональная форма еще

    плохая добавить еще K^2.

    Посмотреть графики расчетных и фактических значений X и сделать

    вывод.

Источник данных:

Метод. пособие: Регрессионый анализ В.Суслов и др. стр 74 зад.4       

 Добыча угля в Великобритании

      год        Q        L      K       D

     1964     196.7     597    4.1     0.309

     1965     190.6     565    4.1     0.413

     1966     177.4     518    4.3     0.118

     1967     174.9     496    4.3     0.108

     1968     166.7     446    4.3     0.057

     1969     153.0     407    4.3     1.041

     1970     144.6     382    4.3     1.092

     1971     147.1     368    4.3     0.065

     1972     119.5     330    4.3    10.800

     1973     130.2     315    4.2     0.091

     1974     109.3     300    4.2     5.628

     1975     127.8     303    4.2     0.056

     1976     122.2     297    4.3     0.078

     1977     120.6     299    4.4     0.097

     1978     121.7     295    4.6     0.201

     1979     120.7     288    4.9     0.128

     1980     128.2     286    5.2     0.166

     Q - общая добыча угля (млн тонн)

     L - общая занятость в добыче угля (тыс. чел.)

     K - основные фонды в угледобывающей отрасли

         (восстановительная стоимость в ценах 1975г., млн фунтов)

     D - потери рабочих дней в угледобывающей отрасли из-за

            забастовок (млн дней)

Домашнее задание

Задание заключается в том, чтобы оценить линейную

регрессию.

файл данных - G206.TXT

 Задание сдавать в виде файла Word с подробными пояснениями.

 Не принимаются задания, сделанные на Excel.

 Выполнение задания включает в себя вычисление не только

коэффициентов регрессии, но и прочих полезных величин,

а именно, требуется вычислить также:

 - стандартные ошибки коэффициентов,

 - t-статистики для коэффициентов с указанием количества

 степеней свободы,

 - уровни значимости t-статистик,

 - табличное значение t-распределения для выбранной вероятности,

 - коэффициент детерминации,

 - F-статистику для регрессии в целом с указанием количества

 степеней свободы,

 - уровень значимости F-статистики.

 - табличное значение F-распределения для выбранной вероятности,

 Эти величины нужно не только вычислить, но и интерпретировать

по мере возможности, например, много это или мало, какова нулевая

гипотеза, принимается или отклоняется нулевая гипотеза, значима

или незначима переменная, и т.п.).

 Но это еще не все.

 Проверьте, нет ли в Вашей регрессии признаков

мультиколлинеарности.

 Далее требуется сделать модель более компактной одним из

известных Вам способов, удалив "ненужные" переменные.

 Предположим, что Вы выбрали какую-то модель. Теперь требуется

проверить, не нарушены ли предположения регрессионного анализа,

то есть проверить, нет ли в Вашей модели проблем с

автокорреляцией остатков и гетероскедастичностью.

!!! Для успешной сдачи  задания Вы должны

    уметь давать объясния по всем пунктам задания. !!!

Похожие материалы

Информация о работе

Предмет:
Эконометрия
Тип:
Практика
Размер файла:
70 Kb
Скачали:
0

Уважаемые коллеги! Предлагаем вам разработку программного обеспечения под ключ.

Опытные программисты сделают для вас мобильное приложение, нейронную сеть, систему искусственного интеллекта, SaaS-сервис, производственную систему, внедрят или разработают ERP/CRM, запустят стартап.

Сферы - промышленность, ритейл, производственные компании, стартапы, финансы и другие направления.

Языки программирования: Java, PHP, Ruby, C++, .NET, Python, Go, Kotlin, Swift, React Native, Flutter и многие другие.

Всегда на связи. Соблюдаем сроки. Предложим адекватную конкурентную цену.

Заходите к нам на сайт и пишите, с удовольствием вам во всем поможем.