Парная регрессия. Определение параметров линейного уравнения регрессии, страница 2

Формула для нахождения:

Ᾱ =  ⋅100%

4.1. Для линейного уравнения регрессии:

Ᾱ =  ⋅ 0.931 ⋅ 100% = 6.208% - средняя ошибка аппроксимации показывает хорошее соответствие фактического значения издержек на производство продукции(у) и выравненного значения издержек на производство продукции(ŷ),  то есть качество модели хорошее.

4.2. Для степенного уравнения регрессии:

Ᾱ =  ⋅ 0.963 ⋅ 100% = 6.422% - средняя ошибка аппроксимации показывает хорошее соответствие фактического значения издержек на производство продукции(у) и выравненного значения издержек на производство продукции(ŷ),  то есть качество модели хорошее.

Задание 5:

Чтобы с вероятностью 0.95 оценить значимость каждого параметра уравнений регрессии (линейного и степенного), необходимо использовать t-критерий Стьюдента:

1.  Сначала необходимо определить tтабл:

α = 1-0.95 = 0,05

df – число степеней свободны = n-m-1 = 13

Значит, tтабл = 2,160

2.  Найти среднюю (стандартную) ошибку оцениваемых параметров по формулам:

Se(a) =

Se(b) =  

Se(r ) =    используется только для линейного уравнения.

3.  Рассчитать фактическое значение t-критерия для каждого параметра по формуле:

ti =  , где i – параметр

4.  Сравнить |ti|  и tтабл, оценить значимость параметра.

5.1. Для линейного уравнения регрессии:

Se(a) =  = 0.430                  ta =  = 23.435         |ta| ≥ tтабл

Se(b) =  = 0.027                        tb =  = 6.492            |tb| ≥ tтабл

Se(r ) =  = 0.135                           tr =  = 6.492           |tr| ≥ tтабл

Значит, параметры a, b и r значимы с вероятностью 0.95.

5.2. Для степенного уравнения регрессии:

Для нахождения средних ошибок параметров, необходимо использовать линеаризованную форму степенного уравнения регрессии: Ŷ=2.058+0.188⋅Х

Se(a) =  = 0.087                        ta =  = 23.753               |ta| ≥ tтабл

Se(b) =  = 0.035                            tb =  = 5.380                |tb| ≥ tтабл

Значит, параметры а и b значимы с вероятностью 0,95.

Чтобы с вероятностью 0,95 проверить значимость каждого уравнения регрессии (линейного и степенного), необходимо использовать F-критерий Фишера:

1.  Сначала необходимо определить Fтабл:

α = 1- 0.95 = 0.05

df1 = m = 1

df2 = n-m-1 = 13

Значит, Fтабл = 4,667

2.  Найти фактическое значение F-критерия:

Для линейного уравнения регрессии: F = tb2 = tr2

Для степенного уравнения регрессии: F =

3.  Сравнить F и Fтабл, оценить значимость уравнения.

5.3. Для линейного уравнения регрессии:

F = 6.492² = 42.153

F≥Fтабл, значит линейное уравнение регрессии статистически значимо с вероятностью 0,95. Его можно использовать для прогнозов.

5.4. Для степенного уравнения регрессии:

F =  = 28.948

F≥Fтабл, значит степенное уравнение регрессии статистически значимо с вероятностью 0,95. Его можно использовать для прогнозов.

Задание 6:

Чтобы выбрать лучшее из двух полученных уравнений регрессии и сравнивать их, необходимо проверить, значимы ли параметры этих уравнений. Согласно пунктам 5.1. и 5.2. это условие выполняется. Сами уравнения также являются значимыми согласно пунктам 5.3. и 5.4.

После этого необходимо сравнить коэффициенты детерминации линейного и степенного уравнений регрессии:

·  Для линейного уравнения регрессии: R² = 0.764

·  Для степенного уравнения регрессии: R² = 0.690

Так как у двух полученных уравнений одинаковое количество параметров, то лучшим будет то, у которого R² больше. В данном случае коэффициент детерминации больше у линейного уравнения регрессии, значит,  будет лучшим уравнением из двух полученных.

Задание 7:

В предыдущем задании я выбрала линейное уравнение регрессии как лучшее, значит, по нему с вероятностью 0,95 необходимо построить доверительный интервал ожидаемого значения издержек на производство продукции в предположении, что среднее время простоя оборудования уменьшится на 8% от среднего по совокупности.

Для этого, в первую очередь, надо найти прогнозируемое время простоя оборудования. Оно будет считаться по формуле:

пр = 0.92 ⋅

Подставлю известные значения: пр = 0.92 ⋅ 13.4 = 12.328 дней

После этого найду значение издержек на производство продукции, найденное при заданном пр по линейному уравнению регрессии , то есть проведу точечный прогноз.

ŷпр = 10.077 + 0.175 ⋅ 12.328 = 12.239 млн.руб.

Так как фактические наблюдения не лежат на линии регрессии, а рассеянны вокруг нее, то возникает необходимость найти границы этого рассеивания для заданного пр , то есть провести интервальный прогноз по формуле:

табл ⋅ Se(ŷпр)

Для этого необходимо найти Se(ŷпр) по формуле:

Se(ŷпр) =

Подставлю известные значения: Se(ŷпр) =  = 0.929

После этого можно искать доверительный интервал, значит:

ниж = 12.239 – 2.160 ⋅ 0.929 = 10.232 млн.руб.

верх = 12.239 + 2.160 ⋅0.929 = 14.245 млн.руб.

С вероятностью 0,95 ожидаемое значение издержек на производство продукции находится в границах от 10.232 млн.руб. до 14.245 млн.руб.

Чтобы проверить надежность данного расчета, можно посчитать следующий показатель:

D =  =  = 1.392 раза

Выполненный расчет оказался надежным и точным с вероятностью 0.95, так как диапазон верхней и нижней границ доверительного интервала составляет 1.392 раза.