Формула для нахождения:
Ᾱ = ⋅100%
4.1. Для линейного уравнения регрессии:
Ᾱ = ⋅
0.931 ⋅ 100% = 6.208% -
средняя ошибка аппроксимации показывает хорошее соответствие фактического
значения издержек на производство продукции(у) и выравненного значения издержек
на производство продукции(ŷ), то есть качество модели хорошее.
4.2. Для степенного уравнения регрессии:
Ᾱ = ⋅
0.963 ⋅ 100% = 6.422% -
средняя ошибка аппроксимации показывает хорошее соответствие фактического
значения издержек на производство продукции(у) и выравненного значения издержек
на производство продукции(ŷ), то есть качество модели хорошее.
Задание 5:
Чтобы с вероятностью 0.95 оценить значимость каждого параметра уравнений регрессии (линейного и степенного), необходимо использовать t-критерий Стьюдента:
1. Сначала необходимо определить tтабл:
α = 1-0.95 = 0,05
df – число степеней свободны = n-m-1 = 13
Значит, tтабл = 2,160
2. Найти среднюю (стандартную) ошибку оцениваемых параметров по формулам:
Se(a)
=
Se(b)
=
Se(r ) = используется только для линейного
уравнения.
3. Рассчитать фактическое значение t-критерия для каждого параметра по формуле:
ti = , где i – параметр
4. Сравнить |ti| и tтабл, оценить значимость параметра.
5.1. Для линейного уравнения регрессии:
Se(a)
= = 0.430
ta =
= 23.435 |ta| ≥ tтабл
Se(b)
= = 0.027
tb =
= 6.492 |tb| ≥ tтабл
Se(r
) = = 0.135
tr =
= 6.492 |tr| ≥ tтабл
Значит, параметры a, b и r значимы с вероятностью 0.95.
5.2. Для степенного уравнения регрессии:
Для нахождения средних ошибок параметров, необходимо использовать линеаризованную форму степенного уравнения регрессии: Ŷ=2.058+0.188⋅Х
Se(a)
= = 0.087 ta =
= 23.753 |ta|
≥ tтабл
Se(b) = = 0.035 tb =
= 5.380 |tb| ≥ tтабл
Значит, параметры а и b значимы с вероятностью 0,95.
Чтобы с вероятностью 0,95 проверить значимость каждого уравнения регрессии (линейного и степенного), необходимо использовать F-критерий Фишера:
1. Сначала необходимо определить Fтабл:
α = 1- 0.95 = 0.05
df1 = m = 1
df2 = n-m-1 = 13
Значит, Fтабл = 4,667
2. Найти фактическое значение F-критерия:
Для линейного уравнения регрессии: F = tb2 = tr2
Для степенного
уравнения регрессии: F =
3. Сравнить F и Fтабл, оценить значимость уравнения.
5.3. Для линейного уравнения регрессии:
F = 6.492² = 42.153
F≥Fтабл, значит линейное уравнение регрессии статистически значимо с вероятностью 0,95. Его можно использовать для прогнозов.
5.4. Для степенного уравнения регрессии:
F = = 28.948
F≥Fтабл, значит степенное уравнение регрессии статистически значимо с вероятностью 0,95. Его можно использовать для прогнозов.
Задание 6:
Чтобы выбрать лучшее из двух полученных уравнений регрессии и сравнивать их, необходимо проверить, значимы ли параметры этих уравнений. Согласно пунктам 5.1. и 5.2. это условие выполняется. Сами уравнения также являются значимыми согласно пунктам 5.3. и 5.4.
После этого необходимо сравнить коэффициенты детерминации линейного и степенного уравнений регрессии:
· Для линейного уравнения регрессии: R² = 0.764
· Для степенного уравнения регрессии: R² = 0.690
Так как у двух
полученных уравнений одинаковое количество параметров, то лучшим будет то, у
которого R² больше. В
данном случае коэффициент детерминации больше у линейного уравнения регрессии,
значит, будет лучшим уравнением из двух полученных.
Задание 7:
В предыдущем задании я выбрала линейное уравнение регрессии как лучшее, значит, по нему с вероятностью 0,95 необходимо построить доверительный интервал ожидаемого значения издержек на производство продукции в предположении, что среднее время простоя оборудования уменьшится на 8% от среднего по совокупности.
Для этого, в первую очередь, надо найти прогнозируемое время простоя оборудования. Оно будет считаться по формуле:
пр = 0.92 ⋅
Подставлю
известные значения: пр = 0.92 ⋅ 13.4 = 12.328
дней
После этого
найду значение издержек на производство продукции, найденное при заданном пр по линейному
уравнению регрессии
, то есть проведу точечный прогноз.
ŷпр = 10.077 + 0.175 ⋅ 12.328 = 12.239 млн.руб.
Так как
фактические наблюдения не лежат на линии регрессии, а рассеянны вокруг нее, то
возникает необходимость найти границы этого рассеивания для заданного пр , то есть провести
интервальный прогноз по формуле:
табл ⋅ Se(ŷпр)
Для этого необходимо найти Se(ŷпр) по формуле:
Se(ŷпр) =
Подставлю
известные значения: Se(ŷпр) = = 0.929
После этого можно искать доверительный интервал, значит:
ниж = 12.239 – 2.160
⋅ 0.929 = 10.232
млн.руб.
верх = 12.239 +
2.160 ⋅0.929 = 14.245
млн.руб.
С вероятностью 0,95 ожидаемое значение издержек на производство продукции находится в границах от 10.232 млн.руб. до 14.245 млн.руб.
Чтобы проверить надежность данного расчета, можно посчитать следующий показатель:
D =
=
= 1.392 раза
Выполненный расчет оказался надежным и точным с вероятностью 0.95, так как диапазон верхней и нижней границ доверительного интервала составляет 1.392 раза.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.