Формула для нахождения:
Ᾱ = ⋅100%
4.1. Для линейного уравнения регрессии:
Ᾱ = ⋅ 0.931 ⋅ 100% = 6.208% - средняя ошибка аппроксимации показывает хорошее соответствие фактического значения издержек на производство продукции(у) и выравненного значения издержек на производство продукции(ŷ), то есть качество модели хорошее.
4.2. Для степенного уравнения регрессии:
Ᾱ = ⋅ 0.963 ⋅ 100% = 6.422% - средняя ошибка аппроксимации показывает хорошее соответствие фактического значения издержек на производство продукции(у) и выравненного значения издержек на производство продукции(ŷ), то есть качество модели хорошее.
Задание 5:
Чтобы с вероятностью 0.95 оценить значимость каждого параметра уравнений регрессии (линейного и степенного), необходимо использовать t-критерий Стьюдента:
1. Сначала необходимо определить tтабл:
α = 1-0.95 = 0,05
df – число степеней свободны = n-m-1 = 13
Значит, tтабл = 2,160
2. Найти среднюю (стандартную) ошибку оцениваемых параметров по формулам:
Se(a) =
Se(b) =
Se(r ) = используется только для линейного уравнения.
3. Рассчитать фактическое значение t-критерия для каждого параметра по формуле:
ti = , где i – параметр
4. Сравнить |ti| и tтабл, оценить значимость параметра.
5.1. Для линейного уравнения регрессии:
Se(a) = = 0.430 ta = = 23.435 |ta| ≥ tтабл
Se(b) = = 0.027 tb = = 6.492 |tb| ≥ tтабл
Se(r ) = = 0.135 tr = = 6.492 |tr| ≥ tтабл
Значит, параметры a, b и r значимы с вероятностью 0.95.
5.2. Для степенного уравнения регрессии:
Для нахождения средних ошибок параметров, необходимо использовать линеаризованную форму степенного уравнения регрессии: Ŷ=2.058+0.188⋅Х
Se(a) = = 0.087 ta = = 23.753 |ta| ≥ tтабл
Se(b) = = 0.035 tb = = 5.380 |tb| ≥ tтабл
Значит, параметры а и b значимы с вероятностью 0,95.
Чтобы с вероятностью 0,95 проверить значимость каждого уравнения регрессии (линейного и степенного), необходимо использовать F-критерий Фишера:
1. Сначала необходимо определить Fтабл:
α = 1- 0.95 = 0.05
df1 = m = 1
df2 = n-m-1 = 13
Значит, Fтабл = 4,667
2. Найти фактическое значение F-критерия:
Для линейного уравнения регрессии: F = tb2 = tr2
Для степенного уравнения регрессии: F =
3. Сравнить F и Fтабл, оценить значимость уравнения.
5.3. Для линейного уравнения регрессии:
F = 6.492² = 42.153
F≥Fтабл, значит линейное уравнение регрессии статистически значимо с вероятностью 0,95. Его можно использовать для прогнозов.
5.4. Для степенного уравнения регрессии:
F = = 28.948
F≥Fтабл, значит степенное уравнение регрессии статистически значимо с вероятностью 0,95. Его можно использовать для прогнозов.
Задание 6:
Чтобы выбрать лучшее из двух полученных уравнений регрессии и сравнивать их, необходимо проверить, значимы ли параметры этих уравнений. Согласно пунктам 5.1. и 5.2. это условие выполняется. Сами уравнения также являются значимыми согласно пунктам 5.3. и 5.4.
После этого необходимо сравнить коэффициенты детерминации линейного и степенного уравнений регрессии:
· Для линейного уравнения регрессии: R² = 0.764
· Для степенного уравнения регрессии: R² = 0.690
Так как у двух полученных уравнений одинаковое количество параметров, то лучшим будет то, у которого R² больше. В данном случае коэффициент детерминации больше у линейного уравнения регрессии, значит, будет лучшим уравнением из двух полученных.
Задание 7:
В предыдущем задании я выбрала линейное уравнение регрессии как лучшее, значит, по нему с вероятностью 0,95 необходимо построить доверительный интервал ожидаемого значения издержек на производство продукции в предположении, что среднее время простоя оборудования уменьшится на 8% от среднего по совокупности.
Для этого, в первую очередь, надо найти прогнозируемое время простоя оборудования. Оно будет считаться по формуле:
пр = 0.92 ⋅
Подставлю известные значения: пр = 0.92 ⋅ 13.4 = 12.328 дней
После этого найду значение издержек на производство продукции, найденное при заданном пр по линейному уравнению регрессии , то есть проведу точечный прогноз.
ŷпр = 10.077 + 0.175 ⋅ 12.328 = 12.239 млн.руб.
Так как фактические наблюдения не лежат на линии регрессии, а рассеянны вокруг нее, то возникает необходимость найти границы этого рассеивания для заданного пр , то есть провести интервальный прогноз по формуле:
табл ⋅ Se(ŷпр)
Для этого необходимо найти Se(ŷпр) по формуле:
Se(ŷпр) =
Подставлю известные значения: Se(ŷпр) = = 0.929
После этого можно искать доверительный интервал, значит:
ниж = 12.239 – 2.160 ⋅ 0.929 = 10.232 млн.руб.
верх = 12.239 + 2.160 ⋅0.929 = 14.245 млн.руб.
С вероятностью 0,95 ожидаемое значение издержек на производство продукции находится в границах от 10.232 млн.руб. до 14.245 млн.руб.
Чтобы проверить надежность данного расчета, можно посчитать следующий показатель:
D = = = 1.392 раза
Выполненный расчет оказался надежным и точным с вероятностью 0.95, так как диапазон верхней и нижней границ доверительного интервала составляет 1.392 раза.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.