Значения t-критерия Стьюдента при доверительной вероятности 0,90, 0,95 и 0,99, страница 2

4) Чтобы оценить уравнение линейной парной регрессии Y=a0+a1×X найдем значения параметров a0 и a1. Для этого в ячейку F18 введена формула =ОТРЕЗОК(C3:L3;C2:L2), а в ячейку F19 введена формула = НАКЛОН (C3:L3;C2:L2)

5) Для построения диаграммы рассеяния выделите диапазон ячеек А2:К3 и нажмите кнопку Мастер диаграмм  на панели инструментов. В диалоговом окне Мастер диаграмм (шаг 1 из 4):тип диаграммы задайте Тип графика Точечная, Вид Точечная диаграмма позволяет сравнить пары значений. Нажмите кнопку Далее. В следующем окне (шаг 2) нажмите кнопку Далее.

На шаге 3 на вкладке Заголовки задайте Название диаграммы Точечная диаграмма, Ось Х (категорий) Стоимость ТП, Ось Y (значений) Себестоимость ТП. На вкладке Легенда сбросьте флажок Добавить легенду. Нажмите кнопку Далее.

В последнем окне (шаг 4) нажмите кнопку Готово.

Чтобы добавить на диаграмму линию уравнения линейной регрессии, выделите маркеры на точечной диаграмме, а затем выполните команду меню Диаграмма→Добавить линию тренда… В окне Линия тренда на вкладке Тип укажите тип линии тренда Линейная. На вкладке Параметры установите флажки показывать уравнение на диаграмме и поместить на диаграмму величину достоверности аппроксимации (R^2). Нажмите кнопку ОК. На диаграмме добавится линии тренда, а также уравнение этой линии и коэффициент детерминации R2 для данного варианта аппроксимации, характеризующий достоверность аппроксимации.

6) Спрогнозируем показатель Y (прогноз обозначим как ), если показатель X примет значение 125.

*= a0+a1×125=86,706.

Для расчета прогноза  в ячейку F20 можно ввести формулу =F18+F19*125 либо формулу =ПРЕДСКАЗ(125;C3:L3;C2:L2) либо формулу =ТЕНДЕНЦИЯ(C3:L3;C2:L2;125;1), которая является более универсальной и часто используется при прогнозировании.

7) Доверительный интервал для прогноза Y находят по формуле

, где t – коэффициент доверия, определяемый по распределению Стьюдента (рассчитан ранее в ячейке F17);

 – стандартная ошибка для оценки ;

 – средняя арифметическая показателя X.

.

Для расчета средней арифметической  в ячейке F21 использована формула =СРЗНАЧ(C2:L2)

Для расчета суммы квадратов отклонений от средней  в ячейке F22 использована формула =КВАДРОТКЛ(C2:L2)

Для вычисления множителя  в ячейке F23 использована формула =КОРЕНЬ(1+1/10+(125-F21)^2/F22)

Для расчета среднеквадратического отклонения  в ячейку F24 введена формула =ИНДЕКС(ЛИНЕЙН(C3:L3;C2:L2;1;1);3;2)

Замечание. Статистическая функция ЛИНЕЙН возвращает параметры линейной аппроксимации данных. Функция ЛИНЕЙН возвращает параметры в виде массива значений. Искомое значение  расположено в третьей строке, во втором столбце. Для получения доступа к элементу массива использована функция ИНДЕКС.

В ячейку F25 введена формула =F20-F17*F24*F23

8) По аналогии с п.5 можно добавить другие линии тренда.

В списке доступных линий тренда Microsoft Excel отсутствует уравнение гиперболы. Для оценивания уравнения гиперболы введем преобразованный показатель Х’=1/Х в диапазон С27:L27. Чтобы добавить на диаграмму рассеяния точки, соответствующие уравнению гиперболы, щелкните правой кнопкой мыши по диаграмме и выберите в контекстном меню пункт Исходные данные… В окне Исходные данные щелкните по вкладке Ряд, затем нажмите кнопку Добавить. Для Ряд2 задайте следующие данные: Значения Х C2:L2 Значения Y C30:L30

9) Значения коэффициента детерминации R2 для различных вариантов аппроксимации можно вывести на диаграмму рассеяния. Однако для уравнения гиперболы его необходимо рассчитать.

, где  – средняя арифметическая показателя Y.

 – оценка уравнения регрессии в i-ой точке;

SSD – обусловленная регрессией сумма квадратов;

SST – полная сумма квадратов.

В ячейку F31 введена формула =КВАДРОТКЛ(C30:L30)

В ячейку F32 введена формула =КВАДРОТКЛ(C3:L3)

Более удобным способом нахождения коэффициента детерминации R2 является использование формулы

=ИНДЕКС(ЛИНЕЙН(C3:L3;C27:L27;1;1);3;1), которая не требует промежуточных вычислений SSD и SST.

10) Показатель R2 часто используется в качестве критерия для выбора наилучшего уравнения регрессии. Чем выше значение R2, тем большую долю разброса относительно среднего  можно «объяснить» регрессией.

Приведем полученные значения R2 для рассмотренных нами уравнений регрессии: линейная регрессия R2=0,7073; уравнение параболы R2=0,8185; степенная функция R2=0,6639, логарифмическая функция R2=0,6164; экспоненциальная функция R2=0,7479 и уравнение гиперболы R2=0,5111.

Отсюда можно сделать вывод, что наилучшим уравнением регрессии является либо парабола, либо экспонента. Однако визуально на диаграмме рассеяния более предпочтительно выглядят линейная регрессия и степенная функция.

К сожалению, в данном случае проявился известный недостаток показателя R2 – он часто увеличивается с ростом числа параметров в уравнении регрессии, поэтому для параболы было получено наибольшее значение показателя R2. Другая проблема, с которой мы столкнулись – это малый объем выборки. По 10 наблюдениям сложно делать однозначный вывод о наилучшем уравнении регрессии.

Для получения более обоснованных выводов о виде уравнения регрессии необходимо было бы провести дополнительные наблюдения. Также можно было бы использовать другие критерии выбора наилучшего уравнения регрессии (например, модифицированный R2, критерий Маллоуса Ср и другие).