Прикладные методы в теории вероятности, страница 8

где  — квантиль –распределения с  степенями свободы порядка .

Отсюда имеем:

или

а значит, найдены границы доверительного интервала

                                         

                                     (1.59)

где

Пример.

Пусть ищутся интервальные оценки для 5-параметрической модели по выборке из 28 точек. Доверительная вероятность составляет 0,95. В этом случае , ,  или в процентах . По таблице «Процентные точки распределения Стьюдента» (односторонняя критическая область) находим при , .

Для сравнения заметим, что , т.е. при использовании более грубых интервальных оценок, основанных на нормальном распределении, мы бы несколько заузили доверительный интервал  по сравнению с более тонкими оценками, основанными на распределении Стьюдента .

2.2) Интервальная оценка линейной регрессии

                                                        .

Границы доверительного интервала находятся аналогичным образом по формуле

                                                                                       (1.60)

где

.

1.6. Проверка значимости оценок параметров регрессии

При построении регрессионных моделей обычно стремятся минимизировать их сложность и, в частности, при сохранении точности уменьшить число слагаемых в выражении

                                           .

                                                                                       (1.61)

Поскольку на начальной стадии построения модели нередко рассматривается избыточная структура с большим числом , то в дальнейшем возникает вопрос об отсеивании мало значащих слагаемых, для которых коэффициенты  близки к нулю.

Для этой цели, прежде всего, полезно перед построением модели выполнить нормирование переменных, т.е. приведение их к безразмерному виду и равному масштабу.

Из (1.61) следует, что

                                                                                                  (1.62)

где

,

выборочные средние

Тогда

                                                                             (1.63)

и

                                                               (1.64)

где

выборочные СКО.

Переходя к нормированным переменным и коэффициентам

                 ,           (1.65)

получим искомую модель

                                                                                              (1.66)

Если в нормированной модели (1.66) какие-либо коэффициенты  близки к нулю, то это является определенным основанием для «выкидывания» из нее соответствующих слагаемых, т.е. признания их незначимыми.

Для обоснованного удаления таких слагаемых из модели следует выполнить для каждого из них проверку гипотезы о том, что соответствующий параметр  равен нулю. Такая гипотеза может быть принята, если доверительный интервал

при малой выборке или

при большой выборке «накрывает» (содержит) значение .

Пример 1.

Пусть , , . В этом случае интервал  не содержит нулевое значение, а значит -е слагаемое модели удалять не следует.

Пример 2.

Пусть , , . В этом случае интервал  содержит нуль, а значит -е слагаемое может быть удалено из модели.

После удаления незначимых параметров можно легко найти параметры ненормированной модели с помощью соотношений (1.65).

1.7. Оценка качества регрессионной модели

Основное назначение регрессионных моделей — достаточно точное предсказание выходной переменной y по значениям входов x. Обычно для построения модели необходимо потратить много усилий и средств, поэтому, построив модель, важно понять, в какой степени она помогла снизить неопределенность при оценивании y. При этом можно рассуждать следующим образом. В отсутствие модели в качестве оценки yможно принять его среднее значение . Тогда рассогласование между экспериментальными данными и подобной наиболее простой моделью может быть задано оценкой СКО y

.