где — квантиль –распределения с степенями свободы порядка .
Отсюда имеем:
или
а значит, найдены границы доверительного интервала
(1.59)
где
Пример.
Пусть ищутся интервальные оценки для 5-параметрической модели по выборке из 28 точек. Доверительная вероятность составляет 0,95. В этом случае , , или в процентах . По таблице «Процентные точки распределения Стьюдента» (односторонняя критическая область) находим при , .
Для сравнения заметим, что , т.е. при использовании более грубых интервальных оценок, основанных на нормальном распределении, мы бы несколько заузили доверительный интервал по сравнению с более тонкими оценками, основанными на распределении Стьюдента .
2.2) Интервальная оценка линейной регрессии
.
Границы доверительного интервала находятся аналогичным образом по формуле
(1.60)
где
.
1.6. Проверка значимости оценок параметров регрессии
При построении регрессионных моделей обычно стремятся минимизировать их сложность и, в частности, при сохранении точности уменьшить число слагаемых в выражении
.
(1.61)
Поскольку на начальной стадии построения модели нередко рассматривается избыточная структура с большим числом , то в дальнейшем возникает вопрос об отсеивании мало значащих слагаемых, для которых коэффициенты близки к нулю.
Для этой цели, прежде всего, полезно перед построением модели выполнить нормирование переменных, т.е. приведение их к безразмерному виду и равному масштабу.
Из (1.61) следует, что
(1.62)
где
,
выборочные средние
Тогда
(1.63)
и
(1.64)
где
выборочные СКО.
Переходя к нормированным переменным и коэффициентам
, (1.65)
получим искомую модель
(1.66)
Если в нормированной модели (1.66) какие-либо коэффициенты близки к нулю, то это является определенным основанием для «выкидывания» из нее соответствующих слагаемых, т.е. признания их незначимыми.
Для обоснованного удаления таких слагаемых из модели следует выполнить для каждого из них проверку гипотезы о том, что соответствующий параметр равен нулю. Такая гипотеза может быть принята, если доверительный интервал
при малой выборке или
при большой выборке «накрывает» (содержит) значение .
Пример 1.
Пусть , , . В этом случае интервал не содержит нулевое значение, а значит -е слагаемое модели удалять не следует.
Пример 2.
Пусть , , . В этом случае интервал содержит нуль, а значит -е слагаемое может быть удалено из модели.
После удаления незначимых параметров можно легко найти параметры ненормированной модели с помощью соотношений (1.65).
1.7. Оценка качества регрессионной модели
Основное назначение регрессионных моделей — достаточно точное предсказание выходной переменной y по значениям входов x. Обычно для построения модели необходимо потратить много усилий и средств, поэтому, построив модель, важно понять, в какой степени она помогла снизить неопределенность при оценивании y. При этом можно рассуждать следующим образом. В отсутствие модели в качестве оценки yможно принять его среднее значение . Тогда рассогласование между экспериментальными данными и подобной наиболее простой моделью может быть задано оценкой СКО y
.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.