Для
того, чтобы воспользоваться методом наименьших квадратов, нужно минимизировать
Обозначим , тогда
Для минимизации необходимо,
чтобы
.
Продифференцируем по :
Это уравнение распадается на два, т.е. одно уравнение получается из другого путем транспонирования:
, откуда
- уравнение, определяющее значение коэффициентов а.
Так как Sr –
среднеквадратичное отклонение e , то оценка дисперсии
ошибки e :
где р – число переменных x, n – число экспериментов.
Отклонение коэффициента аi , определяющее доверительный интервал оценок аi имеет распределение Стьюдента и находится по формуле:
Пример: Рассмотрим зависимость y(x) = x2 и найдем наилучшую линейную аппроксимацию этой
зависимости y = a0 + a1x
(рис.9)
рис.9
Зависимостьy = x 2 и ее линейная аппроксимация.
![]() |
Пусть задается в трех точках x 1 = 0, x 2 = 0.5, x 3 = 1, тогда векторы и
имеют вид:
Составим матрицу плана:
![]() |
|||
![]() |
|||
Матрица
X ТX будет выглядеть следующим образом:
![]() |
|||
![]() |
Так как находим
![]() |
|||
![]() |
|||
Следовательно коэффициент а0 = -1/12 , коэффициент а1 = 1. Т.о. аппроксимирующая линия описывается уравнением y(x) = -1/12 + x (рис.9).
Пример2: Пусть
регрессионная зависимость имеет вид: e
Измерения y проводятся в шести точках:
x 1 = -1, x 2 = -0.6, x 3 = -0.2, x 4 = 0.2, x 5 = 0.6, x 6 = 1.
Точные значения y принимают тогда значения:
y 1 = -1, y 2 = -0.2, y 3 = 0.6, y 4 = 1.4, y 5 = 2.2, y 6 = 3.
Допустим, что ошибка e имеет нормальное распределение с единичной дисперсией. Если для определения ei воспользоваться таблицей случайных чисел, то результаты измерений могут иметь следующий вид:
y 1 = -1.49, y 2 = 1.48, y 3 = 0.54, y 4 = 0.17, y 5 = 1.71, y 6 = 3.86
![]() |
Находим X ТX:
Определяем
Следовательно =
1.07
= 1.95
Определяем доверительный интервал для а0 и а1
. Для этого нужно найти оценку дисперсии . Для
этого найдем:
![]() |
![]() |
Так как t0,975(4) = 2.77,
то
Отклонения велики,
т.к. число экспериментов мало. Чтобы этого избежать существует два пути:
1) увеличивать число экспериментов
2) производят некоторое число повторных экспериментов в каждой из экспериментальных точек xi .
Если в
каждой из nточек
производится к – повторных экспериментов, то оценка дисперсии
вычисляется по формуле:
где к – число повторных экспериментов в каждой из n точек
yij – результаты nk измерений;
- среднее
значение y; в каждой из n
точек (
).
Отклонения оценок
коэффициента
определяется аналогично
вышеприведенному, с тем отличием, что число степеней свободы распределения
Стьюдента должно равняться
т.е.
:
Расчет остальных параметров
регрессионной зависимости производится по вышеприведенной формуле с заменой .
3.3.Модель нелинейной регрессии.
Уравнение регрессионной зависимости имеет вид:
ei
Определение коэффициента аi может осуществляться по традиционному пути, если составить матрицу плана в виде:
![]() |
Тогда оценка вектора параметров имеет известный вид:
Все остальные характеристики определяются аналогично приведенным выше расчетам. Необходимо, конечно, иметь ввиду, что число экспериментов n должно быть увеличено. Так, например, для проведения параболы нужно как минимум три точки.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.