Для того, чтобы воспользоваться методом наименьших квадратов, нужно минимизировать
Обозначим , тогда
Для минимизации необходимо, чтобы .
Продифференцируем по :
Это уравнение распадается на два, т.е. одно уравнение получается из другого путем транспонирования:
, откуда - уравнение, определяющее значение коэффициентов а.
Так как Sr – среднеквадратичное отклонение e , то оценка дисперсии
ошибки e :
где р – число переменных x, n – число экспериментов.
Отклонение коэффициента аi , определяющее доверительный интервал оценок аi имеет распределение Стьюдента и находится по формуле:
Пример: Рассмотрим зависимость y(x) = x2 и найдем наилучшую линейную аппроксимацию этой зависимости y = a0 + a1x (рис.9)
рис.9
Зависимостьy = x 2 и ее линейная аппроксимация.
Пусть задается в трех точках x 1 = 0, x 2 = 0.5, x 3 = 1, тогда векторы и
имеют вид:
Составим матрицу плана:
Матрица X ТX будет выглядеть следующим образом:
Так как находим
Следовательно коэффициент а0 = -1/12 , коэффициент а1 = 1. Т.о. аппроксимирующая линия описывается уравнением y(x) = -1/12 + x (рис.9).
Пример2: Пусть регрессионная зависимость имеет вид: e
Измерения y проводятся в шести точках:
x 1 = -1, x 2 = -0.6, x 3 = -0.2, x 4 = 0.2, x 5 = 0.6, x 6 = 1.
Точные значения y принимают тогда значения:
y 1 = -1, y 2 = -0.2, y 3 = 0.6, y 4 = 1.4, y 5 = 2.2, y 6 = 3.
Допустим, что ошибка e имеет нормальное распределение с единичной дисперсией. Если для определения ei воспользоваться таблицей случайных чисел, то результаты измерений могут иметь следующий вид:
y 1 = -1.49, y 2 = 1.48, y 3 = 0.54, y 4 = 0.17, y 5 = 1.71, y 6 = 3.86
Находим X ТX:
Определяем
Следовательно = 1.07 = 1.95
Определяем доверительный интервал для а0 и а1 . Для этого нужно найти оценку дисперсии . Для этого найдем:
Так как t0,975(4) = 2.77, то
Отклонения велики, т.к. число экспериментов мало. Чтобы этого избежать существует два пути:
1) увеличивать число экспериментов
2) производят некоторое число повторных экспериментов в каждой из экспериментальных точек xi .
Если в каждой из nточек производится к – повторных экспериментов, то оценка дисперсии вычисляется по формуле:
где к – число повторных экспериментов в каждой из n точек
yij – результаты nk измерений;
- среднее значение y; в каждой из n точек ( ).
Отклонения оценок коэффициента определяется аналогично вышеприведенному, с тем отличием, что число степеней свободы распределения Стьюдента должно равняться т.е. :
Расчет остальных параметров регрессионной зависимости производится по вышеприведенной формуле с заменой .
3.3.Модель нелинейной регрессии.
Уравнение регрессионной зависимости имеет вид:
ei
Определение коэффициента аi может осуществляться по традиционному пути, если составить матрицу плана в виде:
Тогда оценка вектора параметров имеет известный вид:
Все остальные характеристики определяются аналогично приведенным выше расчетам. Необходимо, конечно, иметь ввиду, что число экспериментов n должно быть увеличено. Так, например, для проведения параболы нужно как минимум три точки.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.