Методы оптимизации композиционных систем, страница 9


k-ik-1(5.7) (5.8)

X

аА(х

X

= (Е~аА)(хк По свойству норм имеем

*-1

Оценка сверху для нормы матрицы дает [lis -аА§<q~ max Jl-al\,|lЗависимость qfa) представлена на рис.5.1, из которого следует, что при ae(0; 2/L) величина q<l. Кроме того, из неравенств

Рис 5.1. Зависимость оценки знаменателя геометрической прогрессии от величины шага а градиентного метода

Из рис.5.1 следует, что величина q принимает минимальное значение q = fL l)/(L + I) при a = a = VflAl). Поэтому от соотношения между L и / существенно зависит число итераций градиентного метода при минимизации выпуклой квадратичной функции. Проиллюстрируем это на примере квадратичной функции двух переменных. При L = / > 0 точка минимума ffx) находится за один шаг.

Пример 5.1. Решить задачу f(x) = х2 + х\ -> min градиент-ным методом из начальной точки х = (1,1), приняв а - а .

В   данном   случае   матрица  А   квадратичной   функции

(2  ОЛ

А = \            Очевидно, /   1 = 2. Поэтому а - 21 (L + I) - 1/2 и

\0  2,

х1 - х° - \/2f'(x) = (0,0). Легко проверить, чтох1 = х.

При / - L линии уровня целевой функции ffx) - это концентрические окружности, поэтому направление антиградиента указывает на центр этих окружностей, т.е. на точку глобального минимума ffx).

Если L » I > 0, то линиями уровня являются эллипсы, полуоси которых сильно различаются. Поэтому направление антиградиента в некоторой точке может сильно отличаться от направления к точке глобального минимума.

Пример 5.2. Из начальной точки х° = (1, 1) выполнить несколько итераций поиска точки минимума функции f(x) - х2 +100x2 градиентным методом, полагая а - а.

Собственные значения матрицы А этой квадратичной функции равны: / 2, L - 200. Линиями уровня ffx) являются эллипсы, сильно вытянутые вдоль оси 0х]. Поэтому в точке х° направление вектора антиградиента ffx) - (-2, -200) сильно отличается от направления к точке глобального минимума х* - х° - (-1, -1). Приняв в формуле (5.5) а = а = 2/(1 + L) = 1/101, получим с учетом выражения для градиента ffx) - (2х\, 200л'2) следующую зависимость изменения координат точек минимизирующей последовательности:

Jff+,=jc*-99/101;;с2А+, = -х^ 99/101.

Из этой зависимости следует, что последовательность {х} сходится к точке глобального минимума медленно и траектория сходимости имеет ярко выраженный зигзагообразный характер.

В курсе линейной алгебры для симметрической положительно определенной матрицы вводится число обусловленности матрицы р L / I - отношение наибольшего к наименьшему собственному значению. В задаче минимизации произвольной (не обязательно квадратичной) сильно выпуклой функции ffx) эта величина для матрицы ее вторых производных (гессиана) 32 характеризует степень вытянутости линий (поверхностей) уровня ffx) = с. Очевидно, что всегда р > I. Если р велико, то линии (поверхности) уровня сильно вытянуты и говорят, что функция имеет овражный характер, т.е. резко меняется по одним направлениям и слабо - по другим. В подобных случаях задачу минимизации называют плохо обусловченной (см. пример 5.2). Если же р близко к единице, то линии (поверхности) уровня близки к окружностям (сферам) и задача минимизации является хорошо обусловленной (см. пример 5.1).

5.2. Метод наискорейшего спуска

В этом варианте градиентного метода также полагают pk = -f(xk) и величина шага ак находится в результате решения задачи одномерной минимизации

Фк(а)-> mm,                                                                           (5.9)

где Фк(а)= f{xk-of{xk)\a > 0, т.е. на каждой итерации в направлении антиградиента - fix*) совершается исчерпывающий спуск.

Опишем алгоритм метода. Шаг 0. Задать параметр точности е > 0 , выбрать х е Еп. Шаг 1. Вычислить f(x) и проверить условие достижения точности: ||/'(х)| < я. Если оно выполнено, то принять х*=х,

f* = f(x) и поиск завершить, иначе - перейти к шагу 2.

Шаг 2. Решить задачу одномерной минимизации (5.9) для

хк -х, т.е. найти а . Принять х = х - a *f(x)   и  перейти  к