Методы первого порядка. Задачи и методы условной оптимизации нелинейного программирования, страница 2

Рис. 4.12

При использовании геометрических представлений учитывается, что градиентное направление является ортогональным к линиям равного уровня (или что направление вектора градиента в некоторой точке X нормально линии уровня, проходящей через эту точку).

Отметим далее, что выбор длины шага является очень важным для рассматриваемого метода.

При этом, в частности, приходится принимать во внимание, что модуль вектора- градиента уменьшается по мере продвижения к точке экстремума. Поэтому в стратегии спуска (4.23) модуль вектора шага D(X^k) при постоянном значении h будет также уменьшаться. Такое изменение, в принципе, благоприятно для реализации метода. Тем не менее, как указано в [15,24,33], такое уменьшение в ряде случаев может оказаться недостаточным. В частности, значение целевой функции во вновь рассчитанной точке может оказаться большим, чем ее значение в предыдущей точке (то есть нарушится условие z(X^k+1) < z(X^k) ). (Можно сказать, что в этом случае шаг D(X^k) изменяется слишком медленно).

Для предотвращения подобных случаев на практике применяются различные стратегии изменения длины шага h^k, описываемые в общем виде формулой (4.24).

Так, может быть использован один из алгоритмов поиска с возвратом [22]. В соответствии с одним из них, после нарушения условия убывания ЦФ, поиск производится путем возврата в предыдущую точку X^kи повторного перемещения в том же направлении с шагом h^k /2 . (При этом процедура дробления шага производится до тех пор, пока его значение не станет меньше некоторого малого положительного числа D_зад). Аналогичный алгоритм, предусматривающий уменьшение длины шага в два раза, приводится и в [26].

В [17] описан способ удвоения, в соответствии к которым в зависимости от выполнения или не выполнения на определенном шаге условия убывания ЦФ шаг либо уменьшается, либо увеличивается в два раза.

Разработаны и более гибкие тактики увеличения или уменьшения длины шага (названные в [4] тактиками «разгона и торможения»), учитывающие, например, угол поворота градиента на k +1-м шаге по отношению к градиенту на k-м шаге [26], а также сумму абсолютных значений компонент вектора градиента на k-ом шаге [33].

Использование нормированного вектора градиента gz(X) позволяет более эффективно реализовывать различные стратегии изменения h^kдля изменения длины D(X^k), поскольку в этом случае этом отпадает необходимость учета изменения модуля градиента.

В качестве критериев окончания поиска в рассматриваемом методе помимо критериев вида (4.11) при переменном шаге может использоваться “шаговые” критерии

h^k£ D_задили ïX^k-X^k+1ï £ D_зад. (4.27)

Кроме того, может использоваться специальный “градиентный” критерий, основывающийся на том, что модуль вектора-градиента в окрестности точки оптимума при увеличении k стремится к нулю:

| grad z(X^k) | £ D_зад. (4.28)

Метод наискорейшего спуска.

(Другое название - метод скорейшего спуска).

Рассматриваемый метод считается развитием предыдущего метода. В основе его лежит идея того, что для повышения быстродействия целесообразно каждую итерацию выполнять с максимально возможным шагом.

В методе наискорейшего спуска движение вдоль направления, задаваемого градиентом, осуществляется до тех пор, пока ЦФ уменьшается (или, более точно, до точки, где ЦФ принимает минимальное значение в направлении антиградиента).

Таким образом, очередная точка X^k+1определяется как точка минимума ЦФ z(X) на луче, задаваемом соотношением X(h) = X^k – h grad z(X^k), h³0, направленном от точки X^kпо антиградиенту.

Длина шага, обеспечивающая такое движение на каждой итерации, может быть определена в результате решения вспомогательной одномерной задачи оптимизации по неотрицательной переменной h:

1 2 3 4 5 6 7 8 9 10 11 12 13 14

Скачать файл