Настройка и адаптация. Адаптивное управление, страница 5



с начальным условием х(0) = Хц. В силу того что параметр 6 входит в уравнение линейно, его можно оценить по методу наименьших квадратов. Точностно эквивалентное управле­ние, стабилизирующее систему, имеет вид и =- х - дх^.

Обозначим через в = д-Q погрешность оценивания. Замкну­тая система тогда приобретает следующий вид:



hi

Если оценка точна, последнее слагаемое исчезает и . экспоненциально сходится к нулю. Ситуация существенн иная при наличии ошибки оценивания. Предположим, что эт

ошибка экспоненциально стремится к нулю, т.е. e(f) = ее Подставив последнее выражение в формулу (5), получи1 уравнение Риккати, имеющее решение



На ранних этапах исследования непрямых схем предпола­галось, что объект представляет собой линейную динамичес­кую систему, например систему с дискретным временем, описываемую уравнением

или эквивалентную ей с непрерывным временем. В силу того что неизвестные параметры входят в уравнение линейно, их можно оценить с помощью линейных регрессионных методов, например методом наименьших квадратов. К самонастраива­ющимся регуляторам применялось множество известных методов конструирования регуляторов, таких как расположе­ние полюсов, LQG, * ff.

Интересное свойство самонастраивающихся регуляторов состоит в том, что их параметры могут сходиться к правиль­ным значениям, даже если структура модели для их конструи­рования выбрана неверно. Это достаточно давно обнаружен­ное свойство исследовано в работах [32, 34, 35, 83]. В статье [90] показано, что самонастройка может не реализоваться для критериев качества типа обобщенных затрат; дальнейшие результаты по этой проблеме приведены в работе [52]. Анализ проблемы самонастройки дает понимание и вопросов сходимости параметров [18, 85, 1 14, 146].

2.4. Погрешности модели

Для непрямых схем естественно возникает несколько вопросов. Один из них - как быть с погрешностями оценива­ния. В проблеме оценивания присутствуют два типа погреш­ностей: смещение, объясняемое возможным неправильным выбором структуры модели, и погрешность, возникающая из-за случайных флуктуаций [91]. В первоначальных схемах конструирования регуляторов погрешности в оценках параметров игнорировались. Такое допущение называется "точностной эквивалентностью" (certainty equivalence) [126].

*LQG зш)ача инмиттеского кчцструирониния регуляторы при линейных тршшчениях, кшдрититюм критерии кичестчи ч муссттй помехе. — Прим. пер.

Эта стратегия управления называется осторожным регулятором (cautious controller), поскольку она уменьшае7 отклонение и использует меньший коэффициент усиления при неточных оценках. Осторожное управление приближается к точностно эквивалентному при Р,/Ј' - 0.

Минимизация критерия (4) весьма затруднительна при п > > 1. Однако решения, которые можно определить численно, представляют несомненный интерес. Стратегии можно описать выражением

где/- функция, определяемая численно.

Эти стратегии близки к осторожному регулятору, когда оценки точны, т.е., когда отношение Р,1^ мало, а ошибка управления у, - у, велика. Они, однако, совершенно иные, когда величины Р,1^ и у, - у, малы. Управляющие сигналы, порождаемые данной стратегией, могут превосходить соответствующие сигналы при точностно эквивалентном управлении и осторожных регуляторах. Это объясняется тем, что закон управления генерирует управляющие сигналы, чтобы улучшить оценки. Причина, по которой в осторожном регуляторе не реализуются пробные воздействия, состоит в том, что временной горизонт составляет лишь один шаг, и стимул к пробным воздействиям отсутствует.           О