Настройка и адаптация. Адаптивное управление, страница 6

Термин "дуальное управление" был предложен А. Фельд-баумом в работе [41]. Идея заключается в том, что в условиях неопределенности управление должно быть и изучающим, и направляющим. Оно должно, таким образом, вести систему к заданной цели, в то же время вводя дополнительные пробные сигналы, если в системе имеется неопределенность. система дуального управления поддерживает оптимальный баланс между всеми задачами. Проблемы дуального управле­ния можно сформулировать как оптимизационные (см. пример 2). Предположив, что решение существует, можно воспользо­ваться методом динамического программирования для вывода функционального уравнения оптимального закона управле­ния. Это уравнение, называемое уравнением Беллмана, представляетсобойобобщениеуравненийГамильтона-Якоби в динамическом программировании [19, 20]. С уравнением Беллмана связаны две проблемы. Пространство состояний велико: для простого примера 2 это - R^, и размерность стремительно увеличивается с ростом числа неизвестных параметров. Уравнение также трудно решить численно. Более подробно эти вопросы рассмотрены в монографии [14].

Сделано множество попыток приближенно определить стратегии дуального управления. Первоначальные усилия концентрировались на аппроксимациях уравнения Беллмана [16, 17]. Были решены также некоторые несложные задачи [13, 22, 133]. Пробовали модифицировать критерии [42, 145]. Недавний обзор работ в рассматриваемой области приведен в докладе [144]. Весьма интересное применение дуального управления предложено в работе [3]. Оно связано с управлени­ем приводом рафинера древесной стружки, где дуальное управление вполне естественно. Хотелось бы найти методы конструирования адаптивных регуляторов для достаточно общих (в разумных пределах) задач, а также "добавить" возможности дуального управления стандартным самона­страивающимся регуляторам. Эти проблемы до сих пор не решены. Есть надежда, что проявившийся вновь интерес к дуальному управлению принесет и новые идеи [50, 141].

2.5. Идентификация для управления

В последнее время в области идентификации систем наблюдается значительный интерес к осмыслению того, как результаты идентификации будут использоваться в управле­нии. Эта проблема тесно связана с адаптивным управлением.

Можно действительно утверждать, что адаптивное управление представляет собой окончательное слияние идентификации и управления. Хорошие обзоры результатов, полученных в этой области, имеются в работах [46, 140], содержащих множество ссылок. Можно обратиться также к публикациям [24,46,88,121,131,147].

Итеративные схемы с повторяющимися шагами иден­тификации и управления - один из результатов проведенных исследований [24, 128]. Параметры регулятора остаются постоянными в процессе идентификации и изменяются в начале цикла, идентификация проводится в замкнутом контуре. Такую схему можно рассматривать как адаптивную систему управления, параметры регулятора в которой уточняются в некоторые, достаточно редкие моменты времени. Одно из достоинств идентификации в замкнутом контуре несмотря на то, что функции чувствительности замкнутого контура неизвестны, состоит в том, что метод позволяет определить действие функции чувствительности на некоторые сигналы.

Интересная итеративная схема предложена в работе [58]. Ее можно описать следующим образом. Все эксперименты проводятся в замкнутом контуре. Это требует априорного знания стабилизирующего регулятора. Сперва выполняется очередной идентификационный эксперимент. Строится модель, удовлетворяющая данным замкнутого контура, и конструируется регулятор. Для второго эксперимента в качестве входного выбирается выходной сигнал первого эксперимента. Далее процесс повторяется.

Рассмотренный подход применим к широкому спектру задач. Первоначально метод был предложен в стохастической постановке. Доказательства сходимости для некоторых задач приводятся в работах [57, 58].