Тогда оценку переменных
состояния
, оптимальную по критерию максимума
апостериорной вероятности (2.2.8),
формирует следующая динамическая система (ПИД-наблюдатель переменных
состояния):
|
(2.3.24) |
|
(2.3.25) |
|
(2.3.26) |
с начальными условиями (2.3.11), где
|
(2.3.27) |
а матрицы ,
и
вычисляют
по формулам (2.3.12), (2.3.13) и (2.1.24).
Для доказательства теоремы 2 вновь введем переменную по формулам (2.2.10) и заменим задачу
максимизации условной плотности (2.2.8) на эквивалентную задачу минимизации
функции стоимости (2.2.11) при ограничениях (2.2.1), (2.1.24)-(2.1.27). Дальнейшее доказательство теоремы 2 осуществляется так
же, как и доказательство теоремы 1.
ПИД-наблюдатель переменных состояния нелинейного
объекта с произвольными шумами. Рассмотрим
теперь случай, когда функции распределения вероятности погрешностей измерений и вектора погрешностей аппроксимации
неизвестны.
Синтез ПИД‑наблюдателя переменных состояния объекта управления (2.2.1) можно выполнять минимизацией функции стоимости (2.2.11) обобщенного МНК с ограничениями (2.2.1), (2.1.8) и (2.1.24)-(2.1.27). Очевидно, что эта вариационная задача совпадает с вариационной задачей, составленной по условиям теоремы 2. Поэтому ПИД‑наблюдатель (2.3.24)-(2.3.27), (2.3.12), (2.3.13), (2.1.24) формирует оценки переменных состояния нелинейного объекта (2.2.1) с произвольными шумами, оптимальные по критерию (2.2.11) обобщенного МНК.
Пример 1. Нелинейный объект имеет следующие уравнения состояния:
|
(2.3.28) |
|
(2.3.29) |
где - пространственная координата объекта в системе координат, в центре
которой находится устройство, измеряющее расстояние до объекта:
|
(2.3.30) |
,
- скорость движения
объекта и управляющее воздействие, недоступные прямым измерениям;
- возмущающее воздей-ствие,
которое является неизвестной функцией пространственной координаты объекта;
- постоянная
времени объекта, значение которой известно приближенно;
- случайная погрешность измерений с дисперсией
.
Объект (2.3.28)-(2.3.30), имеющий
постоянную времени (известное наблюдателю значение
постоянной времени
), движется под действием
управляющего и возмущающего воздействий, законы изменения которых от своих
аргументов приведены на рисунках 2.5 и 2.6.
На рисунке 2.7 изображен график изменения скорости движения объекта. На рисунке 2.8 приведены результаты измерений текущих значений пространственной координаты этого объекта.
Рис. 2.5. Изменение возмущающего воздействия вдоль пространственной координаты |
Рис. 2.6. Изменение управляющего воздействия во времени |
Результаты измерений текущих значений пространственной
координаты, выполненные с относительной погрешностью ,
использовались для оценивания текущих значений скорости движения объекта
(одновременно с идентификацией его постоянной времени) с помощью рекуррентного
метода наименьших квадратов (фильтра Калмана) и алгоритма (2.3.8)-(2.3.13) при величине временного
окна
и
.
Рис. 2.7. Изменение скорости движения объекта во времени |
Рис. 2.8. Изменение во времени выходного сигнала измерительного устройства |
Результаты оценивания скорости движения объекта с помощью указанных методов приведены на рисунке 2.9.
Рис. 2.9. Результаты оценивания скорости движения объекта
На рисунке 2.9 изображены изменение во времени действи-тельной
скорости движения объекта (линия 2), оценка скорости, вычисленная с помощью
разработанного алгоритма (линия 1), и оценка скорости по алгоритму
фильтра Калмана (линия 3). Резуль-таты моделирования (рис. 2.9)
показывают, что в этом примере алгоритм (2.3.8)-(2.3.13) обеспечивает несмещенные оценки скорости движения
объекта со среднеквадратическим отклонением погреш-ности оценивания . В то же время оценки фильтра Калмана (линия
2 на рис. 2.9) имеют существенное смещение.
2.4. ПИ-наблюдатель переменных состояния объекта
с неизвестной математической моделью
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.