Интеллектуальные агенты. Конкретные архитектуры интеллектуальных агентов. Языки программирования агентов., страница 17

Если образцы распределены по поверхности  случайным образом, тогда оснащение большого количества роботов этими простыми поведениями даст очень хорошие результаты. Но мы знаем из описания проблемы, сделанном выше, что это не так: что образцы находятся в кластерах. В этом случае имеет смысли агентам работать совместно для нахождения образцов. Таким образом, когда один агент находит большой образец, будет полезно сообщить об этом другим агентам, для того чтобы они помогли собрать камни. К сожалению, мы также знаем из описания проблемы, что прямая коммуникация невозможна. Стилс разработал простое решение этой проблемы, частично вдохновленное поведением заготавливания у муравьев. Идея вертиться вокруг того, что агент создает след из радиоактивных крошек в том месте, где он нашел образец камня. Этот след создается, когда агент возвращается к материнскому кораблю. Если в какой-то момент другой агент пересечет этом след ,то ему надо будет только спуститься вниз по градиентному полю, чтобы определить источник образцов камней. Несколько небольших уточнений могут еще более улучшить эффективность этой остроумной схемы. Первое, агент следуя по следу к источнику образцов камней, подбирает некоторые крошки, которые он находит, делая таким образом след более слабым. Второе след прокладывается только агентами, возвращающимися к кораблю. Следовательно, если агент идет по следу к источнику незначительного образца камней, он уменьшит след на своем пути и не будет возвращаться не имея образцов, чтобы усилить его. После того как несколько агентов пройдут по пути не приводящему к образцам, путь по существу будет удален.

Модифицированное поведение в этому случае будет следующим. Избегание препятствий (1.6) остается неизменным. Однако два правила определяющие что делать, если несешь образцы, изменились следующим образом:

если несу образцы и на базе, тогда сбросить образцы                                            (1.11)

если несу образцы и не на базе, то бросить 2 крошки и идти на усиление сигнала(1.12)

Поведение (1.12) требует от агента бросать крошки когда от возвращается на базу с образцом, таким образом более усиливая или создавая след. Поведение подбирание образца (1.9) остается неизменным. Однако дополнительно поведение необходимо для работы с крошками.

если чувствую крошку, то подобрать 1 крошку и двигаться в направлении ослабления сигнала                               (1.13)

Окончательно, поведение случайного перемещения (1.10) остается неизменным. Эти поведения располагается в следующем порядке категоризационной иерархии:


Стилс показал, как это простое уточнение позволяет достигнуть почти оптимального поведения во многих ситуациях. Более того, это решение недорого (требуемая вычислительна мощность для каждого агента минимальна) и устойчиво (потери одного агента существенно не скажется на производительности системы в целом).

Подводя итог,  есть очевидные преимущества в реактивных подходах  в таких как категоризационная архитектура Брукса: простота, экономность, вычислительная легкость, устойчивость к отказам, и элегантность, все это делает такие архитектуры привлекательными. Но существуют несколько фундаментальных неразрешенных проблем, не только с категоризационной структурой, но и с другими чисто реактивными архитектурами:

-  если агенты не используют модели своего окружения, то они должны иметь достаточно информации в своем локальном окружении, для того чтобы определить приемлемое действие;

-  Т.к. чисто реактивные агенты принимают решения основываясь на локальной информации (т.е. информации о текущем состоянии агента), трудно увидеть как это принятие решения может принять во внимание не локальную информацию – он неотъемлемо имеет «краткосрочный» взгляд;

-  Трудно представить как чисто реактивные агенты могут быть сконструированы для обучения на собственном опыте и улучшать свое исполнение со временим.