Профилирование агентов при разработке мультиагентной системы управления городом
Профилирование агентов при разработке мультиагентной системы управления городом
Аннотация
Описаны проблемы управления городскими ресурсами. Обосновано применение мультиагентного подхода при решении задач в данной области. Приведена архитектура агента. Исследованы методы и принципы проектирования мультиагентных систем, рассмотрены основные алгоритмы работы. Приведен математический аппарат, необходимый для описания и функционирования агента. Описаны компоненты функции цели. Рассмотрены модели коллективного поведения агентов. Проведена архитектура комплекса мультиагентных систем в решении частных задач городского управления. Описаны возможности объединения этих систем. Представлен принцип работы локальной мультиагентной системы, решающей частные задачи городского управления. Сформирована процедура достижения глобальной цели агента-координатора. Приведены выводы исследования и описаны преимущества использования мультиагентного подхода.
1. Введение
Городское планирование является сложной многообъектной и многопараметрической задачей . Это обусловлено множественными факторами, постоянно влияющими на состояние объектов управления, что позволяет им изменяться во времени, усложняя процедуры распределения ресурсов, что, в свою очередь, влияет на качество жизни горожан. Поэтому оперативность принятия решений и адаптивность к изменяющимся параметрам являются необходимыми качествами подобных систем , .
Также усложняет проектирование и государственный аппарат учреждений федерального, муниципального и регионального уровня, принимающих решения на основе ограниченного объема данных с планируемым эффектом в ближайшей перспективе. Еще одной проблемой является субъективизм принимаемых решений, а также отсутствие общего органа управления, осуществляющего кроме выработки решений еще и их оптимизацию.
И, наконец, на разных уровнях могут решаться лишь узкие задачи, направленные на развитие одного из направлений городского хозяйства, хотя при этом и не исключаются повторы поставленных задач. Поэтому решение перечисленных проблем является актуальной задачей данной статьи.
2. Методы и принципы проектирования мультиагентных систем
Для управления городскими ресурсами в работе предлагается использовать мультиагентную систему, принципы организации которой изложены в , . Агент – программная или программно-аппаратная сущность, которая исполняет команды от управляющего центра, воспринимая текущие условия внешней среды, и оказывает на нее влияние. В литературе отмечается, что большое количество атрибутов и видов агентов, сложность принципов организации мультиагентных систем, – все это приводит к отсутствию строгого описания и выработки общей теории, что препятствует их развитию.
Управление множеством агентов осуществляет агент-координатор. В сложных мультиагентных системах связи образуют многоуровневую иерархическую систему, а взаимосвязь между уровнями осуществляют агенты-координаторы, которые управляют агентами-исполнителями.
Пусть каждый агент имеет унифицированную архитектуру, представленную на рисунке 1. Надо отметить, что в литературных источниках входная информация и вырабатываемые агентом действия часто интерпретируются как входящие и исходящие сообщения (соответственно), а функционирование агента в этом случае близко к работе сервиса или бота.

Рисунок 1 - Архитектура агента
Рассмотрим кратко работу агентов, опираясь на основные виды алгоритмов:
– простые рефлексные;
– рефлексные, основанные на модели;
– агенты, действующие на основании цели;
– агенты, действующие на основании полезности;
– интеллектуальные агенты.
1. Алгоритм работы простых рефлексных агентов соответствует схеме «условие-действие» с абстрагированием от выработанных ранее решений, и, поэтому, обладают низким интеллектом, но вместе с тем самый простой. Недостатками алгоритма являются возможное: неправильное восприятие состояний внешней среды, зависание из-за ситуаций неопределенности, а также неспособность к обучению.
2. Принятие решений рефлексных агентов, основанных на модели, уже учитывает как текущее состояние внешней среды, так и изменения ее во времени из-за действий всех агентов системы. При этом к схеме «условие-действие» добавляется оценки внешней среды.
3. Алгоритм работы агента, действующего на основании цели, схож с предыдущим. Но вместо схемы «условие-действие» работа агента нацелена на выполнение цели C.
4. Показатель полезности позволяет оценить, насколько решение удовлетворяет множеству целей C, поставленных перед агентом (вместо стратегии определения выполнимости локальной цели C). В случае многовариантности и противоречивости целей оптимум функции полезности Q(X) является целевым показателем взвешенного решения поставленной задачи с заданной точностью, полученного поисковым агентом:
Hopt → extr(Q(X)) = (Ci wi) *
(μj φj),
Q (X) = (x1, x2, ..., xn),
wi = 1.
где μj φj – штрафная функция j-го ограничения φj (μj принимает значения 0 или 1 в зависимости от нарушения или выполнения ограничения соответственно);
wi – важность i-й цели Ci для всей мультиагентной системы;
p – мощность множества целей;
l – мощность множества ограничений.
5. Интеллектуальных агентов в зависимости от сложности мультиагентной системы наделяют множеством свойств: автономностью, коммуникабельностью, реактивностью, знаниями, убеждениями, желаниями, намерениями, целями, обязательствами, мобильностью, благожелательностью, правдивостью, рациональностью и так далее. В данной работе ограничимся свойствами реактивности, знания и цели, а основой интеллектуальных агентов будем считать обучающийся компонент, который, несомненно, усложняет алгоритм его работы. При этом организуется обратная связь, с помощью которой, посредством элемента критика и генератора проблем, производится выработка решений агентом. Таким образом, такой агент использует знания, накопленные на предыдущих шагах работы, и имеет возможность работы в условиях неопределенности, касающихся, например, состояния внешней среды, или отсутствие информации от других агентов.
Для профилирования агента используем следующий набор элементов, необходимых для его описания и функционирования.
Опишем агента-исполнителя как кортеж:
N = {Dвх, Dисх, A, L, B, W, ...},
где Dвх – множество входящих сообщений относительно рассматриваемого агента;
Dисх – множество исходящих сообщений;
A – множество архитектур агентов;
L – множество программ работы агента;
B – множество заданий для агента;
W – эффективность работы агента.
Работу мультиагентной системы будем представлять как итерационный процесс, при этом оценку эффективности работы агента на j-м шаге W j будет выражать кортеж:
W j = {Ui j, Vi j, Zi j, Si j}, i = 1, ..., n, j = 1, ..., k,
где Ui j – успех i-го агента на j-м шаге поиска;
Vi j – достигнутый результат i-го агента;
Zi j – затраты агента на поиск;
Si j – перспектива дальнейшего участия агента в поиске;
n – количество агентов;
k – количество шагов поиска.
Агент-координатор оптимизирует глобальную функцию цели G, тогда как локальную цель Gij пытается достичь агент-исполнитель на каждой из j-х подсистем i-го уровня. Опишем цель Gij наборами, состоящими из параметров:
Gопт = extr (F(Gij)), Gij =F(C, S, R, Y, F(S,Y)),
причем:
F(S,Y)→ R, F(Х,Y),
где: S – множество средств для достижения глобальной цели C алгоритма подсистемы мультиагентной системы; R – множество полученных результатов на уровне подсистемы; Y – множество состояний внешней среды; X – множество внутренних параметров системы; F (S,Y) – оператор связи средств и состояний внешней среды.
Представим достигнутый результат i-го агента на j-м шаге поиска оптимума n-мерной функции Q (X) = (x1, x2, ..., xn) как:
Vi j = extr (Qi j(X)),
т.е. достигнутое экстремальное значение на данном шаге.
Достигнутый успех для i-го агента определяется как:
Ui j = |Qi j-1(X) - Qi j(X)|,
а затраты на поиск Zi j могут определяться в единицах времени или в условных единицах.
Перспектива дальнейшего участия i-го агента в поиске будет прямо пропорциональна Ui j и обратно пропорциональна Zi j .
Для создания мультиагентной системы, реализующей интеллектуальные методы, требуются разнообразные агенты: агенты-менеджеры, агенты-механизмы, агенты-координаторы, поисковые агенты, обучающиеся агенты, принимающие решения.
Для создания сообществ агентов необходимо определить:
– структуры представления информации;
– стратегии поиска из альтернативных решений (разрешение конфликтов);
– модель коллективного поведения агентов.
3. Описание общей архитектуры комплекса систем управления городом
Однако для решения всего комплекса городских задач одной мультиагентной системы будет недостаточно. Ввиду большого количества объектов управления и разрозненности сфер, в которых они находятся проектирование общей мультиагентной системы управления городом является не целесообразным. Предлагается её декомпозиция на комплекс систем, решающих частные задачи городского регулирования, который впоследствии может быть объединён в единую структуру посредством организации миграции данных между компонентами. Пример архитектуры такого комплекса приведён на рисунке 2.

Рисунок 2 - Архитектура комплекса мультиагентных систем управления городом
4. Функционирование локальной мультиагентной системы
Далее рассмотрен процесс работы локальной мультиагентной системы (рисунок 3).

Рисунок 3 - Концептуальная схема мультиагентной системы
Так же в схеме присутствует координирующий агент, призванный оценить вклад каждого агента в работу системы и задать уровень его влияния на итоговый результат. Процедура достижения глобальной цели G агента-координатора является основой при разработке мультиагентной системы и может строиться на основе одной из моделей коллективного поведения агентов. Причем такая модель кооперации строится с учетом используемых архитектур агентов.
При разработке модели коллективного поведения агентов для решения конкретной задачи строится на основе:
– теории коллективного поведения независимых автоматов;
– теории игр;
– распределенного искусственного интеллекта;
– законов функционирования биологических систем;
– экономических закономерностей;
– социальных законов.
Наиболее простой в реализации является модель аукциона , которая не предполагает процесс анализа состояний внешней среды, а агенты двух типов взаимодействуют друг с другом (торговля) для достижения локальных целей (покупка/продажа товара), при этом достигнутый результат на определенном шаге является конечным (сделка). Такие связи между компонентами системы на рисунке 3 представлены стрелками.
Агент-координатор производит последовательный опрос сначала со стороны покупателей, а затем со стороны продавцов на предмет заключения сделки. Если цена оказывается подходящей, то сделка совершается.
Внешней средой выступает конъюнктура рынка, которая динамично изменяется в зависимости от наличия успешных сделок, времени торговли, трендов и т.п.
В качестве ограничений выступают: время и ресурсы, а цели – продажа товаров по максимальной цене и покупка по минимальной.
Такой вид координации подходит для моделирования работы на уровне магазинов, предприятий (в задачах распределения работ среди персонала) и т.п. Для задач такого вида подходят агенты первого и второго типов. В представлен пример системы контроля производственных ресурсов, реализованный на основе мультиагентного подхода, среди других работ данных авторов имеется описания применения подобных решений и для других сфер управления. А в рассматривается проблема перемещения морских судов.
Для организации агентов в более сложных задачах, например, систем принятия решений для оценки деятельности предприятия с участием экспертов, необходимо уже использование методов: анализа иерархий, попарного сравнения альтернатив с целью их ранжирования, согласования оценок экспертов, так как процесс в данном случае является многокритериальным и многостадийным. Усложняется работа и агента-координатора в связи с тем, что необходимо управлять разнородными агентами, решающими разные задачи и на разных стадиях. Помимо агентов-исполнителей, в этом случае будут присутствовать: агенты-координаторы, агенты-эксперты и управляющий агент. Отметим, что в данной задаче процесс принятия решений в динамике будет развиваться, не исходя из изменений внешней среды, а в зависимости от готовности данных, достаточных для перехода на следующую стадию алгоритма.
5. Заключение
Применение мультиагентных систем в процессе городского управления призвано повысить эффективность работы государственных органов посредством выработки оптимальных решений, полученных в ходе кооперации агентов. Агент вырабатывает решения, исходя из свойств среды, т.е. адаптивен, что позволяет системе быстро реагировать на любые изменения и принимать решения и учётом заданных оператором ограничений. Текущие системы городского управления направлены как правило на сбор, хранение и обработку данных, описывающих объекты управления, а предлагаемое решение направлено на поддержку принятия решений в данной области. Такой подход при этом является достаточно универсальным и может использоваться для решения частных утилитарных задач, таких как, например, управление дорожным трафиком или прогнозирование пассажиропотока .
Разработанный профиль может служить базисом для подсистем мультиагентной системы управления разными видами ресурсов города. Это позволяет достичь унификации и взаимозаменяемости агентов при разработке разноплановых систем управления. В дальнейших работах авторы предполагают подробно изложить процесс разработки подобных систем как со стороны проектирования архитектуры, так и со стороны подготовки математического аппарата и программной реализации.