Оптимизация стратегий поведения в имитационной модели многоагентной социально-экономической системы
Оптимизация стратегий поведения в имитационной модели многоагентной социально-экономической системы
Аннотация
Код статьи
S042473880027006-5-1
Тип публикации
Статья
Статус публикации
Опубликовано
Авторы
Акопов Андраник Сумбатович 
Должность: главный научный сотрудник
Аффилиация: ЦЭМИ РАН
Адрес: Москва, РФ
Бекларян Армен Левонович
Аффилиация: Национальный исследовательский университет «Высшая школа экономики»
Адрес: Российская Федерация, Москва
Выпуск
Страницы
117-131
Аннотация

В статье представлена новая имитационная модель многоагентной социально-экономической системы (МСЭС), в которой реализуются индивидуальные, в том числе межпродуктовые, взаимодействия. В рамках МСЭС изучаются модели поведения агентов-производителей и агентов-потребителей со своими целевыми функционалами. В частности, производители реализуют собственную производственную стратегию посредством выбора моментов времени для ввода новых основных фондов и трудовых ресурсов. Потребители участвуют в бартерных и монетарных сделках, взаимодействуя с другими агентами. Состояния готовности агентов-производителей вводить новые основные фонды и трудовые ресурсы, а также состояния готовности агентов-потребителей заключать бартерные и монетарные сделки задаются для каждого момента времени с помощью логнормальных распределений с заданными характеристиками, являющимися управляющими параметрами системы. Сформулированы важные двухкритериальные оптимизационные задачи для ансамблей агентов-производителей и агентов-потребителей. Разработан новый параллельный гибридный генетический алгоритм (MORCGA-MOPSO), обеспечивающий, в частности, возможность поиска оптимальных по Парето решений для задач максимизации средней (по ансамблю агентов) прибыли и общего числа покупателей продукции агентов-производителей, а также максимизации средней полезности и денежных накоплений агентов-потребителей. Вычислены параметры логнормальных распределений, определяющих состояния взаимодействующих агентов, принимающих индивидуальные решения. Выявлены особенности стратегий поведения производителей и потребителей, позволяющие достигать улучшения значений целевых функционалов за счет управления динамикой ввода производственных ресурсов и выбора предпочтительных типов межпродуктовых взаимодействий, в частности бартерных, монетарных и др.

 

Ключевые слова
многоагентная социально-экономическая система, межпродуктовые взаимодействия, имитационное моделирование экономических процессов, генетические алгоритмы, метод роя частиц, многокритериальная оптимизация
Источник финансирования
Исследование выполнено при финансовой поддержке Российского научного фонда (проект № 23–21–00012).
Классификатор
Получено
06.08.2023
Дата публикации
19.09.2023
Всего подписок
13
Всего просмотров
235
Оценка читателей
0.0 (0 голосов)
Цитировать   Скачать pdf
1 ВВЕДЕНИЕ
2 Первая экономико-математическая балансовая модель, характеризующая межотраслевые производственные взаимосвязи в экономике, была разработана В.В. Леонтьевым ( Леонтьев , 1925, 1936). Модель межотраслевого баланса (МОБ) описывает соотношения между выпуском продукции в одной отрасли и использованием продукции других отраслей экономики для технологического обеспечения этого выпуска. В дальнейшем в СССР были разработаны динамические модели межотраслевого баланса (МОБ) (Шатилов, 1967; Аганбегян, Вальтух, 1974), с использованием которых можно изучать взаимовлияние динамики конечного спроса и характеристик производителей (основных фондов, трудовых ресурсов и т.д.), в том числе с учетом влияния рыночных факторов на плановую социально-экономическую систему (Ведута, 1999).
3 В настоящее время актуально построение агент-ориентированных имитационных моделей (АОМ) (Makarov, Bakhtizin, Epstein, 2022). Методы АОМ применятся для изучения поведения взаимодействующих агентов с индивидуальными системами принятия решений, (например, для исследования популяционной динамики мигрантов и коренных жителей (Макаров и др., 2019, 2020, 2022), изучения эффектов сегрегации и десегрегации населения в моделях ограниченного соседства (Акопов, Бекларян Л., Бекларян А., 2021), оптимизации характеристик интеллектуальных транспортных систем (Akopov, Beklaryan, Thakur, 2022) и др.). Важным преимуществом АОМ является возможность учета влияния индивидуального поведения каждого агента и процессов их взаимодействия на систему в целом, что обеспечивает существенно большую реалистичность и управляемость моделируемой системы.
4 Предпринимаются усилия по созданию агент-ориентированных МОБ (Суслов и др., 2016), в том числе с использованием оптимизационных алгоритмов для формирования сбалансированных межотраслевых и межрегиональных связей (см. оптимизационные межотраслевые межрегиональные модели (ОМММ) в (Ершов, Мельникова, Суслов, 2009).
5 Комбинированное применение АОМ и МОБ представляет собой нетривиальную задачу, так как включение в модель агентов со своими индивидуальными системами принятия решений, реализующих стохастические процессы межотраслевого и межпродуктового взаимодействия, приводит к принципиальному усложнению изучаемой системы. В этом случае традиционные методы линейного программирования и векторной оптимизации практически не применимы для поиска наилучших траекторий развития многоагентной социально-экономической системы (МСЭС). Поэтому для оптимизации характеристик крупномасштабной МСЭС целесообразно использовать эвристические методы оптимизации, в частности генетические (Holland, 1992; Akopov et al., 2019) и роевые алгоритмы (Kennedy, 1997; Xiaohui, Eberhart, 2002).
6 Актуальность развития методов моделирования и оптимизации характеристик МСЭС обусловлена прежде всего потребностью в улучшении динамики макроэкономических характеристик системы за счет оптимального управления индивидуальными стратегиями межотраслевого и межпродуктового взаимодействия. Здесь под стратегией взаимодействия понимается выбор моментов времени, обеспечивающих максимизацию интегрального выпуска и минимизацию совокупных производственных издержек со стороны агентов–предприятий различных отраслей экономики. При этом на поведение агентов-производителей и агентов-потребителей оказывают влияние множество факторов, в частности — их пространственные распределение, радиус торгового взаимодействия, вероятность заключения продуктовых сделок и др. Подобные стохастические модели, предложенные впервые в работах (Поспелов, 2018; Поспелов, Жукова, 2012), применяются, в частности, для поиска оптимальных торговых стратегий.
7 Улучшение характеристик МСЭС может быть реализовано в результате постановки и решения задач многокритериальной оптимизации для формирования и аппроксимации фронтов Парето (Lotov, Bushenkov, Kamenev, 2004; Lovot, Miettinen, 2008) с использованием предложенных эвристических алгоритмов.
8 Цель данной статьи состоит в разработке подхода к моделированию стохастических продуктовых взаимодействий между агентами-потребителями (индивидуумами) и агентами-производителями (предприятиями различных отраслей промышленности), управляющими динамикой ввода новых производственных ресурсов. Для поиска наилучших компромиссных (Парето-оптимальных) решений в подобной крупномасштабной МСЭС разработан новый двухкритериальный генетический алгоритм MORCGA-MOPSO (Multi-objective real-coded genetic algorithm aggregated with particle swarm optimization).
9 ИМИТАЦИОННАЯ МОДЕЛЬ МСЭС
10 Концепция модели
11 Рассматривается закрытая МСЭС, состоящая из территориально распределенных промышленных агентов-производителей (предприятий) и агентов-потребителей (индивидуумов), в которой в каждый момент модельного времени между каждой парой агентов, находящихся в диапазоне видимости, может быть осуществлен товарообмен или монетарная сделка (т.е. покупка продукта за деньги) для обеспечения производственного процесса и получения прибыли агентами-предприятиями либо удовлетворения потребительского спроса со стороны домохозяйств.
12 Производственные возможности предприятий зависят от числа задействованных в них работников и динамики основных фондов, определяемой интенсивностью инвестиционных вложений. Для расчета объемов выпускаемой предприятиями продукции в натуральном выражении используются производственные функции Кобба–Дугласа с заданными параметрами. Для упрощения модели будем считать, что каждое предприятие имеет однозначную отраслевую классификацию и выпускает только один тип продукта (например, нефть, продукцию черной металлургии и т.д.). Темпы изменения цен на продукцию считаются эндогенными и зависят от соотношения объема продукции, имеющейся у агентов-производителей (данного продукта), и совокупного спроса на эту продукцию со стороны агентов-потребителей. Таким образом, имитируется формирование равновесных цен на локальных рынках, которые используются при расчете прибыли производителей и расходов потребителей. Аналогично, увеличение прибыли агентов-предприятий изменяет темпы роста заработной платы, что приводит к периодическому перераспределению рабочей силы между предприятиями в пределах отрасли.
13 Агенты-потребители сами ничего не производят, но участвуют в монетарных и бартерных сделках, взаимодействуя друг с другом и производителями с целью личного потребления готовой продукции. При этом потребление носит инерционный характер, т.е. в течение некоторого периода времени приобретенный или обмененный продукт сохраняется за агентом (т.е. рассматриваются потребительские товары долговременного пользования). Также, работники могут участвовать в производственных процессах агентов-производителей для получения денежных средств (формирования накоплений для будущего потребления), могут менять место работы в случае существенной асимметрии в уровнях заработной платы между предприятиями своей отрасли и при наличии свободных рабочих мест в территориальной доступности.
14 Конфигурация пространственного размещения агентов-производителей и связанных с ними индивидуумов задается централизованно (рис. 1). На нем показана ситуация потенциальной конкуренции двух агентов-предприятий (выделенных светло-серым цветом) за трудовые ресурсы (выделенных темно-серым цветом), находящихся в зоне территориальной доступности (рабочих мест) заданной размерности, а также конечных потребителей, в том числе предприятий-потребителей, находящихся в зоне торгового взаимодействия.
15

16 Рис. 1. Конфигурация пространственного размещения агентов-предприятий и связанных с ними трудовых ресурсов
17 Стратегия принятия индивидуальных решений агентов-производителей состоит в формировании оптимальных состояний (готовности) ввода новых основных фондов и трудовых ресурсов, влияющих на объемы выпуска соответствующей продукции. Стратегия для агентов-потребителей — в формировании оптимальных состояний (готовности) заключения торговых сделок для каждого момента времени.
18 В рамках изучаемой МСЭС рассматривается пара концептуально связанных двухкритериальных оптимизационных задач. В первой задаче целевыми функционалами являются средняя (по ансамблю агентов) накопленная прибыль агентов-производителей и среднее число покупателей, которые должны быть максимизированы. Во второй задаче целевые функционалы — средняя (по ансамблю агентов) полезность от потребления конечной продукции для агентов-потребителей и сформированные накопления, которые также должны быть максимизированы. Для каждой подобной задачи требуется сформировать подмножества решений оптимальных по Парето, среди которых экономические агенты могут выбрать наиболее предпочтительные субоптимальные решения. При этом необходимо учитывать ограничения на значения соответствующих целевых функций и искомых переменных. Далее приведем краткое формальное описание разработанной модели МСЭС.
19 Пусть T={t0,t1...,T} — набор моментов времени (по месяцам), T  — общее число моментов времени; t0T и tTT  — начальный и конечный моменты модели; P={p1,...,pP}  — набор индексов отраслей промышленности и выпускаемых ими продуктов (упорядоченных по уровню отраслевой схожести продуктов), где P — общее число отраслей (видов продукции); Jp={jp1,...,jpJp},    pP — набор индексов агентов-производителей (предприятий отраслей промышленности), где Jp — общее число агентов-производителей в отрасли промышленности p ; I={i1,...,iI} — набор индексов агентов-потребителей (домохозяйств), где I — общее число агентов-потребителей.
20 Модель поведения агентов-производителей
21 Агенты-производители реализуют собственную производственную стратегию посредством выбора моментов времени для ввода новых основных фондов и трудовых ресурсов. Подобный подход впервые предложен в работах, посвященных изучению динамических МОБ (Шатилов, 1967; Аганбегян, Вальтух, 1974).
22 Основные фонды агента-производителя jp , зависящие от интенсивности инвестиций в момент tk (tkT), равны
23 Kjp(tk)=Kjp(tk-1)+ajp(tk)ΔKp(tk), (1)
24 где ΔKp(tk),    jpJp,    pP — заданный темп ввода новых основных фондов агента-производителя jp в момент tk (tkT) ; ajp(tk){0,1},    jpJp,    pP  — состояние готовности агента-производителя jp (jpJp,    pP) к вводу новых основных фондов в момент tk (tkT) .
25 Количество трудовых ресурсов (из числа агентов-потребителей), задействованных агентом-производителем jp в момент tk (tkT), равно
26 Ljp(tk)=Ljp(tk-1)+cjp(tk)ΔLjp(tk), (2)
27 где ΔLjp(tk),jpJp,pP  — темп формирования новых рабочих мест, занятых агентами-потребителями, входящими в зону территориальной доступности соответствующего агента-производителя в момент tk (tkT) ; cjp(tk){0,1},jpJp,pP  — состояние готовности агента-производителя jp (jpJp,pP) к вводу новых основных фондов и трудовых ресурсов в момент tk (tkT) .
28 Состояния готовности агента-производителя jp (jpJp,pP) к вводу новых основных фондов и трудовых ресурсов задаются для каждого момента времени tk с помощью логнормальных распределений с заданными характеристиками:
29 ajp(tk)=lnN(μa,σa2)/lnN(μa,σa2),    еслиlnN(μa,σa2)>0,0,еслиlnN(μa,σa2)=0, (3)
30 сjp(tk)=lnN(μс,σс2)/lnN(μс,σс2),еслиlnN(μс,σс2)>0,0,еслиlnN(μс,σс2)=0, (4)
31 где {lnN(μa,σa2),lnN(μc,σc2)}  — случайные величины, имеющие логнормальные распределения с параметрами {μa,σa2,μc,σc2} .
32 Объем продукции, выпускаемой производителем jp в отрасли p , вычисляемый с использованием производственной функции Кобба–Дугласа в момент tk, равен
33 v^jp(tk)=ApKjpγp(tk)Ljp1-γp(tk), (5)
34 где Ap , γp  — параметры производственной функции в отрасли p . Производственные расходы производителя jp в момент tk
35 z~jp(tk)=pPπp(tk)gpjpv^jp(tk), (6)
36 где gpjp[0,1],pP,jpJp — коэффициент прямых затрат, характеризующий количество продукции отрасли p , которое расходуется при производстве одной единицы продукции производителя jp .
37 Уровень заработной платы, выплачиваемой агентом-производителем jp , зависящий от темпов роста прибыли в момент tk :
38 wjp(tk)=wjp(tk-1)r~jp(tk-1)/r~jp(tk-2). (7)
39 Стоимость единицы продукции в отрасли p (зависит от соотношения объемов продукции, имеющихся у продавцов, и спроса со стороны покупателей) в момент tk может быть определена как
40 πp(tk)=πp(tk-1)jp=1Jpv^jp(tk)/i=1I+Jpv^di(tk), (8)
41 где v^di(tk),diP,iJbI  — количество продукта di , востребованного агентами i (спрос со стороны предприятий и домохозяйств) в момент tk .
42 Валовая прибыль агента-производителя jp в момент tk :
43 r~jp(tk)=πp(tk)v~jp(tk)-z~jp(tk)-Ljp(tk)wjp(tk), (9)
44 где v~jp(tk),jpJp,pP,tkT  — объем продукции, реализованной агентом-производителем jp в результате монетарных сделок в момент tk .
45 Средняя прибыль агентов-производителей равна
46 R=1Jptk=0Tjp=1Jpr~jp(tk). (10)
47 Среднее число покупателей продукции агентов-производителей —
48 С=1Jptk=0Tjp=1JpiI+Jpn~ijp(tk), (11)
49 Где
50 n~ijp(tk)=1,еслиv~ijp(tk)>0,0,еслиv~ijp(tk)=0.
51 Здесь v~ijp(tk)  — объем продукции, проданной или переданной по бартеру агенту i (iIJp,pP) агентом-производителем jp (jpJp,pP) в момент tk .
52 Тогда можно сформулировать первую задачу формирования оптимальных стратегий поведения агентов-производителей в следующем виде.
53 Задача A. Требуется максимизировать среднюю прибыль и среднее число покупателей для ансамбля агентов-производителей по набору управляющих параметров, определяющих состояния агентов {μa,σa2,μc,σc2}
54 max{μa,σa2,μc,σc2}R;max{μa,σa2,μc,σc2}C (12)
55 при ограничениях R_RR- , C_CC- , μa,μc[-1,1] , σa2,σc2(0,1], где U_,N_ , U-,N-  — нижние и верхние граничные значения целевых функций агентов-потребителей.
56 В рамках предложенного подхода для ансамбля агентов-производителей могут быть выбраны и другие целевые функционалы, например объем выпуска (5), производственные расходы (6) и др.
57 Модель поведения агентов-потребителей
58 Агенты-потребители участвуют в бартерных и монетарных сделках, взаимодействуя с другими агентами-потребителями и агентами-производителями. Подобный подход впервые был предложен для построения и изучения моделей случайных продаж (Kiyotaki, Wright, 1989; Поспелов, Жукова, 2012; Akopov et al., 2023).
59 В такой системе расстояние между продуктом pi~(tk) (pi~(tk)P) , имеющимся у продавца i~, и продуктом di^(tk) (di^(tk)P), который необходим агенту-потребителю i^ , измеренное по длине дуги числовой окружности с равномерно распределенными числами 1,  ...,  P в момент tk :
60 δi~i^(tk)=P-1-1minpi~(tk)-di^(tk),    P-pi~(tk)-di^(tk). (13)
61 Здесь pi~(tk)P,    i~JpI,    pP — индекс продукта, имеющегося у агента-продавца i~ в момент tk ; di^(tk)P,    i^I — индекс продукта, который необходим агенту-потребителю i в момент tk .
62 Оценка уровня соответствия продукта продавца i~ (i~JpI,    pP) интересам агента-потребителя i^ (i^I) в момент tk может быть задана как:
63 βi~i^(tk)=1,еслиδi~i^(tk)α,0,еслиδi~i^(tk)>α, (14)
64 где α0 — коэффициент контрактности (т.е. порогового соответствия) продукта агента-продавца интересам агента-покупателя. Поскольку α0,1, этот коэффициент может интерпретироваться как вероятность сделки.
65 Состояния готовности агента-потребителя i к заключению бартерных и монетарных сделок задаются для каждого момента времени tk с помощью логнормальных распределений с заданными характеристиками:
66 bi(tk)=lnN(μb,σb2)/lnN(μb,σb2),еслиlnN(μb,σb2)>0;0,еслиlnN(μb,σb2)=0, (15)
67 mi(tk)=lnN(μm,σm2)/lnN(μm,σm2),еслиlnN(μm,σm2)>0;0,еслиlnN(μb,σb2)=0, (16)
68 где {lnN(μb,σb2),lnN(μm,σm2)}  — случайные величины, имеющие логнормальные распределения с параметрами {μb,σb2,μm,σm2} .
69 В каждый момент tk между агентом i~ (i~JpI,    pP) и агентом-потребителем i^ может осуществляться монетарная или бартерная сделка, результатом которой является симметричное изменение количества денежных средств при монетарном взаимодействии:
70 qi~(tk)=qi~(tk-1)+πp(tk),есливыполняетсяI;qi~(tk-1),есливыполняетсяIII, (17)
71 qi^(tk)=qi^(tk-1)-πp(tk),есливыполняетсяI;qi^(tk-1),есливыполняетсяIII,    - (18)
72 и продуктов у агентов при монетарном или бартерном взаимодействии:
73 vpi~(tk)=vpi~(tk-1)-1,есливыполняетсяIилиII;vpi~(tk-1),есливыполняетсяIII, (19)
74 vpi^(tk)=vpi^(tk-1)+1,есливыполняетсяIилиII;vpi^(tk-1),есливыполняетсяIII, (20)
75 Где
76 I: πi~(tk-1)=0&πi^(tk-1)>0&βi~i^(tk)=1&mi~(tk)mi^(tk)=1 и агенты расположены в пределах зоны торгового взаимодействия, что означает отсутствие денег у продавца, наличие денег у покупателя, наличие продукта у продавца, пороговое соответствие продукта агента-продавца интересу агента-покупателя и обоюдная готовность агентов к монетарным сделкам;
77 II: πi~(tk-1)=0&πi^(tk-1)=0&βi~i^(tk)=1&bi~(tk)bi^(tk)=1 и агенты расположены в пределах зоны торгового взаимодействия, что означает отсутствие денег у продавца и покупателя, пороговое соответствие продукта агента-продавца интересу агента-покупателя и обоюдная готовность агентов к бартерным сделкам;
78 III: πi~(tk-1)>0&πi^(tk-1)>0, или {πi~(tk-1)=0  &πi^(tk-1)>0  & pi~(tk)=di^(tk)&mi~(tk)mi^(tk)=0}, или {πi~(tk-1)=0&πi^(tk-1)=0&pi~(tk)=di^(tk)&bi~(tk)bi^(tk)=0), или βi~i^(tk)=0, или агенты не расположены в зоне торгового взаимодействия, что означает встречу двух агентов с деньгами, или неготовность агентов к сделке, или пороговое несоответствие продукта агента-продавца интересу агента-покупателя.
79 Прирост денежных средств у агентов-потребителей также обеспечивается получением заработной платы от агентов-производителей в случае занятости.
80 Средняя полезность для агентов-потребителей может быть определена как
81 U=1Itk=0Ti=1Iβi~i^(tk)(δi~i^(tk)+1)-ν-λr,    i{i~:i^I,βi~i^(tk)=1}; (21)
82 средние денежные накопления агентов-потребителей —
83 N=1Itk=0Ti=1Iqi(tk). (22)
84 Здесь r[1,r-]  — радиус торгового взаимодействия, т.е. диапазон ячеек дискретного пространства размещения агентов, считающихся соседними, r-  — максимально допустимое расстояние между взаимодействующими агентами; {v,λ}  — коэффициенты, определяющие влияние издержек расстояния между целевым и приобретаемым продуктом, а также между покупателем и продавцом соответственно.
85 Тогда можно сформулировать вторую задачу формирования оптимальных стратегий поведения агентов-потребителей в следующем виде.
86 Задача B. Требуется максимизировать среднюю полезностью от потребления и средние денежные накопления для ансамбля агентов-потребителей по наборам управляющих параметров, определяющих состояния агентов {μb,σb2,μm,σm2}
87 max{μb,σb2,μm,σm2}U;max{μb,σb2,μm,σm2}N (23)
88 при ограничениях: U_UU- , N_NN- , μb,μm[-1,1] , σb2,σm2(0,1] . Здесь, U_,N_ , U-,N-  — нижние и верхние граничные значения целевых функций агентов-потребителей.
89 ГЕНЕТИЧЕСКИЙ ОПТИМИЗАЦИОННЫЙ АЛГОРИТМ
90 Алгоритм MORCGA-MOPSO
91 Далее, был разработан генетический оптимизационный алгоритм (MORCGA-MOPSO), агрегированный по целевым функционалам с предложенной МСЭС (рис. 2), реализованными с использованием FLAME GPU (Richmond et al., 2010). Особенностью MORCGA-MOPSO является применение методов машинного обучения, в частности искусственных нейронных сетей (ИНС), для аппроксимации фитнес-функции, компоненты которой (т.е. целевые функционалы) вычисляются в результате имитационного моделирования. Подобный подход позволяет существенно сократить временные затраты, обусловленные необходимостью множественных пересчетов агентной модели для каждого варианта потенциальных решений (Jin, 2005).
92

93 Рис. 2. Блок-схема генетического алгоритма (MORCGA-MOPSO) ( t={t0,...,T} — набор итераций MORCGA-MOPSO, T  — общее число итераций, t0T , tTT  — начальный и конечный моменты MORCGA-MOPSO; w  — частота чередования использования алгоритмов MORCGA и MOPSO и взаимного обновления полученными недоминируемыми решениями в рамках единой процедуры эволюционного поиска)
94 Важным отличием MORCGA-MOPSO (см. рис. 2) от других известных алгоритмов многокритериальной оптимизации (например, SPEA (Zitzler, Thiele, 1999), SPEA2 (Zitzler, Laumanns, Thiele, 2001), NSGA-II (Deb et al., 2002a) MOPSO (Xiaohui, Eberhart, 2002) и FCGA (Akopov et al., 2022)) является комбинирование различных эвристических методов в рамках единой процедуры эволюционного поиска Парето-оптимальных решений. В частности, выполнена интеграция многокритериального генетического алгоритма вещественного кодирования MORCGA (multi-objective real-coded genetic algorithm) и многокритериального роевого алгоритма MOPSO (multi-objective particle swarm optimization). В результате обеспечивается существенно большее быстродействие вычислительной процедуры при сохранении достаточно высокого качества получаемых решений (в сравнении с автономным использованием генетических и роевых алгоритмов).
95 Результаты тестирования и верификации MORCGA-MOPSO
96 Для апробации и верификации разработанного алгоритма MORCGA-MOPSO были привлечены известные тестовые функции (табл. 1).
97 Таблица 1. Тестовые функции для RCGA-PSO
98
Тестовая функция Постановка задачи (минимизируемые целевые функции) Диапазоны поиска решений
FT1 — функция Бина – Корна (Binh, Korn, 1997) f1=4x2+4y2f2=(x-5)2+(y-5)2 при условии g1=(x-5)2+y225;g2=(x-8)2+(y+3)27,7 0x5; 0y3
FT2 — функция Фонсеки–Флеминга (Fonseca, Fleming, 1995) f1=1-exp-j=1nxj-n-1/22;f2=1-exp-j=1nxj+n-1/22 -4xj4 , 1jn
FT3 — функция Курсаве (Kursawe, 1991) f1=j=12-10exp-0,2xj2+xj+12;f2=j=13xj0,8+5xj3 -5xj5 , 1j3
FT4 — функция Полони 2 для задач двухкритериальной оптимизации (Po-loni, et al., 2000) f1=1+A1-B12+A2-B22;f2=(x+3)2+(y+1)2 где A1=0,5sin1-2cos1+sin2-1,5cos2;A2=1,5sin1-cos1+2sin2-0,5cos2;B1=0,5sinx-2cosx+siny-1,5cosy;B2=1,5sinx-cosx+2siny-0,5cosy -πxπ-πyπ
FT5 — функция Зистера–Дьеба–Тери N.3 (Deb, et al., 2002b) f1=x1;f2=gh, где g=1+929j=230xj;h=1-f1/g-f1/gsin(10πf1) 0xj1 , 1j30
FT6 — функция Зистера–Дьеба–Тери N.4 (Deb, et al., 2002b) f1=x1;f2=gh, где g=91+j=210xj2-10cos(4πxj);h=1-f1/g 0x11 , -5xj5 , 2j10
99 Затем была выполнена оценка производительности алгоритма MORCGA-MOPSO в сравнении с другими известными параллельными алгоритмами многокритериальной оптимизации, также реализованными с использованием FLAME GPU по наиболее важным критериям:
100 LHV — максимизируемый показатель, характеризующий логарифмический гиперообъем, определяющий суммарную площадь пространства, покрываемого фронтом Парето;
101 IGD — максимизируемая метрика, характеризующая расстояние между фронтом Парето, полученным с помощью эвристического алгоритма, и эталонным фронтом Парето;
102 CPF — максимизируемая мощность фронта Парето, характеризующая число найденных недоминируемых решений, принадлежащих фронту Парето (при условии равномерного распределения решений по фронту Парето);
103 PT, секунд — минимизируемое время, затрачиваемое на формирование Парето-оптимальных решений;
104 CPF / PT — соотношение числа полученных недоминируемых решений к затраченному процессному времени.
105 В табл. 2 представлены средние значения показателей производительности MORCGA-MOPSO в сравнении с другими известными параллельными алгоритмами многокритериальной оптимизации. Оптимизационные эксперименты были проведены на суперкомпьютере ЦЭМИ РАН DSWS PRO (2x Intel Xeon Silver 4114, 1x NVIDIA QUADRO RTX) при использовании 100 агентов-процессов и агентов-частиц, общем числе итераций T=100 и w=5 . Таблица 2. Оценка эффективности MORCGA-MOPSO
106
Показатель эффективности MORCGA-MOPSO Алгоритмы MORCGA и PSO
SPEA SPEA2 NSGA-II FCGA MOPSO
FT1 — Функция Бина и Корна
LHV 3,841 3,824 3,829 3,840 3,843 3,807
IGD 0,0759 0,0224 0,0761 0,1323 0,2795 0,0223
CPF 1712 996 1052 2587 2760 835
PT, с 54 52 63 103 147 21
CPF/PT 31,7 19,2 16,8 25,0 18,8 39,1
FT2 — Функция Фонсеки и Флеминга
LHV –0,0014 –0,0038 –0,0034 –0,0013 –0,0019 –0,0019
IGD 0,0002 0,0004 0,0002 0,0001 0,0001 0,0009
CPF 1330 379 519 2826 2825 308
PT, с 41 27 32 165 257 21
CPF/PT 32,2 14,2 16,2 17,2 11,0 14,9
FT3 — Функция Курсаве
LHV 1,9016 1,8895 1,8923 1,8996 1,9035 1,8664
IGD 0,0439 0,0493 0,1489 0,0608 0,0618 0,1166
CPF 117 29 24 357 335 36
PT, с 31 21 14 44 45 21
CPF/PT 3,8 1,4 1,7 8,1 7,4 1,7
FT4 — Функция Полони
LHV 2,7065 2,6815 2,7055 2,6933 2,6925 2,7061
IGD 0,1606 0,2787 0,2002 0,3737 0,3362 0,1298
CPF 112 53 84 54 67 94
PT, с 25 17 18 31 35 21
CPF/PT 4,5 3,2 4,7 1,8 1,9 4,5
FT5 Функция ЗистераДьебаТери N.3
LHV 0,2021 0,2011 0,2021 0,2014 0,2021 0,2017
IGD 0,0023 0,0023 0,0023 0,0023 0,0024 0,0024
CPF 259 259 259 258 260 258
PT, с 22 17 23 35 43 11
CPF/PT 11,8 15,5 11,4 7,4 6,0 24,2
FT6 — Функция ЗистераДьебаТери N.4
LHV 0,0678 0,0561 0,0614 0,0758 0,0743 0,0630
IGD 0,0096 0,0153 0,0151 0,0111 0,0104 0,0103
CPF 1106 144 116 3588 3480 123
PT, с 37 15 13 121 185 11
CPF/PT 29,6 9,4 9,2 29,6 18,8 11,5
107 Примечание. Темно-серым цветом выделены ячейки с показателями эффективности эвристических алгоритмов, значения которых являются наилучшими для соответствующей тестовой функции (т.е. максимальными для LHV, CPF, CPF/PT и минимальными для IGD и PT).; светло-серым — показатели, значения которых можно оценить как относительно благоприятные.
108 Анализ показал, что предложенный гибридный генетический алгоритм MORCGA-MOPSO по критерию временной эффективности (PT) сопоставим c методами быстрой многокритериальной эвристической оптимизации MOPSO (Xiaohui, Eberhart, 2002) и SPEA (Zitzler, Thiele, 1999), а по мощности фронта Парето (CPF) и логарифмическому гиперобъему (LHV) — с ресурсозатратными алгоритмами NSGA-II (Deb et al., 2002) и FCGA (Akopov et al., 2022).
109 На рис. 3 представлена визуализация аппроксимируемых фронтов Парето, полученных с использованием исследуемых алгоритмов для выбранного набора тестовых функций. Результатом решения двухкритериальных задач A и B являются множества субоптимальных решений. Из них на рис. 3 приведены 8 наиболее различающихся решений (А.1–А.8 и В.1–В.8).
110

111 Рис. 3. Аппроксимируемые фронты Парето для набора тестовых функций
112 Как следует из графиков на рис. 3 и данных в табл. 2 (см. показатель IGD), алгоритм MORCGA-MOPSO обеспечивает достаточное приближение аппроксимируемых фронтов Парето к соответствующим истинным фронтам, количественные характеристики которых являются известными.
113 РЕЗУЛЬТАТЫ ОПТИМИЗАЦИОННЫХ ЭКСПЕРИМЕНТОВ
114 Далее, были проведены оптимизационные эксперименты с использованием разработанного гибридного генетического алгоритма MORCGA-MOPSO, агрегированного по целевым функционалам с предложенной имитационной моделью МСЭС. При этом были приняты следующие наиболее важные допущения.
115 Период моделирования T=12 (мес.).
116 Общее число отраслей промышленности — P=15 , отрасли характеризуются эластичностью выпуска по основным фондам γp[0.3,0.98],pP (нижняя граница соответствует «производству резиновых и пластмассовых изделий», верхняя — «производству машин и оборудования»).
117 Общее число агентов-производителей, т.е. промышленных предприятий, Jp=150 (соотношение с реальным числом предприятий 1 : 2000) и агентов-потребителей, т.е. занятых и незанятых индивидуумов, I=3000 (соотношение с реальным числом людей 1 : 5000).
118 Радиус торгового взаимодействия: r=10 (ячеек дискретного пространства).
119 Коэффициенты, определяющие влияние издержек расстояний: v=1,5 , λ=0,01 .
120 На рис. 4 показаны фронты Парето и выделены частные наиболее отличающиеся субоптимальные альтернативы, полученные в результате решения задач A и B с использованием MORCGA-MOPSO.
121

122 Рис. 4. Аппроксимируемые фронты Парето, вычисленные для задач A и B с использованием MORCGA-MOPSO
123 В табл. 3 представлены субоптимальные решения, принадлежащие фронтам Парето (см. рис. 4), вычисленным с использованием MORCGA-MOPSO для задач A и B.
124 Таблица 3. Субоптимальные решения, принадлежащие фронтам Парето
125
Субоптимальные решения для задачи A Параметры логнормальных распределений агентов-производителей Преимущественные состояния агентов
μa σa2 μc σc2 ajp(tk) сjp(tk)
Решение A.1 –0,4450 0,4620 –0,1010 0,8190 0 0
Решение A.2 –0,6500 0,0540 –0,2730 0,3440 0 0
Решение A.3 0,1530 0,6810 0,1930 0,4850 0 0
Решение A.4 0,1720 0,5360 0,2680 0,3020 0 1
Решение A.5 0,3890 0,6700 0,6480 0,6690 1 1
Решение A.6 0,6730 0,4850 0,9740 0,5540 1 1
Решение A.7 0,7250 0,4700 0,8230 0,5350 1 1
Решение A.8 0,8050 0,7740 0,9840 0,6190 1 1
Субоптимальные решения для задачи B Параметры логнормальных распределений агентов-потребителей Преимущественные состояния агентов
μb σb2 μm σm2 bi(tk) mi(tk)
Решение B.1 0,9710 0,3500 0,9520 0,0200 1 1
Решение B.2 0,9340 0,0230 0,8570 0,8240 1 1
Решение B.3 0,7850 0,3220 0,9200 0,7360 1 1
Решение B.4 0,9670 0,7690 0,8970 0,5790 1 1
Решение B.5 0,7350 0,1520 0,1170 0,9010 1 0
Решение B.6 0,1620 0,7910 0,1470 0,6610 0 0
Решение B.7 – 0,1220 0,8260 –0,1490 0,5720 0 0
Решение B.8 – 0,5510 0,2320 –0,2870 0,7650 0 0
126 Стратегия поведения агентов-производителей, направленная на максимизацию собственной прибыли (решения A.1–A.4) в основном реализуется за счет ограничения темпов ввода новых основных фондов и трудовых ресурсов (см. табл. 3). Увеличение клиентской базы, наоборот, обусловливает необходимость наращивания производственных ресурсов (решения A.5–A.8). Стратегия поведения агентов-потребителей, направленная на максимизацию средней полезности от потребления, как правило, предполагает реализацию всех типов сделок (решения B.1–B4). Максимизация денежных накоплений сопровождается отказом от монетарных сделок в пользу бартерного обмена (решения B.5–B.8).
127 ЗАКЛЮЧЕНИЕ
128 В данной работе представлен подход к имитационному моделированию продуктовых взаимодействий и оптимизации стратегий поведения экономических агентов в рамках МСЭС. Сформулированы важные двухкритериальные оптимизационные задачи для ансамблей агентов-производителей и агентов-потребителей. Разработан новый параллельный гибридный генетический алгоритм (MORCGA-MOPSO), в рамках которого реализуется комбинированное использование генетического алгоритма вещественного кодирования (класса RCGA) и метода роевой оптимизации (PSO) для достижения максимальной временной эффективности. Выполнена программная реализация разработанной имитационной модели МСЭС, агрегированной по целевым функционалам с предложенным генетическим алгоритмом в системе крупномасштабного агентного моделирования FLAME GPU.
129 Дальнейшие исследования будут направлены на детализацию МСЭС, увеличение типов и общего количества взаимодействующих экономических агентов, а также развитие методов оптимального управления их поведением с использованием генетических алгоритмов и машинного обучения.

Библиография

1. Аганбегян А.Г., Вальтух К.К. (1974). Использование народно-хозяйственных моделей в планировании. М.: Экономика. 231 с.

2. Акопов А.С., Бекларян Л.А., Бекларян А.Л. (2021). Мультисекторная модель ограничен-ного соседства: сегрегация агентов и оптимизация характеристик среды // Математи-ческое моделирование. Т. 33. № 11. C. 95–114.

3. Ведута Н.И. (1999). Социально эффективная экономика. Под общей ред. Е.Н. Ведута. Mos-cow: РЭА. 254 с.

4. Ершов Ю.С., Мельникова Л.В., Суслов В.И. (2009). Практика применения оптимизацион-ных мультирегиональных межотраслевых моделей в стратегических прогнозах россий-ской экономики // Вестник НГУ. Серия: Социально-экономические науки. Т. 9. № 4. C. 9–23.

5. Леонтьев В.В. (1925). Баланс народного хозяйства СССР. Методологический разбор работы ЦСУ // Плановое хозяйство: Ежемесячный журнал. Издание Госплана СССР. № 12. С. 254–258.

6. Макаров В.Л., Бахтизин А.Р., Бекларян Г.Л., Акопов А.С., Ровенская Е.А., Стрелков-ский Н.В. (2022). Агентное моделирование социально-экономических последствий миграции при государственном регулировании занятости // Экономика и математические методы. Т. 58. № 1. С. 113–130.

7. Макаров В.Л., Бахтизин А.Р., Бекларян Г.Л., Акопов А.С., Ровенская Е.А., Стрелков-ский Н.В. (2020). Агентное моделирование популяционной динамики двух взаимодей-ствующих сообществ: мигрантов и коренных жителей // Экономика и математические методы. Т. 56. № 2. С. 5–19.

8. Макаров В.Л., Бахтизин А.Р., Бекларян Г.Л., Акопов А.С., Ровенская Е.А., Стрелков-ский Н.В. (2019). Укрупненная агент-ориентированная имитационная модель миграционных потоков стран Европейского союза // Экономика и математические методы. Т. 55. № 1. С. 3–15.

9. Поспелов И.Г. (2018). Модель случайных продаж // Математические заметки. Т. 103. № 3. С. 445–459.

10. Поспелов И.Г., Жукова А.А. (2012). Стохастическая модель торговли неликвидным това-ром // Труды МФТИ. Т. 2. № 4. С. 131–146.

11. Суслов В.И., Доможиров Д.А., Ибрагимов Н.М., Костин В.С., Мельникова Л.В., Цыпла-ков А.А. (2016). Агент-ориентированная многорегиональная модель «затраты – вы-пуск» российской экономики // Экономика и математические методы. Т. 52. № 1. С. 112–131.

12. Шатилов Н.Ф. (1967). Моделирование расширенного воспроизводства. М.: Экономика. 173 с.

13. Akopov A.S., Beklaryan A.L., Zhukova A.A. (2023). Optimization of characteristics for a sto-chastic agent-based model of goods exchange with the use of parallel hybrid genetic algo-rithm. Cybernetics and Information Technologies, 23 (2), 87–104.

14. Akopov A.S., Beklaryan L.A., Thakur M. (2022). Improvement of maneuverability within a mul-tiagent fuzzy transportation system with the use of parallel biobjective real-coded genetic algorithm. IEEE Transactions on Intelligent Transportation Systems, 23 (8), 12648–12664.

15. Akopov A.S., Beklaryan L.A., Thakur M., Verma D.B. (2019). Parallel multi-agent real-coded genetic algorithm for large-scale black-box single-objective optimisation. Knowledge-Based Systems, 174, 103–122.

16. Binh T., Korn U. (1997). MOBES: A multiobjective evolution strategy for constrained optimiza-tion problems. In: Proceedings of the Third International Conference on Genetic Algorithms. Czech Republic, 176–182.

17. Deb K., Pratap A., Agarwal S., Meyarivan T. (2002a). A fast and elitist multiobjective genetic algorithm: NSGA-II. IEEE Transactions on Evolutionary Computation, 6 (2), 182–197.

18. Deb K., Thiele L., Laumanns M., Zitzler E. (2002b). Scalable multi-objective optimization test problems. Proceedings of the 2002 IEEE Congress on Evolutionary Computation, 1, 825–830.

19. Fonseca C.M., Fleming P.J. (1995). An overview of evolutionary algorithms in multiobjective optimization. Evolutionary Computation, 3 (1), 1–16.

20. Holland J.H. (1992). Genetic Algorithms. Scientific American, 267 (1), 66–73.

21. Jin Y. (2005). A comprehensive survey of fitness approximation in evolutionary computation. Soft Computing, (9), 3–12.

22. Kennedy J. (1997). The particle swarm: Social adaptation of knowledge. Proceedings of IEEE In-ternational Conference on Evolutionary Computation, 303–308.

23. Kiyotaki N., Wright R. (1989). On money as a medium of exchange. Journal of Political Econo-my, 97 (4), 927–954.

24. Kursawe F. (1991). A variant of evolution strategies for vector optimization. PPSN I990. Lecture Notes in Computer Science. Springer, Berlin, Heidelberg, 496, 193–197.

25. Lotov A.V., Bushenkov V.A., Kamenev G.K. (2004). Interactive decision maps. Approximation and visualization of the Pareto frontier. Boston: Kluwer Academic Publishers. 307 p.

26. Lotov A.V., Miettinen K. (2008). Visualizing the Pareto Frontier. In: Multiobjective optimization. Interactive and evolutionary approaches, lecture notes in computer science, 5252. Berlin-Heidelberg: Springer, 213–244.

27. Makarov V.L., Bakhtizin A.R., Epstein J.M. (2022). Agent-based modeling for a complex world. 2nd ed., revised. Moscow: GAUGN, Scientific publications department. 74 p.

28. Poloni G., Giurgevich A., Onesti L., Pediroda V. (2000). Hybridization of a multi-objective ge-netic algorithm, a neural network and a classical optimizer for a complex design problem in fluid dynamics. Computer Methods in Applied Mechanics and Engineering, 186 (2–4), 403–420.

29. Richmond P., Walker D., Coakley S., Romano D. (2010). High performance cellular level agent-based simulation with FLAME for the GPU. Briefings in Bioinformatics, 11 (3), 334–347.

30. Xiaohui Hu, Eberhart R. (2002). Multiobjective optimization using dynamic neighborhood par-ticle swarm optimization. Proceedings of the 2002 Congress on Evolutionary Computation. CEC'02 (Cat, 02TH8600). Honolulu, HI, USA, 1677–1681.

31. Zitzler E., Laumanns M., Thiele L. (2001). SPEA2: Improving the strength Pareto evolutionary algorithm. Swiss Federal Inst. Technol., Zürich, Switzerland, TIK-Rep. 103 p.

32. Zitzler E., Thiele L. (1999). Multiobjective evolutionary algorithms: A comparative case study and the strength Pareto approach. IEEE Transactions on Evolutionary Computation, 3 (4), 257–271.

Комментарии

Сообщения не найдены

Написать отзыв
Перевести