• 论文 • 上一篇    

离散时间大种群随机多智能体系统的线性二次分散动态博弈

马翠芹, 李韬, 张纪峰   

  1. 中国科学院数学与系统科学研究院, 北京 100080
  • 收稿日期:2007-04-29 修回日期:1900-01-01 出版日期:2007-06-25 发布日期:2007-06-25

马翠芹;李韬;张纪峰. 离散时间大种群随机多智能体系统的线性二次分散动态博弈[J]. 系统科学与数学, 2007, 27(3): 464-480.

Ma Cuiqin;Li Tao;Zhang Jifeng. Linear Quadratic Decentralized Dynamic Games for Large PopulationDiscrete-Time Stochastic Multi-Agent Systems[J]. Journal of Systems Science and Mathematical Sciences, 2007, 27(3): 464-480.

Linear Quadratic Decentralized Dynamic Games for Large PopulationDiscrete-Time Stochastic Multi-Agent Systems

Ma Cuiqin, Li Tao, Zhang Jifeng   

  1. Academy of Mathematics and Systems Science, Chinese Academy of Sciences, Beijing 100080
  • Received:2007-04-29 Revised:1900-01-01 Online:2007-06-25 Published:2007-06-25
研究具有耦合二次型随机性能指标的离散时间大种群随机多智能体系统的分散博弈问题.系统所受的噪声干扰为条件二阶矩有界的鞅差序列,比以往研究所考虑的高斯白噪声情形更具有广泛性.采用状态聚集方法构造了对种群状态平均的估计,基于Nash必然等价原理设计了分散控制律,并利用概率极限理论分析了闭环系统的稳定性和最优性.主要结果包括:(1)证明了对种群状态的平均的估计在某种范数意义下的强一致性,即种群状态的平均与其估计值之间的误差在该范数意义下将随系统个体数$N$的增加几乎必然收敛于0;\q (2)证明了闭环系统的几乎必然一致稳定性,即系统的稳定性与种群个体数$N$无关;(3)证明了所设计的分散控制律是几乎必然渐近Nash均衡策略.
In this paper, decentralized games of discrete-time large population stochastic multi-agent systems are considered under a coupled quadratic performance index. Based on the state aggregation method, the estimate of the population state average is constructed, with which and the Nash certainty equivalence principle, the decentralized control law is designed. By the probability limit theory, the stability and optimality of closed-loop system is analyzed. The main results
are: (1) The estimate of the PSA is shown to be strongly consistent in some norm sense, which implies that the estimation error is convergent to zero almost surely as the number of agents increases to infinity. (2) The closed-loop system is almost surely uniformly stable, in other words, the stability is independent of the number of system agents. (3) The decentralized control law is an almost surely asymptotic Nash equilibrium strategy.

MR(2010)主题分类: 

()
[1] 赵兰浩, 纪志坚. 符号网络条件下扩散耦合多智能体系统的可控性分析[J]. 系统科学与数学, 2021, 41(6): 1455-1466.
[2] 李珂, 慕小武. 半马氏切换拓扑下随机非线性多智能体系统的$H_{\infty}$包含控制问题研究[J]. 系统科学与数学, 2021, 41(6): 1467-1480.
[3] 陈振杰, 傅勤, 郁鹏飞, 张丹. 一类四阶抛物型偏微分多智能体系统的协调控制[J]. 系统科学与数学, 2021, 41(4): 898-912.
[4] 晋守博,李耀红,魏章志.  基于大通讯时滞的多智能体系统的控制协议研究[J]. 系统科学与数学, 2020, 40(9): 1531-1538.
[5] 张金凤,纪志坚,渠继军. 基于自同构和领导者对称的多智能体系统能控性[J]. 系统科学与数学, 2020, 40(4): 565-577.
[6] 唐益萍,傅勤,王雪松. 基于迭代学习的正则非线性多智能体系统的跟踪控制[J]. 系统科学与数学, 2019, 39(8): 1171-1183.
[7] 张晓丹,刘开恩,纪志坚. 具有时变时滞多智能体系统二分一致性[J]. 系统科学与数学, 2018, 38(8): 841-851.
[8] 郭少岩,莫立坡,尹升鹏. 持续干扰下马尔科夫切换多智能体系统的均方一致性[J]. 系统科学与数学, 2017, 37(6): 1427-1438.
[9] 何英高,王翔宇. 基于二部图的多智能体系统加权分组一致性[J]. 系统科学与数学, 2017, 37(4): 1010-1020.
[10] 王平,贾英民. 具有有界输入领航者的二阶非线性多智能体系统的协调跟踪[J]. 系统科学与数学, 2016, 36(9): 1376-1387.
[11] 李健,沈艳军,刘允刚. 线性多智能体系统一致性的自适应动态规划求解方法[J]. 系统科学与数学, 2016, 36(7): 1016-1030.
[12] 张婷,李俊民. 基于${\it\Sigma}\Delta$量化的多智能体系统的量化一致性[J]. 系统科学与数学, 2016, 36(5): 617-632.
[13] 王龙,杜金铭. 多智能体协调控制的演化博弈方法[J]. 系统科学与数学, 2016, 36(3): 302-318.
[14] 崔玉龙,高利新,陈文海,郑海鹰. 离散时间下广义多智能体系统基于观测器的分布式一致协议[J]. 系统科学与数学, 2016, 36(3): 437-452.
[15] 李宗刚,张通州,谢广明. 一类异构线性多智能体系统最优输出跟踪的分析与控制[J]. 系统科学与数学, 2015, 35(7): 766-778.
阅读次数
全文


摘要