1995 年,Vicsek 等人从统计力学的角度提出了一个离散时间模型,堪称“经典”,也就是多智能体最早期的模型“Vicker”。他们在观察细菌群落的生长情况时,发现倘若在不利于自身生存的情况下,细菌之间必须有一种协作行为。于是在此基础上,他们进行了深入探索,发现每个粒子的运动状态是通过一种基于自身状态的局部规则实现实时更新自身的运动方向,最终所有粒子朝同一方向运动[6]:
其中, 表示t时刻智能体i的方向, 表示邻居集合, 表示邻居数量, 表示噪音。邻居是指与该智能体的距离小于某一常数值r的智能体。由于在实验中,粒子的绝对速度取值范围只是理论数据,缺乏严谨的理论证明,于是在2003年,Jadbabaie等人首次对“Vicsek”模型进行了理论分析并建立了模型,该模型忽略了噪声干扰[7],即 87421
研究者运用代数知识将智能体之间的通信关系建模生成无向图,之后利用矩阵方面的知识分析了该系统之间的通信拓扑是连通的,所以所有的智能体最终的运动方向都会趋于一致。除此之外,他们还提出了一个新的概念:领导者。所谓领导者,其实就是以一固定速度运动的智能体,围绕在它周围的“邻居”会按照以下规则来改变自身的运动方向:
在t时刻,如果满足该领导者i为跟随者的“邻居”这一条件,那么 =1。同样的,如果系统的图是连通的,那么系统中所有智能体最终运动状态都会趋于一致[8]。文献[9]中作者对“Vicsek”模型进行了深入的研究,从而得出了系统的一致性行为是与该系统初始状态有关,同样,与最初的参数设置也有很大的关系。文献[10]在研究“Vicsek”模型时证明了这样一个结论:若粒子的个数n趋向于无穷大,那么对个体而言,它的速度和通信范围就会减小,最终粒子实现高度同步。
2004年,Saber和Murray[11]提出了一个解决多智能体一致性问题的基本框架,具有开创性意义。在该系统中,研究者提出了一个经典的连续时间线性一致性协议: (1-4)
以及在时延不变情况下的一致性协议:
其中, (t)表示在t时刻,节点j传递给节点i的信息加权因子,是一个非负实数。Saber和Murray考虑的时延是不变的,然而,在实际情况中,时延一般都是变化的。于是在文献[12]中Ren和Beard给出了时变时延情况下的一致性协议:
由于在一般情况下,智能体在接收信息时才会有时延,于是在文献[13]中Moreau提出了另外一种带时延的协议,即:
在实际系统设计时,我们需要兼顾智能体的位置和速度状态,这就对一致性协议提出了新的要求。随后Ren提出了一个二阶的一致性协议,解决了这一难题,即: (1-8)
当然,以上有些都是比较早期的研究,研究的内容可能不够全面。在文献[14]中作者成功解决了系统跟踪协调一致的问题,并针对一阶线性系统给出了几种适当的分布式算法。针对多智能体离散时间系统,文献[15]提出了使系统实现一致性的充分条件。作者在文献[16中研究了有限时间跟踪控制问题,得出这样一个结论:大多数的领导跟随智能体系统都研究渐进一致性问题,然而与渐进一致性控制器相比,有限时间控制器往往有更好的效果。文献[17]主要研究了具有随机通信时延时系统一致性问题,并设计了相对有效的一致性算法。文献[18]针对非线性多智能体系统,致力于研究具有更好的控制效果的分布式一致性算法,成果显著。文献[19]针对分布式下重复运行的多智能体系统,提出对系统输入和初始状态迭代学习的一致性算法,并通过仿真验证了结果的有效性。文献[20]建立在动态网络一致性的基础上,主要研究分布式模式下多智能体的队形保持和跟踪控制,并提出了一种多智能体动态控制律的算法。