网络演化博弈（网络演化博弈）-趣爱秀

演化网络博弈基本定义

要讨论合作的涌现，必须涉及相当数量的个体（局中人），而且合理地认为这些局中人以及他们之间的关系构成一个复杂网络，随着时间的演化，每个局中人都在和他的邻居进行博弈，这就称为演化网络博弈，它的定义可以表述为：

（1）数量

的局中人位于一个复杂网络上。

（2）每个时间演化步，按一定法则选取的一部分局中人以一定频率匹配进行博弈。

（3）局中人采取的对策可以按一定法则更新，所有局中人的策略更新法则相同。这种法则称为“策略的策略”。然而，法则更新比博弈频率慢得多，使得局中人可以根据上一次更新对策成功与否选择、调整下一次的更新。（4）局中人可以感知环境、吸取信息，然后根据自己的经验和信念，在策略更新法则下更新策略。

（5）策略更新法则可能受到局中人所在网络拓扑结构的影响。^[1]

演化网络博弈研究内容

第一，研究网络拓扑结构对博弈演化动力学的影响。

第二，探索一些可能的支持合作行为涌现的动力学机制。

第三，研究博弈动力学和网络拓扑结构的共演化，即个体策略和网络拓扑结构协同演化的情形。^[2]

促进合作行为涌现的机制

重复博弈（争锋相对、冷酷策略）、巴普洛夫策略、亲缘选择、直接互惠、间接互惠（声誉）、网络互惠以及群选择。

公共利益博弈

演化博弈论与经典博弈论的区别

（1）策略内涵的不同：不同行为到生物系统中的不同类型物种本身，策略由物种的不同表现型来体现；

（2）均衡意义的不同：纳什均衡到演化稳定策略(ESS)；

（3）个体互相作用方式的不同（博弈个体与博弈次数）

网络上的演化博弈研究方向

(1)研究网络拓扑结构对博弈动力学演化结果的影响;

(2) 一定的网络结构下，探讨各种演化规则对演化结果的影响;

(3)网络拓扑和博弈动力学的共演化，主要是自适应网络上博弈动力学 ,即网络拓扑调整受博弈动力学影响.

网络演化博弈的策略更新规则

(1)模仿最优者：即在每轮博弈过后，个体采取其邻居中获得最高收益的个体的策略进行下一轮博弈。

(2)模仿优胜者：即个体在策略更新时，同时参考那些收益比自身高的邻居的策略，以正比于他们所得收益的概率进行策略转变。

以上两种规则可以统称为模仿策略. 模仿策略的基本思想是个体的更新策略，根据邻居中收益最高的个体策略进行模仿，以期获得更高的收益。

(3)配对比较：即个体随机选择某一邻居进行收益的比较，以某个概率(为此两个体收益差的函数)转变为对方的策略!

费米函数

每个节点(对应博弈者假设为

)随机的选取他的一个邻居节点(对应博弈者假设为

)，

以一定概率W模仿

的策略，常用的演化规则（统计力学的费米函数）

其中，

表示

的累积收益，参数

为噪音，代表了一种非理性行为的可能，一般是一个很小的值，常取0.1。当

时，表示所有的信息都被噪音淹没，策略进行完全随机的更新；当

时，表示确定的模仿规则，即当

的累积收益高于

时，

则采取

的策略。

另一类演化规则

其中，

为

与

中较大度节点的度，P,T,S,R为

收益矩阵元素。

资料

(4)随机过程方法：通常考虑Moran过程(birth一death) (或者death一birth过程) ，即在策略更新时，以正比于个体适应度(由收益来衡量)的概率产生一个新的个体，然后随机取代此个体的某个邻居。

Moran过程是将Darwin的进化思想直接引入到演化博弈中。一个实际背景是种群中的变异入侵，以下图为例，种群中所有个体“C”，当某个个体发生变异后，变为”D”，以后每一步考虑随机移去一个个体，并以正比于原种群中“C”个体适应度的概率生成一个新的“C”个体，否则生成一个新的“D”个体。在适应度函数满足一定条件时，“D”个体可能完全侵占整个种群(Invade)，

Martin A.Nowak等人研究了这类种群侵占问题，将某种策略从种群中仅存在一个变异个体时，最终能侵占整个种群的概率定义为策略的扎根概率。

死生过程是Moran过程的一个自然推广，原始网络中存在合作“C”、背叛“D”两种策略，按照连边关系个体之间进行博弈，获得一个累计收益，其中b表示合作收益，即遇到对手采取合作时获得收益；c表示合作代价，即个体采取合作获得负收益。随机选择选择一个个体死亡(假设为位于中间位置的“D”节点)，则其所有的邻居按照正比于个体适应度的概率产生一个后代，填补个体死亡后留下的空位。重复这一过程，种群中的策略将达到动态平衡。

参考资料

[1] 基于复杂网络上的演化博弈 · 超星发现[引用日期2017-12-05]

[2] 复杂网络上的演化博弈 · 超星发现[引用日期2017-12-05]

网络演化博弈