王龙课题组提出鲁棒博弈动力学与控制的理论框架

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2024年08月07日 来源：北京大学新闻网

编辑推荐：

　　研究成果以?“The evolution of social behaviors and risk preferences in settings with uncertainty”为题近期发表于《美国科学院院刊》（PNAS）上。北京大学工学院2020级博士生王国丞为第一作者，王龙、苏奇和Joshua Plotkin为通讯作者。

博弈论是用来描述理性个体如何决策的数学工具，广泛应用于经济学、物理学、控制工程、计算机科学、生物生态学等多个领域。1973年，Maynard Smith将群体动态演化的思想引入博弈论，创立了演化博弈论这一理论体系。演化博弈论是研究群体行为的涌现，多智能体的交互与学习，群体的智能决策，合作行为的演化，观点传播动力学等的有力工具。

在演化博弈论中，博弈的信息是完全的、确定的，每个个体都知道其他所有个体的收益，进而可以学习收益较高的个体的策略，形成动态演化。然而，在实际博弈交互过程中，由于不确定性以及各种干扰、摄动的存在，个体并不能精确地知道其他每个个体的收益。在演化博弈中如何应对各种不确定性以及不确定性对演化动力学有何影响目前仍然是一个尚未探索的领域。

在控制理论中，鲁棒性（robustness）是指系统抵御各种不确定性（如物理参数摄动、量测误差、未建模动态、环境变化、外部干扰等）的能力。系统稳定性和鲁棒性是保证控制系统正常运行的前提。在经济学中，对于不确定性的研究，其基本框架是由冯诺依曼和摩根斯坦等人提出的期望效用理论，用来描述完全理性的个体面对风险是如何决策的。其中每个个体具有自己主观的效用函数，效用函数将物质收益映射为个体的主观满足程度。个体在作决策时总是会选择可以使自己期望效用最大化的选项。而效用函数的凹凸性则反映了个体对于风险的偏好。凹的效用函数对应着风险厌恶（risk-averse），而凸的效用函数则对应着风险追逐（risk-seeking）。

图1 风险偏好可以改变演化动力学的类型

北京大学王龙课题组和上海交通大学苏奇副教授、美国宾夕法尼亚大学Plotkin教授合作，建立了鲁棒博弈动力学研究的理论框架和分析综合方法。他们将期望效用理论与演化博弈论相结合，提出了系统具有不确定性和个体风险响应的博弈动力学模型和研究方法。在群体风险偏好固定的情况下，他们发现，不确定性可以定性地改变系统的动力学行为。例如，原本为囚徒困境类型的博弈，在特定的不确定性结构下，风险厌恶的群体可以使得演化动力学行为变为和Stag Hunt博弈相同，而风险追逐的群体可以使得演化动力学具有Snowdrift博弈的特性（如图1）。此外，对于适应性风险偏好的情形（即当个体获得较高收益时，个体以高概率变得更加风险追逐；当个体获得较低收益时，个体以高概率变得更加风险厌恶），他们研究了策略和风险偏好的共演化动力学，发现在囚徒困境中，合作者比例和风险厌恶者比例会出现持续性周期震荡（稳定的极限环）（如图2）。进一步地，他们给出了囚徒困境下，极限环存在的数学条件，还分析了其它类型博弈中的震荡现象，发现系统可能同时在多个区域出现震荡现象。

图2 适应性风险偏好可以产生周期震荡

该工作表明，不确定性以及个体对不不确定性的应对方式对于系统的演化动力学具有重要影响，可以产生（相比于确定性情形）复杂得多的动力学行为。这对于群体行为的复杂性与调控、多智能体的交互学习与合作、群体智能的涌现都具有重要意义。

上述研究成果以“The evolution of social behaviors and risk preferences in settings with uncertainty”为题近期发表于《美国科学院院刊》（PNAS）上。北京大学工学院2020级博士生王国丞为第一作者，王龙、苏奇和Joshua Plotkin为通讯作者。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号