6

为无法定义最优解的博弈赋予意义:拓展了微分博弈论的基础

 1 year ago
source link: http://jandan.net/p/112567
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

今日好价 0315比隐形传输更加不可思议的“反事实量子信息交互”

majer @ 2023.03.15 , 14:46

0

为无法定义最优解的博弈赋予意义:拓展了微分博弈论的基础

为了让无人驾驶车辆可以适用于真实路况,研究人员经常使用博弈论——代表理性主体为实现其目标而采取战略行动的数学模型。

Dejan Milutinovic 是加州大学圣克鲁兹分校的电气和计算机工程学教授,长期以来一直与同事研究博弈论的一个分支——微分博弈,这与运动中的玩家相关。

微分博弈里有一个重要的课题,称为追墙游戏。这是一种相对简单的模型:一个速度更快的鬼,试图去抓速度较慢的一个人,而后者只能沿着某形状(指的是墙作为界线分割出的形状,或干脆理解成只能在特定的曲线上移动)的墙奔跑。

自近60年前首次描述这个游戏以来,博弈论专家就意识到一个问题——有一组被认为不存在最优解的位置。

但现在,Milutinovic 和同事在 IEEE Transactions on Automatic Control 期刊上发表的一篇新论文中证明,这个长期存在的困境实际上并不存在,并引入了一种新的分析方法,证明总有一个确定性的最优解。这一发现为解决微分博弈领域中存在的其他类似挑战打开了大门,并能够更好地为无人驾驶汽车等自主系统提供底层算法。

追墙博弈里,鬼和人两方玩家的经典纳什均衡点,可以描述他们在几乎所有位置上的最佳策略。然而,在追击者和逃避者之间存在一组位置, 这组位置被称为奇异曲面,类比于几何上的尖点,导致附近的微分没有定义,所以其上的最优解在数学上毫无意义——多年来,研究界已经自行吞下了这枚苦果,把它作为必须接受的现实。

但Milutinovic和他的合著者不愿意接受这样的现实。

“这让我们很困扰,因为我们认为,如果逃脱者知道存在这样的奇异曲面,那么就有可能进入曲面并滥用它。逃避者可以迫使去到你不知道如何采取最佳行动的奇异表面里——然后我们博弈在数学上就无法分析了。”

因此,他们想出了一种解决方案,使用了当年还不存在的数学概念。通过引入 Hamilton-Jacobi-Isaacs 方程的粘性解并引入损失率分析来求解奇异曲面,他们能够发现可以在所有情况下确定博弈最优解并解决困境。

偏微分方程的粘性解是直到 1980 年代才发明出来的数学概念。现在众所周知,这个概念与最优控制和博弈论相关。

最好的一点是,把这套技术用于经典场合,得到的最优解和使用传统方法推出的最优解是一致的。所以,他们在奇异曲面里引入的最优解可以看作是传统最优解的自然延拓。新的定义是有意义的。

为了找到玩家如何最大限度地减少损失,作者分析了 Hamilton-Jacobi-Isaacs 方程在导数未明确定义的奇异曲面周围的粘性解。 然后,他们对方程的奇异面状态引入了损失率分析。 他们发现,当每个参与者试图将其损失率降至最低时,他们在奇异表面上的行动就有明确的博弈策略。

“当我们采用损失率分析并将其应用于其他场合时,经典分析给出的最优解不会受到影响。因此这是一个重要的结果,表明这是一项博弈论领域里的基本贡献 。”

Milutinovic等人有兴趣探索其他博弈论问题。他们在论文里还公开呼吁学界对其他困境引入他们的分析工具。

https://phys.org/news/2023-03-year-old-game-theory-dilemma.html

赞一个 (3)


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK