10

赌博的最优策略 (II)

 3 years ago
source link: https://zhiqiang.org/math/how-to-gamble-if-you-in-hurry.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

赌博的最优策略 (II)

作者: 张志强

, 发表于 2011-12-13

, 共 968 字 , 共阅读 133 次

系列:生活中的数学

查看该系列所有文章

在 slashdot 上看到一篇科技新闻,两个数学家(其中一个来自于 MIT )和一个计算机学家,在 arXiv 上发表了一篇论文《HOW TO GAMBLE IF YOU』RE IN A HURRY》(PDF 版链接),是最近几天很热门的一条新闻。

其实论文的内容很简单,基本上就是我以前一篇博客赌博的最优策略里的内容:

假设有数量为nn 的本钱,赌博规则为每次可以压任意多的钱,赌博结果为以pp 的概率赢回同样多的钱(输了的话压出去的钱就没了)。如果赌博的目标是本钱增长到NN 或者破产(输光所有的钱为止)。问什么样的方式可以最大化成功(赢到NN 走人)的概率呢?

然后这篇文章里只考虑离散的情况,即nn 和NN 都是整数,并且每次只能下整数的赌注。在这种情况下问题更简单了。如果不考虑结束的时间的话,赌博的策略如下:

如果p<0.5p<0.5 ,那么每次下注min(n,N−n)min(n,N−n) 。

如果p>0.5p>0.5 ,每次下注 1。

但当p>0.5p>0.5 时,每次下注 1 ,游戏结束的时间太长了。更优的方法是Kelly 判据,即每次押上2p−12p−1 倍的本金。在初始本金 n 为 100 , N 为 200 , p 为 3/5 时, Kelly 策略的成功概率为 99.988%,期望结束时间只有 45 轮,而每次下注 1 的期望结束时间是 500 轮。

那上面新闻里的论文做了什么工作呢?事实上,它给出了一个程序,用来计算用什么方式可以最大化在给定期限TT 内赢到NN 走人的概率(还有一些其它乱七八糟但也差不多的东西),即计算以下函数:

f(n,T)=max1≤x≤min(n,N−n)((1−p)f(n−x,T−1)+pf(n+x,T−1))(1)(1)f(n,T)=max1≤x≤min(n,N−n)((1−p)f(n−x,T−1)+pf(n+x,T−1))

好吧,我也没明白这篇文章为何会这么热门,我认为这个程序是一个本科生甚至一个高中生就可以完成的工作,这篇文章也不是严肃的学术性结果新闻里提到作者之一 Evangelos Georgiadis 是来自 MIT 的数学家。但我在 MIT 上找不到该人的详细信息,深表怀疑他只是 MIT 的一个学生。

Q. E. D.

avatar-0.jpg

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK