在写德州扑克AI的时候想到的一种实现模糊决策的方法

目前的AI决策方式是线性的，给定了一个条件X，代入一条曲线获得一个Y后直接作为决策值。略略灵活一点的，从两条曲线中取得两个值Y1，Y2，然后随机从两者中间的区域中取得一个值。

但是，这样做会使AI表现出非常明显的“边界”，与AI交流能够明显的感觉的AI的限度在哪里。感觉会比较“僵硬”。原因在于人类的决策过程并没有这种边界。当我们面对某一个条件X的时候，我们的决策“曲线”应该是这个样子的

如图，人类的决策没有明显的边界，所以看起来非常的模糊。模糊处理貌似是一个非常普遍的，在AI领域研究的比较多的内容。

我最近也一直在想如何能够实现这种模糊决策逻辑。最近忽然想到它既然能被表示成模糊的图像，为何不直接使用图像。

这种思路是从一张图片开始，为了简单，我们假设是一张32*32的图。

我们假设左下角为0点，横向为X纵向为Y。将这个图片读到计算机里面，读取每一个像素的红色色值，组成一个32*32的矩阵。矩阵横向表示条件参数X，纵向表示Y值可能的概率分布。

这样对应与每一个X值，我们都能够获得一个数列。在这个简单的例子里面，我们假设X=18，获得下面这样一条曲线。

这个曲线中，横坐标表示可能取到的Y值，纵坐标表示一个与Y值出现的概率成正比的数值，我们姑且称之为F(Y). 假设对图上这一系列离散的点进行求和得到的值为Σ，那么Y的概率分布函数P(Y)就可以表示为P(Y)=F(Y)/Σ。我们暂且不管他，就直接用这个F(Y)。我们把这些数值拼接在一起，并且记住每一个F(Y)所对应的Y值。

上面的饼图很好的说明了这种操作，这个饼一周的刻度是Σ即3009，右边的颜色表表明了饼上面每一个颜色区域表示的Y值。接下来的工作就所剩无几了。我们沿顺时针方向随机一个0~3009之间的数值，你会发现这个随机过程恰恰满足了我们所要追求的P(Y)概率分布函数。

这样，经过切片，排序，随机这三个过程，我们就从一个给定条件X获得了一个“模糊”的Y值。这种方式远远比用包络线来定义上下界要科学的多，我想如果用这种原理构建AI的决策系统，必然会让其非常的灵活，自然又不失规律性。

时间： 2025-01-12 14:28:29

在写德州扑克AI的时候想到的一种实现模糊决策的方法

在写德州扑克AI的时候想到的一种实现模糊决策的方法的相关文章

德州扑克AI简介——2015华为软件精英赛小结

德州扑克AI实现 TexasHoldem Poker

德州扑克AI WEB版

德州扑克AI(译)

德州扑克AI

德州扑克输赢判断-C#

德州扑克游戏

模拟德州扑克对战游戏

一场改变你投资生涯的讨论：职业德州扑克手看交易