博弈论是人工智能中的一个分支。顾名思义就是下棋的算法。当然引申出来的应用可能不止用来下棋,也可以用来做游戏或者模拟战争策略等。
博弈的基本算法也是模拟人的思维,比如当自己下子时遍历所有可能寻求最有利步骤,但是一种走法如果不能一步取胜则要考虑对方可能采取的对自己最不利的走法,如果对方不能取胜,然后再进一步考虑在对方的走法下自己最佳的应对是什么,如此递归下去,找到每条路径的胜算,采取最优策略。
伪代码可以这样:
function find_best(P)
{
var bestSolution=WORST;
for every possible step S after P:
if ( willWin(s))
return S;
else if(willEnd(S))
if( S >= bestSolution) bestSolution = S;
else
var W= find_worse(S);
if( W >= bestSolution ) bestSolution =W;
return bestSolution;
}
find_worse函数应该有类似的逻辑,唯一不同在于find_worse判断逻辑反过来,找出对对方最有利的解决办法。
上边描述的只是最简单的算法,实际上,在稍微复杂的棋类游戏中,这种算法都无法工作。原因是上述算法会递归遍历所有的可能性,在很多棋类游戏中,这在时间上无法支持的 – 太耗时。如果预先计算好所有可能又太耗存储空间。这时往往需要递归到特定深度即结束,并且由于往往不能搜索到棋局的最终胜或者负的结局,必须对任一状态有一个评估函数来评估分数。为了进一步优化,可能要对遍历的路径做些裁剪。比如,五子棋中不去考虑那些离已经存在的子太远的解决方案等等。
既然我们今天只研究最简单的情况,那么上边的算法还是可以解决问题的。我们就以井字棋为例,完全可以遍历所有情况,直接上递归算法都不会引起栈溢出 – 总共只有9步深度:).
代码在这里:http://www.luoxq.com/tic.html