婆罗门
精华
|
战斗力 鹅
|
回帖 0
注册时间 2005-7-24
|
事实上如果讲的深刻一些
不SL的杀戮尖塔是 他有两层博弈,
第一个博弈是 一个对所有可能随机数求期望的游戏
它 的 operator是
for all State in Probablity Space
find 操作 序列S =s1s2.....
如果将受益 理解为通关的概率,那么对于每一层
游戏是一个 TWO PLAYER GAME
一个player是玩家
另一个player是随机的结果
如果用r表示随机结果,s表示操作
玩家在每个随机的结果后确定一些操作
那么
最佳策略树是
si := argmax E (r_i+1,s_i+1r_i+2,s_i+2...)
换句话说,每一个操作si 都要使以后所有的随机数产生结果以及后续操作的期望最大化。
由于基本上这个期望的最大值是求不出来的,所以我们只能逼近可能的最佳打发。
第二个博弈是和下面SL的一样的层间博弈。
SL的杀戮尖塔
每一层的随机数是确定的
也就是对于确定的序列 R=r1r2 ...
找到 操作序列S 使得
收益最大化。
这个基本上是一个靠暴力算的过程。
也就是说从计算量和策略深度来看
,SL是只有层间的策略深度,每一层的最佳打法都可以认为是是固定的。 所以极大的简化了游戏的决策树。
|
|