我目前正在使用置换表来排序走法。通过使用迭代加深搜索,我存储了前一次迭代的极小极大值,以便为下一次迭代排序走法。这都没问题。
我感到困惑的是:
如果我在置换表中找到了某个位置,那么我会使用之前计算的分数来排序走法(来自迭代加深的前一次迭代)。然而,如果这个位置的分数被更新(在极小极大值返回后),并且在另一个子树中再次找到这个位置(同一迭代加深的迭代中)——我不想仅将其用于排序走法… 我应该能够返回这个值,因为这个值现在已经为本次迭代计算出来,并且是绝对的。
我的问题是:是否标准做法是使用两个置换表?一个用于前一次迭代,一个用于当前迭代加深的迭代。因此,我会首先检查当前迭代的表,看看极小极大值是否已经计算出来,如果是的话,直接返回这个值。如果不在这个表中,我会使用前一次迭代的表来排序走法。如果不在两个表中,那么这是一个我在本次搜索中之前没有见过的新位置。
这种思路正确吗,还是有更有效的方法?
回答:
我同意@Dennis_Soemers的观点。你应该保存深度,并且可能还要添加alpha/beta边界到你的置换表中。不,你不需要两个表。
让我们检查一下Stockfish源码中的表格。
https://github.com/official-stockfish/Stockfish/blob/master/src/tt.h
/// TTEntry结构是10字节的置换表条目,定义如下:////// key 16位/// move 16位/// value 16位/// eval value 16位/// generation 6位/// bound type 2位/// depth 8位
表的保存函数定义为:
void save(Key k, Value v, Bound b, Depth d, Move m, Value ev, uint8_t g)
现在,如果你有两个相同的位置,来自深度d-1
和d
。你可以这样做:
// 我的哈希键现在是位置 + 深度Key my_hash_key = k + d
你可以轻松地检查前一次迭代和当前迭代:
Key previous_iter_key = my_position_key + d-1probe(previous_iter_key ...)Key current_iter_key = my_position_key + dprobe(current_iter_key ...)