探索围棋官子最优解(四):最后一目

探索围棋官子最优解(四):最后一目

(接上文

不会功夫的潘达:探索围棋官子最优解(三):组合博弈论

,主参考文献:Elwyn R. Berlekamp, David Wolfe, Mathematical Go:Chilling Gets the Last Point.)

(本文暂时谢绝一切转载)

(不想看推导的读者请直接跳到第九节看有应用价值的结论)

七、正微量与负微量

  请看上图中的局面,和前文介绍的※有些相似吧。这个官子和※的区别是,黑棋嘴里有两个俘虏,而不是一个。我们仍然采用冷却法做分析:黑先封口,冷却后的结果是0;白先冲击,则留下一个价值2目(后手4目)的官子,结果可以用{0|-2}表示。黑白先手的结果结合,则此局面可表示为{0‖0|-2}。注意,双竖线‖的功能和单竖线|没有区别,只是标明阅读顺序:从双竖线所在的位置开始逐级扩展游戏树。

   康威教授将此局面定义为“正微量-2”(Tiny 2),本文将其记作 \top_2 (为避免与加号+混淆,笔者选用了与原书不同的表记)。下标的2对应 {0‖0|-2}中的2。若黑白互换,则构成“负微量-2”(Miny 2),记作 \bot_2 。也就是说,负微量-2是正微量-2的相反数,即 \top_2+\bot_2=0 , 它们的和是0.

  如果俘虏变多,或者俘虏后还有空间,则微量的值也会相应变化。例如下图:

  一个俘虏加一目空共3目,对应 \top_1 ; 三个俘虏共计6目,对应 \top_4 ; 只有一个俘虏即2目,即 \top_0 ,也就是熟悉的↑。我们通常把↑区别于其他微量对待,因为它与其它正微量的性质有显著差异。

  一般地,如果白棋冲一下能直接威胁黑棋腹中的x目,则此局面记作“正微量{x-2}”,即 \top_{x-2}

  微量和星号※、箭头↑一样,都是无穷小量,因此它们小于任何正数。正微量都是正数,因为无论黑先还是白先,都是黑棋收后;即 \top_n>0 . 而且,微量是比箭头更小(高阶)的无穷小量,比如 \uparrow+\bot_2=\uparrow-\top_2>0. 要证明此不等式,考虑↑和 \bot_2 的组合局面。

  无论黑先还是白先,黑棋总能收到最后一官(除非白棋把黑棋两兄弟放走,那么黑棋赢得更多),请读者自行验证。

  同理,如果x>y,则 \top_x<\top_y ,即下标大的正微量更小(高阶无穷小)。注意,此处的无穷小都是冷却以后的值;越“小”的无穷小,其实价值越接近1目,应该优先选择。


八、多俘虏长走廊

我们回到上一篇开头的问题,两个长长的走廊尽头,各有两三个俘虏,走哪一个更好呢?

  隔离右边的局部,并采用冷却分析法画出游戏树,如下图。

  此局部因而可总结为{ \bot_2 |0‖0|||0},简写为 \bot_2|0^3 ,意为黑棋要走三步才能到达 \bot_2

  此类棋形比微量要大(低阶无穷小),因为对手的冲击相对不那么急迫;但此类棋形比箭头↑要小(高阶无穷小),请读者自行验证。


九、各类一目官子总结

  上表是各类小官子优先级的总结。假设y>x>0,则优先级依次为:

1、攻击负微量 \bot_y

2、走后手y+2目的官子;

3、攻击负微量 \bot_x

4、走后手x+2目的官子;

5、依次攻击带有多个俘虏的长走廊;优先攻击俘虏数量少的;若俘虏数量一样则优先攻击较短的走廊;

6、攻击仅有一个俘虏的走廊(即↓,↓↓※等);无论走廊长短,做这些攻击是等价的;

7、如果有奇数个※,走※;

8、防守带有俘虏的长走廊;无论走廊长短或俘虏多少,这些防守是等价的;

9、走价值为分数的走廊;分母大(即更长的走廊)的先走;

10、最后填单官。


十、见合

  見合い,日语,意为“相亲”。作为围棋术语,见合指某局面下有两个价值相当的选择,双方总是各得其一。

  在组合博弈论中的见合(miai)就是指两个(或更多)数的和为零。比如两个星号※的和是零,对应到棋盘上就是两个一路扳粘见合。又比如↑+↓=0,即↑和↓见合。

  在分析某个官子局面时,我们需要先识别出所有见合的局部,然后当它们不存在。做完这一步以后,才可以按照(九)中介绍的流程继续。


十一、采用数学符号的必要性

  可能有些读者早已在心中抱怨,为何要引入这些花花绿绿的数学符号呢?只用棋盘上的局部来表示不够吗?

  数学符号的特点是抽象。将具体的事物抽象成符号,就能识别出貌不同而本质相同的两个事物。比如下面这个等式:

  仅仅盯着棋盘看,恐怕很难发现这两处官子是等价的。

  又比如下面这个等式

  乍一看很难接受。若写成↑+↑+※=↑↑※,是不是就很简单了呢?


十二、难倒九段的一道题

  本题即本文题图。白先。埃尔文教授曾用此题难倒了多位中、日职业九段。本题包含几处前文不曾提到的棋型,比如DEF、KL、NPOQR等处的断头(紧气后要补一手)。篇幅所限,本文不再展开分析此类棋形,仅给出正解:

上图是对各个局部做冷却分析的结果。

  上图求出各个局部的总和,结果是0+无穷小量。按照此表,对照(九)中介绍的流程,白棋应该走C,为本题唯一正解。


十三、总结

  上世纪九十年代,埃尔文教授曾造访中国棋院,推销这一套官子理论。埃尔文教授拿出若干道如(十二)中的考题,让很多棋手目瞪口呆。然而,少年常昊不畏艰险,挑灯夜战,最终给出了其中一道题的正解。可是,当常昊向埃尔文教授解释自己的推理时,双方都懵逼了。在最浅显的层面上,常昊采用了“见合”的分析方法,归并部分官子,算是与组合博弈论不谋而合。但越是深入,常昊的诠释就不可避免的涉及“先手”、“后手”之类围棋手习惯的概念。这些常见的概念中蕴藏着风险:何谓“先手”?如何确定先手?你会发现,这些概念都没有严谨的定义。雪上加霜的是,埃尔文教授尝试将常昊的方法应用于类似的问题,却无一例外的失败了。不可重复的算法在数学上是错误的算法。

  (注:尽管如此,埃尔文教授对常昊的印象非常好。无论如何,能给出如此难题的正解,天赋和恒心均不可或缺。常昊之后成为中国围棋的一代领军人物,曾获得三个世界冠军。)

  成为一名职业棋手需要十余年的训练,成为一名职业数学家也是,这两者不曾有交集。

  数学家的目标是:寻找最优解,并且给出一个可证明的算法。

  围棋手的目标是:寻找近似的解,从而尽可能的少犯错误,比对手犯更少的错误。

  这两个目标看上去很接近,而埃尔文教授花了十几年时间才意识到二者间隐藏着的观念上的巨大差异。对于围棋手来说,“证明”的含义是在棋盘上把变化摆出来。数学家和围棋手,终究活在两个世界。

  AlphaGo问世,人类败得溃不成军。但我们有组合博弈论。在终点线前一米,我们可以和围棋上帝打成平手。在最后一目的问题面前,AlphaGo有可能被纯数学击败。这离围棋在数学上的真正最优解还很远很远,但至少我们已经迈出了坚实的第一步。

编辑于 2018-02-24

文章被以下专栏收录