首发于AI学人
围棋人机大战一周年急速短评

围棋人机大战一周年急速短评

飞旧金山的 CA985 起飞前,微信公号“量子位”约我谈谈对围棋人机大战一周年的看法。时间紧,就匆匆梳理了思路,择要点敲了寥寥几行字。刚下飞机,“量子位”的《围棋人机大战一周年:被 AlphaGo 改变的世界》就已发出。这里把文章中我的回答摘出来,算是一个《急速短评》。

量子位:一年后再看 AlphaGo 有何改变?有什么记忆犹新的片段?

王咏刚:AlphaGo 出世一年,其实进入大家视野的是三个版本:5:0 击败樊麾的内测版本,4:1 击败李世石的版本,以 Master 网名 60:0 快棋挑落中日韩高手的版本。三个版本演进脉络明显,每次迭代都有重大升级。

最震撼的是计算机在人类传统认为极其玄妙的、电脑无法掌握的“大局观”上突飞猛进,远远将人类选手甩在身后。电脑计算“大局观”的方式,和人类培养“大局观”的思路,有根本的差别。人类没可能在这方面赶上电脑。

和樊麾对局的棋谱基本上还看不出 AlphaGo 的大局观有多强,和李世石对局就下出了聂卫平赞不绝口的五路肩冲,到了 Master 的 60 局,大局观体现在两个地方:

1)从始至终对局势的把握,比如第 60 局古力用 AlphaGo 的思路对付 AlphaGo,把中央撑得很满,但 AlphaGo 不紧不慢,总是恰到好处地保持胜势。

2)已经深刻影响人类对布局的思考,大飞守角之类的变化迅速被人类棋手模仿,这和当年深蓝问世后,国际象棋的布局革命是一样的。

量子位:过去一年,有什么具体产品或研究,是基于 AlphaGo 的么?

王咏刚:AlphaGo 用的是 AI 领域应用非常普遍的算法:深度学习、蒙特卡洛算法、增强学习等。

从概念上可以说,机器视觉相关的深度学习技术,包含环境-决策-反馈的智能系统,里面都有 AlphaGo 的影子。当然,直接的代码实现层面,肯定没有复制、粘贴这样直接借用的关系,因为 AlphaGo 的深度学习模型毕竟是围绕围棋的特征建立的。

DeepMind 去年发布的读唇术 LipNet,与英国国家医疗服务体系 NHS 合作推出的医疗辅助应用 Streams,与眼科医院合作帮助眼部疾病诊断等等,可以说都是与 AlphaGo 同源的技术。

量子位:AlphaGo 是否已经攻克围棋?未来可提升的空间还有哪些?

王咏刚:“攻克围棋”,如果说战胜人类选手的话,AlphaGo 已经实现了,而且现在“绝艺”,DeepZen 之类的程序对人类胜率也很高了。

未来最多三年必将发生的是,手机上的本地 APP 就可以战胜人类职业高手,现在热闹的网上围棋对弈平台都会死掉(因为对手可以轻易用手机作弊),人类围棋将回归现场竞赛,围棋培训讲师将更重视普及教育,因为中高级的提高训练完全可以用机器代练。

不过,如果说“攻克围棋”是像计算机可以穷举西洋跳棋的所有变化那样,让电脑成为围棋“上帝”,这个应该还不大可能。现在AI大部分的招数,还在人类高手可以理解的范畴内。AI也有一些可疑的“弱点”,比如官子水平到底如何等等。

以后 AI 和 AI 之间的竞赛,应该会不断促进 AI 提高(但这种没有太多商业利益的事情,有没有持续投入是个问题)。人类应该望尘莫及,但可以不断从 AI 中学习新的思想。

按:匆匆短评,既不深入,也不精确。错漏难免。回头也许真要抽时间,从技术角度好好梳理一下 AI 下棋这件事。
编辑于 2017-03-13 11:10