北京时间 3 月 13 日下午 4 点 44 分,人机大战五番棋大战第四场结束,世界围棋冠军李世石执白在第 78 手下出“神之一手”战胜 AlphaGo,在五局比赛中首次获胜,但总比分仍以 1 比 3 落后。双方的第五场比赛将于下周二中午 12 时举行。
针对此次李世石的胜利,AlphaGo 创始人哈萨比斯表示李世石再次向大家证明他是一个传奇:“李世石是一个出色的棋手,他对于 AlphaGo 表现的非常好,AlphaGo 最开始的时候表现的还是不错的,我们以为他会在中盘的时候非常好,但是因为李世石给我们的 AlphaGo 带来很大的压力,所以说最后他没有表现好。但是我们非常高兴,这就是我们来到这的原因,我们要测试 AlphaGo 的极限,找到 AlphaGo 有没有什么样的弱点,通过这样的方式我们在能够不断的改善我们的程序。”
哈萨比斯还表示:“AlphaGo 一开始它是自己跟自己比赛,然后进行学习,这就意味着他有可能知识上还有缺陷,但是我们之前是没有合适的棋手帮我们找到这个缺陷,我们来到这里就是要找到一个很好的棋手帮助 AlphaGo 找到他的缺陷。李世石先生的确推动了 AlphaGo 展现了自己的缺点,对于我们来讲这是非常有价值的。”
此外,现场解说嘉宾麦克雷蒙表示这是一场有趣的比赛:“在比赛的中间部分,就是 78 手下李世石下的非常好,而且我有点惊讶。我想多数的对手都会感到惊讶,特别是 AlphaGo 也感到惊讶,这样的一手实际上最终达到了中腹这部分能够获胜,这就是展现了李世石很有实力。”
针对 AlphaGo 在专业人士看来是错误的的问题,哈萨比斯回应称 AlphaGo 是原型的程序:“没有到 beta 程度,只是在阿尔法阶段,因此我们就是要来看一看他有什么样的缺点,得在真正的围棋比赛当中看到这一点。李世石是顶尖棋手,能够帮助我们找到这样的缺点,因此我们的确打了一场非常不错的比赛。医疗是不一样的东西,我们要更进一步的测试这个软件,我们这样一个软件是在原型的阶段,所以我们来到这里进行测试,这就是我们现在的情况。”
针对 AlphaGo 头一次认输的问题,哈萨比斯回应称:“AlphaGo 通过计算胜利的可能性选择有哪一手,要增加胜利的可能性,如果胜利的可能性低于阈值的话就认输,它会告诉操作员。AlphaGo 是跟人一样认输的。AlphaGo 总是认为他的对手可能下出最好的手,所以说他这样的计算就是要增加他最有可能胜的这样一些胜率,就是他这一手跟他的原则是一致的,不管对手是什么样的水平。”
在比赛中有评论称李世石和 AlphaGo 信息不对称,对此哈萨比斯回应称:“AlphaGo 不是针对李世石来进行训练的。我们用人类的棋局来培训它的,主要是从互联网上下载了一些业余的棋谱对它进行训练,这些都是日常开展的。我觉得 AlphaGo 是通过自我的学习,不断的对弈,来不断的成长的。我们并没有专门就李世石对它进行培训。即使我们想要针对李世石对它进行培训的话,AlphaGo 也需要几百万的棋局对它进行培训,如果只是 100 场是没有办法对它进行很好的培训的。因为它是需要几百万,上亿的培训。”