最近看了不少关于AlphaGo的油管视频,其中一个是一位台湾棋手讲解AlphaGo Zero和李世石版本的AlphaGo对弈的棋谱,棋手讲得是感慨万分,我听得也是感慨万分。
李世石版本的AlphaGo 是根据人类的棋谱发展而成的,处处有人类所理解的棋理,当年就以4:1击败李世石,自学习之后,棋力当然远超人类。后来的Master版本横扫所有与之对弈的职业高手,除了掉线那盘,保持了全胜记录。
而AlphaGo Zero是直接从围棋的规则出发,没有受人类棋理的影响,它自学习40小时之后,就已经能够击败人类最高手(包括李世石版本的AlphaGo)了。而受人类棋理影响的AlphaGo,一开始进步很快,但40小时后就基本没有进步。
这两盘棋,受人类棋理影响的李世石版本的AlphaGo就好象一个努力捍卫人类尊严的机器人,虽然竭尽了全力,但依然被AlphaGo Zero无情碾压,毫无还手之力。
我粗看Alphgo Zero的行棋方式,隐隐有当年吴清源的下棋的味道。主要有两点让我印象深刻。第一,吴清源和AlphaGo都极其注重中腹。第二,当年吴清源经常脱先,让对手在某个地方纠缠半天最后还捞不到好处,而自己在别的地方连下数手,模样就建起来了。这里第一局AlphaGo Zero就是这么对待李世石版本的AlphaGo。
所以我觉得,对于围棋的理解,吴清源应该是最接近AlphaGo Zero的人类了。AlphaGo Zero在职业围棋界是被当作神一样的存在,吴清源看来是最接近围棋之神的人类。
关于AlphaGo Zero的研究论文发表在自然杂志,链接在此: