前番一篇七期连载的博客,弄得天下看官耐心皆无,纷纷掩卷抱怨道:人类都已进入大微信时代了,俺们除了三言两语的鸡汤式文体和一句概括一万句的煽情式文体,别的啥都看不进去,你整出这又臭又长的原理莫非是想找俺催眠的不成?
好吧,那就重新整理思路,另写一篇童话版的阿尔法狗原理介绍。
话说这阿尔法狗,其实是一庞大军团的总称。阿尔法狗是军团总司令,手下拥有雄兵亿万、战将千员。光是元帅级别的著名将领就有贝塔猫、伽玛猴、德尔塔眼镜蛇、艾普西龙黑蝙蝠等等。
说来也怪,阿尔法狗虽然身为三军总司令,马上就要率领大军杀向棋盘阵地,可他对于围棋居然做到了一窍都不通。这也罢了,问题在于即使是他手下的那些勇冠三军的将领们也没比他强到哪儿去,连怎样在棋盘上“叫吃”都不明白。不过,也不能小瞧这群乌合之众,因为他们个个身怀另类绝技。
比如,总司令阿尔法狗居然有能耐从人类的围棋服务器KGS上下载了一本秘密兵法,里面载有业余和职业棋手真实对弈的三千万步棋谱。
阿尔法狗将此兵法复印了两份,一份交给贝塔猫,一份交给伽玛猴,另外叫来军师德尔塔眼镜蛇,开始布置任务:“众将官听令,咱们现在就来演习围棋。首先由贝将军和伽将军大战一万回合,德军师,你负责记录!”
贝塔猫和伽玛猴一个劲儿地摇头:“可我们……一点儿也不懂围棋呀!”
“没用的东西!” 阿尔法狗勃然大怒:“手上的兵书是干什么用的?每当你们需要落子之时,就先去兵书里查查看有没有类似的战例,如果有,书上说怎么下,你们就怎么下!”
贝塔猫和伽玛猴心领神会,因为他俩的绝活就是以闪电般的速度从海量信息中查找八卦新闻和桃色事件。
贝塔猫执黑先行。他见棋盘上空空如也,一个子都没有,就去兵书上查找,果然看见人类棋手在这种情况下都是往四个角上落子。于是“啪”地下出了第一手。
该伽玛猴下了。他去兵书上一查,发现人类棋手在一个角被占之后一般都是去抢另外的角,于是也依样画葫芦地下出了一招。
他二人你来我往挑灯夜战,杀了个难解难分。多数情况下他们找不到现成的战例,于是就挑那棋形最为接近的作为参考。好在兵书有3千万页,再怪异的棋局都可以找到类似的对应。
德尔塔眼镜蛇有一双聚光眼睛,记录比赛是他的拿手好戏。他嘴里吐出长长的信子,不停地在纸上刷刷地写着。
一万回合下完了,结果,贝塔猫赢了6000多盘。
“德军师,”阿尔法狗不慌不忙地发布命令,“请把你刚才记录下来的棋谱交给贝将军和伽将军,让他们继续比赛。”
德尔塔眼镜蛇哪敢怠慢,急忙将手中的棋谱复印了一式二份,交给贝塔猫和伽马猴。
“还有,” 阿尔法狗接着说,“查查刚才的记录,看看贝将军和伽将军都使用了哪些棋谱。我想这些棋谱中一定有一些鱼目混珠的混帐棋谱。你现在就去核实,假如有哪个棋谱一而再再而三地导致输掉比赛,就让他们把那个棋谱从兵书中拿掉!”
德尔塔眼镜蛇仔细查看比赛记录,果然找到了几十个可疑的棋谱。虽然德尔塔眼镜蛇看不懂围棋,但是从统计的角度来看,只要是用到这些棋谱的比赛,最终的结果都是输。
“把这些棋谱统统撕掉,继续比赛!”阿尔法狗大声发布命令。
在贝塔猫和伽玛猴的对弈过程中,新的棋谱不断地产生,混帐棋谱也不断被撕去。二人越战越勇,直杀得天昏地暗,旭日无光。
这日,德尔塔眼镜蛇屈指一数,好家伙,整整下了3000万盘棋。经过这番演练,二人手里的棋谱早已更新换代不知多少轮了。
“艾将军何在?” 阿尔法狗突然大声下令。
“末将在!” 艾普西龙黑蝙蝠打着旋风大踏步地赶来,“啪”地来了个立正。
“本司令命你去整理贝将军和伽将军的对局棋谱,从那三千万盘棋当中,每盘选出一步棋谱,并在上面标出这盘棋最终是哪方获胜。”
“可是咱们不是已经有了那么多棋谱了吗?” 艾普西龙黑蝙蝠有些迟疑。
“用法不一样,他们的那本棋谱是用来决定落子的,叫‘落子棋谱’,而你将要整理的棋谱是用来决定胜负的,叫‘胜负棋谱’。”
“胜负棋谱”派做啥用场?艾普西龙黑蝙蝠在心里暗自嘀咕。可是当他看见阿尔法狗总司令那威严的目光时,哪里还敢怠慢,急匆匆照着司令的吩咐去做了。
309号高地争夺战打响了,敌方守将乃是围棋界赫赫有名的世界冠军李世乭。
战斗进行得相当惨烈。阿尔法狗军团仗着人多势众,向309号高地发起了新的一轮猛攻。他们大声呼喊:誓与阵地共存亡,一定要把数字309变成敌人刻骨铭心的惨痛记忆。
正当此时,李世乭从容地在棋盘的右上角落下一子,对阿尔法狗军团造成了极大威胁,形势登时变得岌岌可危。
“怎么办?”贝塔猫见状有些恐慌,“要不咱们举白旗投降?”
“混账!”阿尔法狗怒不可遏地大叫,“你的兵书呢?”
“兵书?”
“对,拿出最后版本的兵书,快去查找过去的战例!”
“噢!”贝塔猫恍然大悟,急忙拿出兵书,去查找与眼前棋局相似的战例。
“别慌,”阿尔法狗接着说,“不能只查一个,要把所有相似的战例统统查找出来!”
“得令!”贝塔猫并不知道总司令为何要那么多战例,只管飞速地查找起来。只用了一毫秒的时间,就查出了5000多个相似的战例。
“看看那些成功的战例中,下一步应该怎么走!”阿尔法狗继续发布威严的命令。
贝塔猫定睛观瞧,综合这些战例,下一步可以有33种落子法。
“召开全军战前动员会议!”阿尔法狗命令。
所有士兵都整整齐齐地列立在统帅阿尔法狗面前。阿尔法狗清了清嗓子,用洪亮的声音号召道:
“弟兄们,到了为党国尽忠的时刻了,你们必须经受得起党国对你们的考验!打赢了这场战役,你们将会获得享不尽的荣华富贵,吃不完的山珍海味,源源不断的金银财宝。我知道弟兄们连日征战,已经非常疲惫。不过只要能打进桥头,我立刻给全军放假三天!”
“乌拉!万岁!为了党国,冲啊!”士兵们发出一阵阵歇斯底里般的呼嚎。
“我们面对的是最强大和最危险的敌人,因此必须非常谨慎。现在我们一共有33套方案,必须把每个方案都充分论证后才能做出最终的决定。贝元帅何在?”
“末将在!”贝塔猫精神抖擞地回答。
“把你所带军团的士兵分为二人一组,让他们用第一套方案接着下棋,然后看看有多少赢棋的机会。”
“他们,他们可是些大字不识的文盲兵啊。像我们这些元帅级别的将领,虽不懂围棋,至少还知道怎样去查兵书呀,可这些士兵,连查兵书都不会,叫他们怎么下呢?”
“就叫他们乱下!”
“什么?”贝塔猫听得目瞪口呆。
“对,就是乱下。现在,我方执白,敌人李世乭执黑。你把士兵们分为两人一组,让他们演习白子和黑子对决。白方的第一步一定要按兵书上的落子去下。接下来呢他们就必须乱下,也就是说,只要看到棋盘上有空格就可以落子,不必管它围不围棋不棋的!”
“遵命!”贝塔猫满腹狐疑,但不敢违抗军令。
“伽将军听令!”
“末将在!”伽玛猴高声回答。
“给贝塔猫的命令你听清楚了吗?”
“听清楚了。”
“本司令现在给你发布同样的任务,只不过,你的士兵得按第二套方案下。”
“得令!”伽马猴不敢违抗,乖乖地领命而去。
阿尔法狗一共派出了33路人马,去模拟33套方案。最后他把目光移向了艾普西龙黑蝙蝠。
“艾将军,日前我命你整理的那本‘胜负棋谱’是否仍带在身边?”
“回司令的话,末将整理好棋谱之后,一直带在身边,就连夜里睡觉,都与之同眠共枕。”
“好,”阿尔法狗的脸上露出了满意的笑容,“我让你在那棋谱上标明胜负,你可知其中的道理?”
“末将愚钝,不知其中缘故。”
“适才我已命士兵们去演习那33套方案了。可是你知道吗,围棋比赛是有时间限制的,假如我们等士兵们把这33套方案全部下到底,时间早就用完了。所以,现在本司令命你带着这些棋谱去各营巡视,要是谁的棋局和你手中的某个棋谱相类似,就让他立即停止演习。这时你只要看看棋谱上写的是白子赢还是黑子赢,就可以决定胜负了。”
“司令高见!”艾普西龙黑蝙蝠领命已毕,刮起一阵旋风飞也似地去了。
不过十来秒钟,士兵们的演习结果已经出来了:第一套方案,共派了1000万对士兵随机乱下,结果白方胜700万盘,负300万盘;第二套方案,也派了1000万对士兵随机乱下,结果白方胜680万盘,负320万盘……比来比去,只有第十八套方案的结果最好,白方胜920万盘,负80万盘。
好,这回我要让人类的世界冠军瞧瞧本狗的厉害!阿尔法狗脸上带着极端的自负发布了命令:“照第十八套方案的方法落子!”
阿尔法狗军团打出了一记漂亮而有力的重拳。
人类世界冠军李世乭做梦也没想到阿尔法狗军团有着如此勇猛的战斗力。他使出浑身解数在敌军中左冲右杀,奈何阿尔法狗军团的攻势一阵猛过一阵,闹得小李子只有招架之功,并无还手之力,被前来讨阵的敌将杀了个盔歪甲斜,狼狈不堪,最后只得插上白旗,缴械投降。
309高地攻陷!听到这个消息后,全军士气大涨。在阿尔法狗的指挥下,他们一鼓作气,继续向310高地、312高地、313高地和315高地发起猛攻。虽然在攻占313高地的战役中,由于艾普西龙黑蝙蝠前一天吃了太多的韩国泡菜而拉肚子,致使他在查找“胜负棋谱”时不能正常发挥而导致战斗失利,但其他高地的争夺战均进展顺利。最后阿尔法狗军团以五战四捷的成绩大获全胜!
庆功会上,众将领簇拥着阿尔法狗,他们交杯换盏,大块吃肉,大口喝酒,好不痛快。待到酒过三巡,菜过五味,阿尔法狗突然发问道:“诸将领以为,此番我们取胜之最主要的原因是什么?”
“当然是总司令高超的指挥艺术了!”众将领谄媚地恭维道。
阿尔法狗谦虚地说:“非也,非也。依我看来,此番我等能取得如此之大胜,完全是因为我们战前准备工作做得好。其一,我们准备了一亿步‘落子棋谱’;其二,我们准备了3000万步‘胜负棋谱’;其三,我们人多势众,可以当场把未来可能出现的情况都演习一遍。有了这三点,再强的棋手也难打败我们不是?”
“总司令高见,总司令高见!”众将领随声附和道。
“司令,末将有一事不明,还望当面指点。” 贝塔猫一边抿着杯中的葡萄酒,一边疑惑地问道,“司令当时命令我军士兵胡乱下棋,我有点儿想不通的是,这胡乱下的棋,怎么反而下出好招数了呢?”
“哈哈哈哈哈……”阿尔法狗得意地大笑:“这正是本司令用兵的奥妙。大家请想,在比赛中我下了一个子,但不知道下得对不对。这时有一个办法可以帮我验证,那就是,把这盘棋交给另外两个人接着下完。如果最后是我这一方赢,那就说明我的子下得是对的,否则就不对。不过大家想想,要想得到正确的结果,这两个替我下棋的人的棋艺应该是旗鼓相当好呢还是相差悬殊好?”
“当然是旗鼓相当的好!”众将领恍然大悟地说。
“正是这样。”阿尔法狗越发得意了:“所以,重点是他俩的棋艺得相当,至于是九段的相当还是六段的相当还是棋盲的相当都无所谓。”
“高见,高见!”众将领对阿尔法狗的见地佩服得五体投地。
“司令,”伽马猴问道,“我听说人类正在研究能下围棋的机器人,可有此事?”
“我也听说了。”阿尔法狗醉意朦胧地说,“不过我觉得他们那套东西简直就是咱们的山寨。首先,他们也是到KGS服务器上弄了三千万步对弈棋谱,并以此开始训练他们的机器人。只不过他们没有像贝将军和伽将军这样能在短时间内过滤海量棋谱的神勇将领,因此他们只好靠训练神经网络来解决问题”。
见大家困惑的样子,阿尔法狗越发飘飘然了。他摇头晃脑地解释道:“你们肯定听不懂啥叫‘神经网络’吧?告诉你们,神经网络并不神奇,你可以把它想象成一个能存储大量棋谱的黑盒子。这个黑盒子有一个神奇的功能,那就是,假如你拿来一个它从未见过的棋谱,它能从盒子里把所有相似的棋谱都翻找出来。”
“这有什么神奇的?对贝将军和伽将军来说,这样的伎俩还不是小菜一碟吗?” 德尔塔黑蝙蝠轻蔑地说,他想提醒大家其实自己也拥有同样的本领。
“所以我说人类有点儿不知天高地厚嘛!” 阿尔法狗说,“拿着鸡毛当令箭,发明了‘神经网络’,就以为掌握了人工智能的关键技术,真让人笑掉大牙了!”
众首领一阵哄堂大笑。
“难道他们也像贝将军和伽将军那样通过自我演练产生了很多新棋谱吗?” 德尔塔眼镜蛇依旧非常好奇。
“一点儿都不错。在他们搭好了第一批神经网络之后,就把它命名为‘决策网络’(Policy Network),然后把KGS服务器上的三千万步棋谱放到里面去,让两个‘决策网络’相互厮杀。正像贝将军和伽将军的自我演练一样,在这个过程中,它们不断地更换和产生棋谱,使两个网络的棋力越来越高。他们还给这互相厮杀的过程起了个高大上的名字,叫自增强学习(Reinforcement Learning),啥自增强,不过是虎虎人罢了。别人不知道,咱们还不清楚吗,这‘决策网络’黑盒子里装的其实就是咱们的‘落子棋谱’。”
“人类也像咱们一样准备了‘胜负棋谱吗’” 生怕得不到大家注意的艾普西龙黑蝙蝠又一次尖着嗓子问。
“没错!”阿尔法狗撇着嘴说,“在‘决策网络’相互厮杀了3000万盘棋之后,他们就从中挑了3000万步棋谱,也像咱们一样,在每页棋谱上标明谁胜谁负,然后把它们装进了另一个神经网络的黑盒子里,他们给这个网络起名叫‘评估网络’(Value Network)。”
艾普西龙黑蝙蝠想到战场上自己的职责,又刨根问底地问:“在正式比赛时,假如他们的‘决策网络’也给出了33套方案,难道他们有那么多人马去一个一个地论证吗?”
“根本没有!”阿尔法狗不屑地说,“他们哪有咱们这么兵强马壮!不过人类也有自己的杀手锏,那是一种叫做CPU和GPU的东西,据说这玩意儿可以替代千军万马去演练方案。不过它所做的事和咱们士兵所做的事没啥两样,就是胡乱下棋!胡乱下棋就胡乱下棋呗,可厚颜无耻的人类却为它起了个谁也看不懂的文明名字,叫什么‘蒙特卡洛树搜索’!”
“我明白了!” 艾普西龙黑蝙蝠恍然大悟,“他们让CPU和GPU去胡乱下棋,逐一演练‘决策网络’提出的方案,而让‘评估网络’去告诉CPU和GPU,说胜负下到这里就可以看出来了,不用把棋盘全部下满了。原来,机器人下棋也怕超时啊!”
“所以我说,” 阿尔法狗总结似的说,“人类研制的下棋机器人没什么大不了的,用的都是咱们老套路。”
“对对对,”众将领附和道,“下次要是让咱们遇到了这猖狂的机器人,定要好好教训他一顿,杀它个人仰马翻,片甲不留!”
大家不停地推杯换盏,将庆功会推向了一个又一个高潮。在阿尔法狗总司令的鼓动下,众将领畅饮坛内琼浆玉液,遍尝盘中美味珍馐,最后尽欢而散。
人工智能历史上的著名攻坚战役就此落下帷幕。正可谓:好汉难敌群殴狗,英雄坐失百万金。
阶梯讲师原创作品•谢谢阅读
IT就两件事,一是数据库,而是编程。人工智能,bioinformatics都不例外,没那么神秘