幽幽茶香烟尚绿

人生到处知何似,应是飞鸿踏雪泥,泥上偶然留指爪,鸿飞那复计东西。
正文

人工智能真的来了,是喜是祸?

(2016-01-29 08:20:23) 下一个

先来看一段昨天的新闻:

面对谷歌围棋AI,人类最后的智力骄傲即将崩塌

 

1997年,国际象棋AI第一次打败顶尖的人类;2006年,人类最后一次打败顶尖的国际象棋AI。欧美传统里的顶级人类智力试金石,在电脑面前终于一败涂地,应了四十多年前计算机科学家的预言。
 
至少还有东方,人们自我安慰道。围棋AI长期以来举步维艰,顶级AI甚至不能打败稍强的业余选手。这似乎也合情合理:国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;相比之下,围棋每回合有250种可能,一盘棋可以长达150回合。这一巨大的数目,足以令任何蛮力穷举者望而却步——而人类,我们相信,可以凭借某种难以复制的算法跳过蛮力,一眼看到棋盘的本质。
 
但是,无论人怎么想,这样的局面当然不可能永远延续下去。就在今天,国际顶尖期刊《自然》封面文章报道了谷歌研究者开发的新围棋AI。这款名为“阿尔法围棋”(AlphaGo)的人工智能,在没有任何让子的情况下以5:0完胜欧洲冠军,职业围棋二段樊麾。

AlphaGo与欧洲围棋冠军樊麾的5局较量。图片来源:参考文献[1]

这是人类历史上,围棋AI第一次在公平比赛中战胜职业选手。

AlphaGo的战绩如何?

此次比赛和以往不同。之前的比赛中,由于AI棋力比人类弱,人类选手都会让子,而且AI主要和业余段位的棋手比赛。而AlphaGo对战樊麾是完全公平的比赛,没有让子。职业二段樊麾出生于中国,目前是法国国家围棋队总教练,已经连续三年赢得欧洲围棋冠军的称号。

研究者也让AlphaGo和其他的围棋AI进行了较量,在总计495局中只输了一局,胜率是99.8%。它甚至尝试了让4子对阵Crazy Stone,Zen和Pachi三个先进的AI,胜率分别是77%,86%和99%。可见AlphaGo有多强大。

在接下来3月份,AlphaGo将和韩国九段棋手李世乭在首尔一战,奖金是由Google提供的100万美金。李世乭是最近10年中获得世界第一头衔最多的棋手。围棋是最后一个人类顶尖高手能战胜AI的棋类游戏。之前有人预测说,AI需要再花十几年才能战胜人类。所以这场比赛或许会见证历史,我们将拭目以待。

李世乭表示很荣幸自己将与电脑公平对弈。“无论结果如何,这都会是围棋史上极具意义的事件。”他说,“我听说谷歌Deep Mind的AI出人意料地强,而且正在变得更强。但我有自信至少这次能赢。”图片来源:tygem.com

AI下围棋到底有多难?

计算围棋是个极其复杂的问题,比国际象棋要困难得多。围棋最大有3^361 种局面,大致的体量是10^170,而已经观测到的宇宙中,原子的数量才10^80。国际象棋最大只有2^155种局面,称为香农数,大致是10^47

面对任何棋类,一种直观又偷懒的思路是暴力列举所有能赢的方案,这些方案会形成一个树形地图。AI只要根据这个地图下棋就能永远胜利。然而,围棋一盘大约要下150步,每一步有250种可选的下法,所以粗略来说,要是AI用暴力列举所有情况的方式,围棋需要计算250^150种情况,大致是10^360。相对的,国际象棋每盘大约80步,每一步有35种可选下法,所以只要算35^80种情况,大概是10^124。无论如何,枚举所有情况的方法不可行,所以研究者们需要用巧妙的方法来解决问题,他们选择了模仿人类大师的下棋方式。

机器学习

研究者们祭出了终极杀器——“深度学习”(Deep Learning)。深度学习是目前人工智能领域中最热门的科目,它能完成笔迹识别,面部识别,驾驶自动汽车,自然语言处理,识别声音,分析生物信息数据等非常复杂的任务。

描述AlphaGo研究成果的论文成为了1月28日的《自然》杂志的封面文章。图片来源:Nature/Google DeepMind

AlphaGo 的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。

其中,“值网络”负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑;而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。利用蒙特卡洛拟合,将这些信息放入一个概率函数,AI就不用给每一步以同样的重视程度,而可以重点分析那些有戏的棋着。

AlphaGo所使用的神经网络结构示意图。图片来源:参考文献[1]

AlphaGo利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。

研究者们用许多专业棋局训练AI,这种方法称为监督学习(supervised learning),然后让AI和自己对弈,这种方法称为强化学习(reinforcement learning),每次对弈都能让AI棋力精进。然后他就能战胜冠军啦!

人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。所以AlphaGo只要经过了足够的训练,就能击败所有的人类选手。

Google DeepMind

Google DeepMind是这个程序的创造者,我们来看一下他们萌萌的程序员。

杰米斯·哈萨比斯(Demis Hassabis) 是Google DeepMind 的CEO。图片来源:Nature Video

文章的第一作者大卫·西尔弗(David Silver)。图片来源:Nature Video

Google DeepMind 去年在《自然》杂志上发表过一篇论文[2],他们用增强学习的方法训练AI玩经典的Atari游戏。其实在几年前就有人研究如何让AI玩《星际争霸》,目前人类大师还是能击败AI的。电脑游戏中大量使用人工智能技术,你有没有觉得游戏变得越来越聪明了?

那么……未来呢?

人工智能研究者面对这样的成就当然欣喜。深度学习和强化学习等技术完全可以用于更广泛的领域。比如最近很火的精准治疗,我们可以训练它们判断哪些治疗方案对某个特定的人有效。
 
但是,围棋毕竟不仅仅是一项智力成就。就像十多年前的国际象棋一样,围棋必定也会引发超出本领域之外的讨论。等到计算机能在围棋上秒杀人类的时候,围棋是不是就变成了一种无聊的游戏?人类的智力成就是不是就贬值了?AI还将在其他层面上继续碾压人类吗?传统认为AI不可能完成的任务是否也都将被逐一打破?人类最后是会进入AI乌托邦还是被AI淘汰呢?
 
没人知道答案。但有一点毫无疑问:AI一定会进入我们的生活,我们不可能躲开。这一接触虽然很可能悄无声息,但意义或许不亚于我们第一次接触外星生命。

赶快去买一期自然杂志收藏下,这是一个划时代的事件。

 

 

[ 打印 ]
阅读 ()评论 (9)
评论
bachata 回复 悄悄话 回复 '低智商猪头' 的评论 : 人类“我”的观念是来自哪里呢? 是否和人类作为一部自然的机器能够自我主动食入养份而存活着有关呢, 还是说和包括感情,爱和恨,恻隐之心; 灵感,创造能力等等的一起,是来自于独立于肉身之外的"灵魂"呢? 至于后者的话,人类也许永远无法明白. 如果是前者的话,计算机似乎永远掌控在人类手里而无法自我具备这种能力,何况超越,隐藏,欺骗人类。计算机之对于人类,也许就象人类对于造物主,人类对于上帝的,自然科学的探索,也许只能无限接近真理却永远无法穷尽.
武胜 回复 悄悄话 当然是喜!围棋电脑下过人早晚的事。有了汽车人就不比赛跑了?奥运会不是都看得津津有味么?

也不用过高估计AI的水平。首先挑战李世石未可乐观,即便电脑赢了他,也未必能赢其他棋手。据说小李不擅长对付电脑。其次,蒙特卡洛树搜索不算特别高深的技术,只不过比较切合围棋的情况,而现在的电脑处理能力又比过去强。希望围棋手们也学习AI技术,从中找出击败它的途径,然后电脑再改进,彼此助长。这样棋手们就不只是从游戏里赚钱,也为科技做点贡献。

Google悬赏百万不会只有一次吧?钱么,就该这样花在有意思的地方。百度啊,华为啊,快来与AlphaGo打擂台吧,毕竟围棋是国粹呢。
J_man 回复 悄悄话 AI的目的是多样的,像本文的AlphaGo是专门用来下围棋的,模仿人类对弈,但优于人类。也有专门要模仿人的,需要有情感以更像人,像SIRI。所以,情感,爱,恨,是否划为智能范畴要看具体的AI目标。要直接模仿情感,就建立情感模式的数据库,设计产生情感模式的触发条件,以及相应的逻辑好了。
人类的情感来源我看是来自百万年的进化,比如说反复擦地板1000遍,人会感到烦躁,愤怒等情绪而停止。而没有任何情绪再擦1000遍的人已经灭绝了,很可能是手指摸烂而无法寻找食物。。。所以没能留下后代。
灵感是偶发事件,计算机有随机函数;创造能力是将已有知识重新排列组合,形成新的知识,我相信AlphaGo已经拥有,不然下不过欧洲冠军。
匡吉 回复 悄悄话 AI如何实现人类的感情,灵感,创造能力?比如爱和恨,恻隐之心,人类自己都没弄明白怎么来的,如何用AI实现?
J_man 回复 悄悄话 谷歌AI的突破在我看来是能够动态修正AI的逻辑,或者说是拥有持续学习的能力。这跟人类学习的方式是一样的,通过与环境的互动,每天都在长知识。对事物的评价,人类大脑用的是统计学的贝叶斯算法(Bayesian law),根据事件出现的数量,不断修正事件发生的概率。游戏的AI一般是既定的程式,开发设计时要考虑到所有可能出现的情况,并给之逻辑处理程式,当游戏发布时就定型了。“自我意识"也不难突破,一些研究者认为只要拥有”自传体式的记忆能力“即可。
无论如何,AI不是敌人不是朋友,AI就是人类自己,是人类大脑的延伸。
forqzy所说”把人类肉身抛弃之后的高级生命体”是另外一个话题,我也相信这是人类的未来,关键的步骤是如何实现你将独特的人生记忆和感知世界的逻辑无损地转换到电子设备上。
forqzy 回复 悄悄话 拔电和摧毁机器其实都不能毁灭人工智能的,最终是人类进化的产物,把人类肉身抛弃之后的高级生命体

低智商猪头 发表评论于 2016-02-10 19:58:15
计算再多也是计算机。最重要的焦点是人工智能能不能形成“我”的观念。能否通过图灵测试。如果能,那绝对是人类的末日。它智力大大高于人类,就会自我隐藏,欺骗人类而不被察觉。而它与人类一定是对立的,因为人会拔电源(类似的行为)来控制它,而智慧生命体必然要避免这种情况的发生。
独上南岛 回复 悄悄话 下棋就是下棋,世上的事情,未必都可以用下棋的计算法来解决。
低智商猪头 回复 悄悄话 计算再多也是计算机。最重要的焦点是人工智能能不能形成“我”的观念。能否通过图灵测试。如果能,那绝对是人类的末日。它智力大大高于人类,就会自我隐藏,欺骗人类而不被察觉。而它与人类一定是对立的,因为人会拔电源(类似的行为)来控制它,而智慧生命体必然要避免这种情况的发生。
狸猫的爸 回复 悄悄话 很了不起的成就,主要是GOOGLE肯投资围棋. 关于AlphaGo 的文章: http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html
登录后才可评论.