首页 > 疾病 > 百科 > 内容

电脑围棋“大师”挑战人类尊严最敏感地带

2019-03-06 16:12来源:互联网关注:作者:蒙多

原标题:电脑围棋“大师”挑战人类尊严最敏感地带

  一篇《自然》杂志封面文章28日引爆舆论——名为“阿尔法围棋”(Alpha Go)的谷歌计算机程序,在完全平等条件下以5∶0完胜欧洲冠军、职业围棋二段棋手樊麾。《自然》以“All SYSTEMS GO”为题报道,指出计算机围棋战胜人类冠军一切已然就绪。

  这当然不是说说而已:Alpha Go已经约战近10年来获世界冠军头衔最多的棋手、韩国天才李世石九段,奖金是由谷歌提供的100万美金。

  国内媒体甚至用“人类最后的智力骄傲即将崩塌”来渲染此事,似也有据可依:两个月前,首届世界计算机围棋锦标赛冠军“石子旋风”(Dolbaram)对决中国现任围棋名人连笑,结果被让4子、被让5子负,被让6子胜,就被誉为“历史性的突破”;此前,计算机围棋甚至不足以成为业余高段位棋手的对手,对弈职业棋手,被让9子几无胜绩……放在18年前超级计算机“深蓝”战胜国际象棋世界冠军卡斯帕罗夫之后、计算机围棋博弈水平仍一直远低于人类的大背景下,Alpha Go敢于挑战世界顶尖棋手,确有一种石破天惊的震撼效应。

  那么这一次,计算机围棋战胜人类,真的近在眼前了吗?

  人类智力运动“皇冠上的明珠”

  计算机围棋之难,首先难在这项被称为人类智力运动“皇冠上的明珠”本身的多重复杂性。“最简单的规则,最复杂的变化”,是对围棋最简单明了的概括。

  “围棋具有巨大的状态空间复杂度和博弈树复杂度,又在本质上无法做准确的静态盘面评估”,这使得即使采样样本足够大,也有力所不逮之处。北京邮电大学教授、计算机围棋研究所所长刘知青用以下一组数据来说明:状态空间复杂度(用于搜索),围棋是10172,中国象棋、国际象棋分别是1048、1046;博弈树复杂度(用于决策),围棋是10300,中国象棋、国际象棋分别是10150、10123。

  另一重复杂,是围棋落子选点无法验证。一手棋有多大价值,数学证明,或搜索验证,都难以胜任。“分析围棋棋子位置,数目的多少,以及棋子之间的静态关系(例如影响函数),无法完整、准确地评判围棋棋子的作用和最终死活;围棋棋子的作用和最终死活必须由博弈的具体进程决定”。

  令人震惊的巨大突破

  尽管Alpha Go此次完胜的对手并非职业顶尖棋手,中国围棋队总教练余斌九段仍感觉“吃惊”。以往认为,计算机围棋“100年都不会有突破”的他,从中看到“关键的突破点已被找到”。

  刘知青把它看作“远超过去”的巨大突破——已公布的五局棋谱,经国内“准一线”棋手察验,质量很高,“虽然离一线水准还有差距,但差距不大”。

  具有相当棋力、一直从事“互联网+围棋”的北京万同科技有限公司CEO陈雷注意到,五局棋的对弈时间早于去年11月份的首届世界计算机围棋锦标赛,而彼时的赛后沙龙上,几乎所有计算机围棋技术从业者都相当乐观地认可,计算机棋手平等战胜人类,会在15—20年内发生。其实陈雷在“乐观派”中亦属最乐观的,当时他就认为“10年内必有突破”;但“谷歌默默无闻地做,一下子拿出来”,仍“令人震惊”。

  深度神经网络让Alpha Go显著进步

  乐观的理由,在于近年来“蒙特卡洛算法”的应用,它在解决围棋盘面“一手棋有多大价值、怎样判断形势优劣”两大核心问题上,比前辈做的都好。

  但此次Alpha Go明显更进了一步。刘知青、陈雷介绍,它应用了目前人工智能领域最热门的卷积神经网络技术,能模拟人脑神经元,具有深度学习、主动识别、自适应等功能,在图像处理方面异常强大。

  比如,作为其核心的两种深度神经网络“策略网络”(policy network)和 “价值网络”(value network)的成功应用:前者,将盘面落子选点从几百、几十个大大缩减为三五个,逐渐接近职业棋手;后者,也是最难的,在盘面形势判断上,通过职业棋手棋谱的验证、筛选,给出下一步的预判,这比以往基于海量数据的“蒙特卡洛树搜索”(未加任何验证)对职业棋手盘面符合率达到40%—50%要好很多。

  在此情况下,专业人士所最担忧的“所有技术开发人员都不知道职业棋手是怎么想的”,似可迎刃而解。

  Alpha Go会是另一个“深蓝”吗?

  至于令人瞩目的3月份人机约战,包括对计算机围棋最乐观的人在内,迄今没有人明确表示Alpha Go会是另一个“深蓝”。

  “具体结果不好说”,刘知青没有明确胜负倾向,但技术发展这么快,看不到“天花板”,“还有两个月时间,谁知道会发生什么”。

版权声明:除注明外均收集于互联网,如有侵权请及时联系我们处理!

热门排行
推荐文章