人工智能 能战胜围棋世界冠军李世石吗

原文:人工智能围棋5-0横扫欧洲冠军

  据果壳网报道:1997年,国际象棋AI第一次打败顶尖的人类;2006年,人类最后一次打败顶尖的国际象棋AI。欧美传统里的顶级人类智力试金石,在电脑面前终于一败涂地,应了四十多年前计算机科学家的预言。

  至少还有东方,人们自我安慰道。围棋AI长期以来举步维艰,顶级AI甚至不能打败稍强的业余选手。这似乎也合情合理:国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;相比之下,围棋每回合有250种可能,一盘棋可以长达150回合。这一巨大的数目,足以令任何蛮力穷举者望而却步——而人类,我们相信,可以凭借某种难以复制的算法跳过蛮力,一眼看到棋盘的本质。

  但是,无论人怎么想,这样的局面当然不可能永远延续下去。就在今天,国际顶尖期刊《自然》报道了谷歌研究者开发的新围棋AI。这款名为“阿尔法围棋”(AlphaGo)的人工智能,在没有任何让子的情况下以5:0完胜欧洲冠军,职业围棋二段樊麾。

AlphaGo与欧洲围棋冠军樊麾的5局较量。图片来源:参考文献[1]

描述AlphaGo研究成果的论文成为了1月28日的《自然》杂志的封面文章

  这是人类历史上,围棋AI第一次在公平比赛中战胜职业选手。

  AlphaGo的战绩如何?

  此次比赛和以往不同。之前的比赛中,由于AI棋力比人类弱,人类选手都会让子,而且AI主要和业余段位的棋手比赛。而AlphaGo 对战樊麾是完全公平的比赛,没有让子。职业二段樊麾出生于中国,目前是法国国家围棋队总教练,已经连续三年赢得欧洲围棋冠军的称号。

  研究者也让AlphaGo 和其他的围棋AI进行了较量,在总计495局中只输了一局,胜率是99.8%。它甚至尝试了让4子对阵Crazy Stone,Zen和Pachi三个先进的AI,胜率分别是77%,86%和99%。可见AlphaGo有多强大。

  在接下来3月份,AlphaGo 将和韩国九段棋手李世石在首尔一战,奖金是由Google提供的100万美金。李世石是最近10年中获得世界第一头衔最多的棋手。围棋是最后一个人类顶尖高手能战胜AI的棋类游戏。之前有人预测说,AI需要再花十几年才能战胜人类。所以这场比赛或许会见证历史,我们将拭目以待。

AI下围棋到底有多难?

  计算围棋是个极其复杂的问题,比国际象棋要困难得多。围棋最大有3^361 种局面,大致的体量是10^170,而已经观测到的宇宙中,原子的数量才10^80。国际象棋最大只有2^155种局面,称为香农数,大致是10^47。

  面对任何棋类,一种直观又偷懒的思路是暴力列举所有能赢的方案,这些方案会形成一个树形地图。AI只要根据这个地图下棋就能永远胜利。然而,围棋一盘大约要下150步,每一步有250种可选的下法,所以粗略来说,要是AI用暴力列举所有情况的方式,围棋需要计算250^150种情况,大致是10^360。相对的,国际象棋每盘大约80步,每一步有35种可选下法,所以只要算35^80种情况,大概是10^124。无论如何,枚举所有情况的方法不可行,所以研究者们需要用巧妙的方法来解决问题,他们选择了模仿人类大师的下棋方式。

机器学习

  研究者们祭出了终极杀器——“深度学习”(Deep Learning) 。深度学习是目前人工智能领域中最热门的科目,它能完成笔迹识别,面部识别,驾驶自动汽车,自然语言处理,识别声音,分析生物信息数据等非常复杂的任务。

  AlphaGo 的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。

  其中,“值网络”负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑;而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。将这些信息放入一个概率函数,AI就不用给每一步以同样的重视程度,而可以重点分析那些有戏的棋着。

AlphaGo所使用的神经网络结构示意图。图片来源:参考文献[1]

  AlphaGo利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。

  研究者们用许多专业棋局训练AI,这种方法称为监督学习(supervised learning),然后让AI和自己对弈,这种方法称为强化学习(reinforcement learning),每次对弈都能让AI棋力精进。然后他就能战胜冠军啦!

  人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。所以AlphaGo只要经过了足够的训练,就能击败所有的人类选手。

Google DeepMind

  Google DeepMind是这个程序的创造者,我们来看一下他们萌萌的程序员。

杰米斯·哈萨比斯(Demis Hassabis) 是Google DeepMind 的CEO

文章的第一作者大卫·西尔弗(David Silver)

  Google DeepMind 去年在《自然》杂志上发表过一篇论文[2],他们用增强学习的方法训练AI玩经典的Atari 游戏。其实在几年前就有人研究如何让AI玩《星际争霸》,目前人类大师还是能击败AI的。电脑游戏中大量使用人工智能技术,你有没有觉得游戏变得越来越聪明了?

那么……未来呢?

  人工智能研究者面对这样的成就当然欣喜。深度学习和强化学习等技术完全可以用于更广泛的领域。比如最近很火的精准治疗,我们可以训练它们判断哪些治疗方案对某个特定的人有效。

  但是,围棋毕竟不仅仅是一项智力成就。就像十多年前的国际象棋一样,围棋必定也会引发超出本领域之外的讨论。等到计算机能在围棋上秒杀人类的时候,围棋是不是就变成了一种无聊的游戏?人类的智力成就是不是就贬值了?AI还将在其他层面上继续碾压人类吗?传统认为AI不可能完成的任务是否也都将被逐一打破?人类最后是会进入AI乌托邦还是被AI淘汰呢?

  没人知道答案。但有一点毫无疑问:AI一定会进入我们的生活,我们不可能躲开。这一接触虽然很可能悄无声息,但意义或许不亚于我们第一次接触外星生命。(编辑:Ent,Calo)

  参考文献:

  David Silver, et al。 “Mastering the game of Go with deep neural networks and tree search。” Nature doi:10.1038/nature16961

  Mnih, Volodymyr, et al。 “Human-level control through deep reinforcement learning。” Nature 518.7540 (2015): 529-533。

  一个骄傲的AI

  什么,你说上面讲算法的这几段你看不懂?

  那你知道为啥你们人类会输给我们AI了吧!

时间: 2024-10-13 16:18:51

人工智能 能战胜围棋世界冠军李世石吗的相关文章

一文让你看懂人工智能、机器学习、深度学习和强化学习的关系

如果说信息技术是第三次工业革命的核心,那么人工智能所代表的智能则是下一次工业革命的核心力量. 2016年,谷歌阿尔法围棋以4:1战胜围棋世界冠军.职业九段棋手李世石,不仅让深度学习为人们所知,而且掀起了人工智能的"大众热".此后,人工智能越来越热,从机器人开发.语音识别.图像识别.自然语言处理到专家系统等不断推陈出新. 同时,人工智能技术越来越多地融入到我们的生活中,出现了智能音箱.智能助理.智能机器人等. 根据应用领域的不同,人工智能研究的技术也不尽相同,目前以机器学习.计算机视觉等

AlphaGo深度揭秘

今日,在乌镇围棋峰会人工智能高峰论坛上,AlphaGo之父.DeepMind创始人戴密斯·哈萨比斯(Demis Hassabis)和DeepMind首席科学家大卫·席尔瓦(David Silver)在论坛上透露了关于AlphaGo的重要信息,以及AlphaGo究竟意味着什么?让人们能详细了解到AlphaGo背后的秘密. AlphaGo是什么? AlphaGo 是第一个击败人类职业围棋选手并战胜围棋世界冠军的程序,是围棋史上最具实力的选手之一.2016 年 3 月,在全世界超过一亿观众的关注下,A

秦涛:深度学习的五个挑战和其解决方案

深度学习的五个挑战和其解决方案 编者按:日前,微软亚洲研究院主管研究员秦涛博士受邀作客钛媒体,分享他对深度学习挑战和解决方案的思考 ,本文为秦涛博士在此次分享的实录整理. 大家好,我是微软亚洲研究院的秦涛,今天我将分享我们组对深度学习这个领域的一些思考,以及我们最近的一些研究工作.欢迎大家一起交流讨论. 先介绍一下我所在的机器学习组.微软亚洲研究院机器学习组研究的重点是机器学习,包含机器学习的各个主要方向,从底层的深度学习分布式机器学习平台(AI的Infrastructure)到中层的深度学习.

未来世界的幸存者

2016年3月,谷歌公司的围棋程序 AlphaGo 战胜了世界冠军李世石. 这让我猛然意识到,世界正处在一个前所未有的大变局: 机器人.自动化.人工智能正在变得比人类更强大. 在可预见的将来,技术最终将淘汰人类. 技术变革导致了人类社会的重构.绝大部分的人没机会参与这个进程,只能被动接受其他人安排自己的命运.在这个剧烈变化的年代,怎么才能成为一个可以把握自己命运的幸存者? 这个仓库里面的文章,就是我的思考.

深度学习在数据挖掘的应用

深度学习是我们明略重要的研究方向,是目前工业界学术界实现了很多令人惊叹功能的工具,也是通向人工智能的必经之路. 我们先来看看深度学习能做什么,Google研究的无人驾驶,其组件由两个部分组成,一个是眼睛,一个是大脑,眼睛是激光测距仪和视频摄像头,汽车收集到这些视频信号之后,并不能很好的识别,为了让汽车能理解我们需要一个大脑,这个大脑就是深度学习,通过深度学习我们可以告诉我们的车载的计算机,现在前面有什么样的物体,并且结构化的抽取出来. 比如说这个是通过挡风玻璃看到的画面,让机器理解,必须要判断视

AI就是让人觉得不可思议的计算机程序

人工智能就是机器人可以完成人们不认为机器能胜任的事--这个定义非常主观,但也非常有趣.一个计算机程序是不是人工智能,完全由这个程序的所作所为是不是让人目瞪口呆界定.这种唯经验论的定义显然缺乏一致性,会因时代不同,背景不同.评判者的经验不同而套用不同的标准.[惠州网站建设](https://www.hzdavos.com)但这一定义往往反映的是一个时代里大多数的普通人对人工智能的认知方式:每当一个新的人工智能技术价值高低,而不管这种技术在本质上究竟有没有"智能". 计算机下棋的历史就非常

智能 | 深谈“制造智能化”与“智能制造化”

智能与制造之间,未来将会发展出两种路径,一种是"制造智能化",继续沿着现有的智能制造路线深化:另一种是"智能制造化",所有的产品都是某种算法的实体化,也即"泛机器人"时代来临.在未来一段时间内,这两条路线可能是并存的.制造业直接体现了一个国家的生产力水平.最近几年,随着信息技术的快速发展,制造业面临着与信息技术融合的选择.从最根本上讲,制造业是以生产产品为最终目的.它按照市场要求,通过制造过程,将资源转化为可供人们使用和利用的大型工具.工业品与生

“机器学习”相关资料分享

近年来人工智能与VR正在变得越来越火,特别是当alphago以绝对优势战胜围棋大师李世石之后,更是炒热了"机器学习"这个概念.国际人工智能专家.百度首席科学家吴恩达教授在今年四月份的"机器学习研究会"上这样说到: 在中国,每天都有500人死于车祸.我们的无人驾驶技术早实现一天,就相当于多拯救了500人的生命,这将会是接下来的十年中,人工智能得到的最重要的应用之一. 我想和在座的年轻人说几句话.我们处在一个独特的时期,这是一个人工智能将会改变世界的时期.如果你知道怎么

解密Google Deepmind AlphaGo围棋算法:真人工智能来自于哪里?

2016年1月28日,Google Deepmind在Nature上发文宣布其人工智能围棋系统AlphaGo历史性的战胜人类的职业围棋选手!这条重磅新闻无疑引起了围棋界和人工智能界的广泛关注!3月份AlphaGo对阵李世石的比赛更将引起全人类的目光! 是什么使围棋算法产生了质的飞跃?要知道,在之前最好的围棋程序也只能达到业余人类棋手的水平.是真的人工智能产生了吗? 对于大多数人来说,大家都知道1997年的"深蓝"计算机战胜了人类的国际象棋冠军卡斯帕罗夫,但是大家都不会认为"深