也谈谈AlphaGo

距离AlphaGo击败李世石已经过去数月了,心中的震撼至今犹在,全刊报道此项比赛的《围棋天地》杂志我已经看了不下十遍。总也想说点自己的意见,却也不知道从哪里说起,更不知道想表达些什么。

作为一个评论者我的身份较特殊,人工智能相关的技术领域我涉足了5年,下围棋的时间则有18年。前者的水平我不敢妄自评估,但领域内的最新技术,包括AlphaGo使用的蒙特卡洛搜索树和深度学习之类,基本也在我了解范围之内;后者的水平,大约相当于业余弱5段的样子,高中的时候在县里打打比赛拿个名次也是家常便饭。而我那些比我更懂人工智能的同事们,却连围棋基本规则的也不懂,看直播的时候只是看个热闹而已。我只能孤零零地一个人看新浪的围棋直播,默默地看着李世石一局接一局地落败。即使是他赢下的第四局,实际上也不过是恰好触发了AlphaGo的bug而已。

比赛前我没有看过之前AlphaGo和欧洲冠军樊麾比赛的棋谱,但无论从一个程序员还是一个棋手的角度来讲,我都不认为AlphaGo有哪怕百分之一的胜算。小李的强大是全方位的,也是靠他过去的战绩足以证明的。但是五局比赛下来,除了第四局有一丝隐隐约约的小李风格之外,其他四局完全看不出来是他在对局。抛开第一、二局中的打劫争议不谈(个人是绝对不会同意小李故意不打劫这种说法的),小李在比赛中的问题手以他的水平来讲偏多,而且大都显而易见。换句话说,小李在整个人机大战中并没有发挥出自己的真实水平。

事实上,小李不能发挥出自己的真实水平是必然的,其原因有以下几点:

(1)信息不对称。AlphaGo事先存储了包括李世石在内的大量人类高手的棋谱,而李世石显然是不知道AlphaGo的代码逻辑的,即使有估计他也看不懂。虽然也有放出AlphaGo对阵范麾的五张棋谱,但是这些棋谱是AlphaGo几个月前的水平,而在几个月之后,它通过自我对局水平提高了多少,小李肯定无从得知,大概也只有DeepMind开发团队能了解。如果事先知道对手的综合实力(比如布局中盘官子哪个更强),以及对局风格(比如倾向于攻击还是防守还是均衡),也许小李就不需要在第一、三局进行试探,也不会在第二、四局下得那么保守。事实上,赛前整个围棋界对AlphaGo的评估都是有偏差的。之前所有的人工智能所表现出的都是较强的计算力和相对较弱的大局观(或者叫判断力),而AlphaGo与之完全不同,从与小李的五局来看,其大局观,要强于计算力。AlphaGo可以在第二局下出天外飞仙的37手,也能在第四、五局的封闭局部中出现很明显的误算,就很能说明问题了。

(2)机器节奏导致逻辑割裂。一般人类棋手的落子节奏取决于当前局面,有些地方的招法相对固定,可能1分钟之内可以下十几手,而一些复杂局面会思考一个小时甚至更长。就像一首好听的歌曲,时而节奏轻快,时而节奏缓慢,音调时而高时而低,但整体是顺畅的,悦耳的。但AlphaGo完全不同,它有时候也会长考,但是一个再简单的局面它也会想一分钟再落子,某种意义上它把每一步棋之间的逻辑割裂了。就好像我们平时在家电视剧,进行到中间某个时间的时候突然跳出广告,然后1分钟后再开始播。显然在广告跳出来的时候人一定会产生一个心理波动(比如烦躁),这是人的神经反射所决定的。即便作为一个胜负师,小李的心理承受能力高于常人,但机器落子节奏的影响绝对是不可忽略的。

(3)心理战。许多职业棋手能通过对方的表情和动作来判断其战术意图甚至心理状态,从而针对性地行棋。心理战确实是人和人比赛中不可或缺而且十分精彩的一个部分,不由得想起皮蓬对马龙经典的耳语“记住,邮差周末不上班”。但是人机大战中,心理战完全无效,而且越精通心理战的棋手就越吃亏。小李是心理战的高手,无法使用心理战无疑会在很大程度上降低他的水平。这里还不得不提到AlphaGo的人肉臂黄士杰博士,为了不影响对局,他在整个比赛中滴水未沾,甚至时刻保持面部表情严肃,必须对他表示由衷的敬佩。

(4)水平波动。人是复杂的动物,心理对表现的影响极大,在围棋这样的智力游戏中更为明显。人的水平发挥波动远大于机器,下棋时下出妙手和恶手的概率都要大于机器。不幸的是,恶手易出而妙手难寻,更可况恶手一出很多时候万难挽回。小李固然强,但他的强是对于其他职业棋手而言的强。当他出现恶手而导致局面落于下风的时候,他固然可以凭借自己的妙手翻盘,但更多的时候是通过搅乱局面等待对手失误来获胜的。而机器出恶手的机会要小很多,而且越到后半盘就越不容易犯错误(导致输掉比赛的错误,而非导致局部亏损的小错误)。对战机器,如果单纯以取胜为目标的话,也许会写代码、懂人工智能原理的棋手会比小李更适合,因为他们更容易找到机器的弱点。

那么,我们假设是巅峰状态的李昌镐(22次世界冠军获得者,以心理素质著称,棋风均衡),在事先充分研究了AlphaGo的棋谱,并且在比赛中没有出现显著的水平波动,他能赢AlphaGo么?

我个人的观点是,现在也许能,但在未来的某个时间点开始,任何一位职业棋手都再也不能击败AlphaGo哪怕一局,甚至任何多位职业棋手联合起来也无法击败它。小李输棋,甚至樊麾输棋早已代表了这个趋势,只不过没想到这一天会这么快就来了而已。

那么,在天(穷尽围棋所有变化)与地(围棋规则)之间,人类棋手的水平究竟在什么样的一个位置?以AlphaGo为代表的人工智能又在什么样的一个位置?

没有答案。唯一能知道的是,人和人工智能都在地之上,但永远达不到天。而人工智能作为人在思考能力上延伸,就如同火车飞机是人走路能力的延伸一样,必然在特定的领域上超越人,而且能超越的很远。这对人类是绝对的好事,就如同工业时代机器解放了人类的体力,信息时代人工智能就能解放人类在相对简单又枯燥的思想活动所消耗的脑力,然后投入到更复杂更高级的思想活动中去。其实计算机在几十年前就已经辅助人类证明了四色定理,我们有理由相信它未来能做更多的事,虽然这些事仅凭借我有限的想象力实在是连一件也想不出来。

对于我个人而言,在李世石落败之前,我不下围棋很久了,只是看看新闻和杂志。在李世石落败之后,我又开始偶尔下下围棋了,只不过现实中的对手难觅,不得不选择在网络上下围棋。网络围棋给我的感觉是充满了戾气,总觉得是在为了发泄而下棋,说实话远不如在现实中找到两三个棋友下下棋聊聊天有意思。当然这扯远了。

个人一点想法,欢迎转载,转载请注明出处

时间: 2024-08-24 07:25:53

也谈谈AlphaGo的相关文章

AlphaGo论文的译文,用深度神经网络和树搜索征服围棋:Mastering the game of Go with deep neural networks and tree search

转载请声明 http://blog.csdn.net/u013390476/article/details/50925347 前言: 围棋的英文是 the game of Go,标题翻译为:<用深度神经网络和树搜索征服围棋>.译者简单介绍:大三,211,计算机科学与技术专业,平均分92分,专业第一.为了更好地翻译此文.译者查看了非常多资料.译者翻译此论文已尽全力,不足之处希望读者指出. 在AlphaGo的影响之下,全社会对人工智能的关注进一步提升. 3月12日,AlphaGo 第三次击败李世石

李开复:AlphaGo 若打败了世界冠军,意味着什么?

创新工场董事长李开复在知乎就AlphaGo与李世石的人机大战发表了自己看法,他认为四个月前的AlphaGo击败李世石基本不可能,不过这四个月AlphaGo进步很多,比赛应该很精彩.但是,无论这次结果如何,机器1-2年之内必然完胜人类.完胜人类之后呢?可以做个通用的大脑吗?意味着机器可以思考了吗?还有什么问题是机器无法超越人类的? 以下为李开复就“AlphaGo能战胜李世石吗?”在知乎的回答原文: 先直接回答这个问题,下面再分析AlphaGo和人工智能的未来.我认为AlphaGo这次的比赛打败李世

谈谈对CAP定理的理解

谈谈对CAP定理的理解 CAP定理的常规解释是任何分布式系统只能在一致性(Consitency),可用性(Availability)和分区容忍性(Partition Tolerance)中三选二.这个解释很让人费解,笔者在看了一些文章后谈谈我对它的理解,还请斧正. 从问题出发 假设我们用一台服务器A对外提供存储服务,为了避免这台服务器宕机导致服务不可用,我们又在另外一台服务器B上运行了同样的存储服务.每次用户在往服务器A写入数据的时候,A都往服务器B上写一份,然后再返回客户端.一切都运行得很好,

谈谈我眼中的安徽企腾信息技术集成有限公司

在这里工作一段时间后,说说自己眼中的安徽企腾,我尽量本着客观的原则,不带任何主观因素与感情色彩. 首先,先说说规模,所谓的分成售前与售后,其实就是虚张声势,售前不过是一些笔记本的售后维修,售后与售前基本上没什么关系.而售后,销售加上技术,最多时也不过7个人.平时一些项目,大一点,一些不能做的直接外包出去,小一点的项目,所谓的"施工队",就是全体总动员. 公司里做了好几块业务,其中一块是飕飕商用路由,刚开始,想的是多么好,但是最后却被浇了一盆冷水,市场根本不接受,唯一做了一家宾馆,还是连

谈谈JS里的{ }大括号和[ ]中括号的用法

谈谈JS里的{ }大括号和[ ]中括号的用法,理解后就可以看懂JSON结构了. 一.{ } 大括号,表示定义一个对象,大部分情况下要有成对的属性和值,或是函数. 如:var LangShen = {"Name":"Langshen","AGE":"28"}; 上面声明了一个名为"LangShen"的对象,多个属性或函数用,(逗号)隔开,因为是对象的属性, 所以访问时,应该用.(点)来层层访问:LangShe

《谈谈认同》这个文章有点晦涩 写的不太好

认同是一个人主观能动性的一个影响因素.至于人的主观能动性还有什么影响因素,先不讨论,而且我也没学过也没想过.在可选择事物的主观能动性上,认同应该算最基本也是影响最大的了.回到主题,我们来谈谈认同.        认同有三个表现:第一.口头认同.第二.行动认同.第三.心理认同.简单的理解,就是口头认同只说认同,但不做,事前一套事后一套.行动认同就是说也说了,干也干了,但心里不这样想.心理认同就是口手心合一.但我们都清楚认同其实从本质上讲只有一种,就是心理认同.只有心理认同才是真正的认同.但是在工作

谈谈vector容器的三种遍历方法

说明:本文仅供学习交流,转载请标明出处,欢迎转载! vector容器是最简单的顺序容器,其使用方法类似于数组,实际上vector的底层实现就是采用动态数组.在编写程序的过程中,常常会变量容器中的元素,那么如何遍历这些元素呢?本文给出三种遍历方法. 方法一:采用下标遍历 由于vector容器就是对一个动态数组的包装,所以在vector容器的内部,重载了[]运算符,函数原型为:reference operator [] (size_type n);所以我们可以采用类似于数组的方式来访问vector容

谈谈怎么使用JSONP

JSONP是什么,其实它是目前主流的实现跨域通信的解决方案. 因为我们都知道,在我们使用ajax去发起HTTP请求的时候,是不可以跨域的.也就是不能在不同域名下.端口等去请求.如果我们强行这么做的话,它是会报错. 这里举个例子. function createXHR() { var xhr = new XMLHttpRequest(); return xhr; } function ajax(url) { var xhr = createXHR(); xhr.onreadystatechange

AlphaGo深度揭秘

今日,在乌镇围棋峰会人工智能高峰论坛上,AlphaGo之父.DeepMind创始人戴密斯·哈萨比斯(Demis Hassabis)和DeepMind首席科学家大卫·席尔瓦(David Silver)在论坛上透露了关于AlphaGo的重要信息,以及AlphaGo究竟意味着什么?让人们能详细了解到AlphaGo背后的秘密. AlphaGo是什么? AlphaGo 是第一个击败人类职业围棋选手并战胜围棋世界冠军的程序,是围棋史上最具实力的选手之一.2016 年 3 月,在全世界超过一亿观众的关注下,A