人机对战:不断革新的AlphaGo ——深度学习

2017-04-23

2017年5月23日-27日,现等级分第一人、世界冠军柯洁九段将在浙江乌镇迎战谷歌人工智能AlphaGo,“人机大战Ⅱ”势必再掀围棋热潮。

  人机对战:不断革新的AlphaGo

  AlphaGo是一款由谷歌旗下DeepMind公司研发的围棋人工智能程序。这个名字第一次见诸报端还是去年初,它在没有让子的前提下5-0击败欧洲冠军樊麾。但彼时AlphaGo也仅被视为诸多棋类AI中的一个,尚无今日的影响力。

  直到去年三月,在业内普遍乐观的情况下,世界冠军头衔上双的韩国棋手李世石却被AlphaGo在五番棋中以4-1击败,“人机大战” 引发了关于围棋与人工智能的新思考与新讨论。


1

李世石与AlphaGo的“人机大战”

  赛前圈内之所以压倒性看好李世石,是基于AlphaGo与樊麾的对局,高段棋手普遍认为AlphaGo的实力尚不足以挑战韩国天王,水平大概处于业余六至七段之间。但短短不到三个月,AlphaGo就完成了从业余六段到超职业九段的跨越。

  相比其他围棋AI而言,AlphaGo拥有如此之快的进步速度,这与它“深度学习”的特性密不可分。新版的AlphaGo会产生大量自我对弈棋局,为下一代AI提供训练数据,更新的版本随之而生,此过程循环往复。这意味着,AlphaGo无时无刻不在进步。

  “销声匿迹”大半年后,化名“Master”的AlphaGo于去年底重出江湖,它连挫中、日、韩三国顶尖围棋好手,豪取60胜却难求一败。

  在结束了Master的测试后,DeepMind团队于今年1月下旬宣布推出新版AlphaGo。与前作相比,新版AlphaGo在继续深耕“深度学习”的基础上,摒弃了人类棋谱,这意味着AlphaGo可弈出更贴合人工智能的围棋。

  与柯洁对弈的将是怎样一个AlphaGo,谷歌方面并没有在10日的发布会上披露太多升级细节。但谷歌大中华区总裁石博盟表示,即将亮相乌镇的是AlphaGo的最新版本,优于与李世石对抗之时。

  新模式:顶尖棋手合力“围剿”

  此番柯洁将与AlphaGo对战三番棋,比赛采用中国规则,每方用时为三小时,保留5次1分钟读秒。除番棋对决外,今次还将举办两场形式不同的交流比赛,即配对赛与团体赛。

  世界冠军古力将与连笑一道出战配对赛,两位棋手将与AlphaGo进行交叉组队。古力透露,人机配对此前并未有过练习,由于对局弈和的可能性较小,这也表示其中一方的AlphaGo会输。古力同时表示,如何理解AlphaGo的独特风格并与之合作,是两位参赛棋手将面临的最大挑战。

  团体赛中,时越、芈昱廷、唐韦星、陈耀烨、周睿羊五位世界冠军将组成豪华阵容携手出战,对抗AlphaGo。据悉五位世界冠军将建立“神经网络”,借此降低心理因素的影响,从而作出更加客观的判断。团体赛每方用时为2小时30分,少于柯洁与AlphaGo的三番战。

  的确,在去年年底Master的惊艳表现之后,业内就有声音认为,人机大战的结果其实已无悬念。回想过往约一年时间里,AlphaGo未能取胜的两盘棋:一是败于李世石的灵犀妙手,不过那时的AlphaGo与今时不可同日而语;二就是在与陈耀烨对局时,因断线而被判和棋。

时间: 2024-08-28 08:06:54

人机对战:不断革新的AlphaGo ——深度学习的相关文章

AlphaGo深度揭秘

今日,在乌镇围棋峰会人工智能高峰论坛上,AlphaGo之父.DeepMind创始人戴密斯·哈萨比斯(Demis Hassabis)和DeepMind首席科学家大卫·席尔瓦(David Silver)在论坛上透露了关于AlphaGo的重要信息,以及AlphaGo究竟意味着什么?让人们能详细了解到AlphaGo背后的秘密. AlphaGo是什么? AlphaGo 是第一个击败人类职业围棋选手并战胜围棋世界冠军的程序,是围棋史上最具实力的选手之一.2016 年 3 月,在全世界超过一亿观众的关注下,A

高考作文,人机对战,人工智能只有小学水平

3月份时的人机围棋大战,国际顶尖选手李世石遭阿尔法狗完爆,这次人机对战考验的是围棋的逻辑能力,而计算机本就是逻辑产物,李世石落败情理之中.在昨天高考作文的人机大战中,拼的不仅是逻辑,更重要的语言文字的情感表达能力.在此次直接的语言文字比拼中,人工智能的情感表述尚显稚嫩. 人工智能情感表述尚显稚嫩,高考作文水平不及格 语文高考作文每年都是网络热点话题之一,而在昨天微软小冰也参加了高考作文创作,这被很多网友认为是人工智能与人类又一场PK,微软小冰同场与张鸣.安意如.潘采夫等10位名家进行高考作文创作

棋类人机对战的一般原理

下棋的程序,主要难点在“人机对战”,也就是机器有多聪明,下棋水平(AI)高不高. 不同的棋类,棋盘.棋子.规则都各不相同.但制作人机大战的思路有许多共同的特点. 1.局面估值 根据当前的棋局和“轮到谁走下一步棋”对当前局面进行估算,得到一个或少数几个整数(小数也无防).一般是4个整数合成(加法)一个整数,这4个整数是: 我攻+我防+敌攻+敌防.即对自己有利的 避开对自己有害的 避开对敌人有利的 对敌人有害的.(感谢咙想酒甜  446828992) 2.搜索2.1 单步搜索.根据当前棋局,算出我方

五子棋人机对战

1.? 项目流程 UI界面部分 利用Java的图形界面工具swing和awt来绘制棋盘的框架,绘制了19X19的网格.然后在画布上增加监听器来监听鼠标点击的部分,然后在邻近的网格交点处绘制棋子,这样就实现了下棋的效果. 逻辑处理部分 19X19的棋盘,就用19X19的二维数组来存储棋盘的信息.每当玩家新增加一个棋子,后台部分就会遍历一遍数组,对每一个槽进行8个方向深度为5的DFS搜索,判断是否有五子相连的情况,这样就实现了输赢的判断. 人机对战原理 简而言之就是统计棋型累计评分,例如4个我方或对

C语言 AI智能,五子棋 人机对战,人人对战

C语言五子棋,人机对战,人人对战 [email protected]:~$ cat main.c  # include<stdio.h> # include<string.h> # include<stdlib.h> # define SPA 0 # define MAN 1 # define COM 2    /* 空位置设为0 ,玩家下的位置设为1 ,电脑下的位置设为2 */ int qipan[15][15];    /* 15*15的棋盘 */ int a,b,

Android 蓝牙对战五子棋项目实现(含人机对战功能)

上周花了一周时间做的课程设计的项目,实现的功能如下: 基本功能: (1) 该APP能够通过蓝牙自动搜索周围其他使用了该APP的手机,用户可选择其中某一个APP发起对战的要求,被发起方可以同意或者拒绝: (2) 双方可以实现五子棋蓝牙对战: (3) 具备悔棋等功能. (4) 实现人机对战.提供难度选择. (5)提供用户战绩排名系统. 项目已经上传到Github:https://github.com/jiangzhengnan/PumpkinGoBang.git Github跳转 下面是界面截图和实

HTML5+JS 《五子飞》游戏实现(八)人机对战

要想实现人机对战,就必须让电脑自动下棋,而且要知道自动去查找对方的棋子,看看有没有可以挑一对的,有没有可以夹一个的,这样下起来才有意思. 当电脑用户下完棋后,电脑应立即搜索用户的棋子,然后如果没有被吃的,就再随机走一个棋子(要想让电脑成为下棋高手就不能随机下棋,要考虑下棋后会不会再被对方吃掉等等,这里只简单做随机下子了). 完整<五子飞>游戏人机对战:http://www.lyout.com/projects/Fiveflychess/FiveflyChess8.htm // 查找是否有可挑的

[转]浅谈AlphaGo背后所涉及的深度学习技术

转自:http://www.199it.com/archives/449359.html 导读:关于Alfa Go的评论文章很多,但真正能够与开发团队交流的却不多,感谢Alfa Go开发团队DeepMind的朋友对我这篇文章内容的关注与探讨,指出我在之前那一版文章中用字上的不够精确,所以在此又作调整.我之前文章提到的「全局」指的是跨时间点的整场赛局,很容易被误认为是某个特定时点整个棋盘的棋局,所以后面全部都修改为「整体棋局」.此外,关于整体棋局评估,除了透过脱机数据学习的评价网络之外,还可以透过

介绍一款Android小游戏--交互式人机对战五子棋

文章转载至CSDN社区罗升阳的安卓之旅,原文地址:http://blog.csdn.net/luoshengyang/article/details/6589025 学习Android系统开发之余,编写了一个小游戏--交互式人机对战五子棋,自娱自乐.之所以称之为交互式人机对战五子棋,一是因为在进入人机对战模式这前,你可以任意设置好开局,同时,在对战过程中,你可以看到机器的思考过程,还可以标识出每一个落子点的优劣势:二是因为可以为机器增加游戏经验,使得机器越来越聪明.希望喜欢五子棋的同学能够喜欢,