[翻译]AlphaGO留给我们的东西

来源：

http://headlines.yahoo.co.jp/hl?a=20160317-00000049-cnippou-kr

http://headlines.yahoo.co.jp/hl?a=20160317-00000050-cnippou-kr

作者：首尔大学计算机系教授文炳魯

这场世纪的对决以人工智能的胜利而落幕。然而笔者仍然认为如果李世石九段发挥出全盛时期的实力和创意，是不会输给AlphaGO的。虽然李世石输掉了比赛，但仍然展示了作为过去10年世界围棋第一人的那份宽容和品格。这次的对决中虽然也并非没有规则限制等不完整的地方，但是我们应该看开一些，为人工智能的胜利毫不吝啬的送上祝福和称赞。

如果不知道棋盘上变化数量的庞大性，也就不会明白为啥这次的对决会如此的厉害。在围棋中，光是第一手的放置方式就有将近37个位置。之后稍微有所增加，然后越到终盘可能性会逐渐减少。这里假设一次需要考虑的落点位置大概有40个，如果如果计算机一秒钟能考虑一万种情况的话，那么连下7步所需考虑的情况大概需要多少时间来计算呢？

问过周边的熟人，一般的答案都是仅需数秒，而实际却需要近5年的时间。如果扩展到下30步棋，所需要已经超过了10的36次方年。即使候选放子的位置收缩到10个，最初的7步仍然也需要17分钟，而30步则超过了10的18次方年的时间。永劫の歳月だ。虽然一般来说，围棋都会进行到200手一样。但仅仅是考虑30手的下法就已经这种情况了，那怎样才能完整的计算200手棋呢。就结论而言，非常细致的检索和概算仍然是不可或缺的，即使是alphago也没有回避这个问题。

alphago之所以敢于挑战这个巨大的领域，其背景在于近几年卓越的技术进步。对于人类来说，图片的分类是比较容易的，但对计算机而言却并不简单。就当年的发展速度而言，一年之内能把识别的错误率降低个0.5%就很了不起了。然而在2012年的ILSVRC（就是2015年百度被踢的比赛）大赛中，多伦多大学的hinton教授组将错误率从26%一口气压到了15%，并因此赢得了比赛。取得了本应花上20年才能取得的进步。hinton教授所使用的技术正是深度学习和通用GPU运算。到了2015年，错误率已经被压制到了3%以内，仅仅是3年时间就获得了50年的进步。

alphago得益于这个爆发式的技术进步，并在规模上堆到了极致。alphago所使用的深度神经网络，仅仅输入层的节点数量就超过了2万5000个，而处理这些输入情报的中间层（hidden layer）就有将近830万个。而它们之间的连接边（weight edge）竟然达到了14亿个。如此巨大的神经网络直到最近都是不可能训练的。而alphago使用3000万个落点-近16万分棋谱对这个网络进行训练一次就需要大约一个月的时间。

通过这个惊人的过程，人工智能掌握了本以为是人类专属的抽象思考能力。本次对局中，alphago下一手所需的时间在平均一分钟或者稍微超过一点的范围内。通过逆向推定论文的内容，alphago在一分钟内大约做了接近5亿次的局势判断。5亿次看上去很巨大，如果每一手棋需要考虑30个左右落点的话，大概也就平均6.5手而已，10个落点的话大概仅仅能推测8.5手。最终只能以概算的结果来确定落子点。如果考虑到这种检索方式与生俱来的界限，アルファ碁が中盤にすでに計算を終えていたのではという心配は根拠がない。

能够突破这个界限的正是alphago的另一个厉害的地方。仅仅那个程度的检索其实很难说能够战胜人类的最高等级，因为人类也有很多很多概算的地方，甚至比人工智能程序更加精巧。然而alphago有着比其他围棋软件领先一个时代的概算精度。可即便如此仍然可能比人类要差一些，这其中的差距使用强大的计算能力补全。这个结果给予了我们一个重要的启示。人类的抽象思维能力这种东西，可能并非我们所想的那么复杂。

职业围棋界想必受到了巨大的冲击，从今以后也会成为围棋界的重要收获吧。通过与alphago的五盘对局，展现出了职业棋手所下不出来的创意下法。也许会让职业棋手们从下法的固定观念里面所觉悟出来，甚至有扩展思考边界的机会。围棋的水平也会更进一步的发展吧。

也有人担心如果就这样发展下去，数十年后人类被人工智能所支配。从产业发展的历史来看，例如纺织业，信息化的初期也经常会有人对工作受到威胁产生恐惧。但是最终孕育出了新的工种，为人类带来更加富裕的生活。以深度学习为代表的人工智能技术突然来到了我们的生活中，已经到了这些技术的基本含义应该像常识一样被知晓的时代。突然之间进步50年的发展速度，或许能够让我们享受到本应在有生之年连看都看不到的技术产物。

时间： 2025-01-08 19:44:22

[翻译]AlphaGO留给我们的东西

[翻译]AlphaGO留给我们的东西的相关文章

关于Linux系统的swap交换空间

Notepad++中NppExec的使用之一：基本用法

第八周学习总结

继承多态个人理解

CCPC杭州赛总结

【Gradle教程】第六章构建脚本基础

亚伦.斯沃茨

JSP(一)

C#重的数组、集合（ArrayList）、泛型集合（list<T>）三者比较及扩展延伸……