谷歌人工智能围棋比赛首次完胜欧洲冠军-AET-电子技术应用

谷歌人工智能围棋比赛首次完胜欧洲冠军

日期：2016-01-28

关键词： 谷歌人工智能 AlphaGo 神经网络

1月28日上午消息，谷歌今日宣布在人工智能领域的重要进展：开发出一款能够在围棋中击败职业选手的程序——AlphaGo，该程序能够通过机器学习的方式掌握比赛技巧。

人工智能挑战围棋有多难？

　　计算机和人类竞赛在棋类比赛中已不罕见，在三子棋、跳棋和国际象棋等棋类上，计算机都先后完成了对人类的挑战。但对拥有2500多年历史的围棋而言，计算机在此之前从未战胜过人类。围棋看起来棋盘简单、规则不难，纵横各19九条等距离、垂直交叉的平行线，共构成19×19(361)个交叉点。比赛双方交替落子，目的是在棋盘上占据尽可能大的空间。

　　在极简主义的游戏表象之下，围棋具有令人难以置信的深度和微妙之处。当棋盘为空时，先手拥有361个可选方案。在游戏进行当中，它拥有远比国际象棋更多的选择空间，这也是为什么人工智能、机器学习的研发者们始终希望在此取得突破的原因。

　　就机器学习的角度而言，围棋的计算最大有3361种局面，大致的体量是10170，而已经观测到的宇宙中，原子的数量才1080。国际象棋最大只有2155种局面，称为香农数，大致是1047。

“机器学习”预测人类行为

　　传统的人工智能方法是将所有可能的走法构建成一棵搜索树，但这种方法对围棋并不适用。此次谷歌推出的AlphaGo，将高级搜索树与深度神经网络结合在一起。这些神经网络通过12个处理层传递对棋盘的描述，处理层则包含数百万个类似于神经的连接点。

　　其中一个神经网络“决策网络”(policy network)负责选择下一步走法，另一个神经网络“值网络”(“value network)则预测比赛胜利方。谷歌方面用人类围棋高手的三千万步围棋走法训练神经网络，与此同时，AlphaGo也自行研究新战略，在它的神经网络之间运行了数千局围棋，利用反复试验调整连接点，这个流程也称为巩固学习(reinforcement learning)。通过广泛使用Google云平台，完成了大量研究工作。

AlphaGo所使用的神经网络结构示意图

　　征服围棋对于谷歌来说有重要意义。AlphaGo不仅是遵循人工规则的“专家”系统，它还通过“机器学习”自行掌握如何赢得围棋比赛。谷歌方面希望运用这些技术解决现实社会最严峻、最紧迫的问题——从气候建模到复杂的灾难分析。

　　在具体的机器训练上，决策网络的方式是输入人类围棋专家的比赛，到系统可以预测57%人类行动为止，此前最好成绩是44%。此后AlphaGo 通过在神经网络内部进行比赛的方式(可以简单理解成和自己下棋)，开始学习自主探索新的围棋策略。目前AlphaGo的决策网络可以击败大多数具有庞大搜寻树的最先进的围棋程序。

　　值网络也是通过自己和自己下棋的方式来训练。目前值网络可以评估每一步棋能够有多大胜算。这在此前被认为是不可能的。

AlphaGo战绩惊人

　　实际上，目前AlphaGo已经成为最优秀的人工智能围棋程序。在与其他程序的对弈中，AlphaGo用一台机器就取得了500场的胜利，甚至有过让对手4手后获胜的纪录。去年10月5日-10月9日，谷歌安排AlphaGo与欧洲围棋冠军Fan Hui(樊麾：法国国家围棋队总教练)闭门比赛，谷歌以5-0取胜。

AlphaGo与欧洲围棋冠军樊麾的5局较量

　　公开的比赛将在今年三月举行，AlphaGo将在韩国首尔与韩国围棋选手李世石九段一决高下，李世石是近10年来获得世界第一头衔最多的棋手，谷歌为此提供了100万美元作为奖金。李世石表示很期待此次对决，并且有信心获得胜利。

　　此外，AlphaGo的发布，也是Deep MInd在2014年1月被谷歌收购以来首次发声。在被收购之前，这家位于伦敦的人工智能领域的公司还获得了特斯拉和SpaceX创始人马斯克的投资。

人机对弈谁将胜？

　　值得一提的是，上一次著名的人机对弈要追溯到1997年。当时IBM公司研发的超级计算机“深蓝”战胜了国际象棋冠军卡斯巴罗夫。不过国际象棋的算法要比围棋简单得多。国际象棋中取胜只需“杀死”国王，而围棋中则用数子或比目的方法计算胜负，并不是简单地杀死对方棋子。此前，“深蓝”计算机的设计人2007年发表文章指出，他相信十年内能有超级电脑在围棋上战胜人类。

　　该项目并未给IBM带来可以销售的产品，但却让我们意识到：基础科学研究所面临的巨大挑战是值得我们去迎接的，虽然企业在这方面的收益还无法量化。

　　随着顶级科技公司争相在产品中融入智能技术，谷歌并不是唯一一家研究围棋AI的公司，Facebook对围棋人工智能的研究整合此前也亮相最新的计算技术：深卷积神经网络(deep convolutional neural networks)和蒙特卡洛树搜索(Monte Carlo tree search)，前者利用类似于大脑的算法来学习和识别棋盘上各种模式的重要性，而后者相当于一种超前思维，用于计算详细的战略步骤。

Facebook和谷歌在围棋人工智能方面的研究具有极大的代表意义。与国际象棋相比，围棋更具深度。要让计算机掌握相关技巧，需要更多类似于人类的模式识别和直觉判断技巧，计算机象棋软件越来越优秀，已将揭开了这项游戏的神秘面纱；相比之下，围棋目前更加神秘。但将来，围棋的神秘色彩也可能不复存在。

版权声明：本站内容除特别声明的原创文章之外，转载内容只为传递更多信息，并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题，请及时通过电子邮件或电话通知我们，以便迅速采取适当措施，避免给双方造成不必要的经济损失。联系电话：010-82306118；邮箱：aet@chinaaet.com。

谷歌人工智能围棋比赛首次完胜欧洲冠军

日期：2016-01-28

相关内容