1 / 7
文档名称:

AlphaGo打开新世界.doc

格式:doc   大小:22KB   页数:7页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

AlphaGo打开新世界.doc

上传人:漫山花海 2019/7/2 文件大小:22 KB

下载得到文件列表

AlphaGo打开新世界.doc

相关文档

文档介绍

文档介绍:AlphaGo打开新世界-机械制造论文AlphaGo打开新世界 文/梁霄从3月9日开始的Google人机大战,AlphaGo对决韩国围棋手李世石,一时间引起了全世界人民的关注。四胜一负的AlphaGo好似向人类宣告了一个新的时代——人工智能时代来临。早在2016年1月28日,《自然》杂志发表论文,并以封面故事展示了由谷歌旗下人工智能公司DeepMind研发的计算机围棋程序“AlphaGo”,这项程序在此前一项竞赛中以5比0的成绩战胜了欧洲围棋冠军樊麾,2016年3月又以4比1的成绩战胜了世界围棋冠军李世石。这是有史以来第一次,计算机程序在不让子的情况下,在围棋游戏中击败人类专业高手,而这原本被认为是人工智能在10年后才能达到的成就。“AlphaGo以无数的棋谱数据为基础‘深度学习’,不断完善,又通过自我模拟对局提高实力。此外,我们有针对性地进行了很多测试。所以短短几个月AlphaGO的棋力就能得到显著的提高。”DeepMind公司的CEO兼谷歌副总裁戴密斯·哈萨比斯(DemisHassabis)在接受采访时表示。人工智能最难破解的游戏20多年来,人工智能在大众棋类领域同人类的较量一直存在。从上世纪90年代中期战胜全世界跳棋顶尖高手的“Chinook”程序,到战胜国际象棋大师卡斯帕罗夫的“深蓝”,通过一代代的更新发展,在这类以智力博弈著称的游戏中,人工智能打败人类,创下纪录。然而,一直以来,围棋却是个例外。在这次AlphaGo取得突破性胜利之前,计算机围棋程序虽屡次向人类高手发出挑战,但其博弈水平远远低于人类。在同职业高段位顶尖棋手的较量中往往只能在“让子”的情况下才能打个平手或是略胜一筹。2013年日本电脑围棋“CrazyStone”让四子打败了围棋九段高手石田芳夫,2015年11月韩国专家林宰范研发的“DolBaram”程序在让四子的情况下击败了前超一流棋手赵治勋九段。出现这种情况的原因就在于围棋特别复杂均一回合有35种可能的下法,围棋却高达250种可能。而且每个走法之后还有另外250种走法。以此类推。这意味着,即使最大的超级计算机也难以预测出每个可能下法的结果。因为围棋招法的变化太多了。正如戴密斯·哈萨比斯说的,“可能的位置比宇宙原子数量还要多。为了破解围棋,你需要一种不光会计算的人工智能。它需要多少模仿人类,甚至是人类直觉。你需要会学习的东西。”AlphaGo如何用“大脑”下棋在此前一次次累积的失败经验过后,谷歌研究者开发出了这款名为“AlphaGo”的人工智能程序,祭出了终极杀器——“深度学习”(DeepLearning)。Deepmind公司在《自然》杂志发表的论文中介绍了AlphaGo程序的细节。AlphaGo的核心是两种不同的深度神经网络:“策略网络”(work)和“值网络”(work)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。其中,“值网络”负责减少搜索的深度,其作用是在当前局面下判断下一步可以在哪里走子。它有两种学习模式。一个是简单模式,它通过观察KGS(一个围棋对弈服务器)上的对局数据来训练。粗略地说,这可以理解为让大脑学习“定式”,也就是在一个给定的局面下人类一般会怎么走,这种学习不涉及对优劣的判断。另一个是自我强化学习模