1 / 12
文档名称:

AlphaGo与李世石学习教案.pptx

格式:pptx   大小:160KB   页数:12页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

AlphaGo与李世石学习教案.pptx

上传人:wz_198613 2021/11/8 文件大小:160 KB

下载得到文件列表

AlphaGo与李世石学习教案.pptx

相关文档

文档介绍

文档介绍:会计学
1
AlphaGo与李世石
第一页,共12页。
李世石
李世石,韩国著名围棋棋手,世界顶级围棋棋手,1983年3月2日生于韩国全罗南道,2006年3月12日与女友金贤珍完婚,同年9月3号女儿李慧琳出世。1995年入段,1998年二段,1999年三段,2003年因获LG杯冠军直接(zhíjiē)升为六段,2003年4月获得韩国最大棋战KT杯亚军,升为七段,2003年7月获第16届富士通杯冠军后直接(zhíjiē)升为九段。2006、2007、2008韩国围棋大奖——最优秀棋手大奖(MVP)。棋风特点——李世石属于典型的力战型棋风,善于敏锐地抓住对手的弱处主动出击,以强大的力量击垮对手,他的攻击可以用“稳,准,狠”来形容,经常能在劣势下完成逆转。
第1页/共12页
第二页,共12页。
AlphaGo
阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由位于英国伦敦的谷歌(Google)旗下DeepMind公司的戴维·西尔弗、艾佳·黄和戴密斯·哈萨比斯与他们的团队开发,这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。2015年10月阿尔法围棋以5:0完胜欧洲围棋冠军、职业二段选手樊麾;2016年3月对战世界围棋冠军、职业九段选手李世石,并以4:1的总比分获胜。
2016年3月31日来自中国的围棋人工智能团队已经向本月初(yuèchū)在韩国首尔进行的人机大战中击败李世石九段的谷歌人工智能机器人AlphaGo围棋发起挑战。
第2页/共12页
第三页,共12页。
AlphaGo的两个(liǎnɡ ɡè)大脑
阿尔法围棋(AlphaGo)是通过两个不同神经网络“大脑”合作来改进下棋。这些大脑是多层神经网络跟那些Google图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13 个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。
这些网络通过反复训练来检查结果,再去校对调整参数(cānshù),去让下次执行更好。这个处理器有大量的随机性元素,所以人们是不可能精确知道网络是如何“思考”的,但更多的训练后能让它进化到更好。
第3页/共12页
第四页,共12页。
第一(dìyī)大脑:落子选择器 (Move Picker)
阿尔法围棋(AlphaGo)的第一个神经网络大脑是“监督学习的策略网络(Policy Network)” ,观察棋盘布局企图找到最佳的下一步。事实上,它预测每一个合法下一步的最佳概率,那么最前面猜测(cāicè)的就是那个概率最高的。这可以理解成“落子选择器”。
第4页/共12页
第五页,共12页。
第二(dì èr)大脑:棋局评估器 (Position Evaluator)
阿尔法围棋(AlphaGo)的第二个大脑相对于落子选择器是回答另一个问题。不是去猜测具体下一步,它预测每一个棋手赢棋的可能,再给定棋子位置情况下。这“局面评估器”就是“价值网络(Value Network)”,通过整体局面判断来辅助落子选择器。这个判断仅仅是大概的,但对于阅读速度提高很有帮助。通过分类潜在的未来局面的“好”与“坏”,AlphaGo能够决定是否通过特殊变种去深入阅读。如果(rúguǒ)局面评估器说这个特殊变种不行,那么AI就跳过阅读在这一条线上的任何更多落子。
第5页/共12页
第六页,共12页。
首战,李世石开局执黑子,走出了一个新的布局,AlphaGo一开始应对不佳。李世石形势越来越好,就在其稳操胜券,大家也都认为棋局到了垃圾时间时,李世石出现了小失误,AlphaGo下了两招强手,掌握了局面主导权,局势逆转。最后,李世石投子认输。
李世石赛后说,对AlphaGo的表现感到吃惊,但没想到它下得那么完美。AlphaGo算法能力比较强,实战中下了人类想不到的一手,让其大吃一惊。
计算机博士、《人工智能学家》主编刘锋:震惊于AlphaGo战胜李世石九段,但若以科学实验(kē xué shí yàn)流程规范来评价,我依然认为此次比赛不合格。谷歌应尽早展开线上多人同时在线对弈AlphaGo,以消除其试验不规范带来的质疑。
第6页/共12页
第七页,共12页。
第二局:AlphaGo险中求胜,李世石再败
和第一场不同的是,AlphaGo第二盘积极求战。开局选择挂角出乎人意料,之后还原成中国(zhōnɡ ɡuó)流布局,可以看出AlphaGo对围棋的很多招法有了自己的新理解。但期间AlphaGo也下出了让大师们高呼“大臭棋”的战法,李世石积极应战,取得了一些优势。但AlphaGo让人可怕的一处是,即使每次退缩或妥协之后,局