1 / 40
文档名称:

AlphaGo小白的人工智能之路.pptx

格式:pptx   大小:12,799KB   页数:40页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

AlphaGo小白的人工智能之路.pptx

上传人:镜花水月 2018/11/1 文件大小:12.50 MB

下载得到文件列表

AlphaGo小白的人工智能之路.pptx

相关文档

文档介绍

文档介绍:小白的人工智能之路
2018-6
AlphaGo & AlphaGo Zero
在接下来的一个小时中,你将会……
认识“谁”是可爱的 AlphaGo
还有它的兄弟 AlphaGo Zero……
探知 AlphaGo 和 AlphaGo Zero的实现原理
深度神经网络……蒙特卡洛树搜索……有监督学习
做自己的井字棋 AI /人机对弈程序
易于实现的极大极小树算法
AlphaGo Human or AI?
AlphaGo 战绩
2016年1月27日
AlphaGo 以 5:0 完胜欧洲围棋冠军樊麾
2016年3月9日到15日
挑战世界围棋冠军李世石的AlphaGo 以 4:1 取得胜利
2017年5月23日到27日
乌镇围棋峰会, AlphaGo 以 3:0 战胜世界围棋冠军柯洁
AlphaGo 家族 AlphaGo → AlphaGo Zero → Alpha Zero
AlphaGo:
于2014年开始由Google DeepMind开发的人工智能围棋软件。
它以人类围棋高手的棋谱作为参考数据。
 
AlphaGo Zero:
AlphaGo的团队于2017年10月19日在《自然》杂志上发表了一篇文章,介绍了AlphaGo Zero,这是一个没有用到人类数据的版本(围棋棋盘大小与规则除外),比以前任何击败人类的版本都要强大。
通过跟自己对战,AlphaGo Zero经过3天的学习,以100:0的成绩超越了AlphaGo Lee的实力,21天后达到了AlphaGo Master的水平,并在40天内超过了所有之前的版本。
 
Alpha Zero:
AlphaZero使用与AlphaGo Zero类似但更一般性的算法,在不做太多改变的前提下,并将算法从围棋延伸到将棋与国际象棋上。
AlphaGo 家族有多可怕?!
训练第 0 天的 AlphaGo Zero 什么都不懂,训练第 3 天打败 AlphaGo Lee,训练第 21 天打败 AlphaGo Master,训练第 40天超越了此前AlphaGo 系列的所有成员。
AlphaGo 家族有多可怕?!
AlphaZero在短时间训练后能达到其他算法的同等或更高水平
版本
使用规则
硬件
Elo等级分的理论峰值
战绩
AlphaGo樊(v13)
中国规则
176个GPU,分布式
3,144
5比0战胜[???]
AlphaGo李(v18)
48个TPU,分布式
3,739
4比1战胜[???]
AlphaGo Master
4个TPU v2,单机
4,858
网棋60比0战胜职业棋手; 3比0战胜柯洁;1比0战胜人类团队
AlphaGo Zero
川普-泰勒规则
4个TPU v2,单机
5185
100:0 战胜AlphaGo李; 与AlphaGo Master 对战胜率达90%
AlphaZero
4个TPU v2,单机
N/A
60:40 战胜AlphaGo Zero(3天版本)
AlphaGo 走下神坛
AlphaGo 的胜利意味着AI技术有了突破性的进展?
AlphaGo 的胜利意味着机器打败人脑?
答案是否定的。其实,AlphaGo在算法层面上并没有太多新意,而是通过 Google 强大的团队和计算平台,把已有的技术整合在一起,利用大量的训练数据和计算资源来提高准确性。
AlphaGo = 蒙特卡洛树搜索算法(MCTS) + 深度神经网络