1 / 90
文档名称:

MapReduce海量数据并行处理ch.01.ppt

格式:ppt   大小:9,450KB   页数:90页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

MapReduce海量数据并行处理ch.01.ppt

上传人:联系 2018/7/3 文件大小:9.23 MB

下载得到文件列表

MapReduce海量数据并行处理ch.01.ppt

文档介绍

文档介绍:Ch. 1. 并行计算技术简介
MapReduce海量数据并行处理
南京大学计算机科学与技术系
主讲人:黄宜华
2011年春季学期
鸣谢:本课程得到Google公司(北京)
中国大学合作部精品课程计划资助
Ch. 1. 并行计算技术简介
?



?
1. 为什么需要并行计算?
贯穿整个计算机技术发展的核心目标:提高计算性能!
Intel
微处理器
每秒
1千8百亿次
浮点运算!
近20年性能提高3千多倍
巨型机:中国天河一号,2010年底世界TOP500强第1名 每秒2千5百多万亿次浮点运算,近20年性能提高3千多倍
亿亿
千万亿
百万亿
十万亿
万亿
千亿
百亿
十亿
亿
提高计算机性能的主要手段
:70-80年代:
Intel处理器:
71年,4004,4bits;
78年,8086,8bits;
82年,80286:16bits;
85年~90s,80386,486,Pentium,P2,P3,P4:32bits
05年~,Pentium D往后-Core i3,i5,i7:64bits
为什么需要并行计算?
提高计算机性能的主要手段

摩尔定律:
芯片集成度
每18个月翻
一倍,计算
性能提高一倍
为什么需要并行计算?
为什么需要并行计算?
提高计算机性能的主要手段

实现指令级并行(Instruction-Level Parallelism, ILP)
RISC结构
5级流水线
为什么需要并行计算?
提高计算机性能的主要手段

分支预测,寄存器重命名,超长指令字(VLIW), 超标量(Superscalar),乱序执行,Cache……
Pentium 4(CISC结构)采用了20级复杂流水线
为什么需要并行计算?
提高计算机性能的主要手段
:1990s-2004:
为什么需要并行计算?
所有这些技术极大地提高了微处理器的计算性能,但2004后处理器的性能不再像人们预期的那样提高
单核处理器性能提升接近极限!
集成度
性能