1 / 76
文档名称:

Module 5 - Hadoop Technical Review.ppt

格式:ppt   页数:76
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

Module 5 - Hadoop Technical Review.ppt

上传人:管理资源吧 2011/9/3 文件大小:0 KB

下载得到文件列表

Module 5 - Hadoop Technical Review.ppt

文档介绍

文档介绍:Google puting Faculty Training Workshop
Module V: Hadoop Technical Review
© Spinnaker Labs, Inc.
Overview
Hadoop Technical Walkthrough
HDFS
Databases
Using Hadoop in an Academic Environment
Performance tips and other tools
© Spinnaker Labs, Inc.
You Say, “tomato…”
Google calls it:
Hadoop equivalent:
MapReduce
Hadoop
GFS
HDFS
Bigtable
HBase
Chubby
(nothing yet… but planned)
Some MapReduce Terminology
Job – A “full program”- an execution of a Mapper and Reducer across a data set
Task – An execution of a Mapper or a Reducer on a slice of data
. Task-In-Progress (TIP)
Task Attempt – A particular instance of an attempt to execute a task on a machine
© Spinnaker Labs, Inc.
Terminology Example
Running “Word Count” across 20 files is one job
20 files to be mapped imply 20 map tasks + some number of reduce tasks
At least 20 map task attempts will be performed… more if a machine crashes, etc.
© Spinnaker Labs, Inc.
Task Attempts
A particular task will be attempted at least once, possibly more times if it crashes
If the same input causes crashes over and over, that input will eventually be abandoned
Multiple attempts at one task may occur in parallel with speculative execution turned on
Task ID from TaskInProgress is not a unique identifier; don’t use it that way
© Spinnaker Labs, Inc.
MapReduce: High Level
© Spinnaker Labs, Inc.
Node-to-munication
Hadoop uses its own RPC protocol
munication begins in slave nodes
Prevents circular-wait deadlock
Slaves periodically poll for “status” message
Classes must provide explicit serialization
© Spinnaker Labs, Inc.
Nodes, Trackers, Tasks
Master node runs JobTracker instance, which accepts Job requests from clients
TaskTracker instances run on slave nodes
TaskTracker forks separate Java process for task instances
© Spinnaker Labs, Inc.
Job Distribution
MapReduce programs are contained in a Java “jar” file + an XML file containing serialized program configuration options
Running a MapReduce job p

最近更新

养老护理的康复护理技能 27页

2026年公司停工的通知书 7页

2026年公司人事部个人工作报告通用 15页

2026年八年级物理公式 5页

2026年八年级以陪伴为题的作文 7页

2026年八字喜火女孩用字 3页

2023年三门峡社会管理职业学院单招职业倾向性.. 39页

2023年上海兴伟学院单招职业倾向性考试题库必.. 41页

2023年上海外国语大学贤达经济人文学院单招职.. 40页

2023年上海工程技术大学单招职业倾向性考试模.. 40页

2023年上海师范大学天华学院单招综合素质考试.. 40页

2023年上海政法学院单招职业适应性考试题库附.. 41页

2023年上海立达学院单招职业技能测试模拟测试.. 42页

2023年上海财经大学浙江学院单招职业适应性考.. 41页

2023年上饶职业技术学院单招职业技能测试模拟.. 41页

2023年临夏现代职业学院单招职业倾向性考试题.. 40页

2023年乌海职业技术学院单招职业技能考试题库.. 40页

2023年九江职业技术学院单招职业倾向性考试模.. 41页

2023年云南交通运输职业学院单招职业倾向性测.. 41页

2023年云南国防工业职业技术学院单招职业技能.. 41页

2023年云南工程职业学院单招职业倾向性考试模.. 41页

2023年云南文化艺术职业学院单招职业技能考试.. 40页

2023年云南机电职业技术学院单招职业倾向性测.. 39页

2023年云南水利水电职业学院单招职业适应性考.. 38页

2025年重庆市《保安员证》考试题库含答案 39页

预防滑倒、绊倒及跌落专题培训课件 45页

混凝土工程培训课件优秀PPT 26页

小学数学六年级下册《鸽巢问题》作业设计 9页

食品标签审核确认表 3页

住院患者自带药品使用管理规定通知 3页