1 / 15
文档名称:

hadoop入门实例教程40.ppt

格式:ppt   大小:1,495KB   页数:15页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

hadoop入门实例教程40.ppt

上传人:小可爱 2022/8/21 文件大小:1.46 MB

下载得到文件列表

hadoop入门实例教程40.ppt

文档介绍

文档介绍:hadoop入门实例教程40
半连接实例
全局作业参数传递
全局数据文件传递
课程目标
实例执行结果:半连接
多数据源连接解决方法的限制
如果数据源两两之间需要进行多个不同的主键和外键的连接,则无法一次性完成数hadoop入门实例教程40
半连接实例
全局作业参数传递
全局数据文件传递
课程目标
实例执行结果:半连接
多数据源连接解决方法的限制
如果数据源两两之间需要进行多个不同的主键和外键的连接,则无法一次性完成数据源的连接
通过多次使用MapReduce过程完成不同主/外键键的连接
例如,有三个数据源,Customers(CustomerID主键)、Orders(OrderID主键,CustomerID外键、ItemID外键)、Products(ItemID主键)
解决方法:设计两个MapReduce作业
第一个作业完成Customers与Orders的连接
第二个作业完成第一个作业的连接结果与Products的连接
全局作业参数/数据的传递
MapReduce作业处理过程中,有时需要让每个节点共享一些重要的计算参数或数据
对于小的计算参数,可以通过Configuration类来传递
对于较大的数据,可以用共享数据文件来进行传递
尽量避免用硬代码方式在程序中设置作业参数,而是设置作业参数
实现一个具有一定通用性的程序,允许任意指定字段作为参数
运行程序时指定需传递的数据
然后该参数作为一个属性保存在Configuration对象中
并允许Map和Reduce节点从Configuration对象中获取和使用该属性值
全局作业参数的传递
Configuration类提供的保存和获取属性的方法
全局作业参数的传递实例
需求:
处理顾客和订单数数据集的连接
连接主键参数希望通过在命令行中给出连接主键的列号来设置
代码实现
将第1个输入参数设置为GroupKeyColIdx属性
全局作业参数的传递实例
在Mapper或Reducer类的初始化方法中从Configuration对象中读取该属性值
查询全局MapReduce作业属性
程序可以通过Configuration对象,使用预定义的属性名称查询计算作业相关的信息
感谢您的关注

最近更新

2025年度老旧房屋置换交易合同书 9页

钉钉考勤申请操作 18页

2025年度矿山资源开发与环境保护风险评估合同.. 8页

2025年度生物科技产品买卖合同补充协议 10页

2025年度物流运输居间服务简易合同 9页

2025年度河道治理工程环境影响评价与评估合同.. 9页

2025年度林业碳交易树木砍伐权转让合同 10页

2025年度智慧社区车位租赁出售合同协议 9页

2025年度教育培训机构课程定制合作协议 9页

2025年度房屋租赁安全免责合同(带宠物) 8页

2025年度建设工程律师委托代理服务协议 8页

2025年度工厂车间承包与自动化生产线改造合同.. 9页

2025年度实习协议书:航空航天实习生 7页

2025年度委托招聘合同——企业国际化人才引进.. 8页

2025年度团体定制礼服租赁合同 9页

2025年度合伙人分伙协议书:无人驾驶汽车技术.. 8页

部编版教材语文三年级上册小练笔及习作训练梳.. 10页

2025年度先进设备转让协议书版 10页

最新二手房过户合同 6页

暑假补习班学生安全合同协议 7页

2025年度井盖外观设计定制采购合同 8页

2025年度个体诊所与医疗影像技术员劳动合同书.. 7页

新版建筑工程合同解析 7页

连续外周神经阻滞王连主 52页

文化创意公司劳动合同范本 6页

教育机构教职工劳动合同合同书 7页

文化旅游区土石方运输协议3篇 59页

探索房地产买卖合同新规定 6页

工业用地转让及建设合同模板 7页

车辆保险知识讲座 19页