1 / 6
文档名称:

大数据技术与应用.doc

格式:doc   大小:63KB   页数:6页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据技术与应用.doc

上传人:wwlgqnh 2019/9/12 文件大小:63 KB

下载得到文件列表

大数据技术与应用.doc

文档介绍

文档介绍:附件25:高职电子信息大类大数据技术与应用赛项技能竞赛规程、评分标准及选手须知一、竞赛内容赛项名称:大数据技术与应用赛项内容:以大数据技术与应用为核心内容,重点考察参赛选手在Hadoop平台环境下,对于大规模并行数据处理以及内存计算技术的应用能力。具体包括:,了解基于大数据计算平台的常见应用;、pandas、matplotlib、scikit模块和MapReduce技术、分布式存储系统HDFS、分布式计算框架MapReduce/Yarn、数据仓库Hive、Python等开发语言工具和技术,匹配和连接数据源,实现大数据的采集,提取、清洗、转换、分析、挖掘操作,产生分析结果,并且实现可视化呈现。,完成数据分析报告的编写。二、竞赛方式本赛项为团体赛,每支参赛队由3名参赛选手组成。三、竞赛时量竞赛时间4小时,竞赛连续进行。四、名次确定办法名次确定办法原则上按照竞赛总成绩从高分到低分排序确立选手名次。总成绩相同时,完成时间较短者名次列前;成绩和完成时间均相同时,操作过程较规范者名次列前。五、,采取分项计分制(表1)。表1考核环节及评分标准考核环节考核知识点和技能点分值Hadoop平台安装部署Hadoop平台安装部署和基本配置。15HDFS常用操作命令(查询文件类别、上传、删除文件、查询HDFS基本统计信息)。Hadoop集群的性能调优。数据抓取规则文件数据和关系型数据库数据抓取以及数据同步(同Hadoop/Hive数据同步)。30掌握Hive数据仓库导入、导出以及同Hadoop数据文件的转换,实现Hive数据管理常用命令。能够通过Python编程,使用streaming和MapReduce机制实现数据的抓取。数据清洗、整理、计算和表达基于MapReduce的HDFS文件系统的文件数据的数据查询、整理和计算。20结合Hadoop大数据平台相关技术实现对数据的分析和展现。应用Python编程工具,实现给定数据源的采集,提取、清洗、转换、分析、挖掘操作,产生分析结果,并且实现可视化呈现。综合分析综合应用数据抓取、清洗、整理、计算和表达等相关知识及技术,使用Python编程工具,实现对提供的数据源分析、展现,根据展现结果得出结论,并对结论进行分析,形成分析报告。30团队分工明确合理、操作规范、“裁判长合权负责制”,负责组织评分裁判进行成绩评定。评分裁判负责对参赛队伍(选手)的比赛作品、比赛表现按赛项评分标准进行评定。成绩评定根据竞赛考核目标、内容对参赛队或选手在竞赛过程中的表现和最终成果做出评价。本赛项的评分方法为现场评分和结果评分,现场评分为5分,由现场裁判根据参赛队的操作规范以及综合表现情况进行评分;结果评分为95分,依据赛项评价标准,对参赛选手提交的竞赛成果进行评分。六、(表2)和软件环境(表3)。表2竞赛硬件环境设备类别数量设备用途基本配置服务器1台。内嵌大数据实训管理系统,提供大数据竞赛。PC服务器客户端每支参赛队伍3台。竞赛选手比赛使用。,4G以上内存,显示器要求1024*768以上根据参赛