1 / 13
文档名称:

大数据方案介绍.docx

格式:docx   大小:450KB   页数:13页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据方案介绍.docx

上传人:guoxiachuanyue006 2022/6/7 文件大小:450 KB

下载得到文件列表

大数据方案介绍.docx

相关文档

文档介绍

文档介绍:学台架构
网缁试書荐催设半Uiv^M
开源成熟的hadoop生态体系
从企业的技术选型角度,hadoop能满足大数据场景下绝打多数需求,同时在技术可行性与成本上,具有无可比拟额优势。
1、H加、停用、启用或者移除节点。
,对节点上每个服务进行管理,如HDFS,Yarn,HBase等,包括停止,启动重启。
对象管理,Hive、HBase、HDFS数据对象的增删改查。
日志审计,操作日志记录了所有改变系统配置的操作,通过日志的查询审计,发现不当
操作,保证系统安全稳定运行。
多租户管理
多租户管理模块提供如下功能:
用户管理,负责用户的增删改查。
角色管理,负责角色的增删改查。
权限管理,负责授权和取消授权。
学习文档仅供参考
队列管理,负责Yarn队列管理。
资源使用规则管理,负责资源使用规则的增删改查。
系统监控
系统监控提供如下功能:
集群监控,显示集群cpu、内存、网络、10使用情况。
节点监控,显示节点上每个组件服务的状态及运行情况;显示节点cpu、内存、网络、I0使用情况。
任务监控,监控节点上每个作业的完成情况。
调度管理
Prospector大数据平台提供所有类型的任务调度管理。Prospector大数据平台的任务类型包括:数据集成任务、数据预处理任务和数据分析任务三类。
Prospector大数据平台可以对所有类型任务实线以下类型调度:
一次性执行
定期执行
>条件执行
数据集成〔DataIntegrator〕
数据集成理模块负责将外部数据源导入到Prospector大数据平台,同时也负责将数据分享到其他的外部数据存储。
睿帆DataIntegrator用于将外部数据源的数据集成到Hadoop大数据平台。DataIntegrator支持三大类数据源:
1.数据库、NoSQL系统
文件系统〔FTP、HDFS〕
3.消息队列〔Kafka、ActiveMQ〕
数据库、NoSQL系统数据源
DB2
Oracle
Teradata
MySQL
Netezza
PostgreSQL
学习文档仅供参考
SybaseIQ
Vertica
Greenplum
Hive
HBase
文件系统与文件格式
ApacheLog
CSV/TSV
•HTML/XML
JSON
AVRO
Parquet
Binary
Key,Value
ORC
消息队列数据源
Kafka
ActiveMQ
数据治理〔DataGovernor〕
数据治理模块负责对导入到大数据平台中的数据进行处理,对数据进行清洗、转换、过滤聚合、脱敏等,将数据转化成有意义的数据供分析人员使用。
数据治理模块同时负责数据质量管理。
学习文档仅供参考
业人n~t
数据质量
1.数据质量评估。提供全方位数据质量评估能力,如数据的重复性、关联性、正确性、完全性、一致性、合规性等,对数据进行全面体检。
2.数据质量检核和执行。提供配置化的度量规则和检核方法生成能力,提供检核脚本的定时调度执行和第三方调度工具的调度执行功能。
3.数据质量监控。系统提供报警机制,对检核规则或方法进行阀值设置,对超出阀值的规则进行不同级别的告警和通知。
定制化数据质量报告。系统提供了丰富的API可进行定制化数据质量包括开发,另外系统内置了常用质量报告。
强大的数据质量问题分析能力。提供多种问题分析能力,包括血统分析,影响分析,全链分析,定位问题产生的根源。
数据整理与转换
数据整理。包括数据过滤、数据合并、数据拆分、数据复制、数据排序等数据预处理功能。
数据转换。计算产生新变量、重新赋值、统计汇总、Rank、生成随机数、替换缺失值、空值处理、Lookup等数据转换功能。
数据分析〔DataAnalyzer〕
数据分析模块提供给用开发环境、集成简化机器学习算法、提供图形化的拖拽界面供数据分析使用。
应用开发用户通过可视化方式定义工作流完成下数据分析:统计报表、数据挖掘、机器学习、文本挖掘。
学习文档仅供参考
拖拽式可视化开发环境
「:5=T*门r■-?:
SgualnzskarfcCitlDAckasit
F、匡1已1叫Q®|X|O|HI
IrerMbrin
企业数据分析用户通过可视化开发环境定义数据分析的逻辑,DataAnalyzer将其转化成对底层数据分析算法的调用,并提供任务执行、任务调度和任务管理功能。
DataAnalyzer样例
企业数据分析师可以同过DataAnalyzer完成一系列数据分析。
聚类
通过聚类算法,DataAnalyzer可以把企业

最近更新

2025科技公司员工转正报告动态PPT设计模板 28页

2018文学社全年工作计划范文与2018文明创建工.. 6页

2018最新关于师生演讲稿范文精选与2018最新关.. 3页

2018机关党总支工作思路与2018机关党支部工作.. 7页

2018版幼儿园中班保育员中级考试试题试题(含答.. 10页

2018版幼儿园大班保育员开学模拟考试试题试题.. 11页

2025跨国企业高管述职总结与战略规划演示文稿.. 21页

2018食品销售工作计划书与2018食堂策划书(3篇.. 23页

舞蹈社团制度计划 8页

IOS风格商务风PPT模板 26页

中国风叶公好龙成语故事2025小学语文课件设计.. 22页

二零二五云端协作平台在远程团队知识管理中的.. 26页

二零二五届家委会换届选举流程与规则说明PPT模.. 25页

神马实业股份有限公司帘子布公司动力二期冷冻.. 44页

二零二五年熊猫主题传统文化节日习俗认知课件.. 23页

二零二五毕业季紫色卡通风格班级回忆录主题班.. 21页

教科版科学三年级下册全册知识点归纳整理 6页

某公司质量管理体系及质量手册(doc 45页) 45页

尼日尔矿业法 2页

生物安全标准操作规程 12页

生物安全体系文件 5页

设施设备使用维护管理操作规程 8页

【程序文件】实验室生物安全程序文件 38页

水泥企业环境因素识别评价与对策表 8页

2015高教社杯全国大学生数学建模竞赛获奖名单.. 52页

慕安德烈——属天的医治.doc 39页