1 / 1
文档名称:

数据挖掘可视化系统设计与实现.doc

格式:doc   大小:27KB   页数:1页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘可视化系统设计与实现.doc

上传人:3144187108 2021/8/20 文件大小:27 KB

下载得到文件列表

数据挖掘可视化系统设计与实现.doc

文档介绍

文档介绍:龙源期刊网
数据挖掘可视化系统设计与实现
作者:杨健章 关婷婷 曲婷婷 王璐 来源:《科技创新与应用》 2015 年第 16 期
摘 要:针对当前数据可视化工具的种类、质量和灵活性上存在的不足,构建一个数据挖 掘可视化平台。将获取的数据集上传到系统分布式数据库中,对数据集进行预处理,利用 Mahout 提供的分类、聚类等挖掘算法对数据集进行挖掘,使用 ECharts 将挖掘产生的结果进行
可视化展示。
关键词:数据挖掘;可视化展示;数据预处理;挖掘算法
引言
在大数据时代,通过数据挖掘可以对数据库中的大量业务数据进行抽取、转换、分析和其 他模型化处理,从而提取辅助商业决策的关键性信息,帮助企业做出决策。丰富而灵活的数据 挖掘结果可视化技术使抽象的信息以简明的形式呈现出来,加深用户对数据含义的理解,更好 地了解数据之间的相互关系和发展趋势。然而当前数据可视化工具的种类、质量和灵活性较大 的影响数据挖掘系统的使用、解释能力和吸引力。
这就需要使用分布式大数据处理技术进行数据的存储和计算,构建一个数据挖掘可视化平 台,通过多种挖掘算法实现对原始数据集进行挖掘,从而发现数据中有用的信息。
1 关键技术
MapReduce 离线计算框架
一种在 YARN 系统之上的大数集离线计算框架,使用 MapReduce 可以并行的对原始数据
集进行计算处理,从而高效的得出结果。
HBase 分布式数据库
一个构建在 Hadoop 之上分布式的、面向列的开源数据库。 HBase 不同于一般的关系数据 库,它是一个适合于非结构化数据存储的数据库。
Mahout
Apache Software Foundation 旗下的一个开源项目,提供一些可扩展的机器学****领域经典算 法的实现,包括聚类、分类、推荐过滤、频繁子项挖掘等。
ECharts