1 / 6
文档名称:

大数据挖掘技术应用研究.doc

格式:doc   大小:16KB   页数:6页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据挖掘技术应用研究.doc

上传人:刘禅 2022/8/7 文件大小:16 KB

下载得到文件列表

大数据挖掘技术应用研究.doc

文档介绍

文档介绍:大数据挖掘技术应用研究
摘要:近年来由于计算器技术和信息产业的快速发展,促使了相关的数据量也产生了极大的增长。然而面对这些庞大且杂乱的多维数据集,我们无法快速且有效的找到我们所需要的信息。因此我们必须要使用数据挖掘技术以从数据集
样式评估根据某些有趣度量,来辨认代表知识的有趣样式,也可以说是评估数据跟数据之间的关联性是否是有用的、重要的、是否正确。
用户接口
这个模块让用户可以与数据探勘系统进行沟通,他允许使用者透过设定数据探勘查询或工作与系统进行互动、提供讯息来帮助搜寻,对暂时数据探勘结果进行探索性数据探勘。
2 数据探勘工具
Rapidminer
Rapidminer开源式框架,支持各种类型的数据挖掘像是文本、网络、图像或是链接开放式的数据挖掘[1]。透过它复杂的图形用户接口,数据挖掘的過程可以更加的简洁且快速,直观地实现和执行,并且不需要额外的程序语言编辑技术。
Weka
WEKA用于数据挖掘任务的算法的集合,算法可以直接应用在数据集上,也可以从自己设计的Jave代码调用[2]。Weka它包含了数据的预处理、分类、回归、聚类、关联规则和可视化的工具也就是图形接口,Weka可以算是最古老,且最成功的开元数据挖掘库和软件,随后被集成为Rapidminer和R的扩充软件,也因为Rapidminer和R的出现,它们提供了使用者更加舒适且便利的使用环境,使得Weka的用户开始大幅的下降。
KNIME
KNIME图形接口的自由开源信息汇整系统,它具有杰出的数据统合能力,并且可以运用在数据查询(DataMining)、数据处理、数据分析、流程绘制以及流程规划与管理(Workflow)等等各方面。
3 数据探勘工具比较
Rapidminer:独立平台;使用者:学****者、高级用户、专业用户、企业用户;用户接口:主要是透过图形接口来做流程的设计,也可以同时开启多个窗口来做操作;功能:大于500种,可透过扩展来新增额外的功能,且可扩展WEKA和R作为它的扩充元件,并进行协同工作;操作接口:简洁易懂的操作接口,不需要额外的学****程序语言的编辑能力,使用者只需要透过拉取所需的原件并且将其连接起来即可使用,使用者可自由配置操作接口;支持的输入格式:CSV、Excel、XML、Access、AML、ARFF、XRFF、SPSS、SASDatabases、JDBC....;支持输出模型格式:模型可以导出为不同的档案格式,像是bmp、jpg、pdf、PostScript、raw、XML等各种文件格式。
WEKA:独立开发平台;使用者:学****者、一般用户;用户接口:图形接口;功能:约500种;操作接口:有四种模式可供使用者选择使用,每种模式都各有其优缺点,使用者需挑选最合适的使用模式使用;支持的输入格式:ARFF、CSV、、BSI、Localfile、URLs、JDBC..;支持输出模型格式:不支援。
KNIME:Java平台;使用者:学****者、一般用户;用户接口:可在同一时间开启四个不同的视窗,用来做不同的功能;功能:约100种;操作接口:简洁易懂的使用接口,可以让使用者很容易得学会,也可以自由配置操作接口;支持的输入格式:A