1 / 15
文档名称:

12款常用的数据挖掘工具推荐.docx

格式:docx   大小:897KB   页数:15页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

12款常用的数据挖掘工具推荐.docx

上传人:sxlw2017 2018/3/12 文件大小:897 KB

下载得到文件列表

12款常用的数据挖掘工具推荐.docx

文档介绍

文档介绍:12款常用的数据挖掘工具推荐
数据挖掘工具是使用数据挖掘技术从大型数据集中发现并识别模式的计算机软件。数据在当今世界中就意味着金钱,但是因为大多数数据都是非结构化的。因此,拥有数据挖掘工具将成为帮助您获得正确数据的一种方法。
 
常用的数据挖掘工具
R
R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。
Oracle数据挖掘(ODM)
Oracle Data Mining是Oracle的一个数据挖掘软件。 Oracle数据挖掘是在Oracle 数据库内核中实现的,挖掘模型是第一类数据库对象。Oracle数据挖掘流程使用Oracle 数据库的内置功能来最大限度地提高可伸缩性并有效利用系统资源。
 
Tableau
Tableau提供了一系列专注于商业智能的交互式数据可视化产品。Tableau允许通过将数据转化为视觉上吸引人的交互式可视化(称为仪表板)来实现数据的洞察与分析。这个过程只需要几秒或几分钟,并且通过使用易于使用的拖放界面来实现。
 
5. Scrapy
 
Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。
 
 
Weka
Weka作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学****算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。
Weka高级用户可以通过Java编程和命令行来调用其分析组件。同时,Weka也为普通用户提供了图形化界面,称为Weka KnowledgeFlow Environment和Weka Explorer。和R相比,Weka在统计分析方面较弱,但在机器学****方面要强得多。
 
7、RapidMiner
Rapid Miner,原名YALE又一个学****环境,是一个用于机器学****和数据挖掘实验的环境,用于研究和实际的数据挖掘任务。毫无疑问,这是世界领先的数据挖掘开源系统。该工具以Java编程语言编写,通过基于模板的框架提供高级分析。
8、八爪鱼采集器
八爪鱼是一款通用网页数据采集器,使用简单,完全可视化操作;功能强大,任何网站均可采集,数据可导出为多种格式。
 
9、KNIME
KNIME是一个基于Eclipse平台开发,模块化的数据挖掘系统。它能够让用户可视化创建数据流(也就常说的pipeline),选择性的执行部分或所有分解步骤,然后通过数据和模型上的交互式视图研究执行后的结果。
KNIME中每个节点都带有交通信号灯,用于指示该节点的状态(未连接、未配置、缺乏输入数据时为红灯;准备执行为黄灯;执行完毕后为绿灯)。在KNIME中有个特色功能——HiLite,允许用户在节点结果中标记感兴趣的记录,并进一步展开后续探索。
 
 
10、Orange
 
Orange是一个以Python语言编写的基于组件的数据挖掘和机器学****软件套件。它是一个开放源码的数据可视化和分析的新手和专家。数据挖掘可以通过可视化编程或Python脚本进行。它还包含了数据分析、不同的可视化、从散点图、条形图、树、到树图、网络和热图的特征。
 
11、IBM SPSS Modeler
 
IBM SPSS Modeler工具工作台最适合处理文本分析等大型项目,其可视化界面非常有价值。它允许您在不编程的情况下生成各种数据挖掘算法。它也可以用于异常检测、贝叶斯网络、CARMA、Cox回归以及使用多层感知器进行反向传播学****的基本神经网络。
 
12、Pentaho
Pentaho为数据集成、业务分析以及大数据处理提供一个全面的平台。使用这种商业工具,你可以轻松地混合各种来源的数据,通过对业务数据进行分析可以为未来的决策提供正确的信息引导。
 
Pentaho整合了多个开源项目,目标是和商业BI相抗衡。它偏向于与业务流程相结合的BI解决方案,侧重于大中型企业应用。它允许商业分析人员或开发人员创建报表,仪表盘,分析模型,商业规则和BI流程。
 
 
12、NLTK