1 / 3
文档名称:

数据挖掘十大经典算法.doc

格式:doc   大小:25KB   页数:3页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘十大经典算法.doc

上传人:书生教育 2021/11/15 文件大小:25 KB

下载得到文件列表

数据挖掘十大经典算法.doc

文档介绍

文档介绍:数据挖掘十大经典算法
数据挖掘十大经典算法
1 / 3
数据挖掘十大经典算法
数据挖掘十大经典算法
1.


算法是机器学****算法中的一种分类决策树算法

,其核心算法是

ID3

算法 .

算法
数据挖掘十大经典算法
数据挖掘十大经典算法
3 / 3
数据挖掘十大经典算法
继承了

ID3

算法的优点,并在以下几方面对

ID3

算法进行了改进:
数据挖掘十大经典算法
数据挖掘十大经典算法
3 / 3
数据挖掘十大经典算法
用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的
不足;
在树构造过程中进行剪枝;
能够完成对连续属性的离散化处理;
能够对不完整数据进行处理。
算法有如下优点:产生的分类规则易于理解,准确率较高。其缺点是:在构造树
的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。
数据挖掘十大经典算法
数据挖掘十大经典算法
3 / 3
数据挖掘十大经典算法
2. The k-means algorithm



K-Means

算法
数据挖掘十大经典算法
数据挖掘十大经典算法
3 / 3
数据挖掘十大经典算法
k-means algorithm

算法是一个聚类算法,把

n 的对象根据他们的属性分为

k 个分割,
数据挖掘十大经典算法
数据挖掘十大经典算法
3 / 3
数据挖掘十大经典算法
k < n 。它与处理混合正态分布的最大期望算法很相似,因为他们都试图找到数据中自
然聚类的中心。它假设对象属性来自于空间向量,并且目标是使各个群组内部的均方误差总和最小。
3. Support vector machines
支持向量机,英文为 Support Vector Machine ,简称 SV 机(论文中一般简称 SVM)。
它是一种監督式學習的方法,它广泛的应用于统计分类以及回归分析中。支持向量机
将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分
开数据的超平面的两边建有两个互相平行的超平面。分隔超平面使两个平行超平面的
距离最大化。假定平行超平面间的距离或差距越大,分类器的总误差越小。一个极好
的指南是 Burges 的《模式识别支持向量机指南》。 van der Walt 和 Barnard 将支持向量机和其他分类器进行了比较。
4. The Apriori algorithm
Apriori 算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶
段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。
最大期望 (EM)算法
在统计计算中,最大期望( EM, Expectation –Maximization )