1 / 14
文档名称:

数据挖掘现阶段最常用的算法.doc

格式:doc   大小:180KB   页数:14页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘现阶段最常用的算法.doc

上传人:2786321826 2022/1/2 文件大小:180 KB

下载得到文件列表

数据挖掘现阶段最常用的算法.doc

相关文档

文档介绍

文档介绍:. .
. v .
数据挖掘最常见的十种方法
下面介绍十种数据挖掘〔Data Mining〕的分析方法,以便于大家对模型的初步了解,这些都是日常挖掘中经常遇到的算法,希望对大家有用!〔甚至有数据挖掘公司,用其中的一种算法就能独步天下〕
1、基于历史的MBR分析〔Memory-Based Reasoning;MBR〕
基于历史的MBR分析方法最主要的概念是用的案例〔case〕来预测未来案例的一些属性〔attribute〕,通常找寻最相似的案例来做比拟。记忆根底推理法中有两个主要的要素,分别为距离函数〔distance function〕与结合函数〔bination function〕。距离函数的用意在找出最相似的案例;结合函数那么将相似案例的属性结合起来,以供预测之用。记忆根底推理法的优点是它容许各种型态的数据,这些数据不需服从某些假设。另一个优点是其具备学****能力,它能藉由旧案例的学****来获取关于新案例的知识。较令人诟病的是它需要大量的历史数据,有足够的历史数据方能做良好的预测。此外记忆根底推理法在处理上亦较为费时,不易发现最正确的距离函数与结合函数。其可应用的围包括欺骗行为的侦测、客户反响预测、医学诊疗、反响的归类等方面。
. .
. v .
2、购物篮分析〔Market Basket Analysis〕
,找出相关的联想〔association〕规那么,企业藉由这些规那么的挖掘获得利益与建立竞争优势。举例来说,零售店可藉由此分析改变置物架上的商品排列或是设计吸引客户的商业套餐等等。购物篮分析根本运作过程包含以下三点:〔1〕选择正确的品项:这里所指的正确乃是针对企业体而言,必须要在数以百计、千计品项中选择出真正有用的品项出来。〔2〕经由对共同发生矩阵〔co-occurrence matrix〕的探讨挖掘出联想规那么。〔3〕克制实际上的限制:所选择的品项愈多,计算所消耗的资源与时间愈久〔呈现指数递增〕,此时必须运用一些技术以降低资源与时间的损耗。购物篮分析技术可以应用在以下问题上:〔1〕针对信用卡购物,能够预测未来顾客可能购置什么。〔2〕对于电信与金融效劳业而言,经由购物篮分析能够设计不同的效劳组合以扩大利润。〔3〕保险业能藉由购物篮分析侦测出可能不寻常的投保组合并作预防。〔4〕对病人而言,在疗程的组合上,购物篮分析能作为是否这些疗程组合会导致并发症的判断依据。
3、决策树〔Decision Trees〕
决策树在解决归类与预测上有着极强的能力,它以法那么的方式表达,而这些法那么那么以一连串的问题表示出来,经由不断询问问题最终能导出所需的结果。典型的决策树顶端是一个树根,底部有许多的树叶,它将纪录分解成不同的子集,每个子集中的字段可能都包含一个简单的法那么。此外,决策树可能有着不同的外型,例如二元树、三元树或混和的决策树型态。
. .
. v .
4、遗传算法〔Genetic Algorithm〕
遗传算法学****细胞演化的过程,细胞间可经由不断的选择、复制、交配、突变产生更佳的新细胞。基因算法的运作方式也很类似,它必须预先建立好一个模式,再经由一连串类似产生新细胞过程的运作,利用适合函数〔fitness function〕决定所产生的后代是否与这个模式吻合,最后仅有最吻合的结果能够存活,这个程序一直运作直到此函数收敛到最正确解。基因算法在群集〔cluster〕问题上有不错的表现,一般可用来辅助记忆根底推理法与类神经网络的应用。
5、聚类分析〔Cluster Detection〕
这个技术涵盖围相当广泛,包含基因算法、类神经网络、统计学中的群集分析都有这个功能。它的目标为找出数据中以前未知的相似群体,在许许多多的分析中,刚开场都运用到群集侦测技术,以作为研究的开端。
6、连接分析〔Link Analy