1 / 6
文档名称:

数据挖掘论文关联规则论文.doc

格式:doc   大小:47KB   页数:6页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘论文关联规则论文.doc

上传人:buxiangzhid56 2022/5/5 文件大小:47 KB

下载得到文件列表

数据挖掘论文关联规则论文.doc

文档介绍

文档介绍:数据挖掘论文关联规则论文
摘要:电信行业是最早采用数据挖掘技术的行业之一。数据挖掘中,关联规则的挖掘是最为典型的工作之一,利用相关算法可以进行电信新业务消费群体分析等,帮助运营企业提高市场占有率。
关键词:数据挖掘;关联规则;话单分析
数据挖掘论文关联规则论文
摘要:电信行业是最早采用数据挖掘技术的行业之一。数据挖掘中,关联规则的挖掘是最为典型的工作之一,利用相关算法可以进行电信新业务消费群体分析等,帮助运营企业提高市场占有率。
关键词:数据挖掘;关联规则;话单分析
algorithm and application of association rule mining in billing market analysis
gan lili
(xingtai university,xingtai054000,china)
abstract:telecom is one of the industry that uses data mining technolgy data mining field,associaton rule mining is the most representative one,and with correlation algorithm we can analyse customer groups of telecom new service,which helps telecom operators increase market share.
keywords:data mining;association rule;apriori algorithm;billing analysis
一、关联规则挖掘算法概述
关联规则的形式定义为{x1,x2,….声明….,xn}->y,这意味着如果x1,x2,….,xn全部在事务集合内,那么y也可能在事务中。注意这里用“可能”意味着仅仅是可能,而不是确定。同样注意存在的可能是一个项目集,而不是单个的项目。在全部x1到xn的事务中发现y的可能性叫做置信度。规则在所有的事务中
保持的门限百分比叫做支持度。
在关联规则系统中,规则本身是“如果条件怎么样,那么结果或情况就如何”的简单形式,可以表示为“a=>b”关联规则,它包括两个部分:左部a称为前件,右部b称为后件。前件可以包括一个或多个条件,在某个给定的正确率限制情况下,要使后件为真,前件中的所有条件必须同时为真。后件一般只包含一种情况,而不是多种情况。
支持度的计算方法: ,显然只有支持度较大的规则才是较有价值的规则;置信度的计算方法: ,显然只有置信度比较高的规则才是比较可靠的规则。
一般地,关联规则可以提供给我们许多有价值的信息,在关联规则挖掘时,往往需要事先指定最小支持度与最小置信度。关联规则挖掘实际上真正体现了数据中的知识发现。如果一个规则满足最小支持度,则称这个规则是一个频繁规则;如果一个规则同时满足最小支持度与最小置信度,则通常称这个规则是一个强规则。关联规则挖掘的通常方法是:首先挖掘出所有的频繁规则,再从得到的频繁规则中挖掘强规则。
二、关联规则挖掘算法在话单的市场分析中的应用
电信运营商在日常的市场营销过程中,经常会遇到这样一些问题:如何能