文档介绍:湖南大学
硕士学位论文
具有多维限定性约束条件的交易规则模型及采掘算法研究
姓名:黄超
申请学位级别:硕士
专业:统计学
指导教师:姜灵敏
20020101
要摘论了具有多维约束条件的交易规则模型及其实现算法;在第四部分首先介绍了希望包括本文所提出的模型与算法在内的各种数据挖掘方法能尽早地走向实际关键词:惴‵算法为了及时准确地发现在销售活动中顾客的行为呈现出什么特点,管理人员经常采用关联规则与序列规则分析方法进行商业销售分析,从而为决策者提供决策依据。然而一般的关联规则与序列规则分析无法挖掘带有各种约束条件的交易规则。在本文中,笔者提出了具有多维限定性约束条件的交易规则模型,通过对惴ā算法进行扩展,实现了集中式环境下该模型的采掘算法;通过扩展算法完成了分布式环境下模型的采掘。全文一共分为四个部分:第一部分讨论了数据挖掘与数据仓库的基本概念;第二部分讨论了具有时间约束的交易规则模型及其实现算法;第三部分讨如何在分布式环境下进行关联规则挖掘,然后讨论了如何实现本文提出的模型以及需注意的几个问题。作为一门新兴技术,数据挖掘在我国基本上还处于研究阶段,笔者衷心地数据挖掘关联规则多维约束交易规则采掘算法算法应用。
鸻——篸,猟,—;;;;琲,Ⅱ.
,数据仓库技术应运而生。传统的数据库技术是以单一的数据资源,即数据库为核心,进行从事务处理、批处理到决策分析等各种类型的数据处理工作。然而不同类型的数据处理有着不同的处理特点,以单一的数据组织方式进行组织的数据库并不能反映这种差异。随着数据库技术的普及以及各种管理信息系统途霾咧С窒低的大量应用,人们开始认识到,针对不同的数据处理任务采用不同的数据组织方式是必要的。总的说来,当前的数据处理可以分为两种类型:操作型处理与分析型处理。操作型处理也叫做事务处理,是指企业为完成日常的特定应用,对数据库进行的各种联机操作,如插入、删除、汇总等。为完成此类任务而建立的计算机系统我们一般称之为联机事务处理系统哉饫嘞低橙嗣侵饕9匦牡氖窍煊κ奔洹数据的安全性与完整性。而分析型处理则用于企业管理人员的各类决策分析,如葱行畔⑾低和多维分析等。为完成此类决策分析型任务而建立的计算机系统我们一般称之为联机分析处理系统。为了完成指定的分析任务,系统通常需要访问大量的历史数据并进行相当复杂的运算,而使用系统的管理人员更关心分析结果对决策支持的有效性和可靠性。概括的说,这两类处理的不同主要在于以下五个方面”挛翊碛敕治龃淼男阅芴卣鞑煌治龃矶允菁傻囊G竺飨愿哂谑挛翊恚治龃硇枰O低辰卸菁桑挛翊硐低巢痪弑刚庵挛翊硐低骋话阒槐A舻鼻笆荩治龃硪R源罅康睦肥菸R据;挛翊硐低持斜A袅舜罅康南附谑荩治龃硪6韵附谑萁胁同程度的综合。因此,在传统的事务型环境中亢接构造分析型应用是不合适的。我们必须把能力:
。在下~节里将说明在决策分析过程中,分析型数据从事务环境中提取出来,按照决策支持的需要重新组织,建立单独的分析处理环境。数据仓库正是为了构建这种新的分析处理环境而出现的一种数据存储和组织技术。按照瓾是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程”O耹面我们简要讨论一下数据仓库的四个特征⋯:嫦蛑魈獾模菏莶挚庵械氖荻际俏埔恍┯刖霾哂泄氐闹魈猓绻丝汀供应商、产品等进行组织,排除了对决策无月氖荩傻模和ǔJ莶挚庵械氖堇丛从诙喔鲆熘质菘猓枰6越胧仓库的数据进行清理与集成,以保证命名约定、长度、精度等的一致;北涞模菏荽娲⒋永返慕嵌忍峁┬畔ⅲ莶挚庵械墓丶峁梗或显式地包含时间元素;且资У模菏莶挚庵械氖莶恍枰J挛翊怼⒒指春筒⒎⒖刂苹啤M常,它只需要两种操作:数据的初始化装入和数据访问。,它提供用户用于决策支持的当前和历史数据,而这些数据在传统的操作型数据库中很难或不能得到。数据仓各种技术和模块的总称。所做的一切都是为了让用户更快更方便查询所需要的信息,以便为决策提供支持。图见下页鞘莶挚饪蚣艿氖疽馔肌。最左边是数据源,包括数据库与非数据库源。数据仓库应能通过之类的机制访问各数据源,并能对源数据进行净化、整理。决策者使用各种数据分析工具对进入到数据仓库中的数据进行查询、联机分析以及数据挖掘处理,从而抽取出供决策者使用的决策信息。在上一节我们看到数据仓库框架的工具与接口层中,除了一般的查询、分析与报表工具外,还有一种叫做数据挖掘的工具。在本节我们将详细讨
团圆习习甘困什么是数