1 / 61
文档名称:

序列模式挖掘算法研究及其在业务流程设计中的应用.pdf

格式:pdf   页数:61
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

序列模式挖掘算法研究及其在业务流程设计中的应用.pdf

上传人:山吉 2014/2/11 文件大小:0 KB

下载得到文件列表

序列模式挖掘算法研究及其在业务流程设计中的应用.pdf

文档介绍

文档介绍:天津大学
硕士学位论文
序列模式挖掘算法研究及其在业务流程设计中的应用
姓名:胥春艳
申请学位级别:硕士
专业:信息管理与信息系统
指导教师:陈富赞
20070101
中文摘要关键词:数据挖掘技术是用来发现海量数据背后隐藏的重要信息的技术,已成为最为活跃的前沿研究领域之一。序列模式挖掘是数据挖掘中一个重要的研究方向,具有广泛的应用背景,已经引起了越来越多的数据库应用研究者的兴趣。但是现有序列模式挖掘算法在挖掘过程中产生的中间子序列往往呈递归地增长,导致很难有效地处理大规模数据。本文在对现有研究进行深入分析的基础上,不仅提出了能更有效地处理大规模序列数据的频繁序列模式挖掘算法,而且也将序列模式挖掘工具应用到新的领域。在算法研究方面,本文提出了基于编码频繁模式树的序列模式挖掘算法。该算法不仅能从大规模数据库中高效地挖掘出频繁序列模式,而且能同时适用于一维和多维序列数据。通过利用提出的项目关系标识符的概念,为一维和多维序列数据建立了统一的简化线性形式,并进~。挖掘过程不会递归地产生大量中间子序列,减少了大量的内存和目OJ笛橹っ鳎盟惴ㄓ绕湓诖泶蠊婺数据时比现有算法性能更好。在应用方面,本文提出了自动构建的业务流程模板,不仅为序列模式挖掘工具提供了新的应用领域,也为业务流程设计提供非常有力的工具。业务流程设计对于企业业务流程的建立和重组的成功与否往往起到了至关重要的作用。然而,从目前的情况来看,业务流程的设计仅仅依靠专家个人的经验和技能,使得所需费用高昂、费时费力。本文利用序列模式挖掘算法作为工具,对现有的业务流程进行分析,自动构建出可配置的业务流程模板。在返幕∩鲜迪至烁孟低常诵辛己谩8孟低衬艽右延械陌咐邢低地收集可借鉴的行业经验、积累可重用的行业知识,为企业进行业务流程设计提供了非常有价值的参考。数据挖掘业务流程序列模式多维度序列业务流程重组
甌甌瑆,,,,,,,.瑃琻.,.產。.琤’,瑆,
篋.,.琒珺
导师躲帕‰蕊签字日期:賔月叭学位论文作者签名:胥舂拖学位论文作者签名:胥舌抱独创性声明学位论文版权使用授权书或撰写过的研究成果,也不包含为获得墨鲞太茔或其他教育机构的学位或证年本学位论文作者完全了解苤垄盘堂有关保留、使用学位论文的规定。特授权墨注盘堂可以将学位论文的全部或部分内容编入有关数据库进行检签字日期:灸阥月沈日研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表向国家有关部门或机构送交论文的复印件和磁盘。本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。签字目期:索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校C艿难宦畚脑诮饷芎笫视帽臼谌ㄋ得
,现代化的社会生产和科学研究收集了大量的数据。条码在大部分商业产品中的广泛使用,商务、科学和行政事务的计算机化,由文本和图像扫描平台到卫星遥感系统的数据搜集工具的进步,以及作为全球信息系统的互联网的流行,已经将我们淹没在数据和信息的汪洋大海中。存储数据的爆炸性增长越来越需要有效的数据分析和数据理解工具。目前数据库系统所能做到的只是对数据库中已有的数据进行存取,对大型数据库中快速增长的海量数据,如果没有强有力的工具,人们所获得的信息仅仅是整个数据库所包含的信息的很小一部分,无法获得隐藏在这些数据之后的、在决策生成过程中具有重要参考价值的信息。信息技术飞速发展的同时,人工智能领域的研究也取得很大进展。机器学习、多智能体等分支的理论和技术为知识发现的研究和应用提供了强有力的工具。特别是在机器学习领域,根据人类学习的不同模式,人们提出了多种机器学习方法,如:实例学习、观察和发现学习、决策树、神经网络和遗传算法等等。其中某些较常用且较成熟的算法己被人们应用于实际系统中。由于数据库技术和机器学习技术的发展,以及人们将数据转换为知识的迫切需求,数据挖掘技术逐渐发展起来。数据挖掘的研究具有广阔的应用背景和深远的理论意义,是人工智能和数据库系统研究最重要的前沿课题之一,是信息产业最有前途的交叉学科。简单地说,数据挖掘是从大量数据中提取或“挖掘”知识。更为准确的定义是:数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程人们把原始数据看作是形成知识的源泉,就像从矿石中采矿一样。原始数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,如文本、图形、图像数据,甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的