1 / 73
文档名称:

基于关联规则的Web日志挖掘系统的研究与应用.pdf

格式:pdf   页数:73
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于关联规则的Web日志挖掘系统的研究与应用.pdf

上传人:banana 2014/2/8 文件大小:0 KB

下载得到文件列表

基于关联规则的Web日志挖掘系统的研究与应用.pdf

文档介绍

文档介绍:南京航空航天大学
硕士学位论文
基于关联规则的Web日志挖掘系统的研究与应用
姓名:舒晔
申请学位级别:硕士
专业:计算机科学与技术
指导教师:郑洪源
2010-12
南京航空航天大学硕士学位论文
摘要
在市场经济下,企业竞争就是对客户和市场的争夺,如何能够根据用户需求改进营销策略
和网站结构,从而抓住市场,吸引更多的客户群体,已成为企业竞争的关键。然而传统的通过
用户注册来记录用户信息的模式已不能满足企业想要了解最新最全面的用户信息的需求。随着
信息技术和网络技术的快速发展,人们越来越频繁的进行网上活动,Web 上产生了海量访问数
据,这些数据以日志形式存放,其中隐含着用户访问网站及交易习惯和兴趣,企业可以对这些
数据进行处理从而得到有价值的信息。
本文在分析如何从 Web 日志中得到用户信息的基础上,结合数据挖掘的特点,给出了基于
关联规则的 Web 日志挖掘系统架构。
首先,对 Web 日志挖掘系统架构的各个层次和各部分功能,以及关键技术进行了说明,并
介绍了整个系统的设计流程。
其次,结合 Web 日志数据的特点,分析并研究了数据预处理和挖掘算法实施过程;在挖掘
算法实施过程中,本文选择关联规则算法,对经典的关联规则挖掘算法进行剖析,并将其与已
有改进算法进行比较,在此基础上,提出一种引入关联矩阵思想的关联规则改进算法,实验证
明在相同最小支持度和记录数下,改进后的算法效率优于其他算法。
最后,将论文的研究成果初步应用于某海运企业管理网站,实践证明该系统的应用使得企
业获得的用户信息更及时准确,用户服务质量明显提高。

关键词:Web 日志挖掘,日志记录,数据挖掘,数据预处理,关联规则

i
基于关联规则的 Web 日志挖掘的研究与应用
Abstract
Under the circumstance of market economy, petition in enterprises is to grab customers
and markets. That how to improved the strategy and web site structure that satisfied with users to
attract more customers and grab mackets is essential to pany. However , traditional way of users
registering and logining has not meet the requirements of the enterprise to know the recent and
comprehensive information of their the rapid development puter and ,
plete their transaction on web frequently, and abundant data resources in log structure is
created on the Web. The data hides users’ accessing behavier and their enterprise can
process the Web data and get the valuable information.
In this thesis, on the basis of researching on how to get the user ’s information from ths Web logs
and referring to the data mining technique,the system architecture of web log minning based on
association rule is designed.
The layers and functions of the web log minning system is panied by illustrations and
explanations. Then, the designing flow of system is given and analyzed.
By analyzing the web log datas, do the research of data preprocessing and mining algori