1 / 80
文档名称:

基于Web使用挖掘的网站优化研究.pdf

格式:pdf   页数:80
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

基于Web使用挖掘的网站优化研究.pdf

上传人:coconut 2014/2/19 文件大小:0 KB

下载得到文件列表

基于Web使用挖掘的网站优化研究.pdf

文档介绍

文档介绍:江苏科技大学
硕士学位论文
基于Web使用挖掘的网站优化研究
姓名:卢健
申请学位级别:硕士
专业:管理科学与工程
指导教师:葛世伦
2011-06-15
摘要
摘要
近年来,数据挖掘(Data Mining,简称 DM),受到国际人工智能与数据库界的广
泛重视。但是随着网络时代的到来,传统的数据挖掘的对象发生了改变,这对于数据
挖掘和知识发现提出了新的挑战,Web 挖掘正是这样的背景下提出的。Web 挖掘就是
从 Web 世界的各种数据中识别出有效的、新颖的、潜在有用的,以及最终可理解的
模式的过程。Web 挖掘已经成为 Web 信息决策的重要手段,而 Web 使用挖掘因为其
获得挖掘数据的便利性及准确性,更是成为 Web 挖掘中的重要研究方向之一。
目前我国的互联网已经十分普及,成为人们获取各种信息的主要手段之一。互联
网与实体经济不断融合,利用互联网改造和提升传统产业,带动了传统产业结构调整
和经济增长方式的转变,互联网已经成为我国发展低碳经济的新型战略性产业。工信
部发布的互联网产业数据显示,截至 2009 年底,国内网站数量达到 323 万个,年增
长率 %,,信息产业占国内生产总值的比重达到10%左右。
随着互联网产业的不断发展,网站之间的竞争达到了白热化程度,如何在日益激烈的
网站竞争中脱颖而出是网站决策者面临的主要问题。“以用户为核心”的网站构建思
想已经成为趋势。这就需要网站经营者了解用户对于网站访问的感受,同时根据用户
的需要及时对于网站进行合理的改进,从而赢得用户的青睐。日志文件是网站能够直
接获得的最为全面的用户访问记录,日志文件中记录了用户访问过程的全部信息。
Web 使用挖掘正是从 Web 日志文件中发现用户的访问习惯和访问模式,从而对于网
站的运行布局和结构进行优化,进而提升网站的用户满意度。
本文结合“江苏招生考试网”的真实运行数据,通过 Web 使用挖掘技术对于网
站的运行日志文件进行全面的挖掘分析,从中发现用户的访问习惯和访问模式,进而
发现网站的运行现状以及页面之间的关联性、时序性,最终根据挖掘结果帮助网站决
策者制定优化策略,这对于网站适应未来发展趋势、加快自身发展、应对竞争和挑战
有着极具价值的现实意义。
论文创新之处主要体现于:全面梳理了 Web 使用挖掘的相关理论知识;针对 Web
使用挖掘的整个过程进行了深入探讨,特别针对数据预处理中的主要问题提出相应的
解决办法;在理论研究的基础上,综合运用计算机技术、数据库技术、数据挖掘等手
段,建立了“基于 Web 使用挖掘的网站优化系统”,为 Web 使用挖掘的实际应用做出
了有益的尝试。

关键词:数据挖掘,Web 使用挖掘,数据预处理,关联规则
I
Abstract
Abstract
In recent years, Data Mining has being paid fairly attention by international artificial
intelligence and data base field. With web age’ing, objects of traditional data mining
change, which brings the new challenge to data mining as well as knowledge discovery.
And Web mining, introduced from such a background, that is a course of recognizing
effective, new, potencially useful, comprehensible mode. It has e a significant means
for web information decision-making, meanwhile, e an essential academic interest of
web mining for mining data’s convenience and accuracy.
Our country work’s prevalence promotes itself to e one of the main
manners for people achineving kinds of information. It brings along traditional industry’s
structural readjust