1 / 57
文档名称:

Web日志挖掘系统的设计与实现.pdf

格式:pdf   页数:57
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

Web日志挖掘系统的设计与实现.pdf

上传人:山吉 2014/2/28 文件大小:0 KB

下载得到文件列表

Web日志挖掘系统的设计与实现.pdf

文档介绍

文档介绍:华中科技大学
硕士学位论文
Web日志挖掘系统的设计与实现
姓名:唐西西
申请学位级别:硕士
专业:计算机应用技术
指导教师:肖国强
20061028
华中科技大学硕士学位论文摘要随着竟婺5闹鸾ダ┐螅琖同志数掘同益膨胀,对网站管理的任务变得越来越艰巨。如何从大量罩臼蛑刑崛〕銮痹谟杏的信息和知识,以便网站管理人员可以据此优化网站的结构,便利用户的访问,增加网站访问量;已经成为目静迫切需要解决的一个重要问题。志挖掘系统,对大量罩臼蚪型诰颉首先进行数据采集和预处理,识别原始的服务器月志格式并将其结构化,根据分析的目的删除“无用”的记录以进行数据净化。通过启发性规则,借助站点的拓扑结构识别用户,再进行会话识别,得到各个用户在不同的时刻的会话。对不完整的用户访问记录,借助站点的拓扑结构补充用户的访问路径,得到完整的用户会话。通过分析,确定最大向前路径,发现各个聚类效果。充分利用用户聚类结果,设计一种不需要生成候选集的快速关联规则算法,挖掘出各个用户群的趁婀亓9嬖颍⑼诰蛐畔在系统的实现过程中,实现了数掘采集和预处理、用户访问路径识别关键字:同志数据,恢行牡憔劾嗨惴ǎ植克阉鳎亓9嬖因此设计与实现一个用户的频繁访问路径。将恢行牡憔劾嗨枷胍氡曜家糯惴ǎ鲆恢指慕幕旌弦传聚类算法,从所有用户会话挖掘出各个不同的用户群;这种改进的算法能有效地提高标准遗传算法的局部搜索能力和收敛速度,得到较好的之问的相关联系。和用户模式分析的功能。用某网站半个月的V臼荻韵低辰胁馐与分析。
,,琺;甌,.琲琩痷”.,琯琩甌琫瑀、瑃,
华中科技大学硕士学位论文,狹..簂琒
指制雠:桶苫虽学位论文作者签名:彦西函学位论文作者签名:彦乏§西日期:髂辏T乱度保密口,在——年解密后适用本授权书。日期:勿,巧年加矿日学位论文版权使用授权书独创性声明不保密阢日期:!ぁ辏谠马啡个人藏集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,据库进行检素,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数本论文属子朐谝陨戏娇蚰诖颉”
华中科技大学硕士学位论文髀选题背景罩就诰蚋攀随着镜墓婺:头段У闹鸾ダ┐螅酝竟芾淼娜挝癖涞迷来越艰巨。如何了解网站页面的访问情况,并根据网站页面的访问情况改善网页的内容和网站的服务质量,更好的为瘢嗍覹服务器的运行情况【俊U饩托枰7治鲇没Х梦收镜愕耐臼⒁桓鍪涤玫就诰蛳低车慕⒂兄诓檠⒎治龈饔没Р僮鳎私庥没的访问信息,更好的为用户提供众多的服务。通过对臼萁挖掘分析,可以得到关于群体用户的访问路径、访问频度、访问内容的普遍知识,用以改进衿魃杓疲匾5氖牵ü哉庑┯没特征的理解和分析,可以有助于开展有针对性的电子商务活动,给每个用户个性化的界面,提供个性化的电子商务服务【。胖就诰蚧褂幸桓龇浅V匾5墓δ苁悄苡行У卣莆辗衿鞯脑行状况,诊断差错事故,了解访问分布;可以帮助网络管理人员优化站点的设计,分析、排除网络故障,加强网络系统的维护和管理,满足不诰随着的迅速发展,大量的信息涌现在人们面前,如何从大量的,不完全的,有噪音的,模糊的,随机的葜刑崛∫谄渲械模题,即面向氖萃诰颉=玏挖掘定义为:从与喙氐淖试春行为中抽取感兴趣的、有用的模式和隐含信息,即提取和“挖掘”知识【。及菹喙氐男畔ⅲ衿鞫耍突Ф艘约按矶说取>W魑M就诰蛳低场断增长的网民需求。们事先不知道的但又是潜在有用的信息和知识,己成为人们热切关注的问诰虻氖蚨韵蠹涔惴海负蹩珊撬蠾上的数据以.
华中科技大学硕士学位论文掘对象的数据有以下几种:⒂没У姆梦世芳锹迹庵饕W魑7梦嗜罩敬娣旁诜衿鞫耍⑼疽趁嫖实慕峁剐畔ⅲ饷枋隽苏鐾镜慕峁梗峁故峭ü⒂没У淖⒉嵝畔ⅲ馐怯没Ф宰约旱幕久枋觯哂泻芮康牟慰⑼镜囊趁婺谌荩琖网页的实际内容。诰蛞沧裱耸萃诰虻囊话悴街瑁ㄊ菰ご怼⒛J酵掘、模式分析和模式应用。针对不同的数据类型,可以将诰蚧治R韵氯啵内容挖掘搜索引擎、智能畔⑻崛⑼匙远掷唷⒆远傻龋结构挖掘涸谡鯳页面的多维空间中,有用的知识不仅包含在趁娴哪谌葜校乙舶谝趁要,因此可进一步改进网站结构;使用挖掘留下的访问记录进行挖掘,可以发现用户存取趁娴牡哪J剑禾用户或单个用户的访问模式和兴趣。罩就诰记载了用户访问站点的数据,这些数扼包响应状态等。每当站点被访问一次,菘馓峁┝擞泄豔动态