1 / 18
文档名称:

基于关联分析的Web日志挖掘.doc

格式:doc   大小:163KB   页数:18页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于关联分析的Web日志挖掘.doc

上传人:小雄 2020/9/6 文件大小:163 KB

下载得到文件列表

基于关联分析的Web日志挖掘.doc

相关文档

文档介绍

文档介绍:摘要 1关键词 1Abstract 1Keywords 1一、 Web日志挖掘 2(一) 、数据预处理 2(二) 、模式发现 4(三) 、模式分析 5二、 关联分析 5(一) 关联规则 5(二) Apriori方法简介 7四、 实证分析 8(一) 数据预处理 8(二) 模式发现 9(三) 模式分析 10五、 个性化推荐 11六、 结束语 12参考文献 13附录 15基于关联分析的Web日志挖掘摘要:web日志挖掘是web数据挖掘中的一个重要组成部分,通过从Web访问日志中发现用户的访问模式,预测用户的浏览行为。本文主要介绍了web数据挖掘的一般过程及方法,对Apriori关联分析方法作了重点阐述,并利用该方法对某网站某天的部分webH志数据进行了实证分析,得出了用户浏览模式及网页内容之间的关联规则,找到单个用户在浏览页面兴趣爱好以及群体用户的浏览****惯,继而对网站的网页规划布局提出了个性化的意见。关键词:web0志挖掘;关联分析;实证分析WebLogMiningBasedOnAssociationAnalysisAbstract:Weblogminingisanimportantpartofwebdatamining,findingtheuser'esslogs,theresearchercanpredicttheuser',espacallythemethodofApriori,atthesametime,weusethismethodtoanalysisaparticularsite^slogdatatofindtheusers9browsingpatternsandassociationrulesbetweenwebpages;Italsofindsthebrowsinginterestofasingleuserandgroupsusers'browsinghabits,allafterthen,:Weblogmining;Associationanalysis;Positiveanalysis随着t也前所未有地改变着我们的生活,数据信息已经在这个时代爆炸了。但是,我们又不得不面对“人们被数据淹没,人们却饥饿于知识”的现实。随着兴起与20世纪80年代末的数据挖掘在web上的应用,从某种程度上改善了上述情况。根据所挖掘的Web数据的类型,可以将Web数据挖掘分为以下三类:Web内容挖掘(WebContentMining).Web结构挖掘(WebStructureMining).Web使用挖掘(WebUsageMining)(也称为Web日志挖掘)。Web日志挖掘是指采用数据挖掘的技术,通过对Web服务器日志中大量的用户访问记录深入分析,发现用户的访问模式和兴趣爱好等有趣、新颖、潜在有用的以及可理解的未知信息和知识,用于分析站点的使用情况,从而辅助管理和支持决策。当前,web日志挖掘主要被用于个性化服务与定制、改进系统性能和结构、站点修改、商业智能以及web特征描述等诸多领域。—、Web日志挖掘Web日志挖掘主要是通过对web浏览的日志数据的分析,发现用户的浏览模式,更好地规划站点。下面是一段日志:①2006-10-1700:00:00②③ 80④GET⑤/favicon,ico⑥Mozilla/+(Windows;+U;+Windows+NT+;+;+rv:)+Gecko/20060426+Firefox/:①访问时间;②用户IP地址;③访问的URL,端口;④请求方法(“GET”、“POST”等);⑤访问模式;⑥agent,即用户使用的操作系统类型和浏览器软件。Web日志挖掘一般都包含以下几个过程:(一)数据预处理数据预处理是Web日志挖掘的首要环节,其任务是将原始日志数据转换成适合数据挖掘和模式发现所必需的格式,预处理可以直接简化数据挖掘过程,使结果更具客观性。数据预处理包括数据净化、用户识别、会话识别、路径补充四个步骤。数据净化数据净化,是指将待处理的日志数据导入到关系数据库,删除Web日志数据中的错误值、缺失值等,同时把与Web数据挖掘无关的变量或数据进行清理,已达到简便运算的目的;用户识别用户识别,是从Web日志数据中找出每个用户的访问地址,避免挖掘的重复性。目前,由于本地缓存、***和防火墙的存在,为用户动态的分配IP地址,想要识别出每

最近更新

2024年辽宁轻工职业学院单招职业适应性测试题.. 59页

2024年陕西财经职业技术学院单招职业适应性测.. 57页

2024年黑龙江省双鸭山市行政职业能力测验题库.. 150页

2024年黑龙江省绥化市行政职业能力测验题库(.. 147页

公共基础知识内蒙古兴安盟选调生考试(行政职.. 147页

公共基础知识安徽省安庆市选调生考试(行政职.. 147页

公共基础知识江西省新余市选调生考试(行政职.. 148页

公共基础知识河南省漯河市选调生考试(行政职.. 147页

公共基础知识湖北省荆州市选调生考试(行政职.. 149页

公共基础知识甘肃省武威地区选调生考试(行政.. 148页

公共基础知识青海省海北藏族自治州选调生考试.. 150页

国网2024年高校毕业生招聘英大泰和财产保险股.. 59页

安徽省巢湖市事业单位招聘考试(职业能力倾向.. 149页

安徽省蚌埠市事业单位招聘考试(职业能力倾向.. 147页

宿州市质监系统2024年度公开招聘事业单位工作.. 58页

山东省泰安市事业单位招聘考试(职业能力倾向.. 148页

成都新都区卫生局2024年招聘卫生人员历年高频.. 59页

杭州市余杭区人事局2024年夏季招聘403名事业单.. 60页

江苏省宿迁市事业单位招聘考试(职业能力倾向.. 147页

江苏省淮阴市事业单位招聘考试(职业能力倾向.. 149页

江西省宜春市事业单位招聘考试(职业能力倾向.. 147页

江西省鹰潭市事业单位招聘考试(职业能力倾向.. 147页

浙江农林大学2024事业单位招聘拟聘历年高频难.. 59页

浙江省嘉兴市事业单位招聘考试(职业能力倾向.. 147页

浙江省舟山市事业单位招聘考试(职业能力倾向.. 147页

湖南地勘局四0二队2024年招聘拟聘人员历年高频.. 58页

蓝奏云软件库合集软件资料 1页

传承壮族文化心得体会 5页

艺人经纪人合同范本 22页

智能传感器与传感器系统 111页