1 / 51
文档名称:

数据挖掘81286.ppt

格式:ppt   页数:51页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘81286.ppt

上传人:cdsqbyl 2015/5/25 文件大小:0 KB

下载得到文件列表

数据挖掘81286.ppt

相关文档

文档介绍

文档介绍:第七章 Web挖掘技术 内容提要
Web挖掘的意义
Web挖掘的分类
Web挖掘的含义
Web挖掘的数据来源
Web内容挖掘方法
Web访问信息挖掘方法
Web结构挖掘方法
2017/6/29
1
Data Mining: Concepts and Techniques
Web挖掘的价值
从大量的信息中发现用户感兴趣的信息:因特网上蕴藏着大量的信息,通过简单的浏览或关键词匹配的搜索引擎得到的是孤立而凌乱的“表面信息”,Web挖掘可以发现潜在的、丰富的关联信息。
将Web上的丰富信息转变成有用的知识:Web挖掘是面向Web数据进行分析和知识提取的。因特网中页面内部、页面间、页面链接、页面访问等都包含大量对用户可用的信息,而这些信息的深层次含义是很难被用户直接使用的,必须经过浓缩和提炼。
对用户进行信息个性化:网站信息的个性化是将来的发展趋势。通过Web挖掘,可以达到对用户访问行为、频度、内容等的分析,可以得到关于群体用户访问行为和方式的普遍知识,用以改进Web服务方的设计,提供个性化的服务。
2017/6/29
2
Data Mining: Concepts and Techniques
第七章 Web挖掘技术 内容提要
Web挖掘的意义
Web挖掘的分类
Web挖掘的含义
Web挖掘的数据来源
Web内容挖掘方法
Web访问信息挖掘方法
Web结构挖掘方法
2017/6/29
3
Data Mining: Concepts and Techniques
Web挖掘的类型
Web挖掘依靠它所挖掘的信息来源可以分为:
Web内容挖掘(Web Content Mining):对站点的Web页面的各类信息进行集成、概化、分类等,挖掘某类信息所蕴含的知识模式。
Web访问信息挖掘(Web Usage Mining):Web访问信息挖掘是对用户访问Web时在服务器方留下的访问记录进行挖掘。通过分析日志记录中的规律,可以识别用户的忠实度、喜好、满意度,可以发现潜在用户,增强站点的服务竞争力。
Web结构挖掘(Web Structure Mining):Web结构挖掘是对Web页面之间的链接结构进行挖掘。在整个Web空间里,有用的知识不仅包含在Web页面的内容之中,而且也包含在页面的链接结构之中。对于给定的Web页面集合,通过结构挖掘可以发现页面之间的关联信息,页面之间的包含、引用或者从属关系等。
2017/6/29
4
Data Mining: Concepts and Techniques
第七章 Web挖掘技术 内容提要
Web挖掘的意义
Web挖掘的分类
Web挖掘的含义
Web挖掘的数据来源
Web内容挖掘方法
Web访问信息挖掘方法
Web结构挖掘方法
2017/6/29
5
Data Mining: Concepts and Techniques
Web挖掘的含义
WeB挖掘是一个看宽泛的概念,可以简单地描述为:
针对包括Web页面内容、页面之间的结构、用户访问信息、电子商务信息等在内的各种Web数据,应用数据挖掘方法以帮助人们从因特网中提取知识,为访问者、站点经营者以及包括电子商务在内的基于因特网的商务活动提供决策支持。
2017/6/29
6
Data Mining: Concepts and Techniques
Web挖掘与信息检索
两种截然不同的观点:
Web上的信息检索是Web挖掘的一个方面:Web挖掘旨在解决信息检索、知识抽取以及更宽泛的商业问题,是Web上IR技术的延伸。这种观点大多来自于数据挖掘研究领域。
Web挖掘是智能化的信息检索:对于IR领域的研究人员来说, Web挖掘是IR研究向着智能化的方向发展的结果。
信息检索可能经常被说成是Web挖掘的初级阶段,是为了强调Web挖掘不是简单的信息索引或关键词匹配技术,而是实现信息浓缩成知识的过程,它可以支持更高级的商业决策和分析。
2017/6/29
7
Data Mining: Concepts and Techniques
Web挖掘与信息抽取
Web上的IE的研究目的是希望从众多的Web文挡中抽取可供分析的信息,与Web挖掘的关系也有不同的观点:
IE是Web挖掘整个过程的一部分:这是因为Web上的数据一般是半结构化或无结构的,因此需要进行规格化的信息抽取这样的预处理。
Web挖掘是IE的一个特殊技术:既然IE是希望把Web蕴藏的信息抽取出来,那么Web挖掘或者文本挖掘只不过是达到这个目的的特殊技术手段。
信息抽取经常被说成是Web挖掘的一个预处理阶段,那是因为在数据挖掘领域,Web挖掘的更广义的理解应该是一个知识提取的完整过程。
2017/6/29
8
Data Minin

最近更新

小学六年级下册数学《圆柱与圆锥》专项练习附.. 9页

小学六年级下册数学期末考试卷含完整答案(名.. 7页

教科版三年级上册科学期末测试卷【巩固】 6页

(完整)联系到采购负责人的方法(杂谈) 4页

教科版五年级上册科学期末测试卷及参考答案【.. 7页

教科版四年级下册科学期末测试卷及答案【考点.. 9页

教科版科学一年级上册第一单元《植物》测试卷.. 6页

教科版科学一年级下册第一单元《我们周围的物.. 6页

《蜀相》优质教案 6页

沪教版六年级下册数学期末测试卷含答案【精练.. 7页

苏教版一年级下册科学期末测试卷及答案参考 9页

苏教版五年级上册科学期末测试卷及完整答案一.. 8页

苏教版六年级下册数学期末测试卷含完整答案【.. 6页

信息安全管理流程图 12页

公务员调研报告(共8篇) 63页

苏教版小学四年级下册科学期末测试卷及答案参.. 8页

历年“刑法”知识考试内部题库新版 30页

刑法知识题库及答案【精选题】 30页

苏教版科学六年级上册期末测试卷附完整答案【.. 8页

苏教版科学小学二年级下册期末测试卷附答案【.. 7页

西师大版六年级下册数学第二单元 圆柱和圆锥 .. 6页

安全检查工作会议记录 8页

部编版四年级上册道德与法治期末测试卷及参考.. 6页

(小学段)比例的应用练习题及答案(名师系列.. 8页

平衡计分卡在非营利组织绩效考核中的应用 6页

刑法有关知识考试完整版带答案(完整版) 30页

内部培训(新大纲)一级建筑师考试王牌题库及.. 29页

综合素质评价手册理科生填写样表 12页

设施农业生产花卉园艺工国家职业标准 15页

内部培训消防条例知识考试通用题库含答案【综.. 27页