文档介绍:中文摘要随着牟欢戏⒄梗虻耐臼恳苍诩本缭黾樱嬷黾拥囊趁数量更是不可胜数。因此。信息过载和资源迷失已经成为制约人们高效使用畔⒌钠烤薄P畔⒐厥侵赣没娑蕴ǘ嗟男畔⒛岩约笆钡叵⑽眨资源迷失是指用户不知道如何确切地表达对网上资源的需求,也不知道如何准确有效地寻找资源。而个性化推荐系统能够根据用户的兴趣偏好主动推荐他所需的资料,它的出现解决了人们寻找信息难的问题。鲂曰低车哪勘晔俏S没峁┧窍胍5幕蛐枰5男畔ⅲ槐孛魅询问用户的需求。传统推荐系统的方法是直接收集服务器日志作为褂檬据,通过分析用户的行为模式,挖掘出用户的兴趣、偏好,然后将系统认为是与用户相关的网页链接向用户推荐。本文应用新的方法一一远程代理收集用数据,为数据预处理提供了方便,并提出了精确序列模式的方法进行面推荐。扩展了,从而分别提高了网页推荐的准确率和覆盖率。并且在推荐系统实时运作的过程当中实时抽取有价值的用户访问模式,不断的调整结果页面推荐集合以适应网站的不断发展,避免了网站在精力一段时间的服务后不得不得在离线状态下重新进行模式发现。关键词:诰颍琖使用挖掘,瓽蛄心J中国科学技术大学硕士学位论文
∞,,琒甌,塔;,痓甀瑃狦瑆..中国科学技术大学硕士学位论文。.,.Ⅱ.’.
作者签名:』邂功刁年易月中日中国科学技术大学学位论文相关声明保密的学位论文在解密后也遵守此规定。本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。本人授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。
髀背景信息检索和数据挖掘随着万维网孵,的不断发展壮大,上的信息越来越丰富。也越来越纷繁复杂。全球镜闶垦杆僭龀ぃ氪送保琖站点的结构、规模也越来越大,,,网站数量在个月内翻了一番。互联网调查公司的分析师里奇勒说其中有相当一部分一一约有万到万家网站被频繁访问,并一直保持更新其网上信息;互联网上可公开访问到的网页更是难以计数,并且网页数量正以每天几百万页的速度在增长。这一结果就直接导致了用户不能够在这么庞大的信息面前便捷地得到自己想要的信息,继而失去耐心、失去信心离开网站而转向其他信息网站,最终使得原有网站的知名度不断下降。传统的网站采用的是“一对多”的批发模式,即对所有的浏览用户提供同一的界面、同样的内容,而时下新的竞争要求网站采用“一对一”的零售模式,即对不同的顾客提供不同的服务形式和内容。例如,一个网上书店的顾客,由于职业不同、年龄不同、喜好不同等等,他们所关心的书籍内容可能是完全不同的。那么,电子商务网站就该像一个老练的店员那样,会对不同顾客采取不同的策略推销产品一样。因此,一些大型的门户网站,特别是电子商务网站、新闻组网站等,就从原先的以“网站”为中心向以“用户”为中心转变,尽可能地自动调整其服务以迎合每个用户的浏览兴趣,从而让每个用户能够感觉到他享受的是高质量的服务,就像是网站的唯一用户一样。随着信息技术的发展,出现了许多辅助性的工具,它们能够部分地缓解这些难题,给用户提供方便,如搜索引擎、推荐系统等相继应运而生。随着信息技术的不断深化发展,许多信息技术开始围绕电子商务领域不断的创新发展或者从其他领域被引入到了电子商务领域当中来。其中,最引人注目的信息技术有信息检索乇鹗撬阉饕和数据挖掘缤萍鱿低车等,它们的介入使用户获得了极大的方便,也使电子商务网站受益匪浅。中国科学技术大学硕士学位论文第彻
.:“电子商务个搜索引擎是一种用于帮助用户在互联网上查询信息的搜索工具,它以一定的策略在互联网上发现、搜集信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而达到信息导航的目的。搜索引擎的发展大体经历了三代:第一代搜索引擎出现在年,以唧也就是今天,已被展为代表,其特点为检索速度慢,且极少重新搜集网页去刷新索引;第二代搜索引擎大约出现在年,以4表,其特点是采用分布式方案;年后搜索引擎得到快速发展,出现了以为代表的第三代搜索引擎,它是综合性的搜索引擎,其突出特点为索引数据库的规模大,信息覆盖率高,但其检索结果数据量过大,信息过滤及相关度搜索引擎的出现极大的方便了用户的浏览行为,使得用户能够在浩瀚的信息当中抽丝拨茧,获取其所需的信息。但是并非用户所有的查询均能使其本身得到满意的结果,如查询结果集太大、相关度不高、重