文档介绍:智能比较购物的研究与实现
悄鼙冉瞎何锏难芯坑胧迪
摘要
信息化浪潮改变着世界经济面貌和人们的生活方式。网上购物的
消费模式已被越来越多的人所接受。与此同时,互联网信息爆炸性增
长,消费者很难快速准确地获取自己所需的信息。如何在植
式环境中找到有价值的信息,提供智能化、个性化的服务已经成为一
个重要的研究课题。
比较购物是商务智能的一种表现,是智能信息代理的应用之一。
购物代理可以主动搜索在线商店,收集互联网上异构的商品信息统一
集成存储,并提供商品信息的比较,为消费者提供购买决策支持。购
物代理实现的关键是如何获取有用的信息,这就涉及信息搜索和信息
抽取两方面技术。其中,信息搜索负责收集有关页面信息;信息抽取
则对收集的页面作进一步处理,获得比较购物所需的商品信息。
本文系统地回顾了畔⑺阉骱托畔⒊槿〉难芯肯肿矗芙
了目前存在的问题及发展趋势,并提出了一种面向主题的搜索引擎及
畔⒊槿〉氖迪址椒ā
面向主题的搜索引擎旨在收集主题网页。由于搜索到的页
面相当广泛,其中包含很多不符合主题的信息页面,因此需要对搜索
的网页进行过滤,只采集其中的主题页面。本文提出了一种
阉鞣椒ǎ梅椒ㄗ酆贤车奈谋
把悄鼙冉瞎何锏难芯坑胧迪
内容和结构特点作为页面提取的特征,并对其进行改进以提高系统的
运行效率。信息抽取以采集的主题页面文档作为输入,从中抽取出相
关的商品信息。通常,畔⒊槿∮砂捌赐瓿伞
由于洗蠖嗍畔⒆试辞度朐贖持校腋魍拘畔⑾
示格式不同,构建通用、灵活的包装器比较困难。本文提出了一种
畔⒊槿》椒ǎ梅椒ㄕ攵詗
页面的结构特点而设计,实现的包装器具有较强的空间适应性和时间
适应性。对于搜索引擎提供的页面文档,系统根据页面特征选取合适
的包装器来抽取信息。
最后展望了这一课题的后续工作。
关键词:比较购物,专业搜索引擎,向量空间模型,信息抽取,
半结构化信息,包装器
◇皿蛱远樗芩芏檑绽既
王榭粼嚣
∞.
. 籺
鹖蕊文西甄灏輋醣∞’
南
曲
翔縮鳓黯印囊錳建黥錽珏蟚
撕
Ⅱ酽鏵
╬珏惑鄐芫蟧C豦氧拶。蠢奚篦躿緂
皁琲仃
. 耐瑆
拉痢g錰。璯錰骱场t莍娃祊鑫G鷜辌劐鋈 0
.
糟村鬍
鍆隺£牲鼢菇,v蝜建猠竐拓錮
.
,
硒辌.
蓅蕊。琏螽毫襝髓
鄀瑂皌
悄鼙冉瞎何锏难芯坑胧迪
, 拓瑆
—琣
猙
.
仃琲痵
衄
瑆琣
.
琲瞖.
: , ,琲
仃,—咖瑆
淘宝网购物商城淘宝网购物/
悄鼙冉瞎何锏难芯坑胧迪
第一章引言
第一节本文研究背景及意义
互联网从产生之初的军事领域的运用,发展为学术交流的平台,到现在演变
成大众传播的舞台,当前是一个互联网爆炸式增长的时代。互联网成了一个巨
大的信息源,为人们提供各种信息和服务。面对如此浩瀚的互联网信息资源,如
何有效寻找自己需要的信息已成为一个必须解决的问题。
与此同时,随着互联网信息资源的持续增长,互联网信息闲置与浪费现象也
愈发严重。虽然有各种基于各种主题的专业信息服务网站存在,但由于用户不知
道这些专业网站或者因为浏览多个这样的专业网站太费精力而放弃,因此并非所
有的用户都可以享受到这些信息服务。这就造成了一种尴尬的情况,一方面用户
迫切需要信息资料,而另一方面提供有关资料的信息服务网站却少有人问津。
在网上购物领域,随着电子商务网站的服务商数量和产品数量的迅速增加,
广大消费者面临着更多的困惑:在如此众多的商品中如何才能找到适合自己需要
的网站和物品亩纳唐犯阋在众多的网站平台中,如何寻找值得信赖的
网站,如何获得最好的价值、最好的服务等等问题都让用户感到茫然。随着
的发展,人们对信息获取的要求越来越高。如何提供智能化的服务,帮助人们从
互联网的海量数据中获得更高质量的服务已成为信息检索领域的研究热点,也是
提高电子商务和电子政务的服务和运行水平的关键之一“⋯。
针对目前存在的信息服务的“大数据量小信息量”问题,比较购物可以帮助
用户掌握信息主动权,是“主动服务”的电子商务,对用户制定商品购买决策有
较大的参考价值。它把人工智能、机器学习、数据挖掘等技术有机融合在一起,
有利于提高信息服务的智能化和个性化程度,促进网络应用和电子商务的发展。
因此,本文研究具有很强的理论意义和实际意义。
第二节国内外研究现状
因比较购物涉及的是电子商务领域,且其实现的关键技术是信息