文档介绍:基于萃诰虻闹悄鼙冉瞎何锵低呈迪只蒲芯摘要受,并已经初具规模。相对于互联网数据信息的容量和几何级数式的活动提供辅助支持。为用户收集分布在互联网各处的商品信息,根据在理论研究的基础上,本文初步实现了一个基于萃诰据系统应用特点,提出了两段式的信息抽取工作模式和页面信息单元随着计算机网络技术、信息技术和电子商务的持续飞速发展,越来越多的商业网站出现,网上购物的消费模式被越来越多的人所接分匮乏,而人们对信息获取个性化的要求却越来越高。因此,如何提服务已成为国际性的研究热点。比较购物系统是一种中介程序,它为人们在网上进行的商品选购用户的不同要求,提供不同的商品属性比较。它能使用户足不出户就能货比三家,选择最适合自己的销售商。的概念。首先根据网页结构特点对网页进行分类,获取网页中产品信息高度密集的代码段,即页面信息单元蝗缓笤诜掷嗟腜基础上进行产品信息抽取。增长速度,人们从中快速准确地获取目标信息的能力和手段则显得十供智能化的服务,帮助人们从互联网上的海量数据中获得更高质量的的智能比较购物系统,完成了系统流程和框架结构的分析设计,并根基于萃诰虻闹悄鼙冉匣吲障低呈迪只芯
因此对峁构槟煞掷啵杓仆ㄓ玫某槿」嬖蚴潜疚南低呈迪值墓最后本文对系统的进一步研究工作进行了探讨。由于目前大多数的网络数据信息是嵌入在网页中,而标签是用来设计嘲页格局和外观的,语义表达能力极度缺乏,键。本文提出了产品信息页面结构分类的初步方案,构建页面分析器进行幕袢『头掷啵唤岷先斯ぶ悄芎蚖数据挖掘的理论和技术,实现了不同结构类别男畔⒊槿」嬖蛏杓啤关键词:商务智能,比较购物,萃诰颍虢峁够荩面信息单元,信息抽取基于黯萃诰虻闹悄鼙冉瞎何锵低逞缦只簿
,甀、..基于萃诰虻闹悄鼙冉湘跷锵低呈迪謒翻研究一
:,,琲琤,—.,.,,.瓸基于萃诰虻闹悄鼙冉隙奈锵稻凳迪只肆拙—
第一章引言第一节本文研究背景及意义在电子技术和互联网高速发展的今天,信息技术和互联网的应用已经渗透的人们生活和工作的各个领域,网络早已成为人们日常生活和工作不可或缺的一部分。随之而来的是以充分发展的互联网和信息技术为基础,结合实际商务活动和政务活动的电子商务和电子政务的成熟和蓬勃发展。根据年初的第三次互联网信息资源数量调查报告显示,截至年底,全国网站共个,企业网站所占的比例最大,,占%,数目己接近蚣抑唷中国电子商务已经由表及越来越多的人已经习惯于电子商务的模式。同时,电子商务对于企业不再是一个网站一个网页这么简单,越来越多的企业着眼于构建系统化的企业电子商务解决方案,通过企业信息化建设优化企业经营运作流程各个环节,形成信息化时代的互联网上的海量数据既为人们提供了极其广阔的数据和信息服务,也让人们日渐感受到要有效率的利用互联网数据越来越难。面对纷繁复杂的数据信息,人们往往无所适从。在这种情况下,搜索引擎鸾シ⒄蛊鹄础4批搜索引擎产品诞生,为人们提供了便捷、快速的信息获取和网络信息导航工具。现在人们已经习惯于借助各种搜索引擎在互联网上获取自己需要的信息。然而,随着网络应用越来越复杂,人们对信息获取的要求越来越高,越来越量的服务已成为国际性的研究热点,也是进一步提高电子商务和电子政务的服务便地帮助用户找到其需要的产品信息和价格,“主动地”帮助用户完成数据采集里、从虚到实,从探索、启蒙和推广阶段进入到务实的发展、实施、成熟阶段。企业运营模式。个性化。如何提供智能化的服务,帮助人们从互联网上的海量数据中获得更高质和运行水平的关键之一。本文介绍了面向闹悄鼙冉瞎何锵低车脑硪约熬咛迨迪址椒ǎ于收集分布在上的商品信息,按用户需求集中进行比较。此系统能够方和比较任务,节约了用户的时间和精力,是“主动服务”的电子商务,具有灵活基于诰虻闹悄懿锝瞎何锵低呈迪止趺匮芯
。比较购物把传统的信息检索技术运用于研畔⒓焖魍卣到了信息抽取和机器学习等多个知识领域,结合萃诰蚣际酰迪稚涛本文研究具有很强的理论意义和实际意义。时至今日,互联网、电子商务的迅猛发展使世界发生了巨大变革,大大地影响了商业运作的模式。互联网应用初期,是以协议和技术为基础的静态网站的出现。~时间大量的信息资料出现在网络中,大大促进了互联网的普及。但静态网页不能和用户交互,用户只能被动地接受厂家所发布的信息,而不能在厂家的网站上寻找自己所感兴趣的信息。随后,技术、脚本语言、动态、⑹菘饧际鹾椭屑浼术陆续涌现。这些技术极大地增强了用户和服务器交互信息的能力,同时也为服务器获取用户的信息提供了强有力的手段。这时互联网才真正成为信息的集散地。但是这时的电子商务还仅仅处于简单地获取用户信息的阶段,还不能真正为用户实现个性化服务、不能为用户的请求进行更智能化更有意义的处理。发展到今天的互