1 / 8

文档名称：

通用互联网信息采集系统的设计与初步实现.docx

格式：docx 页数：8页

下载后只包含 1 个 DOCX 格式的文档，没有任何的图纸或源代码，查看文件列表

如果您已付费下载过本站文档，您可以点这里二次下载

分享

预览

下载此文档

通用互联网信息采集系统的设计与初步实现.docx

上传人:799474576 2013/7/30 文件大小：0 KB

下载得到文件列表

通用互联网信息采集系统的设计与初步实现.docx

相关文档

单片机温度采集控制系统的设计与实现_毕业设计论文

磁导航智能车路径信息采集系统的设计与实现

互联网的在线考试系统的设计与实现

毕业设计（论文）-区域医疗信息化共享平台的设计与初步实现

毕业设计（论文）-基于互联网的企业信息交易平台的研究与设计

[优秀论文]互联网舆情信息管控关键技术研究与实现

毕业设计（论文）-传感器采集系统软件设计与实现

互联网新闻信息服务管理规定第一章总则第二章互联网新...

互联网教育舆情监测系统的设计与实现

交通信息采集与区域交通网络优化系统的设计与实现

文档介绍

文档介绍：第 1 期

杜义华等: 通用互联网信息采集系统的设计与初步实现
通用互联网信息采集系统的设计与初步实现
杜义华, 及俊川
( 中国科学院计算机网络信息中心管理服务中心, 北京 100864 )

・187・
摘

要: 通过建立网页资源库, 结合 Spider 技术、内容分析技术、引入用户数据项和替换抽取指令编辑器等, 提
供和定制可视化通用性较强的互联网信息采集系统, 能定期自动跟踪相关网站或网页, 进行比较分析、抽取、规
整入库、分类等, 从互联网上获取所需信息。
关键词: 互联网信息采集系统; 网络信息挖掘; Spider
中图法分类号: TP393
文献标识码: A
文章编号: 1001- 3695( 2005) 01- 0187 - 03
Design and Implementation of Information Gather and Process System
DU Yi-hua, JI Jun-chuan
( OA Center, work Information Center, Chinese Academy of Sciences, Beijing 100864, China)
Abstract: By using Web page database technology, Spider searching technology and content parsing technology, providing with
user-defined field config tool and batch get & replace script language editor, a flexible visual Information gather &
process system is developed, which according to user’s setting, can automatic track Web, filter information, gather informa-
tion, extract information, classify information and save to database termly. This paper introduces the design and implementation
of the system in detail.
Key words: Information Gather and Process System; Web Mining; Spider
采集系统根据用户提供的这些信息进行采集。它不是用于互
1
引言
联网上未知信息、未知网站的自动搜索, 而主要是用于指定网
信息多、有用的少、分布杂乱无章、不断发展变化是互联网
上信息资源的特点, 信息来源的异构性是网络信息难以采集整
理再利用的焦点[ 1] 。近年来关于 Web 信息的利用研究很多,
大多集中在搜索引擎技术[ 2] , 旨在利用先进系统和人工智能
技术, 以一定策略在互联网中搜集、发现、理解、组织信息后为
用户提供网页、图片、软件等检索服务。互联网信息采集系统
是对上某些或某类站点进

相关标签

城市防洪设计规范沉砂池设计规范钢闸门设计规范通信机房设计规范砌石坝设计规范 ui界面设计规范地下停车库设计规范顶管设计规范阶梯教室设计规范 app界面设计规范

最近更新

襄阳文化旅游融合策略建议书 6页

装饰设计挑战与建议书 5页

装饰企业梯队建设策略建议书 6页

装载机操作手册建议书 7页

装备保障效能建议书 5页

装修行业营销安全保护建议书 6页

装修建材选购攻略建议书 5页

装修住宅需求建议书 6页

袜业生产车间建设创新建议书 5页

衣柜整理整理建议书 6页

衡阳城区绿地布局优化建议书 5页

街道物业管理建议书 6页

街角建筑结构优化建议书 5页

衔接性资金项目策划建议书 5页

行政调解策略完善建议书 5页

行政新楼入住建议书 5页

行政复议法律优化建议书 6页

行政副总战略规划建议书 4页

2025丽水市市直招聘到村（社区）专职从事就业.. 33页

融资租赁业务规划建议书 5页

融媒体改革建议书 6页

蜡烛燃烧安全性提升建议书 6页

蜂胶软胶囊市场推广建议书 6页

2025年天津商务职业学院单招职业倾向性测试题.. 43页

2025年郑州城市职业学院单招综合素质考试题库.. 45页

2026年3月时事政治及答案（夺冠） 13页

2026年刑法基础知识考试题库完美版 15页

薯制品项目市场建议书 6页

薪酬审查结果建议书 4页

蔬菜庄园发展规划建议书 6页

猜你喜欢

脑震荡治疗指南建议书 6页

脑梗康复理疗全面建议书 6页

能源转型效益建议书 5页

能源合作项目投资建议书 5页

胶水车间优化建议书 6页

2026年高级会计师考试题库200道及完整答案 94页

2026年高级社会工作师考试200道及参考答案（模.. 87页

肿瘤患者生活改善建议书 5页

2026广西北部湾大学公开招聘高层次人才76人参.. 49页

育秧基地建设建议书 5页

肯德基全渠道策略建议书 5页

肥东县食品产业建设建议书 5页

股权转让项目评估建议书 5页

c语言期末测试题及一套完整答案 13页

股权合作互利发展建议书 7页