文档介绍:会计学
1
WEB网络信息更新监控系统
通常,用户获取网络信息的主要方式是用户主动去浏览页面来获取信息。这种方式费时费力,效率不高。
理想方式应该是让用户关注的信息主动去找用户。正是基于这个目的设计了本课题。
2021/4/26
2
绪言
第1页/共20页
网络爬虫——爬取页面
HTML基本知识——分析网页代码
RSS标准规范——分析RSS文档
2021/4/26
3
相关理论和技术
第2页/共20页
系统主要采用C/S模式实现
系统总体结构包括:
WEB服务器
数据库
客户端程序
2021/4/26
4
系统设计
第3页/共20页
客户端可划分为主程序模块和IE控件模块
主程序模块又可划分为:
界面功能模块
网页监控模块
RSS订阅模块
数据库操作模块
2021/4/26
5
系统设计——客户端结构
第4页/共20页
需要在数据库中添加几个基本表
用户表
RSS表
RSS分组表
用户及RSS关系表
URL表
用户及URL关系表
URL的分组表
用户及URL分组表
2021/4/26
6
系统设计——数据库操作模块
第5页/共20页
需要封装对数据库的一些操作,为其他模块提供接口。
一些对数据库中多个表进行操作的过程需要编写存储过程,以方便程序调用。如用户登录过程、用户添加一个分组、或添加一个RSS源等。
2021/4/26
7
系统设计——数据库操作模块
用户修改一个RSS源
第6页/共20页
四个底层类
监控的Url类
监控的Url的列表类
2021/4/26
8
系统设计——网页监控模块
Url的更新记录类
更新记录列表类
第7页/共20页
2021/4/26
9
系统设计——网页监控模块
启动一个线程循环检测所有监控中的页面
线程大致流程如右边流程图所示
html页面中的超链接一般形式
<a href=”链接地址”>链接文字</a>
第8页/共20页
2021/4/26
10
系统设计——RSS订阅模块
四个底层类
监控的RSS类
监控的RSS的列表类
RSS的更新记录类
更新记录列表类
更新记录列表类包含更新记录类,与CUpdateUrlList类和CUpdateUrl类的关系类似
第9页/共20页