1 / 71
文档名称:

中文微博的话题检测及微博预警.pdf

格式:pdf   大小:867KB   页数:71页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

中文微博的话题检测及微博预警.pdf

上传人:iris028 2021/12/14 文件大小:867 KB

下载得到文件列表

中文微博的话题检测及微博预警.pdf

相关文档

文档介绍

文档介绍:申请上海交通大学专业学位硕士论文
 


中文微博的话题检测及微博预警




学 校: 上海交通大学
院 系: 信息安全工程学院
硕 士 生: 谢婧
班 级: B1003692
学 号: 1100369037
专 业: 电子与通信工程
导 师: 刘功申(副教授)




上海交通大学信息安全工程学院
2012 年 12 月
A Dissertation Submitted to Shanghai Jiao Tong University for
Master Degree of Engineering


Topic Detection and Tweet’s Trends Warning for Chinese
Microblog




Author:Jing Xie
Specialty: Electronics and Communication Engineering
Advisor: Associate Prof. Gongshen Liu




School of Information Security Engineering
Shanghai Jiao Tong University
Shanghai,
December , 2012
上海交通大学专业硕士学位论文 摘 要
中文微博的话题检测及微博预警

摘 要


随着移动互联网技术的发展,微博已经成为一种新兴的网络媒体,
信息通过微博可以得到快速传播及扩散,对微博上的话题传播、检测
及预警技术的研究也变得至关重要。本文首先研究了微博的用户关系
网络模型、话题传播模型及话题传播特点,而后基于以上研究结果,
提出了一种中文微博的话题检测算法及微博预警算法。
对中文微博的话题检测算法,本文优化了话题检测中的预处理、特
征选取、文本表示、权重计算等步骤,并提出了一种微博计分方式,
认为得分小于预设阈值的微博属于噪声数据,首先对微博集中的噪声
数据进行初步筛除,而后基于 Single-Pass 增量式话题聚类算法进行改
进,提出了针对中文微博的话题聚类算法,该聚类算法采用了一种新
的距离计算方法及中心向量更新算法,实验结果表明该算法可以有效
地筛除大量话题无关的噪声微博,并能准确地从微博集中发现热点话
题,同时将微博归类到正确的话题簇中。
对微博的预警算法,本文提出了微博转发链关键点预测算法及用户
对微博的转发行为预测算法,并采用以上两种预测算法进一步给出了
话题微博的预警算法。本文通过预