1 / 6
文档名称:

基于SinglerPass 的网络话题在线聚类方法研究.pdf

格式:pdf   页数:6
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

基于SinglerPass 的网络话题在线聚类方法研究.pdf

上传人:799474576 2013/8/12 文件大小:0 KB

下载得到文件列表

基于SinglerPass 的网络话题在线聚类方法研究.pdf

文档介绍

文档介绍:《现代图书情报技术》版权所有,欢迎下载引用!
请注明引用地址:基于 Single-Pass的网络话题在线聚类方法研究[J],现代图书情报技术,2011(12):52-57.
情报分析与研究
基于 Single-Pass的网络话题在线聚类方法
研究
朱恒民1,2 朱卫未2
1(南京大学信息管理系南京 210093)
2(南京邮电大学经济与管理学院南京 210046)
【摘要】基于 Single-Pass算法思想,研究网络话题的在线聚类方法,以期及时捕捉网络信息的动态变化。在分析
该方法聚类流程的基础上,重点研究网络动态信息流的文本特征抽取和权重计算方法,以及话题类表示和更新等
关键问题,设计实验对比分析不同的标题中特征加权系数、特征权重计算和标准化方法以及话题类向量维度对话
题聚类质量和时间效率的影响。
【关键词】网络舆情话题挖掘在线聚类 Single-Pass
【分类号】
StudyonWebTopicOnlineClusteringApproachBasedonSingle-Pass
Algorithm
ZhuHengmin1,2 ZhuWeiwei2
1(DepartmentofInformationManagement,NanjingUniversity,Nanjing210093,China)
2(CollegeofEconomics&Management,NanjingUniversityofPosts&munications,Nanjing210046,China)
【Abstract】InordertogetdynamicsofWebinformationtimely,lusteringapproachbasedonSingle
-,andthekeyproblemsincluding

paretheeffectsofdifferentweightfactoroffeaturesintitle,weightcalculatingandnormalizing
lusteronclusterqualityandtimeefficiency.
【Keywords】publicopinion Topicmining Onlineclustering Single-Pass
1 引言
网络是一个涉及面广、形式多样、更新快捷的动态信息流,网络话题一旦激起广大网民的关注和热烈讨论,短
时间内将产生大量的网络相关报道。因此,迫切需要一种高效的、能够及时捕捉网络热点的话题聚类方法,这也
是网络舆情监控和预警的一项重要内容。
收稿日期:2011-09-26
收修改稿日期:2011-11-17
本文系江苏省社会科学基金项目“网络舆论危机的生成与预警机制研究”(项目编号:10TQC009)、江苏省教育厅高校哲学社会科学项
目“互联网舆情演化的动态网络模型研究”(项目编号:2011SJB870006)和南京邮电大学青蓝计划