1 / 76
文档名称:

微博舆情分析系统信息处理模块的设计和实现.pdf

格式:pdf   页数:76页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

微博舆情分析系统信息处理模块的设计和实现.pdf

上传人:cxmckate6 2016/3/6 文件大小:0 KB

下载得到文件列表

微博舆情分析系统信息处理模块的设计和实现.pdf

相关文档

文档介绍

文档介绍:东华大学学位论文版权使用授权书学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅或借阅。本人授权东华大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密口,在——年解密后适用本版权书。本学位论文属于/ 不保密√学位论文作者签名:王珐日期:俐‘f年,月17日 V 指导教师签名:副妻平曰期:沙f阵朗27日鹚萍带博舆情分析系统信息处理模块的设计与实现微博舆情分析系统信息处理模块的设计与实现摘要微博作为迅速崛起的新兴社交网络,因为信息的来源良莠不齐, 以及民众的盲从性,利用微博传播谣言,扰乱社会治安的事件时有发生。如今,平均每小时的微博发布量高达数百万条,仅仅通过人工手段来对如此多条目进行监控和分析几乎是不可能完成的任务,因此依靠现代文本自动分析技术来开发一款微博舆情分析预警系统迫在眉睫。本论文的工作是为一款微博舆情信息分析系统设计和开发其中的信息处理模块。论文首先介绍了微博舆情分析系统的整体框架设计, 概括描述了该系统底层的信息采集、索引和分词模块和其所涉及的相关开源软件和技术。本系统的分析手段是通过微博关键词来进行的, 对其所使用的潜在语义分析(LSA)也做出了相应的介绍。论文的后几部分主要介绍信息处理模块,给出其整体设计架构, 以及实时统计、自定义统计、同类词归并、微博影响力分析等功能点的具体设计和编码实现。系统完成的主要功能包括: 1)新浪微博的实时统计和预警; 2)各类复杂且精确地自定义统计; 3)同类词归并; 4)微博分析以及用户分析; 东华大学硕士研究生学位论文微搏舆情分析系统信息处理模块的设计与实现 5)提供分析功能API; 该系统在今后还将进一步发挥重要作用,为大政工平台的应用系统提供信息支持和数据共享。关键词:微博,舆情分析,潜在语义分析,信息处理,中间层设计东华大学硕士研究生学位论文. 微博舆情分析系统信息处理模块的设计与实现 DESIGN AND IMPLEMENTATIoN OF THE INFORM随TIoN PRoCESSING MODULE PUBLIC oPINIoN ANALySIS SYSTEM ABSTRACT Microblog,as arapid riseoftheemerging work,for thefight andfalseinformation am intermingled,somebody using microblog tospread rumour$,or todisturbthesocialorder occured ,microblog release millionstweetsper hour,monitoring and analysing SO many tweets only by manual work impossible,SO develop amicroblog public opinion analysis system rely on modem automatic textanalysis technology forearlywarning imminent. The information processing module for amicroblog—based publicopinion analysissystem designed and ,the overallframe design ofmicroblog public opinion analysis system introduced,include underlying index,information collection,word segmentation module, open source software analysis method ofthissystem was conducted by keywords,for use of latentsemantic analysis(LSA)also made thecorresponding introduction. The overalldesign,architecture,detailed design andcoding ofinformation process module followed,mainly include real—timestatistics,custom statistic