文档介绍:题目: 微博舆情管理平台的设计与实现——数据分析系统
适合专业: 信息安全专业指导教师(签名): 提交日期:2013年03月08日
学院: 计算机学院专业: 信息安全学生姓名学号:
毕业设计(论文)基本内容和要求:
微博作为迅速崛起的新兴社会媒体,在网络舆情领域日益引起研究者的关注。面对互联网上海量的数据信息,我们无法想象仅仅通过人工的方式来对互联网舆情进行全面监控的难度。因此,结合网络信息采集技术和文本信息自动处理等技术研发一个网络舆情自动监控系统将有利于社会管理者们及时了解网络舆情的状态和趋势,因而可以对发现的热点舆情及时进行干预,引导疏通民众情绪和心理,避免矛盾的进一步恶化而造成更大的社会损失。现有舆情监测系统在采集、检索和分析模块中都是采用基于统计和特征关键词的方法,由于忽略了文本中的语义信息往往会导致分析结果的不精确。本毕业设计主要针对当前微博中用户身份定位、热点信息挖掘以及负面信息的发现与及时处理等机制进行设计与实现,主要分为数据采集、数据挖掘分析和结果呈现三个部分。主要的工作分工如下:
数据采集(微博爬虫程序)功能的实现,抓取微博文本信息。
对收集到的文本信息进行数据分析,确定舆情热点关键词、分析用户身份关系
将分析结果进行数据呈现。
微博舆情管理平台预期实现对主流微博平台(新浪微博,腾讯微博等)消息的自动采集分析,得出最近热点词,关键词;输入关键词后可对与此关键词有关的微博消息进行评估预警,提醒使用者及时作出应对措施
毕业设计重点研究的问题:
对收集到的数据进行甄别归类分析,实现分词等算法。
向量空间模型模型(VSM)及潜在语义索引(LSI)
文本倾向性分析实现
毕业设计应完成的工作:
进行微博舆情监控方面现状的网络调研,熟悉微博管理系统的全过程;
熟悉微波舆情监控系统的工作流程,设计合理的分工方案;
熟练掌握c和php
数据分析算法实现;
撰写毕业论文。
参考资料推荐:
王艺.《重大突发公共事件的微博舆情监测与引导初探》.
张超.《文本倾向性分析在舆情监控系统中的应用研究》(硕士学位论文).
莫溢,刘盛华,刘悦,程学旗.《一种相关话题微博信息的筛选规则学习算法》.
陆浩.《网络舆情监测研究与原型实现》.
莫溢,刘盛华,刘悦,程学旗.《一种相关话题微博信息的筛选规则学习算法》.
杨涛.《智能信息处理技术在互联网舆情分析中的应用》(硕士学位论文).
Larsen B,Aone and effective text mining using linear-time document :Proceedings of the Fifth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,San Diego:CA,—22.
其他要说明的问题:
题目: 微博舆情管理平台设计与实现——数据分析系统设计实现
学院:计算机学院专业:信息安全学生姓名:张骁学号: 09283050
文献综述:
研究背景:
舆情分析关乎国家发展与社会和谐,目前已有越来越多的机构和行业从事舆情分析。 时代的到来,使人们进入网络信息大爆炸时代。新浪微博每天有近1 亿的微博内容产生。如何从海量的微博信息中提取有价值的信息,并对负面、消极及虚假信息进行及时的管控,已经成为舆情热点分析的突出问题。良好的解决方案,不仅可以监督规范网络行为,净化网络环境,更重要的还能从中获取各类有用信息,进行诸如商业价值(用户兴趣挖掘),信息传播学(网络拓扑与热点追踪),以及一些社会学方面的研究。从而能够满足人们的需求,同时对于社会的和谐、网络舆论生态的健康、国家的发展都有重要的现实意义。
研究现状及基本方法
目前,已有越来越多的机构从事舆情分析。但是,这些舆情分析系统一般只应用于企业或政府,更关注于对负面、消极及虚假信息的监管,并且不对公众开放。在当今的社会,人们也迫切希望得到一些关乎自身利益的事件的发展情况,如物价的变化、对于一些厂家产品的使用评价等。
对于微博舆情预警功能模块的实现,网络舆情安全的评估预警等功能实现的不多。
研究内容及意义
微博舆情管理平台预期实现对主流微博平台(新浪微博,腾讯微博等)消息的自动采集分析,得出最近热点词,关键词;输入关键词后可对与此关键词有关的微博消息进行评估预警,提醒使用者及时作出应对措施。
面对互联网上海量的数据