1 / 14
文档名称:

基于情感倾向性分析的网络舆情情感演化特征研究.docx

格式:docx   大小:279KB   页数:14页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于情感倾向性分析的网络舆情情感演化特征研究.docx

上传人:科技星球 2022/12/2 文件大小:279 KB

下载得到文件列表

基于情感倾向性分析的网络舆情情感演化特征研究.docx

相关文档

文档介绍

文档介绍:该【基于情感倾向性分析的网络舆情情感演化特征研究 】是由【科技星球】上传分享,文档一共【14】页,该文档可以免费在线阅读,需要了解更多关于【基于情感倾向性分析的网络舆情情感演化特征研究 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。基于情感倾向性分析的网络舆情情感演化特征研究
 
 
蒋知义马王荣邹凯李黎
〔摘要〕[目的/意义]旨在通过对网络舆情进行情感倾向分析和舆情追踪,为政府有效掌控网络舆情突发事件提供理论基础与决策支持。[方法/过程]以“罗一笑”事件为例,在建立加入特定事件语料情感分类词典和构建情感倾向分析模型的基础上,统计该事件微博文本的情感性强度和情感类型,从而划分网络舆情演化阶段。[结果/结论]揭示了舆情演化各阶段的特征与规律,据此提出引导网络舆情情感演化的相关建议。
〔Key〕网络舆情;情感倾向性分析;情感分类;情感演化
DOI:.1008-
〔〕;G203〔〕A〔〕1008-0821(2018)04-0050-08
〔Abstract〕[Purpose/Significance]Thepurposeofthisstudywastoprovideatheoreticalbasisanddecision-makingsupportforthe
governmenttoeffectivelycontrolnetworkpublicopinionemergenciesthroughtheanalysisofemotionaltendencyandpublicopiniontrackingofnetworkpublicopinion.[Method/Process]Taking“LuoYixiao”idcidentasanexample,tasedontheestablishmentofaddingspecificeventcorpusemotionclassificationdictionaryandconstructedsentimentanalysismodel,calculatedthetextemotionalintensityandemotiontypeofmicroblog,thusdividedthenetworkpublicopinionevolutionstage.[Result/Conclusion]Revealedthecharacteristicsandlawsoftheevolutionofpublicopinionatallstagesandsuggestionswereproposedtoguidetheevolutionofemotioninnetworkpublicopinion.
〔Keywords〕networkpublicopinion;sentimentorientation;sentimentclassification;sentimentevolution
第39次《中国互联网络发展状况统计报告》显示,截至2016年12月,,相当于欧洲人口总量,%。随着社会性网络服务(SocialNetworkingServices,SNS)的广泛应用和即时通讯功能的日益丰富,“两微一端”等社交媒体逐渐成为网络舆情传播的主要媒介。网络舆情是网民通过互联网平台表达自己对社会发生的热点事件所持有的不同看法,是網民态度、认知、行为和情感倾向的集合[1]。而情感倾向则是网络舆情的风向标,展现网民对某一事件所持的态度和情感趋势,是社会各阶层意见和态度的真实反映,这些情感信息影响着网络舆论的走向,若缺乏对舆论走向的正确引导,将可能引发极端情绪的蔓延,进而导致群体极化现象。故而
有必要对网络舆情事件展开深入的文本挖掘和情感倾向分析,探索情感演化的特征和规律,从而为政府相关部门有效监管网络舆情、维护社会稳定提供理论支持。
国内外学者在网络舆情情感演化方面均展开了相关研究。PatriciaMoy等[2]认为,对突发事件网络舆情的应对措施和引导处理不当,会引发更大范围事件的产生。LavrenkoV等[3]从技术层面的角度,指出对网络舆情的监管应包括最初对事件的识别以及该事件后续相关报道的话题检测与追踪。Mceoy[4]将美国“黑色联盟”作为案例,分析了“新闻修复”的权威地位。王子文等[5]认为舆情演化的内在动力取决于“网络推手”的利益机制。唐超[6]的研究结果表明,网络情绪是舆情演化的重要因素,并在此基础上提出了网络舆情的情绪演化规律。柳军等[7]将研究视角锁定为舆情传播的微内容,认为网络舆情演化符合“马太效应”和“群体极化”规律。国内外现有研究成果主要集中于网络舆情情感演化的理论研究和技术探索,基于典型案例的实证研究及情感引导策略分析的研究成果较少。因此,本文通过文本挖掘和建立情感词典,再结合情感倾向分析模型对“罗一笑”事件的演化规律进行实证分析,从情感角度对该研究领域进行有效补充。
1相关理论与技术

情感分析(SentimentAnalysis),也称为倾向性分析,是指采用自动化或半自动化手段对基于微博、论坛等在线社交网络产生的主观评论文本内容进行分析、处理、归纳和推导,从中挖掘出用户(个人或群体、组织等)针对主题、
人物、事件等表达的评论、观点和意见的过程[8]。情感倾向性分析的主要对象是网民自主发布的与网络舆情事件相关的文本。

文本挖掘(TextMining)是指对半结构化或非结构化的自然语言文本进行处理并采用一定的技术从中发现和提取特定信息的过程。如图1所示,首先通过对网络文本资源的收集建立文本集合,再运用文本预处理、特征提取以及数据挖掘的方法,对文本集合进行处理,进而获取用户所需的特定信息。

文本预处理是文本挖掘的主要环节之一,主要包括对原始文本集合进行去噪处理[9]、中文分词、去停用词、词性选择等一系列流程(见图2),本文通过ROSTCM文本挖掘软件对预处理后的微博数据进行情感分析。

2情感倾向分析模型构建
情感倾向判断的目的是对主观性文本内容进行情感类别的判定,因此构建情感分类词表对于情感倾向分析的意义不言而喻。首先通过情感词表找到与之相匹配的情感词,进而根据情感词的值计算出每个句子的情感极性值,而整个文本的情感倾向就是所有句子情感值的整合。在通过情感词表进行文本情感倾向的同时,还应当考虑否定或程度修饰副词、句型等对文本情感极性的影响。

为保证词表的全面性和准确性,本文基于公开情感词表,并结合“罗一笑”事件语料库提取的情感词,形成最终的扩展情感词表。
首先,通过八爪鱼数据采集器搜集与该事件相关的75483条微博文本作为数据源,采集时间自2016年11月29日0时始至2016年12月31日24时止。其次,对数据进行初步处理,即去重、去空和去广告等操作,得到有效微博数据74025条。最后,通过分词处理,将提取的情感词与知网HowNet、大连理工大学等情感词表相结合,构建基于特定事件的情感词表(见表1)。

3情感倾向性分析
首先,依据文本情感计算规则,对74025条微博文本进行情感倾向值的计算与统计,进而对其极性进行判断。本文将该事件的微博分为正向微博(情感值大于0)、中性微博(情感值等于0)、负向微博(情感值小于0)3种。如图3所示,该事件中,正向微博达48093之多,占总量的65%,超过中性微博(8271条)和负向微博(17661条)之和。由此可知,虽然该事件对社会造成了一定的负面影响,但网民对此事件的情感倾向较为积极。
其次,根据微博情感倾向值的大小进一步对微博文本情感极性强度进行程度划分,即一般正向(0,10)、中度正向[10,20)、高度正向[20,+∞)、一般负向(-10,0)、中度负向(-20,-10]和高度负向(-∞,-20]。如图4所示,“一般”程度微博数量所占比例最大,任一程度的正向微博数量均多于负向微博数量。
最后,从微观角度对网民情感倾向性做时序分析,如图5所示,该事件整体虽以正向情感为主,然而负向情感多次显现,有时甚至达到了高度负向。
4网络舆情情感演化实证分析
根据网络舆情事件周期演化理论[10],对“罗一笑”事件相关微博数据进行时序统计(见图6)。
由此可知,11月30日有关该事件的微博发布数激增,达43373条;此后,网民的关注度逐渐降低,单日微博的发布数量一度呈下降趋势。具体而言,12月1日的微博发布数量较前一日骤降至17476条,12月2日的微博发布数量降至3414条,自12月3日伊始,每日的微博数量均低于1000条,直至12月24日因罗一笑去世的消息,当日微博数量上升至3364条,然而并没有引起爆炸性轰动,而是随着时间的流逝逐渐淡出网民的视角,最终完全消逝。依据对“罗一笑”事件相关微博发布数量的时序变化统计,本文将舆情演化过程分为开始期、爆发期、发酵期、消解期和反思期5个阶段(见表2)。
通过Stata13对“罗一笑”事件微博情感極性强度的特征统计可知(见表2),该事件的情感极性均值、标准差、最大值、、、388和-122,数据间极性强度差异明显,高度正向情绪与高度负向情绪并存,,,具有尖峰和后尾的特征,不符合正态分布规律。正是由于网络舆情传播集群行为的特性,致使数据间出现极端波动。
通过对“罗一笑”事件舆情演化各阶段情感极性强度及类型的统计可知(见表3)可知,各演化阶段网民对该事件的情感极性都以正向为主,且正向微博的发布数量均高于负向微博。具体而言,开始期由于微博发布数量较少且正向微博居多,,居于各阶段顶峰,这一期间,年少重疾的罗一笑成为大家爱护、援助的对象,而“怀疑”情感的浮现则为之后舆情的反转埋下伏笔;从爆发期到发酵期这一段时间,由于罗尔个人资
产的曝光,舆情中充满了对罗尔利用女儿病情炒作的批判,微博平均情感强度明显下降;在罗尔归还捐款并致歉之后,消解期和反思期的微博平均情感极性强度逐渐回升。总览整个事件发展过程中情感类型的发展变化,开始期以“赞扬”、“相信”等正向情感为主;在爆发期到反思期中,“赞扬”类的正向情感与“贬责”作为主体情感并交织出现,但总体上主要以正向情感为主,此外,“悲伤”是舆情演化过程中网民共有的情感之一。
以上为宏观层面的“罗一笑”事件网络舆情演化过程分析,下面从微观层面对该事件舆情演化各阶段进行探究。

由表4可知,开始期微博发布数量仅17条,包括正向微博11条、负向微博和中性微博各3条,其中,正向微博情感极性多为高度正向,表明该事件初期,网民的情感较为正向,对罗一笑祝福、关爱的同时呼吁更多的人施以援手。
从用户特征的角度来看,开始期尤其是微博情感极性强度为前5的用户(见表5),其所在地多为事发地(深圳),可见该事件网络舆情的迅速传播得益于当地媒体及当事人的宣传。

爆发期的微博发布数量与网民参与量均达到各阶段的顶峰,通过对这一阶段的微博发布数量与平均情感极性强度进行时序变化分析(见图7)可知:
1)2016年11月30日10~13时,呈现出微博发布数量急剧增长而微博平均情感极性强度逐渐递减的趋势,表明在这段时间内网民所发布的负向微博的比例在上升,负向情绪不断攀升并在16时达最低值;
2)2016年11月30日16~22时,微博发布数量递减,而微博平均情感极性强度略有回升,且均高于微博发布数量最多的时间段(13~16时),表明该时间段正向微博的数量增长较为明显;
3)总体上看,11月30日10~24时的微博发布数量先增后减,平均情感极性强度先减后增,前期负向微博较多,而后正向微博占据主导。

在发酵期,网民对该事件的态度逐渐趋于稳定,通过对这一阶段的20890条相关微博文本进行挖掘与分析(见图8)可知:
1)2016年12月1日,“罗一笑”事件网络舆情仍保持较高热度,12~15时之间,呈现出微博发布数量总体增多而微博平均情感极性强度递减的趋势,表明这段时间该事件相关网络舆情负向情感所占比例上升。此外,15时微博发布数量为当日最高值,且微博平均情感极性强度达到最低,表明此时网民的情绪最为低落;
2)2016年12月2日,即“罗一笑”事件网络舆情发酵期的后半阶段呈现出关注热度走低的趋势,此时网络舆情并没有持续恶化,而是得到了有效的控制,这得益于官方的介入以及该事件相关问题的妥善解决。

通过对消解期的5057条相关微博进行发布数量的时序变化分析(见图9)可知,这一阶段微博发布数量呈现出递减趋势,且微博发布数量较少,表明“罗一笑”事件已不再是热点舆情事件。随着12月3日罗尔宣布退还善款并致歉的