文档介绍:中文微博情感分析研究与实现李勇敢周学广孙艳张焕国武汉大学计算机学院海军工程大学信息安全系虫国人民解放军92941部队摘要:中文微博的大数据、指数传播和跨媒体等特性,决定了依托人工方式监控和处理中文微博是不现实的,迫切需要依托计算机开展中文微博情感自动分析研究•该项研究可分为3个任务:中文微博观点句识别、,研制了一个评测系统:通过构建多级词库、制定成词规则、开展串频统计等给出一种基于规则和统计的新词识别方法,在情感词和评价对象的依存模式的基础上给出基于词语特征的观点句识别算法;以词序流表示文本的LDA-Collocation模型,采用吉布斯抽样法推导了算法,实现中文微博情感倾向性自动分类;针对中文微博情感要素抽取召回率较低的问题,利用依存关系分析理论,按主语类和宾语类把依存模式分为两类,建立了6个优先级的评价对象和情感词汇的依存模式,通过评价对象归并算法实现计算机自动抽取情感要素•实验包括两个部分:2012的公开评测,所提方法在微博观点句识别任务中的准确率为第2,在中文微博情感要素抽取任务中的准确率和F值均为第2,验证了该算法的实用性;二是在分析公开评测结果的基础上,分别比较了参加公开评测的各类算法在处理中文微博情感分析时的效率,:中文微博;情感分析;依存分析;情感倾向性分类;情感要素抽取;无监督主题情感模型;作者简介:李勇敢(1973-),男,河南平顶山人,博士生,副教授,主要研究领域为信息内容安全,:周学广(1966-),男,博士,教授,F高级会员,主要研究领域为信息内容安全,网络安全,-mai1:zxgl96610@作者简介:孙艳(1983-),女,博士,工程师,主要研究领域为信息内容安全,:张焕国(1945-),男,教授,F高级会员,主要研究领域为信息安全,:2016-05-19基金:国家重点基础研究发展计划(973)(2014CB340600)ResearchandImplementa/tionofChineseMicroblogSentimentClassificationLIYong-GanZHOUXue-GuangSUNYanZHANGHuan-putetScience,WuhanUniversity;DepartmentofInformationSecurity,NavyUniversityofEngineering;UnitNumberof92941,PLA;Abstract::emotionsentenceidentificationandclassification,emotiontendencyclassification,,UTSM,,,:ChineseMicroblog;sentimentanalysis;dependencyparsing;emotiontendencyclassification;emotionexpressionextraction;unsupeTvisedtopicsentimentmodel;Received:2016-05-19截至2016年12月,,,%,微博实际用户数超过5亿()•网民的快速增加和微博的迅速发展,使得大量评论信息迅速传播LQ•对这