文档介绍:第卷第期计算机工程年月
. .
· 人工智能及识别技术· 文章编号: ——文献标识码: 中图分类号:
基于维吾尔语情感词的句子情感分析
黄俊,田生伟,禹龙,冯冠军
.;.网络中心;.人文学院, 鸟鲁术齐;.新疆大学软件学院,乌鲁木齐
摘要:提出基于自动标注的维吾尔语情感词分析句子情感的方法。将种情感类别作为情感类别集合。判断句子中是否含有转折性连词,
若有则屏蔽含有转折性连词句子的前半部分,通过条件随机场模型自动标注句子中的情感词,依据标注的情感词,为句子的每种情感类别
打分,得分最高的情感类型作为句子的候选情感。识别旬中维语的否定成分,根据否定成分出现的奇偶次数对句子的候选情感修正,得到
句子的最终情感类型。实验结果表明,在句子情感分析上该方法可取得较好的效果。
关键词:维吾尔语;条件随机场模型;特征模板;情感词;否定成分;句子情感
,—,,’
.;.;.,,;
.,,
..
.
. .
.,.
.
;;;;;
:./..—...
概述分类上,但句子的情感并不是非褒即贬,还可能是乐、哀、
随着互联网的普及,越来越多的人们从网络中获取知识怒、恐、惊等其他情感。
和发布信息,对网络文本进行情感挖掘和情感分析,成为自分析句子情感时主要考虑了上下文句子情感的影响,
然语言处理领域研究的一个热点。目前,情感分析主要研究而忽略了句子内部情感词汇、转折连词等对句子情感的影响。
方法是基于人工标注的语料库,利用机器学习的方法对词语、目前的研究对英语和汉语的情感分析研究较多,而针
句子、段落、篇章的情感标注。对维吾尔语等少数民族语言的研究却很少。
在词语级情感分析方面,文献【通过分析词汇上下文信针对以上问题,本文提出了基于自动标注的维吾尔语情
息研究其情感倾向,采用—方法,使用个词汇作为感词,并结合句中的转折性连词、否定成分分析句子的情感。
种子判断其他短语的语义倾向。文献【利用信息抽取技术从基于维吾尔语情感词的句子情感分析
语料中产生特征词汇,以网络为工具分析各词汇与已. 条件瞳机场模型
标定情感类别文档之间的关系,进而计算各词汇的得分,用模型通过局部特征向量,与相应的权重向量表
于判定词汇的语义倾向。汉语词汇的情感倾向研究方面,文示。在模型中, ,被分为状态特征五与转移特征
献建立了基于二元语法依赖关系的情感倾向互信息特征,,,,其中, 与是句子中词语的情感标记序列;
模型,采用机器学习方式实现了汉语词语情感倾向自动是当前输入的句子中的词语序列; 是当前词的位置。其形
判断。
式化表述如下:
对于句子级情感分析,大部分工作还集中在对句子的极
,,,,
性分析和极性强度分析上,文献对句子的褒贬度分类做了, .、. .
一定的工作,其主要思想是“在上下文中,相邻的句子应该,:【,,‘】
具有相同的褒贬类别”。文献把句子的褒贬标记看作一个
情感流问题,并利用序列回归模型给篇章中的每个句子基金项目:国家自然科学基金资助项目;国家社会科学基
进行打分。在汉语方面,文献【提出了基于层叠式条件随机金资助项目,;新疆大学博士基金资助项目
场,模型的句子