文档介绍:中文摘要起了自然语言处理等相关领域的极大关注,主观性识别和情感分类是意见挖掘中取、和意见文摘等自然语言处理系统都有着极其重要的意义。,本文在统计方法和模糊集合论框架下研究汉语句子的主观性识别和情感分类问题。为了降低问题的复杂性,提高系统性能,本文根据汉语句子的特点分析句子中不同粒度层面的主观性及情感倾向,并以它们为基本任务线路,根据不同层次粒度的融合策略解决汉语句子层面的主观性识别和情感分类问题。具体地讲,本文从如下四个方面进行研究:鞴坌允侗鹗且饧诰蛑惺紫纫=饩龅奈侍庵弧C嫦虼蠊婺?7庞τ茫本文提出了一整套汉语句子主观性识别解决方案,包括:诜治龊河镏鞴坌员述的基础上,给出了一种基于畇闹鞴坌蕴卣餮≡穹椒ǎ针对汉语主观性意见表述与客观事实表述的差异性,引入情感密度概念,提出一种基于情感密度的汉语句子主观性识别方法:诤河锞渥拥那楦忻芏鹊幕∩希跃渥拥观性分类方法。实验结果表明,本文提出的汉语句子主客观分类方法具有较强的适应性,能够有效地将文本中的主观性意见表述从客观性事实陈述中分离出来,性分析的基础。针对汉语词语主观性存在的兼类问题和强度问题,本文在计算词随着互联网的迅猛发展,。意见挖掘得到了广泛地应用,并引的两个关键问题,其主要任务就是将文本中人们所表达的意见信息从客观性的信息中识别出来,并确定其情感倾向。这两个问题的解决对意见问答系统、信息抽情感密度区间为特征,描述了一种情感密度和贝叶斯分类器相融合的汉语句子主并取得了较理想的实验结果。视锸枪钩勺匀挥镅缘幕镜ノ唬渲鞴坌允墙徊浇卸逃锖途渥又鞴语的主观性权重的基础上,提出一种对数线性模型和模糊集合相结合的汉语词语主观性强度学习方法。其基本思想是先采用对数线性模型对语料中的候选主观性词语进行主观性权重预测,然后再在模糊集合的框架下融合词语的主观性权重相.‘
一
/㈣煳关信息,构造词语主观性强度的模糊集合及对应的隶属函数并以此判别词语的主观性强度类别,最后应用于汉语句子的主观性识别之中。实验结果表明,由于引入词语的主观性强度类别,本文方法取得了良好的效果。牒河锎视锏慕峁剐畔⒂兄诤河锎视锏那楦星阆蛟げ狻U攵院河锎视律的基础上,针对其中较难分辨的未登录词极性预测问题,将词语中语素等结构特征有效结合,提出了一种统计方法框架下的基于语素的汉语词语情感倾向自动预测方法。并在讨论词汇层面极性预测的基础上,提出了一种基于规则的短语极性计算方法,最后在词语和短语的极性计算基础上,给出了基于阈值法的句子情感分类方法。实验结果表明,与其他方法相比较由于引入句子中多层面的语言信息,本文方法较好的解决了汉语句子情感分类问题。晦性和模糊性,并结合汉语本身的特点,将上下文的多粒度信息融合并引入到整个句子的情感分类中,提出了一个基于多粒度融合与模糊集合相结合的汉语句子分类方法。实验结果表明,与传统的情感分类方法相比,本文提出的基于模糊集合的多粒度融合的汉语句子情感分类方法,从细粒度到粗粒度较精确的识别了汉语句子中各层次的情感强度及情感倾向,因此明显地提高汉语句子级别的情感分类的精确率和召回率。情感倾向难于预测的问题,本文在深入分析了汉语词语结构与词语情感倾向的规疚淖詈笾饕Q芯炕诙嗔6热诤系暮河锞渥忧楦蟹掷喾椒āT谏钊胙芯了语素、词语和短语层面的主观性及情感倾向的基础上,针对情感句子表述的隐关键词意见挖掘;主观性分类;情感分类;模糊集合论黑龙江大学硕十学位论文
●
,.,瑆锄趓跚.·琣琣餰猯甌ⅱ鬭,,,.琽.。.甇0.、,餲:.
..;.甌瑆—.—瑆猯,;;.
录目中文摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。第滦髀邸意见挖掘研究的研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯意见挖掘研究存在的主要问题和发展趋势⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..意见挖掘研究的研究意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。本章主要研究内容与组织⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.引言⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯汉语句子主观性特征及情感密度计算⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯