1 / 59
文档名称:

面向产品评价的细粒度情感分析技术研究.pdf

格式:pdf   大小:2,629KB   页数:59页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

面向产品评价的细粒度情感分析技术研究.pdf

上传人:陈潇睡不醒 2021/9/2 文件大小:2.57 MB

下载得到文件列表

面向产品评价的细粒度情感分析技术研究.pdf

相关文档

文档介绍

文档介绍:硕硕硕士士士学学学位位位论论论文文文
面向产品评价的细粒度情感分析技术研究
FINER GRAINED OPINION ANALYSIS
ON PRODUCT REVIEWS
张张张玥玥玥
2012 年年年 12 月月月
国内图书分类号: 学校代码:10213
国际图书分类号: 密级:公开
工工工学学学硕硕硕士士士学学学位位位论论论文文文
面向产品评价的细粒度情感分析技术研究
硕 士 研 究 生:张玥
导 师:徐睿峰副教授
申 请 学 位:工学硕士
学 科:计算机科学与技术
所 在 单 位:深圳研究生院
答 辩 日 期:2012 年 12 月
授予学位单位:哈尔滨工业大学
Classified Index:
.:
Dissertation for the Master Degree in Engineering
FINER GRAINED OPINION ANALYSIS
ON PRODUCT REVIEWS
Candidate: Zhang Yue
Supervisor: Asso. Prof. Xu Ruifeng
Academic Degree Applied for: Master of Engineering
Specialty: Computer Science and Technology
Affiliation: Shenzhen Graduate School
Date of Defence: December, 2012
Degree-Conferring-Institution: Harbin Institute of Technology
哈尔滨工业大学工学硕士学位论文
摘 要
近年来,随着电子商务的迅猛发展,互联网中出现了大量的产品评价文
本。人们开始寻求通过自动的方法在这些海量的主观文本中抽取出有价值的信
息,于是情感分析研究应运而生。作为情感分析的一个重要的子任务,细粒度
的情感分析,如评价发出者和评价对象的识别,由于可以获得用户评价的精细
化信息,因此越来越受到研究者的关注。
目前细粒度情感分析研究中,基于模板和规则的方法来抽取细粒度要素的
方法是其中的一种主要途径,然而这种方法存在灵活性弱,扩展性差,召回率
低等缺点。另一种主要途径是将细粒度情感要素的抽取视为序列标注问题,采
用基于随机条件场、隐马尔可夫模型等序列标注方法来抽取特定的情感要素,
但是这些方法无法很好地处理评价文本中大量存在的评价元素之间的长距离依
赖,这也降低细粒度情感分析性能上提升的空间。
围绕着对产品评价文本细粒度情感分析任务,本课题进行了一系列系统
化的工作。第一,提出了面向产品评价文本的细粒度情感标注体系。该体系
使用领域本体的形式组织和表示产品的相关概念节点。依据该体系,对1000短
篇相机的产品评论文本进行了标注,建立了一套高质量、细颗度情感分析语
料(CUHIT Opinmine)。第二、文本提出了一种使用基于依存句法树结构的条件
随机场模型对评价对象与评价描述进行结合抽取的方法,该模型改善了线性
条件随机场在标注细粒度情感要素时无法适应情感要素长距离语义依赖的问
题,使用树边特征表达了细粒度要素中的句法相关性。在CUHIT Opinmine语料
库与COAE2011任务三数据集对该模型分别进行了实验和评估。最后,为了进
一步提高产品评价的评价对象的识别效果,本文提出了一种基于半监督的学****br/>本体节点新实例的方法来处理产品评价文本出现的词典未登入领域专有词。实
验中将该方法的输出结果构建为一套单独