文档介绍:密级: 学校代码:10075
分类号: 学号:20091316
工学硕士学位论文
基于词性与句法的产品评论
特征及情感词挖掘
学位申请人:陈硕
指导教师:袁方教授
学位类别:工学硕士
学科专业:计算机软件与理论
授予单位:河北大学
答辩日期:二〇一二年六月
Classified Index: CODE: 10075
: NO: 20091316
A Dissertation for the Degree of M. Engineering
Mining the Feature and Emotional
Words from Product Reviews Based on
the Part of Speech and Syntactic
Relations
Candidate : Chen Shuo
Supervisor : Prof. Yuan Fang
Academic Degree Applied : Master of Engineering
Specialty : Computer Software and Theory
University : Hebei University
Date of Oral Examination : June, 2012
摘要
摘要
人们在网络上购买商品后台上留下对产品优劣的评价。潜
在的消费者可以通过产品评论了解产品信息来决定自己的选择,商家也可以根据评论来
学习别人的优点改正自己的不足。其中,评论中的情感词对于分析评论的态度具有决定
性作用,而情感词所描述的特征词则反映了用户关注的焦点。因此产品评论挖掘的主要
任务之一就是挖掘评论中的情感词与特征词。
本文所做工作主要有如下几个方面:
给出了一种对评论进行规范化和切分的预处理方法。对评论的格式进行规范和统
一,之后将评论切分成短句。通过对评论的预处理有助于文本处理工具对评论取得更好
的处理效果。
在挖掘情感词时,考虑到情感词和特征词在词性组合上的搭配模式,给出了基于词
性模板的情感词挖掘方法。该方法从种子评论集中提取匹配情感词的词性模板,应用模
板对情感词进行挖掘,随后通过停用词集和依存关系对挖掘结果进行双重剪枝。最后的
挖掘结果既包含评价产品显性特征的情感词,也包含评价产品整体和隐性特征的情感
词。
在挖掘特征词时,给出了基于情感词的特征词挖掘方法。通过评论中情感词的位置,
定位特征词所在的句子片段。通过词性搭配与句法结构相融合的方式,对特征词进行自
动匹配,达到特征词与情感词的对应。匹配的结果在识别高频特征词的同时,对低频特
征词也可较好识别。
实验结果表明,应用本文给出的产品评论挖掘方法能够取得较好的挖掘效果。
关键词评论挖掘词性模板依存关系情感词特征词
I
Abstract
Abstract
After purchasing the products, the customers usually leave their reviews of the products
on the platform provided by the traders. The potential consumers can get information of the
product to make decisions; the traders can also learn the advantages of other traders from
those reviews and then correct their own deficiencies. The emotional words in the reviews
play a decisive role for the analysis of the attitudes, for the feature words described by the
emotional words can reflect the focuses of the customers’ attention. One of the most important
tasks during the exploring the product reviews is to set the emotional words and feat