1 / 13
文档名称:

一种通过评价类别分类提升评价对象抽取性能的方法.pdf

格式:pdf   大小:809KB   页数:13页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

一种通过评价类别分类提升评价对象抽取性能的方法.pdf

上传人:好用的文档 2022/2/11 文件大小:809 KB

下载得到文件列表

一种通过评价类别分类提升评价对象抽取性能的方法.pdf

相关文档

文档介绍

文档介绍:: .
计算机工程 程与自动化学院,昆明 650504)
2(昆明理工大学 云南省人工智能重点实验室,昆明 650504)
3(湖南快乐阳光互动传媒有限公司,长沙 410000)
4(云南南天电子信息产业股份有限公司,昆明 650040)

摘 要:评价对象抽取主要用于文本的意见挖掘,旨在发掘评论文本中的评价对象实体。基于无监督的自
编码器方法是研究该任务的重要方法,它可以识别评论语料库中潜藏的主题信息,无需人工标注语料。针
对自编码器抽取的评价对象缺乏多样性的问题,本文提出了一种基于监督学****的句子级分类任务和无监督
学****的自编码器的混合模型。模型训练了一个分类器,生成评价对象类别。自编码器共享分类任务中的
LSTM-Attention 结构进行编码得到句向量表征,以增加语义关联度,再用得到的评价对象类别将句向量
表征转化为中间层语义向量,从而捕捉到评价对象类别与评价对象之间的相关性,提高了编码器的编码能
力,模型通过对句向量的重构进行解码,训练得到评价对象矩阵。最后通过计算评价对象矩阵与句中单词
的余弦相似度来完成评价对象的抽取。通过在多领域评论语料库上的实验表明,与主流方法相比,模型一
定程度上解决了训练过程缺少评价类别多样性的问题,并在餐厅领域中提升了 %,在酒店领域中提升
了 %。
关键词:自编码器;注意力机制;句子分类;LSTM(长短期记忆模型);评价对象抽取



A method of improving aspect extraction performance by aspect category classification

CUI Wei-Qi1,2 , YAN Xin1,2 , TENG Lei3 , CHEN Wei1,2 , XU Guang-Yi4
1(School of Information Engineering and Automation, Kunming University of Science and Technology, Kunming 650504, China)
2(Yunnan Key Laboratory of Artificial Intelligence, Kunming University of Science and Technology, Kunming 650504, China)
3( Interactive Entertainment Media Co., Ltd., Changsha 410000, China)
4(Yunnan Nantian Electro