1 / 8
文档名称:

基于LSTM的文本上下文依赖特征的表示方法之计算机研究.pdf

格式:pdf   大小:280KB   页数:8页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

文档介绍:基于LSTM的文本上下文依赖特征的表示方法之计算机研究



本文是一篇计算机论文,本文主要研究基于LSTM的文本上下文依赖特征的

文本表示方法。本课题将文本上
在斯坦福情感树库数据集和电影影评数据集的文本意见挖掘领域取得了优

异的效果。该类型的文本表示方法最大的特点是能够生成一个具有固定维

度的向量用于表示可变长度的句子或段落的信息。该方法包括两个子模型

:段向量的分布记忆模型和段向量的分布式词袋模型.两个子模型是从wor

d2vec方法拓展而来的,最大的差别体现在输入上,段向量的文本表示方

法在每次采样计算过程中多了一个表示该句(或段落)的标记D,随后的

计算方式与CBOW和Skip-model是一致的。



建模话题与意见文本之间上下文依赖关系,文献提出了一个面向英文推文

的立场分析任务,并分享了一个数据集,同时展示了当时各参赛队伍的比

赛成绩。该任务与基于实体方面的情感分析任务之间的主要区别在于话题

信息不是明显出现在意见文本中,甚至用户的立场可能与话题自身有关,而与意见文本无关。文献提出使用具有条件的LSTM编码方法,该编码方法

在构建文本表示过程中依赖于话题信息,实验结果证明了它优于通过对推

文和话题独立编码的方法。在中文领域,NLPCC&2016分享了一个面向中文

博文的立场分析的任务。文献提出分别针对每个主题信息训练对应的分析

模型,手动生成的五个特征集合分别使用到对应的支持向量机和随机森林

。文献提出了一个基于监督学习方式的针对特定目标的注意力网络模型。

它的主要工作分为两个部分,首先,平均来自话题中词语所对应的词嵌入

,并作为话题向量;其次,将话题向量和意见文本中每一个词语对应的词

嵌入做拼接处理;然后,生成经过文本信息强化后的话题表示;最后,提

出一个神经注意力模型,该模型通过结合经过意见文本强化后的话题表示

用以生成意见文本中的特征注意力权重值。实验表明该工作在中文英文两

个数据集上获得最佳效果。但是该方法在学习话题信息过程中,先学习话

题的向量表示然后加以利用,这个过程忽略了话题中每个词语特征与意见

文本之间的依赖信息。本文针对这一问题,提出注意力聚合的文本表示模

型用于从话题的个体词语特征出发构建包含话题信息和意见文本信息的文

本表示。

.............................

第3章基于注意力机制的双向LSTM的文本表示方法............13

3.1前言.....................13

3.2基于注意力机制的双向LSTM的文本表示模型..............13

第4章基于两阶注意力机制的文本表示方法.............25

4.1引言.............254.2基于两阶注意力机制的文本表示模型..............25

第5章基于注意力聚合网络的文本表示方法.............33

5.1引言..........33

5.2基于注意力聚合网络的

分享好友

预览全文

基于LSTM的文本上下文依赖特征的表示方法之计算机研究.pdf

上传人:周瑞 8/10/2022 文件大小:280 KB

下载得到文件列表

基于LSTM的文本上下文依赖特征的表示方法之计算机研究.pdf

相关文档