1 / 4
文档名称:

结合词信息的中文命名实体识别研究.pdf

格式:pdf   大小:952KB   页数:4页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

结合词信息的中文命名实体识别研究.pdf

上传人:学习好资料 2021/8/13 文件大小:952 KB

下载得到文件列表

结合词信息的中文命名实体识别研究.pdf

文档介绍

文档介绍:技术论坛 移动信息
结合词信息的中文命名实体识别研究
赖兰妹
广东财经大学统计与数学学院,广东 广州 510320
摘要:中文文本没有分词的标志符号,而分词的好坏会直接影响中文命名实体识别。针对这个问题,文章将从
基于联合分词任务 (CWS) 的多任务学****的方法、基于上下文编码层嵌入词汇信息的方法和基于分布式表示层嵌
入词汇信息的方法这 3 个方面对目前利用词汇信息的中文 NER 任务进行阐述分析。
关键词:中文命名实体识别;深度学****词信息
中图分类号:
0  引言 别的准确率。对于基于单词的中文命名实体识别框
架,分词错误会直接导致实体识别的错误。在不同
命名实体识别(NER)的任务是同时预测实体
的领域中,单词的黄金分割不同,因此跨领域分词
边界和实体类别标签。实体的对象包括人名、机构名、
更容易出错,而这也是自然语言处理中亟须解决的
地名、时间和数字等,是自然语言处理(NLP)的基
一个问题。此外,分词也是产生未登录词的重要来
础任务之一。命名实体识别在自然语言处理的下游
源(OOV),而未登录词也会产生新的一些问题,
任务中起着非常重要的作用,其中包括事件抽取、
需要引入其他的方法进行修正。对于基于字符的中
关系抽取、问答系统、机器翻译和实体链指等任务。
文命名实体识别框架,它没有考虑到单词的语义信
研究者最早用基于规则和基于统计的方法来处
息和词序信息。有研究表明基于字符的方法在中文
理命名实体识别。随着深度学****的发展,研究者开
命名实体识别中的表现优于基于单词的方法 [5]。两
始使用神经网络框架来识别命