1 / 3
文档名称:

中文产品评论中属性词抽取方法研究.pdf

格式:pdf   页数:3
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

中文产品评论中属性词抽取方法研究.pdf

上传人:sdhdjhty 2014/1/17 文件大小:0 KB

下载得到文件列表

中文产品评论中属性词抽取方法研究.pdf

文档介绍

文档介绍:计算机工程 2011 年 6 月
第 37 卷第 12 期
June 2011
Engineering

···软件技术与数据库·软件技术与数据库··· 文章编号:::1000 ———3428(2011)12 ———0026 ———03 文献标识码:::A 中图分类号:::TP393

中文产品评论中属性词抽取方法研究
栗春亮,,,朱艳辉,朱艳辉,,,徐叶强,徐叶强
(湖南工业大学计算机与通信学院,湖南株洲 412008)
摘摘摘要要要:要:::针对现有属性词抽取方法的准确率和覆盖率偏低问题,利用百度百科和分词后相邻词语同现比例识别专业领域生词,降低分词错
误对属性词识别的影响,在中文产品评论语料中通过设计词性序列模板获得候选属性词集,该词性序列模板包含名词和名词短语模板、动
词和动词短语模板,采用统计技术和自然语言处理技术筛选候选属性词。实验结果表明,对于 3 623 篇手机评论文章,利用该方法可获得
1 732 个属性词,准确率为 、召回率为 、调和平均值为 ,具有较好的抽取性能。
关键词:::产品评论: ;生词识别;序列模板;属性词
Research of Attribute Word Extraction Method
in Chinese ment
LI Chun-liang, ZHU Yan-hui, XU Ye-qiang
(Institute puter & Communication, Hunan University of Technology, Zhuzhou 412008, China)
【【【Abstract 】】】Aiming at solving problems of relatively low precision, rate of coverage when using existing attribute word extraction methods, this
paper adopts Baidu Baike and co
occurrence proportion of adjacent words after word segmentation to identify new domain words, decreases impact
on recognition of attribute word caused by segmentation errors. This paper designs part of speech sequence templates which contain noun and noun
phrase templates, verb and verb phrase templates to obtain attribute word candidates from Chinese ments, then utilizes statistical
technique and natural language processing technique to filter attribute wor