1 / 7
文档名称:

语料库语料库的词性标注.ppt

格式:ppt   大小:42KB   页数:7页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

语料库语料库的词性标注.ppt

上传人:新起点 2019/2/24 文件大小:42 KB

下载得到文件列表

语料库语料库的词性标注.ppt

文档介绍

文档介绍:语料库的词性标注中国外语教育研究中心梁茂成主要内容词性标注的意义词性标注方法词性标注集词性标注语料的检索词性标注的意义又称词性赋码(POS,Part-of-SpeechTagging),指对文本中的所有词进行分析,确定其语法属性,并将该属性添加到文本中的对应位置。对经过词性标注后的语料库可以进行更有效的检索和分析,可以方便从语料库中提取语法相关信息,即Leech所说的addedvalue。词性标注方法词性标注原理TreeTagger()的操作方法词性标注集词性标注集(tagset)即一整套符号,代表各类词性。词性标注集具有内在规律。词性标注语料的检索安装EditPadPro以赋码为线索,借助正则表达式检索AntConc支持正则表达式谢谢