1 / 79
文档名称:

关键词抽取方法研究PPT教案.pptx

格式:pptx   大小:3,447KB   页数:79页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

关键词抽取方法研究PPT教案.pptx

上传人:12345 2021/6/9 文件大小:3.37 MB

下载得到文件列表

关键词抽取方法研究PPT教案.pptx

相关文档

文档介绍

文档介绍:会计学
1
关键词抽取方法研究
第1页/共79页
报告摘要
关键词抽取简介
关键词抽取方法
关键词抽取的应用
展望
第2页/共79页
问题描述
关键词自动抽取
Automatic Keyphrase Extraction
定义:自动从文档中抽取关键词作为文档摘要
特点:
多个词或短语
一般来自文档内容
第3页/共79页
关键词抽取的典型应用场景
第4页/共79页
关键词标注方式
第5页/共79页
关键词标注方法
第6页/共79页
有监督方法
转化为二分类问题
判断某个候选关键词是否为关键词
Frank 1999采用朴素贝叶斯分类器
Turney
转化为多分类多标签问题
传统文本分类方法
受限词表作为候选关键词集合(分类标签)
第7页/共79页
无监督方法
词频
基于TFIDF及其变形对候选关键词进行排序
图方法
Rada 2004: PageRank  TextRank
Huang 2006: 复杂网络统计性质
Litvak and Last 2007: HITS
第8页/共79页
词频方法
Term-frequency inverse document-frequency (TFIDF)
TF: the importance of the term within the document
IDF: the informativeness of the term in the document set
第9页/共79页
TextRank
第10页/共79页