1 / 16
文档名称:

(任宁)求职简历信息的自动抽取.ppt

格式:ppt   页数:16页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

(任宁)求职简历信息的自动抽取.ppt

上传人:lfh2233102 2011/12/8 文件大小:0 KB

下载得到文件列表

(任宁)求职简历信息的自动抽取.ppt

文档介绍

文档介绍:求职简历信息的自动抽取
--任宁
求职简历信息抽取的意义
大型公司人力资源库的动态更新
猎头公司建立人力资源库
招聘网站便利用户
网上进行的各种认证、报名的需要
求职简历的特点
求职简历范例
结构化文本
半结构化文本
非结构化文本
求职简历的构成
求职简历的“A+B+1”结构模式
A部分:个人信息
此外教育背景、实践经历、个人评价还有其他信息的部分内容也出现在这一部分。
B部分:教育背景、实践经历和个人评价
此外可能含有其他信息和联系信息中的部分内容。
“1”:联系信息
联系信息既可能出现在A部分,也可能出现在B部分的末尾。
把求职简历的格式以“A+B+1”模式来描述的原因
在A部分,各简历信息基本是以“项:值”格式存在的。即前面是简历项名称,后面是简历项内容,中间用分隔符(可能是“:”、制表符或空格)隔开。值的部分是表达单纯概念的简单信息,往往是一个短语。
而在B部分,各简历信息的值相对复杂,为组合概念,项、值之间多以换行分隔。
“A+B+1”的具体构成
求职简历信息的抽取方法
求职简历A部分简历信息的抽取方法
求职简历B部分简历信息的抽取方法
识别求职简历A部分与B部分的分界
“1”的定位和处理
求职简历A部分简历信息的抽取方法
按顺序一行行读入文本;
去掉每行空格;
以A部分简历信息中常见的简历项名称做触发词语,遇到触发词语则替换成“换行符+触发词语”的格式;
对A部分每一行进行处理,提取触发词语作为简历项名称,后面的部分做为简历项的“值”。