文档介绍:第卷第期计算机技术与发展.
年月
基于贝叶斯分类器的简历筛选模型
洪海燕
安徽大学江淮学院,安徽合肥
摘要:现代社会网络招聘兴起,为社会、企业节省了不少物力、人力、财力,但如何快速、简捷地从众多的电子简历中找出
符合要求的简历又是一个让人头疼的问题。文中在贝叶斯网络的基础上,分别从朴素贝叶斯分类器和分类器角度,
构建一个基于贝叶斯分类器的电子简历筛选模型,并通过实验验证该模型对电子简历进行分类时的准确率和查全率,且
引入一个新的评价指标,同时考虑准确率和查全率,得出没有属性变量相互独立限制的分类器具有较好的分类效果
的结论。
关键词:贝叶斯网络;贝叶斯分类器;朴素贝叶斯分类器;分类器
中图分类号:.;. 文献标识码: 文章编号:
。,
:,.
. .,
.
, .
.
:;;;
引言出节点相对于其父节点的所有可能的条件概率,以表
现代企业的人员招聘途径已经越来越多,网络、招示不同信息之间的影响程度。
聘会、校园招聘等等,为招聘单位提供了大量的人才信在贝叶斯网络中,把节点置的所有父节点作为条
息。在众多的招聘方式中,简历筛选成为很重要的一件,并且规定节点置与任意一个非置子节点的节点条
个环节,尤其是网络招聘。文中结合实际,在贝叶斯网件独立,按照变量之间相互独立的性质,有个节点
络基础上,构建一个简历筛选模型。的贝叶斯网络的联合概率分布为:
。,,⋯,【。仃
贝叶斯网络基本概念
其中把贝叶斯网络中置的所有父节点集合中的
贝叶斯网络属于概率网络范畴,是用于处理不确
变量取值后的一个组合记为置;若贝叶斯网络中
定性知识与数据的表达与推理的模型,是目前社会处
置恰恰没有父节点,则令置仃。
理不确定信息技术的主流。贝叶斯网络基本上由两
同时贝叶斯分类亦是一种非规则分类,基本思想
部分组成:首先具备一个有向但无环的图形结构,
是通过训练集的训练总结归纳出较适合的分类器,并
其中图形中的每一个节点表示一个变量,节点与节点
充分利用该分类器对没有分类的数据进行分类。
之间的有向弧刻画了变量与变量之间的依赖关系,图
若有一待分类的样本, 。, ,⋯, ,
形中节点的父节点指的是指向的所有节点;其次
表示一个离散型随机变量的集合,其中, ,⋯,
必须具备与每个节点相关的条件概率表,此表中需列
表示为属性变量, 是属性变量置的取值;表示类
别变量,。,:,⋯,。则是属于类别的概
收稿日期:—;修回日期:——
率为:
基金项目:安徽省省级青年人才基金项目
作者简介:洪海燕一,女,硕士,讲师,研究方向为谱图理论及,,⋯,
, ⋯、
其应用。—与
· · 计算机技术与发展第卷
斯分类器来讨论电子简历的分类及其分类准确率和查
盖耳,⋯全率。
其中是类的先验概率, ,:,⋯,是基于假定属性变量间相互条件独立的前提,将每
类的后验概率。根据贝叶斯最大后验准则,待分类个属性变量节点只与类别变量节点相关联,类别变量
的样本的类标签选择使后验概率,,, 视为全体属性变量。的父节点,采取最大似然估计
⋯
, 那个类别为该样本的类标签。法,估计的值,建立朴素