文档介绍:基于Logistic回归模型分析大学生就业影响因素
摘要:利用山东财经大学统计学院2012届本科毕业生的就业数据,以Logistic回归模型为基础,从定量角度对当代大学生就业问题做一定分析,政治面貌、户籍性质、学业成绩、外语水平等因素对毕业生就业情况有很大影响。
关键词:Logistic回归模型就业影响因素
一、数据分析
文中的数据采集自山东财经大学燕山校区统计学院统计0801、统计0802共62名毕业生,包括他们的就业、学****思想和基本情况,数据来自于统计学院学生工作办公室,因此,数据真实可信。
基本情况包括学生的学号、姓名、性别、班级和户籍性质。学****情况中有学生大学四年平均绩点和英语等级成绩情况。思想情况包括学生的政治面貌状况以及大学期间是否担任班内职务状况。数据中的户籍性质分为城市户籍和农村户籍。英语水平分为未过六级和过六级两种情况。此外,还需要特别说明的是,两个班共有毕业生79人,本文所研究的就业状况中不包括考取研究生以及出国深造的学生,这样,除去考取研究生和出国深造的毕业生17人以外,实际有效样本量是62人。本案例中所采用的数据的基本特征如表1所示:
从表l可以看出,研究中的山东财经大学12届统计学62名毕业生中,成功找到工作的有34名,%。性别方面,,男女生的比例有着显著的区别,这也符合经济类院校的特点。%的学生都是城市户口。学****成绩用毕业生大学四年的平均绩点表示,%,平均绩点介于这个水平的可以认为是学****成绩较优秀的毕业生。%的学生通过了大学生英语六级考试,%的毕业生是党员身份,大约20%的毕业生在大学期间担任过一定班级职务。
二、大学生是否就业的Logistic回归模型
在因变量是分类变量时,通常采用Logistic回归分析来研究分类因变量与一组解释变量之间的关系。本文中将就业与否作为模型的因变量,其取值有两种可能,是和否。本文从六个方面探讨毕业生就业的影响元素:学业成绩、是否是党员、性别、英语等级、籍贯、是否担任过班内职务,这六个元素便是模型的自变量。本文构建的Logistic回归模型为下:
三、模型的相关检验
采用的是SPSS中默认的逐步回归方法选择自变量。变量的显著性检验如表2所示:
各变量的显著性水平及相应统计量值上表所示,,通过显著性检验的变量有户籍性质、平均绩点、英语水平和是否是党员。
四、回归模型的建立
根据上面的分析,由于通过显著性检验的自变量为户籍性质、平均绩点、英语水平和党员状况,故建立的最终模型为:
五、Logistic回归模型分析
1 学生基本情况对大学生就业的影响
(1)性别因素的影响。虽然在就业过程中,女生可能能受到歧视而造成就业率低于男生,但在经济类专业就业中,这种现象可能并不是很严重,而且从毕业生各方面的情况来看,女生在各方面情况要优于男生,女生在平时学****考证和找工作过程中付出的努力更多,这样女生的总体就业情况仍然要好于男生。
(2)户籍因素的影响。,这表明具有优越经济、文化背景的城镇孩子就业率明显高于来自经济不发达地区的孩子