文档介绍:判别分析实例
第1页,此课件共18页哦
研究目的:
使用先前博士研究生的信息来预测后来学生是否能成功完成毕业项目。
包括10-7年前50 个学生的信息。因变量是category(1代表完成判别分析实例
第1页,此课件共18页哦
研究目的:
使用先前博士研究生的信息来预测后来学生是否能成功完成毕业项目。
包括10-7年前50 个学生的信息。因变量是category(1代表完成了博士学业,2代表没有)。用17个预测变量预测被试在两组中的从属关系,这些变量为:
gender: 性别,1代表女性,2 代表男性
age: 被试当时的年龄
marital:婚姻状况, 1代表已婚,2 代表单身
gpa: 未毕业时总的GPA
areagpa: 专业领域的GPA
grearea: GRE考试中专业领域的得分
第2页,此课件共18页哦
grequant: GRE考试中数学部分的得分
greveral: GRE考试中词汇部分的得分
letter1:三封推荐信中的第一封(1代表很弱,9代表很强)
letter2:三封推荐信中的第二封(评分同上)
letter3:三封推荐信中的第三封(评分同上)
motive:申请者的动机水平(从1到9分别代表从低到高)
stabe:申请者的情绪稳定性(从此项开始评分标准都同上)
resourse:财力和支持系统
interact: 申请者与同事和导师友好相处的能力
hostile: 申请者的内心敌对程度
inpress: 选择者进行面试后的印象
第3页,此课件共18页哦
SPSS操作程序
在因变量category的基础上预测被试对两组的从属关系。用17个自变量来建立判别方程。
选择stepwise过程,采用使wilks'lamabda最小化的方法,,;然后,选择Mean,Box'sM(多元正态性检验)和UnivariateANOVA(检验所有自变量在各组间有无差别),以便对自变量的单变量特征有更全面的理解,计算unstandarddized(基于判别变量原始分数建立的判别函数的非标准化系数)Fisher's founction coefficients(规范判别函数系数)。
输出部分:选择Combined-groups plot(包括2个组别的直方图),Result for each case(所有被试的真实分组信息) 和Summary table(累计每组正确分类和未正确分类数目及百分比)
第4页,此课件共18页哦
结果分析
第5页,此课件共18页哦
结果分析
第6页,此课件共18页哦
。。有发现证明,即使在多元正态性被违反的条件下,判别函数仍经常运行得相当好。因为这个值很低,因此比较好的做法是查看包含在分析中的一些变量的一元正态性(univariate)。如,性别变量不是正态分布,但放入性别变量却能提高判别方程的功能。
判别分析能够容忍不符合正态的情况: A sample size of about 20 in the smallest cell should ensure robustness to violation of normality as long as sample size are equal and two-tailed tests are used
第7页,此课件共18页哦
结果分析
第8页,此课件共18页哦
结果
第9页,此课件共18页哦
第10页,此课件共18页哦
第11页,此课件共18页哦
第12页,此课件共18页哦
根据上表可以得出分类判别函数:
完成博士学位=-++-++++++
未完成博士学位=-++-+20x推荐信2+++++
第13页,此课件共18页哦
存在问题
由于本数据为虚拟数据,被试量为50,以及分类只有两类等原因,有很多关于判别分析的事项需要注意:
最小的组中的记录数是否显著超过预测变量的数目,是否产生过度拟合的问题?