1 / 7
文档名称:

信息分析方法 相关分析.doc

格式:doc   大小:137KB   页数:7页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

信息分析方法 相关分析.doc

上传人:小博士 2019/11/3 文件大小:137 KB

下载得到文件列表

信息分析方法 相关分析.doc

文档介绍

文档介绍::..第一节 相关关系分析一、定类变量的相关分析定类变量,又称类别变量、称名变量。该变量是按某种品质或属性特征对其进行平行分组或分类,用定类数据表示。如性别、经济类型等。定类数据是指按定类尺度计量的数据,表示类别,但不分顺序。如用“1”表示男性,“0”表示女性。定类变量的数据处理只能采取计算频数、频率、众数、卡方检验、列联相关等统计方法。定类变量的相关分析方法,主要有以下三种:(-)四分相关1、 适用条件①两个变量都是正态连续变量,且呈直线关系②两个变量被人为地划分二分变量(即只有两种类别)。2、 计算公式利用皮尔逊余弦龙法rt=cos(180°\+yjad/bc式中,分相关系数,cos为余弦符号,a、b、分别表示由两个二分变量所构成得四种类别的实际频数。(―)①相关1、 适用条件两个变量都是二分变量(可以是真实的或人为的)。2、 计算公式_ ad-be彳 +b)(a+c)(Z?+d)(c+d)ad-bc7^x18x44x2式中,a、b、c、d为四格表中的实际频数。学历录用未录用总和本科生a=10b=14a+b二24专科生c=8d=30c+d=38总和a+c=18b+d=4462例招聘工作数据汇总表10x30-8x14300-112_188=022相关程度低,即学历与录用与否关系不大。3、①相关系数显著性检验hq:p=aH]:〜力2(i)给定显著性水平a,查*分布表找出临界值力2。。当/>/-拒绝丹°。两变量相关程度高。(三)列联相关1、适用条件两个变量均被分成两个以上类别,或其中一列变量被分成两个以上类别。列联相关在某种程度上可以被看成是①相关的扩展。2、计算公式\N+x),N为样本容量(总频式中,c为列联相关系数,才为列联表(横行,纵列)计算出的才值(力2数需要指出的是:,其最大值随变量所分类别的多少而变化。如果横行(r)的类别二竖列(c)的最大值只能达到c=F。二、定序变量的相关分析定序变量是指由定序数据反映的变量。如产品等级、受交于程度等。定序数据是指按定序尺度计量的数据,表现为类别,但分顺序。如产品等级的数值表现为:一等品、二等晶、三等晶。定序变量的数据处理可以采取计算中位数、四分位数、百分数、肯徳和谐系数、等级相关等统计方法。定序变量的相关分析,即进行等级相关分析,通过计算等级相关系数来实现。等级相关适用于对量表的数据进行关系(或一致性程度)分析。等级量表数据的特点是两个或多个变量都以等级次序排列。等级相关对数据得特性要求不高,不要求变量所属总体呈正态分布,也不要求样本大于30o(一)斯皮尔曼等级相关1、 适用条件两个变量均为定序量表变量,或一个变量是定序变量,另一个变量是定距(或定比)变量。在第二种场合,计算时应当把分数转换成等级。2、 计算公式6VD2r=1——J——5n(zi2-l)式中,S为斯皮尔曼等级相关系数,£>,=Xi-yi,兀和必分别是两个变量(或现象)按大小(或优劣)排位的等级,n为样本(成对等级)的数量。需要提醒的是:在把分数转换成等级时,半出现相同分数(等级)有两个或更多的情况,这些分数(等级)应具有同样的等级值,即把相同等级所处的顺序号相加后求平均数。3、 相关显著性检验7/。