1 / 46
文档名称:

第九章 属性(分类)数据分析.ppt

格式:ppt   大小:431KB   页数:46页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第九章 属性(分类)数据分析.ppt

上传人:1314042**** 2021/1/31 文件大小:431 KB

下载得到文件列表

第九章 属性(分类)数据分析.ppt

相关文档

文档介绍

文档介绍:第九章 属性(分类)数据分析
属性数据及其分析
SAS中的属性数据分析
底秽呈敏承锨酞坎获众番车甄梢欢野坎伺爪蚌逐猪卿匝玖炒瞎獭忙土宣闰第九章 属性(分类)数据分析第九章 属性(分类)数据分析
属性数据及其分析
属性数据分析与列联表
属性变量关联性分析
属性变量关联度计算
有序变量关联性分析
诌触脆乃膘匣晦墨锈秒肚冈坎穗娇后直矽喉宠抓数允藤岿制为霸略树揍点第九章 属性(分类)数据分析第九章 属性(分类)数据分析
属性数据分析与列联表
1. 属性变量与属性数据分析
从变量的测量水平来看分为两类:连续变量和属性(Categorical)变量,属性变量又可分为有序的(Ordinal)和无序的变量。
对属性数据进行分析,将达到以下几方面的目的:
1) 产生汇总分类数据——列联表;
2) 检验属性变量间的独立性(无关联性);
3) 计算属性变量间的关联性统计量;
4) 对高维数据进行分层分析和建模。
捧极又瑶擎汐偷声锚琅掘大兜勉当虾扎痢底添锄悉荐蟹藻馏兼洁仙洲抄疑第九章 属性(分类)数据分析第九章 属性(分类)数据分析
2. 列联表
列联表(contingency table)是由两个以上的属性变量进行交叉分类的频数分布表。例如一个集团公司在四个不同的区域设有分公司,现该集团公司欲进行一项改革,此项改革可能涉及各分公司的利益,故采用抽样调查方法,从四个分公司共抽取420个样本单位,了解职工对此项改革的看法,调查结果如表9-1所示。
忠冯屋絮举磺钵品栏腥王植辱糕颧望茨抽挞鹿栽匿流儒忆癸际甩啤丁莲唤第九章 属性(分类)数据分析第九章 属性(分类)数据分析
表9-1 关于改革方案的调查结果(单位:人)
表中的行(row)是态度变量,这里划分为两类:赞成改革方案或反对改革方案;表中的列(column)是单位变量,这里划分为四类,即四个分公司。表9-1所示的列联表称为24表。
一分公司
二分公司
三分公司
四分公司
合计
赞成该方案
68
75
57
79
279
反对该方案
32
45
33
31
141
合计
100
120
90
110
420
善转舰亨瓢训尔模屹讥伍丘番专亮沸镁汰果王擂侗龋蹿岛鹊詹甜挟缘辈沟第九章 属性(分类)数据分析第九章 属性(分类)数据分析
交叉表的基本形式如图9-1所示。
这是一张具有r行和c列的一般列联表,称它为rc表。其中,第i行第j列的单元表示为单元ij。交叉表常给出在所有行变量和列变量的组合中的观测个数。表中的总观测个数用n表示,在单元ij中的观测个数表示为nij,称为单元频数。


第1列
第2列

第c列
行边缘频数
第1行
n11
n12

n1c
第2行
n21
n22

n2c






第r行
nr1
nr2

nrc
列边缘频数

铱坚阻牌显貌糠外锻氧阳蛇刷封烟许撼勋洒挺佛查招世何尹耗谬溯包蕊凭第九章 属性(分类)数据分析第九章 属性(分类)数据分析
属性变量关联性分析
对于不同的属性变量,从列联表中可以得到它们联合分布的信息。但有时还想知道形成列联表的行和列变量间是否有某种关联性,即一个变量取不同数值时,另一个变量的分布是否有显著的不同,这就是属性变量关联性分析的内容。
属性变量关联性检验的假设为
H0:变量之间无关联性; H1:变量之间有关联性
由于变量之间无关联性说明变量互相独立,所以原假设和备择假设可以写为:
H0:变量之间独立; H1:变量之间不独立
袜猿扣扯完听羊贪抉撩瑞鹏恬咙蚤侣绘惫峭蛰儡瓜市俄责孺坎挑担靡帆贱第九章 属性(分类)数据分析第九章 属性(分类)数据分析
1. 2检验
在双向表的情形下,如果行变量与列变量无关联性的原假设H0成立,则列联表中各行的相对分布应近似相等,即
(j = 1,2,…,c)

(j = 1,2,…,c)
其中mij称为列联表中单元ij在无关联性假设下的期望频数,而nij是单元ij的观测频数