1 / 40
文档名称:

第讲 spss探索和交叉表分析.ppt

格式:ppt   大小:241KB   页数:40页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第讲 spss探索和交叉表分析.ppt

上传人:文库新人 2018/9/21 文件大小:241 KB

下载得到文件列表

第讲 spss探索和交叉表分析.ppt

相关文档

文档介绍

文档介绍:描述和频率分析回顾集中趋势的描述统计量:均值、中位数、众数,代表了数据的集中位置均值(Mean):代表中心值或平均值的描述统计量,只适用于间隔尺度变量计算中位数(Median)是将数据排序后,排在第n/2位置上的案例所对应的数值,由于中位数只是进行排序,因此间隔尺度和顺序尺度变量都可以计算中位数,而名义尺度变量不能计算中位数。在实际应用中,应该根据数据的特点决定使用哪种集中趋势描述统计量,均值的特点是易受极端值影响,因此如果数据中有特别大或特别小的值时,不推荐使用均值,应该使用中位数作为集中趋势统计量。离散趋势的描述统计量:全距、样本方差、样本标准差全距(Range)也称极差,定义是:,是一个比较粗糙的描述离散趋势的描述统计量,通过排序就可以获得,它只能说明数据的分布范围,而不能准确刻画数据离中心的程度,因此实际中不常用。由于全距涉及距离,因此,只适合间隔尺度变量计算。离散趋势的描述统计量刻画了数据离中心的分散程度,也把此类统计量成为分布尺度(Scale)统计量,尺度越大,就越分散,从另一个角度讲,数据越分散,离中心远的数据越多,中心的代表性就越差,因此,也可以认为离散趋势的描述统计量是刻画集中趋势的代表性的统计量。分布形态的描述统计量:偏度和峰偏度是描述数据分布对称性的统计量,如果数据关于中心(均值)的分布是对称的,此时称为分布对称或偏度为0,如果数据大部分分布在中心左边,小部分分布在中心右边,说明此时中心右边有偏大的值,即右边的值距离中心远,左边值距离中心近,这样右边的少数距离能够“抵消”左边的多数距离。此时,偏度为正,称为正偏或右偏分布,反之称为负偏或左偏分布峰度大于0,说明数据分布比标准正态分布更陡峭;峰度小于0,说明数据分布不如标准正态分布陡峭;等于0,说明数据分布陡峭程度和标准正态分布相当。值得指出的是,在经济学和金融学中得到的数据,很多都具有“尖峰后尾”的特点,即峰度大于0,偏度也大于0,在处理这类数据时,:调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索分析。它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。检查数据是否有错误:过大或过小的数据均有可能是奇异值、影响点或错误数据。要找出这样的数据,并分析原因,然后决定是否从分析中删除这些数据。因为奇异值和影响点往往对分析的影响较大,不能真实反映数据的总体特征。对数据规律的初步观察:通过初步观察获得数据的一些内部规律,例如,两个变量间是否线性相关。,获得常用统计量和图形。 一般以图形方式输出,直观帮助用户确定奇异值、影响点、进行假设检验,以及确定用户要使用的某种统计方式是否合适。-Q图。,有时候还需要比较各个分组的方差是否相同,这就要进行方差齐次性检验。 例如,在进行独立右边的T检验之前,就需要事先确定两个数据的方差是否相同。如果通过分析发现各个方差不同,还需要对数据进行方差分析,那么就需要对数据进行转换使得方差尽可能相同。在探索分析中可以使用Levene检验。