1 / 5
文档名称:

第3章 统计数据的整理与显示.doc

格式:doc   页数:5
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第3章 统计数据的整理与显示.doc

上传人:中国课件站 2011/12/13 文件大小:0 KB

下载得到文件列表

第3章 统计数据的整理与显示.doc

文档介绍

文档介绍:第三章数据的整理与显示
§1 数据的预处理
一、数据的审核与筛选
审核
完整性审核
准确性审核
完整性审核:主要是检查应调查的单位或个体是否有遗漏,所有的调查项目或指标是否填写齐全等。
准确性审核:1. 检查数据资料是否真实地反映了客观实际情况,内容是否符合实际;
2. 检查数据是否有错误,计算是否正确等。
数据筛选:
1. 将某些不符合要求的数据或有明显错误的数据予以剔除;
2. 将符合某种特定条件的数据筛选出来,而不符合条件的数据予以剔除。
二、数据的排序
数据排序是按一定顺序将数据排列,以便于研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。
原始数据
顺序统计量或
§2 属性数据的整理与显示
一、分类数据的整理与显示
(一)频数与频数分布
1. 频数(frequency次数):是落在各类别中的数据个数。
频数分布(frequency distribution次数分布):各个类别及其相应的频数全部列出来。
2. 比例(proportion):是一个总体(或样本)中各个部分的数值占全部数值的比重,通常用于反映总体的构成或结构。
3. 百分比(percentage):将比例乘以100就是百分比或百分数,它是将对比的基数抽象化为100而计算出来的,用%表示。
4. 比率(ratio):是各不同类别数值之间的对比关系,因而比值可能大于1。
(二)分类数据的图示
1. 条形图(bar chart)
2. 饼图(pie chart)
二、顺序数据的整理与显示
(一)累积频数和累积频率
(cumulative frequencies)就是将各类别的频数逐级累加起来。
向上累积
向下累积
(二)顺序数据的图式


§3 定量数据的整理与显示
一、数据的分组
分组就是根据统计研究的需要,将数据按照某种标准划分成不同的组别,分组后再计算出各组中出现的次数或频数,形成频数分布表。
相关概念:
[1] 组数
[2] 组限(limit):各组的数量界限。上限不包括在本组范围内
开口组:没有上限或没有下限的组
开口组(第一组)的下限=本组上限-邻组组距
开口组(最末组)的上限=本组下限+邻组组距
[3] 组距(class width):一组的上限与下限之差
等距数列
异距数列
[4] 全距:数列中最大值和最小值的差
全距=最大值-最小值
=最大一组的上限-最小一组的下限
=组距*组数
[5] 组中值(class midpoint):前提是组内变量变化均匀
组中值=(上限+下限)/2
分组的步骤:

斯特奇斯(Sturges)经验公式 K=1+lgn/lg2

组距取比该值稍大的相对整数

二、数值型数据的图示
(一)分组数据:直方图(histogram)和折线图(frequency polygon)
(二)未分组数据:茎叶图(stem-and-leaf display)和箱线图(box plot)
(三)时间序列数据:线型图(line plot)
(四)两个变量间关系的图示:散点图
(五)多变量数据: