文档介绍:数据分析(方法与案例)
统计学
Fundamental Statistics
2010年
第 3 讲数据的整理与展示
数据的录入
数据的预处理
数据的整理与展示(重点)
学习目标:
,并熟练编制统计表和统计图
2010年
统计应用把数据画图之后,要用用脑袋
沃德(Abraham Wald)和许多统计学家一样,在第二次世界大战时也处理了战争与相关的问题。他发明的一些统计方法在战时被视为军事机密。以下是他提出的概念中较简单的一种
沃德被咨询飞机上什么部位应该加强钢板时,开始研究从战役中返航的军机上受敌军创伤的弹孔位置。他画了飞机的轮廓,并且标识出弹孔的位置。资料累积一段时间后,几乎把机身各部位都填满了。于是沃德建议,把剩下少数几个没有弹孔的部位补强。因为这些部位被击中的飞机都没有返航
2010年
数据的录入
纸制统计表
excel数据库
2010年
纸制统计表
在纸上手绘统计表格,横行为个体,纵行为变量,记录原始数据
编号
姓名
性别
年龄
月收入
1
刘恋
女
29
4000
2
陈风
男
35
5000
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
2010年
excel数据库
建立一个excel文件后,直接进行数据的输入操作,一般横行为个体,纵行为一个变量
2010年
数据的预处理
数据审核
数据筛选
数据排序
数据透视表
2010年
数据的预处理
数据审核
检查数据中的错误
数据筛选
找出符合条件的数据
数据排序
升序和降序
寻找数据的基本特征
2010年
数据审核
原始数据(raw data)
完整性审核
检查应调查的单位或个体是否有遗漏
所有的调查项目或指标是否填写齐全
准确性审核
检查数据是否真实反映客观实际情况,内容是否符合实际
检查数据是否有错误,计算是否正确等
逻辑检查和计算检查
2010年
二手数据(second hand data)
适用性审核
弄清楚数据的来源、数据的口径以及有关的背景材料
确定数据是否符合自己分析研究的需要
时效性审核
尽可能使用最新的数据
确认是否有必要做进一步的加工整理