文档介绍:数据分析报告数据来源:老师给的数据包。里面含 12个变量, 1500 个个案。一类变量( scale ) 7 个: 客户数( ncust) 年龄( age) 当前雇主(employer) 地址( address) 家庭收入(千) (e) 债务收入比率(x100)(bedtinc) 信用卡债务(千) (creddebt) 其他债务(千) (othdebt) 二类变量( ordinal ) 1 个: 受教育程度( ed) :变量值 1 为高中未毕业, 2 为高中毕业, 3为 some college, 4 为大学毕业, 5为大学以上的第三类变量( nominal ) 3 个: 部门( branch) 客户编号(customer) 以前拖欠(default): 变量值 0为不拖欠,1为拖欠受教育程度( ed) 的频数柱状图和频数分布表表1受教育程度频数分布表 Level of education 频率百分比有效百分比累积百分比有效 Did plete high school 246 High school degree 527 Some college 333 College degree 310 Post-undergraduate degree 84 合计 1500 图一受教育程度频数柱状图有图表可以看出高中毕业的人占最多的比例。表 2 家庭收入(千) 、债务收入比率(x100) 、信用卡债务(千) 、其他债务(千)、客户数、当前雇主的统计量表统计量 Household e in thousands Debt to e ratio (x100) Credit card debt in thousands Number of customers Years with current employer N有效 1500 1500 1500 1500 1500 缺失 00000 均值 中值 .9861 众数 .53 a 1919 a0 和 5217100 10428 。显示最小值图二家庭收入直方图图三债务收入比率直方图图四信用卡债务直方图图五当前雇主的直方图对信用卡债务(千) (creddebt) 变量的探索性分析表 3信用卡债务处理摘要表案例处理摘要案例有效缺失合计 N百分比 N百分比 N百分比 Credit card debt in thousands 1500 % 0 .0% 1500 % 从表中看出,有效样本有 1500 个,缺失值有 0个。表4信用卡债务描述性表描述统计量标准误 Credit card debt in thousands 均值 .07679 均值的 95% 置信区间下限 上限 5% 修整均值 方差 标准差 极大值 范围 四分位距 偏度 .063 峰度 .126 表4 中给出了均值的可信区间, 5% 修正均值,由表中可以看出,信用卡债务的均值为 。 Credit card debt in thousands Stem-and-Leaf Plot Frequency Stem & Leaf 0. 0000000000000000000000000000000001111111111111111111111111111111111111111111********** 0. 222222222222222222222222222222222222222223333333333333333333333333333333333333333333333333 0. 4444444444444444444444444444444444445555555555555555555555555555555555555555555555 0. 666666666666666666666666666777777777777777777777777777777 0. 88888888888888888888888888888888999999999999999999999999