文档介绍:Transform/Data菜单详解
本章主要介绍数据管理的基本内容,包括数据的合并、拆分、转置、编码等内容,是进行正式统计分析前的重要一步。
Transform菜单主要针对数据中变量的变换,如根据已知变量产生一个新的变量,Data 菜单主要针对数据库的维护,如数据文件的合并、拆分、汇总等。
SPSS对话框元素介绍
下面所介绍的是在SPSS所有的统计分析中都会出现的典型的对话框,了解对话框的基本结构有助于更好的掌握SPSS。
一、一级对话框元素介绍
1、候选变量列表框 2、选入变量列表框 3、变量移动钮 4、五个标准按钮 5、其他按钮
二、二级对话框元素介绍
1、单选框 2、复选框 3、下拉列表框 4、文本框
以回归分析(Analyze——Regression)
三、对话框常用操作技巧(略)见书P30
Transform 菜单详解
本菜单功能丰富,主要针对数据文件中的变量进行各种转换。
pute过程(重点掌握)
Compute过程是Transform菜单中最常用的一个过程,功能是用于给变量赋值。
例1:见书P31(演示操作过程)
方法一:
第一步:产生一个新变量“new”,并给该变量赋值1;
第二步:对该新变量进行修改,修改条件:当血磷值超过1的时候,令“new”的取值为2
方法二:
用逻辑函数any
例2 :,对产地为欧洲的汽车的数据进行转换,将“马力”增加20
函数介绍:
1、Arithmetic 函数——数学函数
Abs (?) ——返回变量的绝对值
Arsin(?)——返回变量的反三角函数值
Mod (?,?) ——返回数值表达式除以模数后的余数,要求模数不能为0
Rnd(?)——返回数值表达式四舍五入后得到的整数值
Trunc (?) ——返回数值表达式截尾以后得到的整数值
2、CDF
返回累积分布函数的累积概率值
如:(X1, 0, 1) =X2
X1
X2
-2
-1
0
1
2
3、日期和时间函数(略)
4、随机变量函数(Random numbers)
(mean,stddev)
——返回来自指定均值和标准离差的正态分布的随机数
(shape)
——返回服从指定参数的指数分布随机数
(mean)
——返回服从指定均值的泊松分布的随机数
( min,max)
——返回指定最小值和最大值的均匀分布的随机数
产生一系列随机数(操作讲解)
应用:
如有100个case, 想打乱它们的顺序,该如何解决?
方法:首先产生一个均匀分布的随机数,然后按随机数进行排序后即可。
如:从编号为1~300的灯泡中随机抽20个进行检验,如何实现?
方法:运用计算机产生20个1到600间的随机数,取出他们对应的灯泡进行检验即可。
5、统计函数
CFVAR(标准离差/均值);MAX/最大值;MIN/最小值;MEAN/均值;SD/标准差;SUM /求和; VARIANCE/方差
例: 运用产生随机数的方法产生一个数据文件,,包含学号(x1),语文(x2)、数学(x3)、英语(x4)四个变量名,计算各门功课的平均成绩/总分。
6、逻辑函数
ANY
7、字符串函数
8、转换函数 converse
主要用于字符型变量与数值型变量的转换
二、Count过程
该过程用于标示某个值或某些值在某个变量的取值中是否出现。
标示:SPSS会自动用数字1来标注满足所需条件的记录。
例1:见书P32
如果想知道哪些记录的血磷脂在2~3之间,则可以通过count过程实现。(操作)
例2 :
注意:
Count 在标示数据的过程中,不能对同时满足多个取值条件的记录进行标示,只能对满足某一个条件的变量进行标示。
三、Recode过程
该过程用于将原变量按照某种一一对应的关系生成新变量,可以将新值赋给原变量也可以生成一个新变量。
例1:见书P33(操作)
例2:,将美国产的汽车进行编码,马力在100以下的取值为0,马力在100~200的取值为10,马力在200以上的取值20,生成新变量temp
四、Rank Cases过程
该过程是专门履行排次序的功能的。因为在非参数统计中,经常要用到秩次这个统计量。
例:请分组计算血磷脂的秩次。
五、其他菜单
1、Random Number Seed