文档介绍:该【描述性分析 】是由【幸福人生】上传分享,文档一共【15】页,该文档可以免费在线阅读,需要了解更多关于【描述性分析 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。描述性分析
2数据转换(Transform)
在有些情况下,原始数据难以满足数据分析的要求,需要对原始数据进行适当的转换。SPSS具体强大的数据转换功能,它不仅可以进行简单的变量转换和重新建立分类变量,还可以进行复杂的统计函数运算以及逻辑函数运算。
在主菜单中点击Transform命令,弹出数据转换子菜单,如图所示。
计算产生变量
重新赋值
测量方位
计数统计
观测值单位排序
自动重新赋值
产生时间序列变量
缺失值代替
随机数
(Compute..)
计算产生变量是根据已存在的变量,经函数计算后,建立新变量或替换原变量值。
例如,我们在方差分析中常常要求对百分数和层数描叙的数据作反正弦函数的转换(sin-1SQRT(x))。
      ○Useexpressionaslabel:以数学表达式作为标签。
Type栏:
      ⊙UseExpressionaslabel:数字型变量
      ○String字符型变量,Width:8字符宽度。
NumericExpression:数学表达式输入
使用键盘或利用系统提供的计算面板输入数学表达式。也可以将Functions(函数)框里的函数选入表达式中。系统提供了70多种函数,它包括算术函数,统计函数,分布函数,日期函数,缺失值函数和字符函数。
If…定义条件
      ⊙Includeallcases:包括所有记录。
      ○Includeifcasessatisfiescondition:符合条件的记录。选中此项后,条件输入框激活,在此框中输入
       变量的逻辑表达式。
SPSS算术函数
函数
说明
示例(x=,y=2)
ABS(x)
绝对值函数
ABS(y-x)→
ARTAN(x)
反正切函数,得弧度值
ARTAN(y)→
ARSIN(x)
反正弦函数,得弧度值
ARSIN(x/4)→
COS(x)
余弦函数(弧度单位)
COS(y)→
EXP(x)
以e为底的指数函数
EXP(y)→
LG10(x)
以10为底的对数函数
LG10(y*100)→
LN(x)
以e为底的对数函数
LN(y)→
MOD(x)
取余函数
MOD(x,y)→
RND(x)
四舍五入后去正
RND(x)→4
SIN(x)
正弦函数(弧度单位)
SIN(y)→
SQRT(x)
平方根函数
SQRT(y)→
TRUNC(x)
取整函数
TRUNC(x)→3
注:x可以是变量、常量,也可以是函数。
(AutomaticRecode)
有的时候,我们需要重新把数值变量或字符变量按它本身的数值大小转换成为从1开始的顺序整数,并存放在新变量对应的记录中。
    
首先,打开数据文据文件(DATA3-),将数据调入工作区。然后,从菜单选择“Transform-AutomaticRecode”命令,弹出连续型变量转换为分类变量对话框,如下图:
操作步骤:
1)从左边数据变量栏里把变量选入到右边的“Variable->NewName”框中。
2)在“NewName:”输入新变量名称后,点击[AddNewName]按钮加入到“Variable->NewName”框中。
3)在“RecodeStartingfrom”设置赋值顺序,有以下两种顺序:
       ⊙Lowestvalue:按从小到大顺序,赋值为1开始的顺序整数。
       ○Highestvalus:按从大到小顺序,赋值为1开始的顺序整数。
4)单击[OK]按钮,执行转换。
 
 
2列联表分析(Crosstabs)
列联表是指两个或多个分类变量各水平的频数分布表,又称频数交叉表。SPSS的Crosstabs过程,为二维或高维列联表分析提供了22种检验和相关性度量方法。其中卡方检验是分析列联表资料常用的假设检验方法。
例子:山东烟台地区病虫测报站预测一代玉米螟卵高峰期。预报发生期y为3级(1级为6月20日前,2级为6月21-25日,3级为6月25日后);预报因子5月份平均气温x1(℃)分为3级(℃以下,-℃,℃以上),6月上旬平均气温x2(℃)分为3级(1级为20℃以下,-℃,℃以上),6月上旬降雨量x3(mm)分为3级(1级为15mm以下,-30mm,3级为30mm以上),6月中旬降雨量x4(mm)分为3级(1级为29mm以下,-36mm,3级为36mm以上)。数据如下表。
山东烟台历年观测数据分级表()
年份
59
60
61
62
63
64
65
66
67
69
70
71
72
73
74
75
76
77
y
1
3
1
1
3
1
1
2
1
3
2
1
2
2
3
2
2
1
x1
3
2
2
3
1
3
2
3
3
1
2
3
1
1
1
2
2
1
x2
1
2
3
1
1
2
2
1
1
1
1
2
3
1
1
1
1
2
x3
3
1
1
3
1
2
1
3
2
2
1
2
1
2
3
2
3
1
x4
3
1
1
1
1
1
1
1
1
1
3
1
1
2
1
1
1
1
注:摘自《农业病虫统计测报》131页。
 
1)输入分析数据
在数据编辑器窗口打开“data1-”数据文件。
数据文件中变量格式如下:
 
2)调用分析过程
在菜单选中“Analyze-Descriptive-Crosstabs”命令,弹出列联表分析对话框,如下图
 
3)设置分析变量
选择行变量:将“五月气温[x1],六月上气温[x2],六月上降雨[x3],六月中降雨[x4]”变量选入“Rows:”行变量框中。
选择列变量:将“玉米螟卵高峰发生期[y]”变量选入“Columns:”列变量框中。
 
4)输出条形图和频数分布表
   Displayclusteredbarcharts:选中显示复式条形图。
  Suppresstable:选中则不输出多维频数分布表。。
 
5)统计量输出
点击“Statistics”按钮,弹出统计分析对话框(如下图)。
Chi-Square:卡方检验。选中可以输出皮尔森卡方检验(Pearson)、似然比卡方检验(Likelihood-ratio)、连续性校正卡方检验
                   (ContinuityCorrection)及Fisher精确概率检验(Fisher’sExacttest)的结果。
Correlations:选中输出皮尔森(Pearson)和Spearman相关系数,用以说明行变量和列变量的相关程度。
Nominal:两分类变量的关联度(Association)测量
ContingencyCoefficient:列联系数,其值越大关联性越强。
    PhiandCramer’sV:Cramer列联系数,其值越大关联性越强。
    Lambda:减少预测误差率,1表示预测效果最好,0表示预测效果最差。
    UncertaintyCoefficient:不定系数
Ordinal:两有序分类变量(等级变量)的关联度测量
Gamma:关联度,+1表示完全正关联,-1表示负关联,0表示无联。
    Somers’d:列联度,其取值范围和意义同上。