1 / 61
文档名称:

SAS数据分析与统计.docx

格式:docx   大小:936KB   页数:61页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

SAS数据分析与统计.docx

上传人:guoxiachuanyue007 2022/8/6 文件大小:936 KB

下载得到文件列表

SAS数据分析与统计.docx

文档介绍

文档介绍:1
数据集的建立
导入Excel数据表的步骤如下:
1)在SAS应用工作空间中,选择菜单“文件”T“导入数据”,打开导入向导“ImportWizard”第一步:选择导入类型(Selectimporttype)。
2)在第二步的““选择成员”对话框,选择数据集。
2)通过SummaryStatistics菜单计算描述性统计量
选择主菜单“Statistics(统计)”T“Descriptive(描述性统计)”T
“SummaryStatistics(汇总统计量)”,打开“SummaryStatistics”对话框,选择变量列表中分析变量,单击“Analysis”按钮,选定分析变量单击“Statistics”按钮,打开“SummaryStatistics:Statistics”对话框。对话框中列出可以计算的所有统计量。
3)通过Distributions菜单计算描述性统计量
选择主菜单“Statistics(统计)”T“Descriptive(描述性统计)”T“Distributions(分布)”,打开“Distributions”对话框,选择变量列表中的分析变量,单击“Analysis”按钮。单击“0K”按钮,即可得到关于分析变量的矩统计量和基本统计测度。
用编程方法计算统计量
1)FREQ过程
FREQ过程包括多个控制频数输出与检验的语句和选项,格式如下:
PR0CFREQDATA=<数据集>;
[TABLES<变量1><变量2>…;]
[F0RMAT<变量1><输出格式1>.<变量2><输出格式2>.…;]
RUN;
其中PROCFREQ语句调用FREQ过程,标志FREQ过程的开始;
TABLES语句用于创建有关变量所构成的各种表格并进行相应的假设检验和计算,可以多次使用。
例如:procfreqdata=;
tablesR_IdIncome;
RUN;
这个语句提供了频数,所占百分数,累计频数,和累计百分数!
8
MEANS过程
MEANS过程的一般格式:
PROCMEANSDATA=〈数据集名>[〈统计量关键字列表>];
[VAR<分析变量列表>;]
[BY<分组变量名>;]
[CLASS<分组变量名>;]
RUN;
例如:procmeansdata=;
varIncome;
run;
PROCMEANS语句后的选项主要用来指定所要计算的统计量,默认情况下,MEANS过程会给出频数、均数、标准差、最大值和最小值等,其余统计量的计算均需要在选项中指定。
VAR语句引导所要进行分析的所有变量的列表,SAS将对VAR语句所引导的所有变量分别进行描述性统计分析。
BY语句与CLASS语句所指定的分类变量用来进行分组统计,但输出格式不同。
使用统计量关键字列表
1)在PROCMEANS语句中使用统计量关键字列表:
procmeansdata=nmeanmedianp1p5p95p99q1q3maxmin;
varIncome;
Run;
关键字
所代表的含义
关键字
n
有效数据记录数
range
所代表的含义
极差
9
nmiss
缺失数据记录数
skewness
偏度
mean
均值
kurtosis
峰度
std
标准差
分布位置假设检验之t统计量
stderr
标准误
probt
上述t统计量对应的概率值
var
方差
q1
第一四分位数
median
中位数
q3
第三四分位数
mode
众数
qrange
四分位数间距
cv
变异系数
p1
第一百分位数
max
最大值
p5
第五百分位数
min
最小值
p10
第十百分位数
sum
总计
p90
第九十百分位数
sumwgt
加权值总计
p95
第九十五百分位数
css
校正平方和
p99
第九十九百分位数
uss
未校正平方和
2)使用CLASS语句和BY语句
使用CLASS语句和BY语句可以分组计算分析变量的描述统计量值,由CLASS语句和BY语句指定的变量在分析中起分组(类)的作用,被称为分类变量。两个语句的区别是:
使用BY语句时要求数据集须按BY变量排序,使用CLASS语句无此要求。
使用BY语句时输出按BY变量的每个值分别提供一个表,使用CLASS语句则将所有结果排列在一个表之中。
10
使用BY语句之前先排序,可以在按分组变量统计:(p46)例如:procsortdata=;
byR_Id;
run;
procmeansdata=nmeanmedianp1p5p95p99q1q3maxmin;varIncom