1 / 32
文档名称:

章数据描述性分析.doc

格式:doc   大小:1,243KB   页数:32页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

章数据描述性分析.doc

上传人:luciferios04 2017/9/11 文件大小:1.21 MB

下载得到文件列表

章数据描述性分析.doc

相关文档

文档介绍

文档介绍:第一章数据描述性分析
教学目标:本章是数据分析的描述性分析,需要掌握数据的一些基本数字特征、相关分析,以及数据的分布检验,并能够熟练地运用SAS软件计算数字特征、相关分析、作出数据的分布图及进行分布检验。
重难点:运用SAS软件计算数字特征、相关分析、作出数据的分布图及进行分布检验。
第零节 SAS系统简介
(约2课时)
SAS(Statistical Analysis System缩写)软件是应用最为广泛的数据分析软件之一,包含了从简单的描述性分析到复杂的多元统计、生存分析等广泛的数据分析方法。
为便于区分,我们约定对SAS系统的专用语句及编程语句用大写字母,对一些说明星的语句用小写字母,而在具体上机编程中不必如此。
SAS系统是在Windows环境下的一个数据分析软件,其界面包括三部分:程序窗口、SAS log窗口及输出结果窗口。
一. 数据的输入与输出
*数据集的建立
SAS系统是按每个观测向量逐个处理数据,一个典型的SAS数据集由变量行和数据行组成:
变量行
数据行
建立SAS数据集的常用方法有两种,一是在程序窗口直接输入数据,二是利用已有数据集建立SAS数据集。
1. 直接输入数据建立SAS数据集
在程序窗口直接输入数据,其基本语句形式为
DATA name;
INPUT variables;
CARDS;
data lines
;
说明:
1)要建立永久性数据集,要采用二级命名。若不赋予数据集名称,则自动赋予名称DATA1、DATA2、…。
2)非数据变量,需要在变量名后空一格,再写“$”。输入变量的格式有两种:自由和固定。
①自由格式输入。在“INPUT”后依次输入各变量,变量之间用空格分开;
②格式化输入
3)如果数据的每一行有多于二组观测向量,则在变量后加“@@”。
4)“;”表示数据结束。

DATA name(新数据集名);
INFILE ‘drive location: file name’(外部数据集的路径及数据集名称);
INPUT variables(根据外部数据集的格式确定相应得变量输入格式);
*SAS数据集的输出
格式:PROC PRINT DATA=name;
说明:打印观测向量序号OBS、各变量名及其取值。
二. 利用已有的SAS数据集建立新的SAS数据集
*两个SAS数据集的合并
1)串联
语句形式:
DATA name(新数据集名);
SET A B;
说明:两数据集必须有相同的变量。
2)并联
语句形式:
DATA name(新数据集名);
MERGE A B;
说明:两数据集必须有相同数据行。
*变量值得排序
语句形式:
DATA new name;
PROC SORT DATA=name;
BY (DESCENDING降序,否则就是升序排列) variable;
*删除数据集中的某些数据行
语句形式:
DATA new name;
SET DATA=name;
IF conditions THEN DELETE;
说明:“conditions”数据行的序号或某个变量的取值所满足的条件。
*删除数据集中某些变量及其观测值
语句形式:
DATA new name;
SET DATA=name;
DROP variables(要删除的变量名)(或KEEP variables需要保留的变量名)
*产生新变量及其观测值
语句形式:
DATA new name;
SET DATA=old name;
变量的变换公式;
RUN;
三. SAS系统的数学运算符号及常用的SAS函数
*数学运算符号
幂运算“**”,加法“+”,减法“-”,乘法“*”,除法“/”。
表达式:变量名=数学表达式或‘非数值字符串’
*SAS函数

在均匀分布和正态分布等的随机函数中,需要给定初值“Seed”,否则在不同的时刻产生不同的随机数。
简单统计量函数种,“arguments”表示一系列数据或已经赋值的一系列变量,将数据或变量逐个列出,并用“,”分开;或者在变量前面加“OF”而不要逗号。
四. 逻辑语句与循环语句
*逻辑语句
语句形式:
IF conditions mand;
mand;
*循环语句
SAS循环语句以“DO”开始,“END”结束,有三种形式:
1)DO variable=a TO b BY increment;
2)DO UNTIL (condition);
3)DO WHILE (condition)
作业:实验一
第一节一维数据的数字特征
(约2课时)
一. 均值、方差等