1 / 57
文档名称:

《多元统计分析》实验教学上机指导书[统计学经典理论].doc

格式:doc   页数:57页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

《多元统计分析》实验教学上机指导书[统计学经典理论].doc

上传人:企业资源 2012/1/11 文件大小:0 KB

下载得到文件列表

《多元统计分析》实验教学上机指导书[统计学经典理论].doc

文档介绍

文档介绍:《多元统计分析》实验教学上机指导书
 
 
 
 
 
 
 
 
 
 
数学与统计学学院
信息与计算科学教研室


第一章   聚类分析
 
一、实验目的与要求
,熟悉系统聚类的用途和操作方法,了解各种距离,能按要求将样本进行分类;
,能正确解释软件处理的结果,尤其是冰柱图和树形图结果的解释;
,掌握系统聚类分析方法在写作中的应用。
 
二、实验内容与步骤
SAS部分
(一)SAS程序语言简介
SAS系统强大的数据管理能力、计算能力、分析能力依赖于作为其基础的SAS语言。SAS语言是一个专用的数据管理与分析语言,它的数据管理功能类似于数据库语言(如FoxPro),但又添加了一般高级程序设计语言的许多成分(如分支、循环、数组),以及专用于数据管理、统计计算的函数。SAS系统的数据管理、报表、图形、统计分析等功能都可以用SAS语言程序来调用,只要指定要完成的任务就可以由SAS系统按照预先设计好的程序去进行,所以SAS 语言和FoxPro等一样是一种第四代计算机语言。SAS语言有它自己的对变量、常量、表达式的一系列规定,有一系列标准函数,有它自己的语句、语法,可以按一定规则构成SAS程序。
SAS语言程序由数据步(DATA步)和过程步(PROC步)组成。数据步用来生成数据集、计算、整理数据,过程步用来对数据进行分析、报告。SAS语言的基本单位是语句,每个SAS语句一般由一个关键字(如DATA,PROC,INPUT,CARDS,BY)开头,包含SAS名字、特殊字符、运算符等,以分号结束。
SAS关键字是用于SAS语句开头的特殊单词。SAS名字在SAS程序中标识各种SAS成分,如变量、数据集、数据库,等等。SAS 名字由1到8个字母、数字、下划线组成,第一个字符必须是字母或下划线。SAS关键字和SAS 名字都不区分大小写。语句关键字用大写或小写方式都可以,但不可简化,必须原样照写。
SAS程序由语句构成。一个SAS语句可以占若干行,可以从任意一列开始,但必须在语句结束处加分号,因为SAS系统是根据分号判断哪些文字属于一个语句的,因此在一行上可以写几个SAS语句,只要每个语句都用分号结束(最常见的SAS编程错误就是丢失分号)。因为分号作为语句结束标志,所以SAS语句不需要单独占一行,一个语句可以写到多行(不需任何续行标志),也可以在一行连续写几个语句。SAS语言中只要允许用一个空格的地方就可以加入任意多个空白(空格、制表符、回车),允许用空格的地方是名字周围、运算符周围。比如,程序
proc print
        data=c9501;
    by              avg;
 
run;

proc print data=c9501;by avg;run;
 
是等效的。另外,虽然SAS关键字和SAS名字不区分大小写,但字符型数据值要区分大小写,比如"Beijing" 和"BEIJING"被认为是不同的数据值。
在SAS程序中可以加入注释,注释使用C语言语法,用/*和*/在两端界定注释,这种注释可以出现在任何允许加入空格的位置,可以占多行。我们一般只把注释单独占一行或若干行,不把注释与程序代码放在同一行。注释的另一个作用是把某些代码暂时屏蔽使其不能运行。下面是一个注释的例子:
/* 生成95级1班考试成绩的数据集*/
data c9501;
SAS程序包括数据步和过程步两种结构,每一个步是一段相对完整的可以单独运行的程序。每个步以RUN语句结束。当一个步后面跟着另一个步时,前面一个步的RUN语句可以省略。一个DATA步后面可以跟几个PROC步,也可以若干个DATA步后面跟几个PROC步;或以PROC步打头,后面跟若干个DATA步,再跟PROC步,程序中的每个步都是相应独立的,彼此不能交叉,不能嵌套。
数据步用来生成、整理数据和自编程计算,过程步调用SAS已编好的处理过程对数据进行处理。我们自己用SAS编程序实现各多元统计分析方法主要用到过程步。在本课的学****过程中,主要采用调用已有数据集的方式,因此程序的重点在PROC步上,要分析的数据集只要在选择项DATA=中指明即可。
最简单的PROC步只有一个PROC语句,即:
PROC 过程名;
该语句调用指定的过程分析在该语句之前最近建立的数据集。在调用时的其他要求全部采用SAS系统设置的缺省值。
PROC语句的一般格式为:
PROC  过程名选择项;
(二)用CLUSTER过程和TREE过程进行谱系聚类
聚类分析又称群分析、点群分析,是