1 / 11
文档名称:

多元统计聚类分析.doc

格式:doc   大小:20KB   页数:11页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

多元统计聚类分析.doc

上传人:wz_198614 2017/10/6 文件大小:20 KB

下载得到文件列表

多元统计聚类分析.doc

文档介绍

文档介绍:多元统计聚类分析
实验报告
课程名称多元统计分析实验项目名称一、聚类分析班级与班级代码 10250401
实验室名称(或课室) 实验楼804 专业统计学任课教师林海明学号: 112504012 姓名: 儿实验日期: 2014年3月30日
广东商学院教务处制
姓名实验报告成绩
评语:
、理论和方法认识正确;
;

注:“不正确”为有不正确之处,具体见后面批注。
指导教师(签名) 2013年4月日
说明:指导教师评分后,实验报告交院(系)办公室保存。
2
实验项目一聚类分析
实验目的:通过聚类分析的实验,熟悉聚类分析问题的提出、解决问题的思路、方法和技能,会调用SAS软件聚类分析有关过程命令,根据计算
机计算的结果,分析和解决聚类分析问题。
实验原理:解决聚类分析问题的思路、理论和方法。实验设备:
计算机与SAS软件。
实验步骤:调用聚类分析过程命令输入数据得到聚类过程表和聚类图,距离选用欧氏距离,方法选用最短距离法。
实验数据:实验数据:我国西部环境保护的数据一、问题的提出
西部大开发是我国在新世纪提出的一项国家发展战略。基于西部地区特殊的地理位置和生态环境状况,国家在提出西部大开发之初就明确指出,西部开发绝不能以牺牲环境为代价,西部地区生态环境极其脆弱,一经破坏就难以恢复,所以实施西部大开发,环境保护是关键,必须建设一个“山川秀丽的西部”。近几年国家在保护西部地区的环境上也花了大力气,并取得了良好的效果,但并没有从根本上解决在发展西部过程中环境保护的问题。西部环境保护现状、特点怎样?本实验就这一问题用聚类分析进行探索并提出一些看法和建议。
指标选取考虑的因素:(1)指标的选择要能尽量反映西部现时的生态环境状况;(2)数据尽量从统计年鉴等规范、权威的刊物中获取。下面十三个指标和数据符合以上要求。
表1: 西部环境保护的原始数据
3
X1-森林覆盖率(%);X2-水土流失率(%);X3-工业废水排放达标率(%);X4-人均工业废水排放量(万吨/万人);X5-人均工业废气排放量(亿标立方米/万人);X6-人均工业固体废物产生量(万吨/万人);X7-各地区工业污染治理
汇总工业企业数(个);X8-环保系统机构总数(个);X9-环保系统人员总数(人);X10-自然保护区面积占辖区面积比
率(%);X11-污染治理项目本年完成投资(万元);X12-各地径流深与
常年比较(±%);X13-各地径流深(mm)。原始数据来自《2002年中
国统计年鉴》《2001年中国水资源公报》和《2002中国可持续发展战略报告》。
实验结果、实验分析、结论(有关表图要有序号、中英文名、表的上下线为粗线、表的内线为细线、表的左右边不封口、表图不能跨页、表图旁不能留空块;表的序号、中英文名在表的上方;图的序号、中英文名在图的正下方;引用结论要注明参考文献):
;
;
4
;
C出现峰值-、、,故分为7类。在图1中,取阈值T=,得样品分为七类:
第一类:内蒙古;
第二类:广西、四川、贵州、云南;
第三类:重庆、甘肃、新疆;
第四类:宁夏;
第五类:陕西;
第六类:青海;
第七类:西藏。
5

表3: 七类样品的均值数据
从表3的数据得出:
第一类地区:内蒙古
X2-水土流失率(%),在类别中是第二高;X3-工业废水排放达标率(%),相对高;X4-人均工业废水排放量(万吨/万人)较低;X5-人均工业废气排放量(亿标立方米/万人)较高;X6-人均工业固体废物产生量(万吨/万人)达到最高;X8-环保系统机构总数(个)最大;X9-环保系统人员总数(人)较多; X12-各地径流深与常年比较(±%)最大,就是比之前有所改善;X13-各地径流深(mm)较小。
6
从这可以看出,该类地区应该加大处理水土流失问题的力度,工业废气与固体废物的污染比较严重。环保机构及其人员也比较多,该地区对环境保护的态度比较好,但是应该从实际出发,落实到底,机构与人员要充分利用,处理好水土流失与工业污染的问题,不能只注重表面工程。
第二类地区:广西、四川、贵州、云南
X1-森林覆盖率(%)