文档介绍:第十一章多变量的可视化分析
第一节引言
第二节折线图分析法
第三节条形图分析法
第四节散点图分析法
第五节雷达图分析法
第六节星座图分析法
第一节引言
众所周知,图形是我们直观了解、认识数据的一种可视化手段。如果能将所研究的数据直接显示在一个平面图上,便可以一目了然地看出分析变量间的数量关系。直方图、散点图等就是我们常用的二维平面图示方法。虽然三维数据也可以用三维图形来表示,但观测三维数据却存在一定的难度,而且在许多实际问题中,多变量数据的维数通常又都大于3,那么如何用图形直观表现三维以上的数据呢?自上世纪70年代以来,多变量数据的可视化分析研究就一直是人们关注的一个问题。
1
从研究的成果来看,主要可以分为两类:
一类是使高维空间的点与平面上的某种图形对应,这种图形能反映高维数据的某些特点或数据间的某些关系;
另一类是对多变量数据进行降维处理,在尽可能多地保留原始信息的原则下,将数据的维数降为2维或1维,然后再在平面上表示。例如前面介绍的主成分分析方法、因子分析方法、多维尺度法等就属于此类方法。这里仅介绍5种实用而有效的多变量可视化方法。
2
,下面分别用5种可视化方法对数据进行分析。
考虑微机的普及应用,本章主要介绍5种图形的制作方法,图形的制作则通过电脑实现。折线图、条形图、矩阵散点图在SPSS中制作,雷达图和星座图则在EXCEL中实现。
华北5省市城镇居民家庭消费性支出
3
第二节折线图分析法
折线图是将多个样品观测数据以折线的方式表示在平面图中的一种多变量可视化图形。折线图用线段的升降来表示变量的大小,常用于表示现象在时间上的变化趋势、现象的分配情况和两个现象之间的依存关系等。
折线图的作图原理如下:
(1)作平面坐标系,横坐标取p个点,表示p个变量,纵坐
标表示变量取值。
(2)对给定的样品观测值,在p个点的纵坐标上标出相应的
变量取值。
(3)将表示p个变量取值的点连接成一条折线,即得到了表
示一个样品观测数据的折线,n次观测可绘出n条折线,构成多变量折线图。
4
在SPSS中作折线图的方法如下:
(1)将原始数据输入SPSS中。(数据-变换)。即把不同地区当成变量,而把支出指标当成观测。
作折线图时的数据组织形式
5
(2)选择菜单项Graphs→Line,打开Line Charts对话框,。在对话框上方的三个选项用于选择折线图的形式,由于是这里是多变量作图,所以选择Multiple。在对话框下面的三个选项中选择Value of individual cases。单击Define按钮,打开Define Multiple Line对话框。
Line Charts对话框
6
(3)在Define Multiple Line对话框中,将代表不同地区的5个变量移入Lines Represent列表框中,将代表支出指标的变量(variable)移入Variable框中。单击OK按钮,。从图中可以清楚地看出北京市几乎各项支出都排在第一,而山西省则几乎每项支出都是最低的。
Define Multiple Line对话框
7
折线图
8
第三节条形图分析法
条形图是由若干平行条状的矩形所构成,而以每一个矩形的高度来代表数值的大小。
,条形图的制作步骤如下:
(1)选择菜单项Graphs→Line,打开Bar Charts对话框, Charts对话框有相同的选项。在对话框上方的三个选项用于选择条形图的形式,由于是这里是多变量作图,所以选择Clustered。在对话框下面的三个选项中选择Value of individual cases。单击Define按钮,打开Define Clustered Bar对话框。
(2)在Define Clustered Bar对话框中,将代表不同地区的5个变量移入Bars Represent列表框中,将代表支出指标的变量移入Variable框中。单击OK按钮,。
9