1 / 38
文档名称:

多变量的可视化分析.ppt

格式:ppt   大小:4,935KB   页数:38页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

多变量的可视化分析.ppt

上传人:文库新人 2022/1/26 文件大小:4.82 MB

下载得到文件列表

多变量的可视化分析.ppt

相关文档

文档介绍

文档介绍:第1页,本讲稿共38页
第一节 引言
众所周知,图形是我们直观了解、认识数据的一种可视化手段。如果能将所研究的数据直接显示在一个平面图上,便可以一目了然地看出分析变量间的数量关系。直方图、散点图等就是我们常用的二维平面图示方法。虽高低来表示变量的大小。
:北京市各项支出都比较高,而山西省各项支出都比较低。
第12页,本讲稿共38页
第四节 散点图分析法
散点图又称散布图,它是以点的分布反映变量之间相关关系的可视化方法。矩阵散点图则是一种反映多个变量之间相关关系的二维散点图。
利用SPSS制作矩阵散点图的步骤如下:
(1),即把支出指标当成变量,而把不同地区当成观测。
作散点图时的数据组织形式
第13页,本讲稿共38页
(2)选择菜单项Graphs→Scatter,打开Scatter plot对话框,。该对话框用于选择散点图的形式。选定Matrix,即矩阵散点图 ,单击Define按钮,打开Scatter plot Matrix对话框,。
Scatter plot对话框
第14页,本讲稿共38页
Scatter plot Matrix对话框
第15页,本讲稿共38页
(3)在打开的Scatter plot Matrix对话框中,将食品、衣着、居住三个变量移入Matrix Variables列表框中,将标志变量region移入Label Cases by列表框中。
(4)点击OK按钮,。
,河北、山西、内蒙古在居住和食品消费支出方面与北京、天津相比较低,食品与居住支出变量之间存在一定的线性关系。天津在衣着支出方面较低,与最低的河北接近,与最高居住支出形成鲜明对比。北京则除在居住支出方面低于天津外,其他方面支出均高于华北其他省市。内蒙古则在衣着支出方面仅次于北京,显示出某种特殊消费特征。
第16页,本讲稿共38页
矩阵散点图
第17页,本讲稿共38页
另外,还可以作三维立体散点图。只需在Scatter plot对话框()中选择3-D选项。在跳出的3-D Scatter plot对话框中将食品、衣着、居住三个变量分别移入X Axis、Y Axis和Z Axis列表框中,将标志变量region移入Label Cases by列表框中。单击OK按钮,。
矩阵散点图不仅可以在二维平面上同时反映多个变量数值,而且可以用于直观反映多个变量间是否存在某种关系。与三维立体图相比,有着更好的可视性。。
第18页,本讲稿共38页
三维立体散点图
第19页,本讲稿共38页
第五节 雷达图分析法
雷达图是一种较为常用的多变量可视化图形。在雷达图中,每个变量都有它自己的数值轴,每个数值轴都是从中心向外辐射。由于图形就好像雷达荧光屏上的图像,故称其为雷达图。又像蜘蛛网,所以也称蛛网图。
雷达图的作图方法:
(1)作一圆,并按变量的个数p将圆周分成p等分。
(2)连接圆心和各分点,将这p条半径连线依次定义为各变量的坐标轴,并标以适当的刻度。
(3)对给定的一次观测值,将每个变量值分别标在相应的坐标轴上,把p个点相连就形成了一个p边形,n次观测值就可画出n个p边形。
第20页,本讲稿共38页
例如,,调用EXCEL图表向导,选择雷达图,然后按图表向导提示,~17所示的雷达图。、天津和河北的雷达图,从图可以看出,三省市消费支出结构有较大差异。北京人均消费支出的各项指标都高,对应面积最大的六边形,其次是天津,在三个省市中面积最小的是河北,天津在居住支出方面与北京较为接近,而在衣着和交通、通讯支出方面则与河北接近。其他支出方面三地存在较大差异。利用雷达图的形状、面积大小,可以对样品进行初始分类分析。
为了加强雷达图的效果,在雷达图中适当的分配坐标轴是很重要的,具体的分配办法要结合分析的问题而定。例如可将要对比的指标分布在左、右或上、下方,以便于对比分析。
第21页,本讲稿共38页
当观测次数n较大和指标较多时,画出的雷达图线段太多,图形的效果会很差。为了获得较好的可视化效果,在一张雷达图上可以画几个样品观测数据,甚至一张雷达图只画一个样品观测数据。~,对这些图进行比较分析,也可了解其特点。

第22页,本讲稿共38页