1 / 12
文档名称:

R语言中的多元统计之判别分析.pdf

格式:pdf   大小:557KB   页数:12页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

R语言中的多元统计之判别分析.pdf

上传人:阳仔仔 2021/3/17 文件大小:557 KB

下载得到文件列表

R语言中的多元统计之判别分析.pdf

文档介绍

文档介绍:.
前言
判别分析 (discriminant analysis )是多元统计分析中较为成熟的一种
分类方法, 它的核心思想是 “分类与判断 ”,即根据已知类别的样本所提
供的信息,总结出分类的规律性,并建立好判别公式和判别准则,在此
基础上,新的样本点将按照此准则判断其所属类型。例如,根据一年甚
至更长时间的每天的湿度差及压差, 我们可以建立一个用于判别是否会
下雨的模型,当我们获取到某一天(建立模型以外的数据)的湿度差及
压差后,使用已建立好的模型,就可以得出这一天是否会下雨的判断。
根据判别的组数来区分, 判别分析可以分为两组判别和多组判别。 接下
来,我们将学****三种常见的判别分析方法,分别是:
距离判别
Bayes 判别
Fisher 判别
一、距离判别基本理论
假设存在两个总体 和 ,另有 为一个 维的样本值,计算得到该样
本到两个总体的距离 和 ,如果 大于 ,则认为
样本 属于总体 ,反之样本 则属于总体 ;若 等于 ,
则该样本待判。这就是距离判别法的基本思想。
.
.
在距离判别法中, 最核心的问题在于距离的计算, 一般情况下我们最常
用的是欧式距离, 但由于该方法在计算多个总体之间的距离时并不考虑
方差的影响, 而马氏距离不受指标量纲及指标间相关性的影响,弥补了
欧式距离在这方面的缺点,其计算公式如下:
, 为总体之间的协方差矩阵
二、距离判别的 R 实现(训练样本)
首先我们导入数据
# 读取 SAS数据
> library(sas7bdat)
> data1 <- ('')
# 截取所需列数据,用于计算马氏距离
> testdata <- data1[2:5]
> head(testdata,3)
X1 X2 X3 X4
1 - -
2 - -
3
# 计算列均值
> colM <- colMeans(testdata)
> colM
.
.
X1 X2 X3 X4
-
# 计算矩阵的协方差
> cov_test <- cov(testdata)
> cov_test
X1 X2 X3 X4
X1 -
X2
X3
X4 -
# 样本的马氏距离计算
> distance <- mahalanobis(testdata,colM,cov_test)
> head(distance,5)
[1]
这样,我们得到了距离判别中最关键的马氏距离值,在此基础上就可以
进行进一步的判别分析了。不过我们介绍一个 R 的第三方包 WMDB ,
该包的 wmd() 函数可以简化我