1 / 15
文档名称:

R语言中的多元统计之判别分析报告.docx

格式:docx   大小:137KB   页数:15页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

R语言中的多元统计之判别分析报告.docx

上传人:maritime_4 2020/12/19 文件大小:137 KB

下载得到文件列表

R语言中的多元统计之判别分析报告.docx

文档介绍

文档介绍:word 格式
前言
判别分析 (discriminant analysis
)是多元统计分析中较为成熟的一
种分类方法 ,它的核心思想是 “分类与判断 ”,即根据已知类别的样本
所提供的信息 ,总结出分类的规律性 ,并建立好判别公式和判别准则

在此基础上 ,新的样本点将按照此准则判断其所属类型
。例如,根据
一年甚至更长时间的每天的湿度差及压差
,我们可以建立一个用于判
别是否会下雨的模型 ,当我们获取到某一天 (建立模型以外的数据 )
的湿度差及压差后 ,使用已建立好的模型 ,就可以得出这一天是否会
下雨的判断 。
根据判别的组数来区分 ,判别分析可以分为两组判别和多组判别 。接
下来,我们将学****三种常见的判别分析方法
,分别是:
距离判别
Bayes 判别
Fisher 判别
一、距离判别基本理论
假设存在两个总体 和 ,另有 为一个 维的样本值 ,计算得到该样
本到两个总体的距离 和 ,如果 大于 ,则认
.. ..
word 格式
为样本 属于总体 ,反之样本 则属于总体 ;若 等于
,则该样本待判 。这就是距离判别法的基本思想 。
在距离判别法中 ,最核心的问题在于距离的计算 ,一般情况下我们最
常用的是欧式距离 ,但由于该方法在计算多个总体之间的距离时并不
考虑方差的影响 ,而马氏距离不受指标量纲及指标间相关性的影响 ,
弥补了欧式距离在这方面的缺点 ,其计算公式如下 :
, 为总体之间的协方差矩阵
二、距离判别的 R 实现(训练样本 )
首先我们导入数据
读取 SAS 数据
library(sas7bdat)
data1 <- ('')
# 截取所需列数据 ,用于计算马氏距离
testdata <- data1[2:5]
.. ..
word 格式
> head(testdata,3)
X1 X2 X3 X4
1 - -
2 - -

# 计算列均值
colM <- colMeans(testdata)
colM
X1
X2
X3
X4
-


计算矩阵的协方差
cov_test <- cov(testdata)
cov_test
X1
X2
X3
X4
X1


-
X2




.. ..
word 格式
X3
X4 -
样本的马氏距离计算
distance <- mahalanobis(testdata,colM,cov_test)
head(distance,5)
[1]
这样,我们得到了距离判别中最关键的马氏距离值 ,在此基础上就可
以进行进一步的判别分析了 。不过我们介绍一个 R 的第三方包 WMDB ,
该包的