1 / 12
文档名称:

基于R语言的判别分析方法和分类方法实现.docx

格式:docx   大小:16KB   页数:12页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于R语言的判别分析方法和分类方法实现.docx

上传人:国霞穿越 2022/6/9 文件大小:16 KB

下载得到文件列表

基于R语言的判别分析方法和分类方法实现.docx

相关文档

文档介绍

文档介绍:基于R语言的判别分析方法和分类方法
判别分析(discriminantanalysis)是一种分类技术。它通过一个已知类别的“训练样本”来建立判别准则,并通过预测变量来为未知类别的数据进行分类。
判别分析根据所采用的数据模型,可分为线性解的时候按照已知类别样本计算,但是对于未知类别样本应用判别函数时不做任何监督。;而决策树和神经网络等方法属于有监督分类,从分类准则建立,到准则的部署全程控制。训练神经网络和决策树是监督学****的最常见技术。这两种技术(神经网络和决策树)高度依赖于事先确定的分类系统给出的信息。对于神经网络来说,分类系统用于判断网络的错误,然后调整网络适应它;对于决策树,分类系统用来判断哪些属性提供了最多的信息,如此一来可以用它解决分类系统的问题。
下面就介绍几种有监督分类方法
利用决策树分类
决策树是以实例为基础的归纳学****算法。它从一组无次序、无规则的元组中推理出决策树表示形式的分类规则。它采用自顶向下的递归方式,在决策树的内部结点进行属性值的比较,并根据不同的属性值从该结点向下分支,叶结点是要学****划分的类。从根到叶结点的一条路径就对应着一条合取规则,整个决策树就对应着一组析取表达式规则。
>library(tree)
>(2)
>data(iris)
>train=sample(1:nrow(iris),100)
>=iris[-train,]
>=tree(Species~.,iris,subset=train)
>=predict(,,type='class')
>table(,$Species)

setosa1500
versicolor0160
virginica0118
>table<-table(,$Species)
>sum(diag((table)))###判对率
[1]
利用神经网络分类
神经网络建立在有自学****能力的数学模型基础上,可以对复杂的数据进行分析,并完成对人脑或其他计算机来说极为复杂的模式抽取及趋势分析。神经网络的典型应用是建立分类模型。神经网络从经验中学****常用于发现一组输入数据和一个结果之间的未知联系神经网络的训练是根据历史样本数据反复进行的。训练过程中,处理单元对数据进行汇总和转换,它们之间的连接被赋以不同的权值。也就是说,为了对每一个样本的结果变量进行预测,一个网络要尝试各种不同的方案。当输出结果在指定的精度级别上与已知结果吻合,或满足其它的结束准则时,网络的训练就不再进行
>library(nnet)
>(2)
>data(iris)
><-nnet(Species~.,linout=F,size=10,decay=,maxit=1000,trace=F,data=iris)
#对分类数据预测需要加上type参数
>=predict(,iris,type='class')
>table(,iris$Species)

setosa5000
versicolor0490
virginica0150
>table<-table(,iris$Species)
sum(diag((table)))###判对率
[1]
利用支持向量机分类、
SVM学****问题可以表示为凸优化问题,因此可以利用已知的有效算法发现目标函数的全局最小值。而其他分类方法(如基于规则的分类器和人工神经网络)都采用一种基于贪心学****的策略来搜索假设空间,这种方法一般只能获得局部最优解。SVM通过最大化决策边界的边缘来控制模型的能力。尽管如此,用户必须提供其他参数,如使用核函数类型和引入松弛变量等。通过对数据中每个分类属性引入一个哑变量,SVM可以应用于分类数据。SVM一般只能用在二类问题,对于多类问题效果不好。
library(e1071)
(2)
data(iris)
<-svm(Species~.,data=iris)
=predict(,iris,type='class')
table(,iris$Species)