1 / 14
文档名称:

KNN最近邻居分类器测试.doc

格式:doc   大小:254KB   页数:14页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

KNN最近邻居分类器测试.doc

上传人:guoxiachuanyue001 2019/6/10 文件大小:254 KB

下载得到文件列表

KNN最近邻居分类器测试.doc

文档介绍

文档介绍:KNN最近邻居分类器实验测试三种数据集在UCI上选择三种数据集。分别是Ecoli-DataSet大肠杆菌数据集、Yease-DataSet酵母数据集、Abalone-DataSet鲍鱼数据集。Ecoli数据集Ecoli数据集,最初用于测试大肠杆菌中蛋白质的分部。数据集中有336中大肠杆菌数据,用于分类。其作者和贝叶斯算法的作者是同一人。该数据集中的一共有8个属性来描述酵母,其中的7个属性用于预测,1个属性是类型cp(cytoplasm)143im(innermembranewithoutsignalsequence)77pp(perisplasm)52imU(innermembrane,uncleavablesignalsequence)35om(outermembrane)20omL(outermembranelipoprotein)5imL(innermembranelipoprotein)2imS(innermembrane,cleavablesignalsequence)2WebSite:,和Ecoli数据集都是用于蛋白质的测试,不同的是,Yeast是酵母的数据,而Ecoli则是大肠杆菌的数据。在yeast数据集中,对于酵母的描述包含9个属性,其实的8个用于预测,1个属性是类型。CYT(cytosolicorcytoskeletal)463NUC(nuclear)429MIT(mitochondrial)244ME3(membraneprotein,noN-terminalsignal)163ME2(membraneprotein,uncleavedsignal)51ME1(membraneprotein,cleavedsignal)44EXC(extracellular)37VAC(vacuolar)30POX(peroxisomal)20ERL(endoplasmicreticulumlumen)5WebSite:-learning-databases/yeastAbalone数据集Abalone数据集是关于鲍鱼的数据集。该数据集,通过对鲍鱼进行物理的测量,预测鲍鱼的年龄。其中包括4177个实例。包括8个属性,包括给定的属性名,属性类别,测量单元。本数据集可以用于连续数据测量和离散数据分类。 Name DataType Meas. Description ---- --------- ----- ----------- Sex nominal M,F,andI(infant) Length continuous mm Longestshell Diameter continuous mm perpendiculartolength Height continuous mm withmeatinshell Wholeweight continuous grams wholeabalone Shuckedweight continuous grams weightofmeat Visceraweight continuous grams gutweight Shellweight continuous grams afterbeingdried Rings integer givestheageinyears对数据集中的数据,进行简单的数据统计分析,结果见表1:,针对此类数据集。有作者做了不同算法分类的比较,结果如下图1:图1Abalone数据集不同算法分析KNN最近邻居分类器原理算法原理KNN(kNearestNeighbors)算法又叫k最临近方法。K最近邻(K-NearestNeighbor,KNN)分类算法可以说是整个数据挖掘分类技术中最简单的方法。所谓K最近邻,就是K个最近的邻居,说的是每个样本都可以用它最接近的K个邻居来代表。假设每一个类包含多个样本数据,而且每个