1 / 5
文档名称:

基于K邻近算法的LocalLDtree分类模型分析.doc

格式:doc   大小:105KB   页数:5页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于K邻近算法的LocalLDtree分类模型分析.doc

上传人:jactupq736 2016/9/21 文件大小:105 KB

下载得到文件列表

基于K邻近算法的LocalLDtree分类模型分析.doc

文档介绍

文档介绍:基于K邻近算法的LocalLDtree分类模型分析摘要重点对懒惰式分类算法加以分析实验,针对提高分类器(Classifier)的分类效果,从急切式学习策略与懒惰式学习相结合和K-邻近思想与懒惰式决策树相结合的角度进行了研究,提出了LocalLDtree分类器,充实了分类研究领域的内容,并取得了较为理想的分类效果。关键词K邻近算法;LocalLDtree;分类器;LazzDT中图分类号:TP391文献标识码:A文章编号:1671-7597(2013)23-0033-,是基于K-邻近算法的思想来进行选择的,确定实例集合后对测试实例进行分类,使用了LazzDT分类器。实验证明,本文提出的LocalLDtree分类模型在绝大部分数据集上取得了较高的分类精度。实验过程中使用LazzDT分类器,结合K-邻近算法筛选出的与实例集合中最为接近的部分实例,在局部训练实例集合中进行实例的分类,实验证明,本文提出的LocalLDtree分类模型在绝大部分数据集上取得了较高的分类精度。经过对懒惰式学习策略的研究,经过实验验证,提出了新分类模型―LocalLDtree。本文主要阐述LocalLDtree分类模型的算法,通过实验比较LocalLDtree、J48、Lazydecisiontree与SimpleBias等四种分类器的分类精度。,按照K-邻近算法的思路选择与本测试实例最为接近的K个训练实例,依据LazzDT分类模型在局部训练实例集中来对测试实例分类。LocalLDtree分类器的建立,要根据测试实例计算其与每个训练实例的距离。关于实例间距的确定是本文需要重点描述的问题。实验中实例间距的确定采用的是Euclideandistance。实验中假设全部实例对应于n维Euclideandistance中的点。任何一个实例z的特征向量都可以表示为:其中ar(z)表示训练实例z第r个属性的值。两个实例zi和zj间距表示为d(zi,zj),其中:d(zi,zj)=使用Euclideandistance进行实例之间间距的确定在实验过程中也取得较好效果。,是基于懒惰式学习策略分类算法。在给测试实例分类的时候,第一步,在最接近的部分训练实例中按照K邻近算法来进行筛选,第二步,测试实例的分类使用LazzDT模型在训练实例集合中来进行。LocalLDtree分类算法在多数数据集合上与其它常用的分类模型相比取得了较高的分类精确度。LocalLDtree分类算法:输入项,带类标的数据训练集SET;某个没有类标等待分类实例z;输出项,带类标的实例z;1)对SET中的所有实例set,确定z到set的间距d(z,set);2)在SET中选择与z的间距最近的K个训练实例,标记为z1,z2,…,zk,使用数据集SUBset来存储这K个实例;3)LazzDT的输入项使用SUBset集合及z,经过LazzDT分类器进行分类,以得到z的类标;4)LazzDT得到的z类标值作为输出项来使用。实验的关键,首先是,测