文档介绍:(PatternRecognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。(SupervisedClassification)无监督的分类(UnsupervisedClassification)二者的主要差别在于:各实验样本所属的类别是否预先已知。、语音识别、声音分类、通信、计算机辅助诊断、数据挖掘等学科。(k-NearestNeighboralgorithm)该算法的基本思路是:在给定新的样本后,考虑在训练集中与该新样本距离最近(最相似)的K个样本,,提取特征,确定新样本的特征向量表示在训练集中选出与新样本最相似的K个文样本,计算公式为:,依次计算每类的权重计算公式如下:比较类的权重,将文本分到权重最大的那个类别中。(LinearDiscriminantAnalysis,LDA),基本思想:将高维的模式样本投影到最佳鉴别矢量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的子空间有最大的类间距离和最小的类内距离即模式在该空间中有最佳的可分离性10.