文档介绍:中国石油大学(华东) 硕士学位论文基于支持向量机增量学习的网页分类方法姓名:冷雪钰申请学位级别:硕士专业:计算机科学与技术指导教师:李村合 201205 利用海量互联网信息的一种有效途径。在已出现的多种网页自动分类算法中,支持向量关键词:支持向量机,增量学习,网页分类,超圆锥模型,核函数??????????????????????甌???????????????????????????????????????琒???????????????????. ?????甶???????????????????????瑃???.????????????????????????????????????.?????????????????????????????甌?????.???????????????????. ????????????????????????琲???????????中陶石油大学?6?硕士学位论文第一章前言互联网的发展速度越来越快,网络上的信息也越来越多,正在以指数的形式增长。??万个,增长幅度近??%。目前网站总量为?????觯?淹黄?亿。自?世纪?网络信息的爆炸性增长给人们在网络上搜寻有用信息带来了巨大的不便,所以人们一直在寻找有效途径来解决这个问题,而网页分类在组织利用海量网络信息中表现了优秀的能力。在互联网出现之前,普通文本分类已经有多种方法被提出,因为互联网的快速发展,使得需要分类的文本对象从普通文本扩展到网页中的信息。按照内容实现网页的自动分类能够快速且有效地分析处理海量的互联网信息。目前,网页分类技术应用在了数字图书馆、搜索引擎的目录导航服务、主动信息推送服务、主题搜索、信息过滤、个性化信息检索等很多领域【【?俊??】】。第一章前言??年南京大学萧嵘等人经过对结构风险和支持向量特点的分析【?】,提出了一种构练集进行??盗贰S纱说玫阶钪辗掷嗥鳌???算法能够提高学习速度,并且能保持响增量训练,会出现振荡,影响速度。?时间也降低了很多。提高分类预测精度。以后的研究应更加注重支持向量的数量和算法中参数值的研究。?,用组合化能力。本课题旨在针对这些问题进行分析,提出支持向量机的改进方法。可以减少训练的时间复杂度和空间复杂度。筛选增量训练样本点的模型是本文的研究方向之一。第一章“前言??樯芰薙?的研究背景和意义,阐述该研究的国内外现状,并对支持向量机的主要研究内容和本文组织结构进行了简要的说明。第二章“网页分类技术综述’’,阐述了网页分类的原理和常用算法,介绍了如何对分类结果进行评价。讨论了支持向量机分类算法,主要包括支持向量机的原理、几何意义、训练算法等内容。第二章网页分类技术综述第二章网页分类技术综述在互联网出现之前,文本自动文类的研究已出现多年,并形成各种不同的文本分类??????????????, ??技术【【?】,【?】?????刀】。网络上的信息海量涌现,因此主要的分类有以下三种形式: 现在的分类算法多数隶属于统计学习法。而依据分类最终结果不同,基于统计学习于或者不属于,在整个分类过程中,文档的某次类别判断不会影响到其他类别判断,是似度是不同的,对相似度进行排序后,找到相似度较高的类别列表,即该文档的从属类???????????????网页分类的基本过程净化。如何快速准确地识别并清除网页内的噪音是提高网页应用程序处理结果准确性的来得到分类模型的算法,分类器有很多种,分类器性能的差异会导致分类结果的差异。中困石油大学?6?硕士学位论文自动文档分类算法的分类