1 / 33
文档名称:

Web信息抽取中的文本分类.doc

格式:doc   大小:650KB   页数:33页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

Web信息抽取中的文本分类.doc

上传人:pppccc8 2019/9/7 文件大小:650 KB

下载得到文件列表

Web信息抽取中的文本分类.doc

文档介绍

文档介绍::..在机器学****理论屮支持向量机(SVM)有着重要的地位,无论是求解分类问题还是求解冋归问题,SVM都有着广泛的应用。本文简单的介绍了SVM的基本原理,讨论了SVM在文本分类屮的应用,并详细的分析了如何利用SVM构造文木分类器。这里说明了文木分类的详细处理过程,并介绍了这些过程中的关键技术,如:分词技术、向量空间模型(VSM)、特征选取技术和SVM的交叉验证技术等隼结合着分析和讨论又概略的说明了利用MicrosoftVisualC++,介绍了重要的类和关键处理函数的实现和优化,以及如何利用动态链接库来实现C++到Java的迁移。最后给出了由本系统得到的实验数据和结论。关键字:机器学****文本分类支持向量机(SVM)ABSTRACTSupportVectorMachines(SVM)hasanimportantpositioninMachinelearningtheory,whetheritistosolvetheclassificationproblemorrequestforthereunificationissue,,ashortintroductionintothebasicprinciplesofSVM,adetaileddiscussionoftheSVMinthetextclassification,'sthetextofthedetailedclassificationprocessandintroducedinthecourseofthesekeytechnologies,suchas:segmentationtechnology,vectorspacemodel(VSM),featuresselectiontechnology,cross-++,introducedtherealizationandoptimizationofthekeyclassandimportantfunctions,andhowtouseofdynamiclinklibrarytoachievethemigrationfromC++,:machinelearningtextclassificationSVM(supportvectormachine)摘要 1目录 1第一章引言 11」总体项目背景 11」」基于Web的信息集成系统 3第二章相关理论 42」文本自动分类 (SVM) 6第三章需求分析 73」SVM的两个阶段 9第四章总体设计与实现工具的选择 104」总体结构 11第五章详细设计与实现 16第六章测试及结果 196」二分测试 24致谢 2527参考文献第一章引言1・1总体项目背景木文主要讨论基于Web的信息集成系统中的一个了系统——文木分类系统的设计与实现,但这里有必要介绍一下基于Web的信息集成系统的基本情况以及文本分类系统在整个项口中的位置与调用关系。——通过统一平台将松散的