1 / 65
文档名称:

Web信息抽取中的文本分类.doc

格式:doc   大小:1,975KB   页数:65页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

Web信息抽取中的文本分类.doc

上传人:cai.li.bin 2019/6/15 文件大小:1.93 MB

下载得到文件列表

Web信息抽取中的文本分类.doc

文档介绍

文档介绍:摘要:..摘要在机器学****理论中支持向量机(SVM)有着重要的地位,无论是求解分类问题还是求解回归问题,SVM都有着广泛的应用。本文简单的介绍了SVM的基本原理,讨论了SVM在文本分类中的应用,并详细的分析了如何利用SVM构造文本分类器。这里说明了文本分类的详细处理过程,并介绍了这些过程中的关键技术,如:分词技术、向量空间模型(VSM)、特征选取技术和SVM的交叉验证技术等等。结合着分析和讨论又概略的说明了利用MicrosoftVisualC++,介绍了重要的类和关键处理函数的实现和优化,以及如何利用动态链接库来实现C++到Java的迁移。最后给出了由本系统得到的实验数据和结论。关键字:机器学****文本分类支持向量机(SVM)ABSTRACTABSTRACTSupportVectorMachines(SVM)hasanimportantpositioninMachinelearningtheory,whetheritistosolvetheclassificationproblemorrequestforthereunificationissue,,ashortintroductionintothebasicprinciplesofSVM,adetaileddiscussionoftheSVMinthetextclassification,'sthetextofthedetailedclassificationprocessandintroducedinthecourseofthesekeytechnologies,suchas:segmentationtechnology,vectorspacemodel(VSM),featuresselectiontechnology,cross-++,introducedtherealizationandoptimizationofthekeyclassandimportantfunctions,andhowtouseofdynamiclinklibrarytoachievethemigrationfromC++,:machinelearningtextclassificationSVM(supportvectormachine)目录目录HYPERLINK\l"_Toc201329074"第一章引言 1HYPERLINK\l"_Toc201329075" 1HYPERLINK\l"_Toc201329076" EF_Toc201329076\h1HYPERLINK\l"_Toc201329077" 2HYPERLINK\l"_Toc201329078" 3HYPERLINK\l"_Toc201329079" F_Toc201329079\h4HYPERLINK\l"_Toc201329080"第二章相关理论 6HYPERLINK\l"_Toc201329081" 6HYPERLINK\l"_Toc201329082"(SVM) 7HYPERLINK\l"_Toc201329083" 7HYPERLINK\l"_Toc201329084" 8HYPERLINK\l"_Toc201329085" 10HYPERLINK\l"_Toc201329086" 11HYPERLINK\l"_Toc201329087"第三章需求分析 13HYPERLINK\l"_Toc201329