1 / 54
文档名称:

流形学习及其在文本分类中的应用.pdf

格式:pdf   页数:54
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

流形学习及其在文本分类中的应用.pdf

上传人:banana 2014/1/17 文件大小:0 KB

下载得到文件列表

流形学习及其在文本分类中的应用.pdf

文档介绍

文档介绍:流形学习及其在文本分类中的应用作者姓名菹继歪学位类型堂匝亟±学科、专业笪理抖堂皇工猩研究方向值:垦筐理皇值星丕统导师及职称奎暨因桓苯叹年
主席:叫巧从入纷乱微引吼解吲拂乙以委压’帽委员:张乃赴舍媚瓠投移碧玑局泌及圃答辩委员会签名:合肥工业大学ぷ鞯ノ弧⒅俺本论文经答辩委员会全体委员审查,确认符合合肥工业大学硕士学位论文质量要求。
学位论文作者签字秘堆字吼泸降垆月栅学位论文者签名:莨瞪孑:可以将学位论文的全部或部分论文内容编入有关数据库进行检索,可以采用影印、缩印或扫学位论文版权使用授权书签字日期:矽年中月伏日独创性声明晡缭铝尤果,也不包含为获得盒屠夹┨本学位论文作者完全了解金汀恍┛糜泄乇A簟⑹褂醚宦畚牡墓娑ǎ腥ūA舨⑾本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标志和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谓十意。国家有关部或机构送交论文的复印件和磁盘,允许论文被查阅或借阅。本人授权盒盒┷描等复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笫视帽臼谌ㄊ签字日期:伤学位论文作者毕业后去向:工作单位:电话:导师签通讯地址:邮编:
流形学习及其在文本分类中的应用摘要关键词:流形学习;文本分类;数据降维;增量学习随着计算机能力的日益增强和存储容量的增长,大规模的数据获取更为方便和普遍,同时也产生了新的问题。在很多领域中,如文本挖掘、生物特征认证、图像分析和计算机视觉、信息检索中的文本分析和计算生物学等,获得的是高维数据,这样极有可能导致“维数灾难”的出现。近年来,流形学习成为了机器学习领域的一个热点研究方向,流形学习期望从高维数据空间中寻找数据隐含的规律性与结构,被广泛用于高维数据降维,是一种非线性数据降维方法。文本分类作为信息检索、搜索引擎、文本数据库、数字化图书馆等领域的技术基础,有着广泛的应用前景。由于文本数据的非结构化特点,进行文本表示时,特征向量高达几万维甚至于几十万维。高维的特点会大大增加冗余特征信息,从而导致分类的准确度下降。数据降维能够减少文本向量的维数,而使特征向量能更好地代表文本或者类别特征。本文假设文本向量空间存在一个潜在的文本流形,将文本看做是这个流形上抽样的点,将流形学习应用在文本分类的文本预处理过程中,提出了一种基于的谋痉掷嗨惴ǎ冉贤暾孛枋隽讼喙乩砺刍〖八法的具体流程,并对算法进行了增量式改进,提出了一种基于增量流形学习的谋痉掷嗨惴ǎ⒈判辛耸笛楸冉虾头治觯笛橹っ髁肆形学习在文本分类中的应用,能有效提高文本分类的性能。
:疭琲,甀,,,,瑆,””.琺,.瑂瑃,琱甌簍#琣!甌琾琧。琾琫.·;。籇。;。
致谢随着这篇硕士学位论文的完成,三年的研究生生涯即将结束,回首三年的学习生活,踏实而充实。在这里,我首先把我最诚挚的谢意和最真挚的祝福献给我的导师倪志伟教授与李锋刚副教授。在我攻读硕士学位期间,两位老师为我创造了良好的学习和工作环境,在学术上对我的指导,思想上对我的启迪,生活上对我的关心,使我终身难忘。两位老师渊博的知识、严谨的治学态度、平易近人的长者风范和对学科发展前沿的洞察力让我倍受熏陶。在论文选题到最终完成论文得到了两位老师的督促与指导,才使得我能顺利完成论文的撰写。在论文完成之际,谨向两位导师致以由衷的感谢和崇高的敬意。我要感谢伍章俊师兄与王力师兄在科研过程中与生活中给予了我无私的帮助与指导;感谢周之强、公维峰、孟金华等师兄与姜苗师姐,是他们在技术上、研究方法上给予我指导,帮助我解决在项目中与科研中遇到的技术难题;感谢同门张庆荣、汪沙、章虎林、金建业、孙英家、潘雪峰,以及已经毕业的李梦喜与金晓华同学,在一起学肷畹娜兆永铮梦腋惺艿搅思宓奈暖,感谢他们对我在生活中的帮助和学习上的指导;感谢在研究所一起学习的其他老师、师兄、师姐、师弟、师妹们,感谢他们在一起学习的过程中给予我的支持与帮助;感谢与我朝夕相处的舍友朱美龙、丁杰、夏原野,有他们的陪伴让我的研究生生活充满了欢乐,他们在生活上与学细栉液芏喟镏牍励,非常感谢他们。感谢我的父母、家人多年来对我的理解、支持和关怀。我在他乡求学,他们的期望和思念,是我刻苦钻研、努力奋斗的动力。再次向尊敬的导师倪志伟教授与李锋刚副教授表示深深的谢意。作者:范继利月
目录第一章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第二章流形学习算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第三章文本分类技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.选题背景及意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯国内外研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯