1 / 50
文档名称:

基于复杂网络理论的文本聚类和关键词提取方法研究.pdf

格式:pdf   页数:50
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于复杂网络理论的文本聚类和关键词提取方法研究.pdf

上传人:banana 2014/3/28 文件大小:0 KB

下载得到文件列表

基于复杂网络理论的文本聚类和关键词提取方法研究.pdf

文档介绍

文档介绍:学位论文作者签名:逾学位论文作者虢盘迅免≥口年易月留日学位论文版权的使用授权书学位论文独创性声明零募:≥本学位论文作者完全了解辽宁师范大学有关保留、使用学位论文的规定,及学校有权保留并向国家有关部门或机构送交复印件或磁盘,允许论文被查阅和借阅。本文授权辽宁师范大学,可以将学位论文的全部或部分内容编入有关数据库并进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文,并且本人电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后使用本授权书。本人承诺:所呈交的学位论文是本人在导师指导下所取得的研究成果。论文中除特别加以标注和致谢的地方外,不包含他人和其他机构已经撰写或发表过的研究成果,其他同志的研究成果对本人的启示和所提供的帮助,均已在论文中做了明确的卢明并表示谢意。弋静擎“蒜譬叠出罐毫委‰、静弧怼兜毫恪C旷俺父。唬§指导教师签名:签名日期:喜》
要摘随着信息技术的高速发展,文本信息的数量正以几何速度飞速增加,如何在这些海量的文本信息中快速的获得自己有用的信息,并且合理的管理和使用这些文本信息,已经成为当今亟待解决的问题。合理的利用数据挖掘技术,能够有效的解决这一问题。文本聚类和文本关键词提取是文本挖掘领域中重要的研究内容。文本聚类将文本集分成若干个类,要求同一类中的文本之间相似度较大,而不同类的文本之间的相似度较小。文本聚类作为一种无监督的机器学习方法,不需要训练集,不需要事先知道聚类个数,因此具有一定的灵活性和现实性。文本关键词提取是处理文本信息的重要技术之一,是文本自动分类、自动聚类、自动摘要生成等文本信息处理的前提和基础。本文介绍了文本聚类和文本关键词提取的研究背景、研究意义、国内外研究现状和相关的理论知识。本文在总结之前国内外经典的文本聚类和关键词提取研究的基础上,分别提出了文本聚类和文本关键词提取的新方法,具体工作包括以下两个方面:岢鲆恢只诟丛油缟缤呕值奈谋揪劾喾椒ǎ紫忍岢隽艘恢旨尤ǜ丛油社团划分的新算法,通过不断寻找复杂网络中的稠密集并对其进行适当操作,达到了划分加权复杂网络的目的。其次将该算法应用于文本聚类,将文本用向量空间模型表示,用余弦公式计算文本之间的相似度,根据邻居节点构造出加权复杂网络,用本文提出的算法对加权复杂网络进行社团划分。最后,对数据集中的部分样本进行聚类,实验表明该方法具有良好的聚类效果。岢鲆恢只诩尤ǜ丛油绲奈谋竟丶侍崛》椒ǎü治鲆延械幕诟丛油络的关键词提取算法的特点和不足,提出了一种基于加权复杂网络的文本关键词提取新算法。首先根据文本特征词之间的关系构建文本的加权复杂网络模型,其次通过节点的加权聚类系数和节点的介数计算节点的综合特征值,最后根据综合特征值提取出文本关键词。实验结果表明,该算法提取的关键词能够很好的体现文本主题,提取关键词的准确率比已有算法要高。关键字:文本聚类;关键词提取;加权复杂网络;稠密集;综合特征值辽宁师范大学硕士学位论文
瓼,瓵.,甌琾甀基于复杂网络理论的文本聚类和关键词提取方法研究,瓾,瓽...,痶,,..,.琣甌,.琣。
.琣籨鴆甪.,’猣瓼,甌;:
目录摘鱷仑⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.研究背景和意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯研究背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.研究意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.国内外研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.文本聚类研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.文本关键词提取研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.本文主要的研究内容⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯】.疚牡淖橹峁埂谋就诰蛴敫丛油缋砺邸文本聚类⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯文本关键词提取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..复杂网络⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.诟丛油缟缤呕值奈谋揪劾喾椒ā基于稠密集的加权复杂网络社团划分算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯基于稠密集的加权复杂网络社团划分算法的文本聚类算法⋯⋯⋯⋯⋯⋯⋯⋯构建文本复杂网络模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯基于复杂网络社团划分的文本聚类方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯基于特征文本提取的文本聚类方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯构造复杂网络⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.基于特征文本提取的文本聚类算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯实验⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..基于特征文本提取的文本聚类算法⋯⋯⋯⋯⋯..诩尤ǜ丛油绲奈谋竟丶侍