1 / 10
文档名称:

一种基于聚类密度的文本分类算法研究.pdf

格式:pdf   大小:640KB   页数:10页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

一种基于聚类密度的文本分类算法研究.pdf

上传人:zhufutaobao 2021/11/16 文件大小:640 KB

下载得到文件列表

一种基于聚类密度的文本分类算法研究.pdf

相关文档

文档介绍

文档介绍:图 书 馆 学 研 究 .
一 种基 于聚 类密 度 的 文本 分 类 算 法研 究
谭 学 清 张 磊 周 通 罗 琳
【摘 要 】在现代信 息技术领域 ,如何快速 、准确和全面地找到用 户真正所 需要 的信 息, 已经成为该领 域 的研
究重点。在 文本分 类的理论基础之上 ,文章针 对 算 法存在 的不足 ,设计 了一种基 于聚类 密度 的文本分 类
算法,通过计 算待分 类文本 的相似度及其权重值 的大小判 断待分类文本的所属 类别 。并通过 个实验对该分 类
算 法进行 了验证 ,实验结果表 明,基于聚类 密度 的分类算法在不 同特征选择 方法、不 同特征 词数下 的分类 效果
都优 于 分 类算法,同时证 明在 多种相似度算法 中,散度更适合聚类 密度算法。
【关键词】文本分类 向量空间模型 最近邻算法 聚类密度
: ,
.,


. .


,—.

数据是信息的具体展现形式 ,我们获得 知识的主要来源是文本数据 ,因而为 了最大程度地满足用户对信息 快
速而准确获取的需求 ,对海量的文本数据实现有效分类与管理是十分必要的。现有 的文本分类体 系中,通过智能
识别文本 内容而确定文本类别的过程即为文本分类⋯ 。向量空间模型作 为常用的文本表示模型 ,与机器学 ****相结
合后 ,在处理 网页文档 、各种 电子文献等长文本方面取得 了较好 的效果 ,其与知识 工程方法相 比,具有较高的分
类准确性 ,同时避免人工参与,效率更好。随着人工智能等科学技术的飞速 发展 以及信息 量的不