1 / 67
文档名称:

面向领域文本的潜在语义分析研究.pdf

格式:pdf   大小:7,281KB   页数:67页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

面向领域文本的潜在语义分析研究.pdf

上传人:陈潇睡不醒 2021/10/11 文件大小:7.11 MB

下载得到文件列表

面向领域文本的潜在语义分析研究.pdf

相关文档

文档介绍

文档介绍:分类号 密级

学 位 论 文
面向领域文本的潜在语义分析研究
题名与副题名
郑翠翠
作者姓名
指导教师姓名 甘利人 教授
申请学位级别 硕 士 专业名称 管理科学与工程
论文提交日期 论文答辩 日期
学位授予单位和日期 南 京 理 工 大 学
答辩委员会主席
评阅人
年 月 日
注 注明 《国际十进分类法 》 的类号 。
硕 士 学 往 伦 文
面向领域文本的潜在语义分析研究
作 者 郑翠翠
指导教师 甘利人 教授
岑咏华 讲师
南 京 理 工 大 学
年 月
M aster,
国叩 妙尸叮


,
声 明
本学位论文是我在导师的指导下取得的研究成果, 尽我所知, 在本
学位论文中, 除了加以标注和致谢的部分外, 不包含其他人己经发表或
公布过的研究成果, 也不包含我为获得任何教育机构的学位或学历而使
用过的材料 。与我一同工作的同事对本学位论文做出的贡献均已在论文
中作了明确的说明 。
研究生签名 州、月砂日
学位论文使用授权声明
南京理工大学有权保存本学位论文的电子和纸质文档, 可以借阅或
上网公布本学位论文的部分或全部内容, 可以向有关部门或机构送交并
授权其保存 、 借阅或上网公布本学位论文的部分或全部内容 。对于保密
论文, 按保密的有关规定和程序处理 。
研究生签名 叫、`月步
硕士论文 面向领域文本的潜在语义分析研究
摘 要
传统基于词语独立性假设、原始高维词语特征表示和字面匹配方法的文本信息处
理往往忽略了文本信息中所隐藏的语义结构, 无法形成对文档、 作者 、研究结构等处
理单元的正确语义表示, 影响了检索 、 聚类 、 分类 、 相似度计算 、 关联挖掘等深层文
本信息处理的效率 、 准确率和召回率 。因此, 探索一种有效的语义分析和表示技术,
对于文本信息处理和挖掘有着重要的意义 。
针对传统文本信息处理存在的问题, 本文引入了潜在语义分析 模型, 试
图通过奇异值分解 、 半离散分解 以及非负矩阵分解 等语义降
维方法达到信息过滤和去除噪声的目的, 实现原始 “词语一文档矩阵