1 / 45
文档名称:

基于动态阈值模型的概率潜在语义分析方法.pdf

格式:pdf   大小:2,260KB   页数:45页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于动态阈值模型的概率潜在语义分析方法.pdf

上传人:陈潇睡不醒 2021/10/31 文件大小:2.21 MB

下载得到文件列表

基于动态阈值模型的概率潜在语义分析方法.pdf

相关文档

文档介绍

文档介绍:A thesis submitted to
Zhengzhou University
for the degree of Master



Probabilistic Latent Semantic Analysis Method Based on
Dynamic Threshold Model




By Wang Yiming
Supervisor: Ye Yangdong

Computer Software and Theory
School of Information Engineering
May 2014
摘要
摘 要
目标识别与目标定位是计算机视觉领域的一个重要分支,随着数字图像在互
联网上的爆炸式增长,基于图像局部特征的目标匹配开始在图像检索中占据越来
越重要的地位,图像的整体分类已很难满足所有的图像检索需求,如何精确而有
效地实现目标识别与目标定位成为图像研究领域的一个关键问题。概率潜在语义
分析(Probabilistic Latent Semantic Analysis,PLSA)是一种基于统计学的自然语
言处理方法,能够有效挖掘隐藏在文本字面数据下的潜在语义结构,是最早的主
题模型方法。在图像应用领域,将 PLSA 作为一种主题挖掘工具,成功实现了非
监督形式的目标识别与目标定位功能。但在实践中存在过度拟合的问题,时常出
现主题隶属度不明确和多个主题过度相似的现象。
针对以上问题,本文提出一种基于动态阈值模型的 PLSA 方法,所完成的主
要工作包括:(1)提出一种高效的稀疏化方法,通过设置稀疏性控制阈值以达到
忽略次要信息,凸显核心主题信息的目的。这种方法合理并有效地限制了每张图
像所对应主题的数量,抑制冗余信息,成功解决了主题隶属度混乱的问题。(2)
提出了基于语义相似性的主题合并策略。对于不同主题过于相似的问题,根据其
语义相似性,动态地决定是否合并相似主题。目的是在确定目标的类信息保存完
整的前提下,实现每个目标类只明确地对应于一个主题。这种策略还能够构造主
题之间的层次结构关系,通过调整阈值的约束范围,可 以 实现主题在不同深度上
的抽象,挖掘更高层次的潜在数据模式。
本文实验表明:与已有的 PLSA 方法相比,本文所述的方法保持了高可靠度
的隐藏模式发现能力,同时大大提高了精确度,并且成功实现了该类方法从无层
次结构模型到多层次结构模型的扩展。
关键字:概率潜在语义分析,目标识别与目标定位,过度拟合,动态阈值

I
Abstract
Abstract
Object discovery and location is an important branch of computer vision. With
the explosion of digital images in the internet, the approach of image retrieval
becomes diverse. The global feature based image classification cannot meet all the
demands. Sometimes we need to retrieve an image according to local object
recognition and