1 / 68
文档名称:

基于概率潜在语义分析的软件变更分类研究.pdf

格式:pdf   大小:1,471KB   页数:68页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于概率潜在语义分析的软件变更分类研究.pdf

上传人:陈潇睡不醒 2021/10/15 文件大小:1.44 MB

下载得到文件列表

基于概率潜在语义分析的软件变更分类研究.pdf

相关文档

文档介绍

文档介绍:基于概率潜在语义分析的软件变更分类研究








重庆大学硕士学位论文
(专业学位)


学生姓名:鄢 萌
指导教师:张小洪 教 授
学位类别:工程硕士(软件工程领域)




重庆大学软件学院
二 O 一三年五月
Software Change Classification based on
Probabilistic Latent Semantic Analysis



A Thesis Submitted to Chongqing University
in Partial Fulfillment of the Requirement for the
Professional Degree
By
Yan Meng


Supervised by Prof. Zhang Xiaohong
Specialty:ME (Software Engineering Field)


School of Software Engineering of
Chongqing University, Chongqing, China
May 2013
摘 要

软件变更是指软件开发者对软件系统的一次更改,在软件的整个生命周期中,
追踪和理解软件变更发生的原因是一项重要且困难的任务。当前已经有研究者提
出了基于关键词检索的方法来识别软件变更发生的原因,也取得了一定的成果,
然而仍然存在一些尚未解决的问题,如在分析软件变更日志中存在的同义词与多
义词问题。本文提出了一种基于半监督主题模型的方法来识别软件变更发生的原
因,根据其原因对软件变更进行分类。研究对象为存储在软件版本控制系统(如
SVN)中的软件变更日志,应用半监督主题模型对软件变更日志进行挖掘和分析,
在主题提取上,采用了概率潜在语义分析 Probabilistic Latent Semantic Analysis
(PLSA)技术。主要工作内容如下:
1. 在软件版本库变更日志的数据抽取与预处理上,提出了联合 CvsAnaly,
GATE, Wordnet 三个工具的解决方案,并通过引用工具提供的 API 包实现了软件变
更日志的数据抽取、存储与预处理;
2. 为解决以往基于关键词检索的软件变更分类中存在的同义与多义问题,提
出了基于 PLSA 主题模型的解决方法,并利用 Eclipse 和 MATLAB 平台完成核心
算法的编写;
PLSA 主题模型时,针对原始的 PLSA 对方法进行了两点改进:第一
则是单

最近更新

2024年小班教研组课题计划(通用11篇) 39页

土拉霉素在猪组织中的残留检测方法及消除规律.. 2页

圆的再认知与其艺术价值研究的开题报告 2页

2024年小小班班级计划(8篇) 29页

国有企业并购价值创造研究——以东航--上航并.. 2页

固相萃取-分光光度法检测痕量重金属离子的研究.. 2页

2024年小学语文老师集体备课计划 9页

2024年小学语文教研组工作总结(热门) 47页

2024年小学语文教师的个人工作计划合集6篇 19页

2024年小学语文培训学习心得体会15篇 34页

唐代诗僧拾得研究的开题报告 2页

2024年小学节日活动方案 46页

2024年小学科学教师学期工作总结 22页

2024年小学生骑鹅旅行记读后感 10页

吉化精细化学品厂循环水冷却塔防结冰改造及系.. 2页

史学研究成果引入高中历史教学的实践探析的开.. 2页

2024年小学生演讲稿必备(8篇) 14页

2024年小学生期末评语通用大全 77页

2024年小学生新学期计划15篇(精华) 18页

双曲几何流的演化方程的开题报告 2页

2024年小学生周记8篇[精选] 7页

箱变日常巡查记录表格 2页

慢性胃炎中医症候评分表格模板2 3页

学校食堂6s管理内容和标准四篇 51页

学习防性侵教育心得体会 3页

作业现场违章分析报告(范本) 27页

商场空调合同能源管理(EMC)项目商业策划书 40页

医院管理精品-康复科脑梗塞恢复期单病种诊疗规.. 3页

尊师开示 7页

十五种解经讲道法(1) 55页