文档介绍:该【基于R语言的测试用例聚类选择程序开发-毕业论文 】是由【海洋里徜徉知识】上传分享,文档一共【40】页,该文档可以免费在线阅读,需要了解更多关于【基于R语言的测试用例聚类选择程序开发-毕业论文 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。李鹏宇:基于R语言的测试用例聚类选择程序开发2016届计算机科学与技术专业毕业设计(论文)毕业设计(论文)题目基于R语言的测试用例聚类选择程序开发专业计算机科学与技术班级计121学生李鹏宇指导教师黑新宏(教授)2016年李鹏宇:基于R语言的测试用例聚类选择程序开发2016届计算机科学与技术专业毕业设计(论文)摘要随着互联网的发展,软件质量逐步被视为企业生命,很多企业都将业务建立在软件系统上,软件与业务密切结合,高质量的软件系统有助于企业增强自身实力,在市场竞争中赢得优势,而软件测试是确保软件质量的重要手段。并且最近几年来,由于软件的复杂度不断地增强,更由于软件的工业化发展趋势,软件测试得到了广泛的重视。越来越多的公司开始加大软件测试的比例,甚至有的公司软件测试占的比重比软件开发占的比重还要高。而设计测试用例是软件测试中比较高效的一种方法,但随着软件规模越来越大、版本迭代越来越快,每迭代一次版本,测试用例都要新添一部分。测试用例的数量也是迅速的增多,很有可能造成测试用例的冗余,相应的测试所需要的资源也被大大的浪费了。这个时候测试用例的约简就显得尤为重要,而如果不加以分析,又不能判断哪些测试用例是过时的,哪些测试用例还可以正常找出程序错误。所以要找一个好的可以分析测试用例的程序是非常重要的。基于R语言的测试用例聚类选择程序开发就是一个很好的帮助,其中聚类过程是无监督的,它可自动的进行分析那些测试用例功能是相似的,那些测试用例功能不同。其中聚类过程用R语言实现,聚类方法采用K中心点聚类的思想。之所以采用R语言,是因为R语言有很强大的数据分析能力,不止是聚类,可以为后续机器学习做出很大的帮助。关键词:R语言实现,测试用例约简,聚类分析李鹏宇:基于R语言的测试用例聚类选择程序开发2016届计算机科学与技术专业毕业设计(论文)ABSTRACT,thequalityofsoftwaregraduallyregardedasthelifeoftheenterprise,panieswillbusinessestablishedinthesoftwaresystems,softwareandserviceintegratedclosely,high-qualitysoftwaresystemshelpenterprisestoenhancetheirownstrength,petition,,plexityofthesoftwareisconstantlyimproved,butalsobecauseofindustrialdevelopmenttrendofsoftware,,,butwiththeincreasingscaleofsoftware,fasterversionoftheiteration,foreachiterationversion,,islikelytocausetheredundancyintestcases,,thereductionoftestcasesisparticularlyimportant,ifnotanalyze,andcannotdeterminewhichtestisoutofdate,,whichclusteringisunsupervised,itcan李鹏宇:基于R语言的测试用例聚类选择程序开发2016届计算机科学与技术专业毕业设计(论文),,becauselanguageRverypowerfuldataanalysiscapabilities,notjustclustering,:Rlanguage,thetestcasereduction,clusteranalysis 李鹏宇:基于R语言的测试用例聚类选择程序开发2016届计算机科学与技术专业毕业设计(论文)前言随着软件规模的不断增大和软件复杂性的日益提高,市场对软件的质量的要求也不断提高,如何保证软件的质量已成为软件开发过程中越来越重要的问题。软件测试时保证软件质量的重要手段,软件测试直接决定软件产品的质量。软件测试中测试用例的设计是一个非常高效的方法,可是随着软件越来越复杂,需要的测试用例数量也越来越多,这个时候测试用例的冗余也就慢慢的显现,急需一种可以很好的解决测试用例的冗余的方法又不减少测试用例的检错能力,本毕设就针对这个问题提出解决方案。本毕设是基于R语言的测试用例聚类选择程序的开发,主要用到R语言的聚类分析,其中R是一门非常强大的数据分析的语言,它可以很好的进行聚类分析,通过R语言的聚类分析,可以清晰的看到每个测试用例所属的分类,并进行后续的分析。在分析过程中涉及到的数据的问题都是有文件读取,聚类的结果也是存放入文件。本论文比较详细的写了从R语言的聚类过程,全论文总共分为5章。第1章介绍了此课题背景与意义还有一些国内外的研究概况,本课题主要研究的内容、研究过程中主要的创新点等等。第2章写的是做此课题的需求分析,主要从系统的需求分析和性能的需求分析两个方面展开所写。深入研究需求,从而确定此需求是真正存在的。第3章写的是实现本课题的程序所需要的环境的搭建以及一些实现本课题所需要的技术的积累,有一些R语言的简介、聚类分析的名词解释等等。第4章是本课题的核心部分,详细写了系统总体的设计,还包括一些子功能模块的概要设计与实现,包括了前台客户端的实现,还有后端服务器的实现。第5章为一些总结和展望,有一部分我的小结,主要反映我再做此课题所遇到的问题并如何解决的,还有就是做此课题的收获等等。当然真理是相对的,实践是多元的,读者就是最好的老师,尽管我在李鹏宇:基于R语言的测试用例聚类选择程序开发2016届计算机科学与技术专业毕业设计(论文)写本论文是算是非常的认真对待,但是由于时间的仓促,本论文中还是有可能出现错误之处,希望广大的读者批评改正。李鹏宇:基于R语言的测试用例聚类选择程序开发2016届计算机科学与技术专业毕业设计(论文)目录摘要 1ABSTRACT 2前言 4第1章 概述 课题背景与意义 国内外研究概况 4第2章需求分析 5第3章环境搭建与技术简介 10第4章系统设计与功能实现 12李鹏宇:基于R语言的测试用例聚类选择程序开发2016届计算机科学与技术专业毕业设计(论文) 21第5章总结与展望 ++与R语言相互调用问题 26致谢 27参考文献 29附录 30 2016届计算机科学与技术专业毕业设计(论文)3011概述课题背景与意义随着互联网的发展,软件应用也越来越重要,软件的质量也受到了软件开发人员与用户的重视。而软件的质量就是软件的生命,它可以直接影响到软件的使用和维护。在软件开发的过程中,软件测试时保证软件质量的不可缺少的一个环节,它能尽可能多的发现软件中存在的问题,并且期望通过改错来消除缺陷,最终来提高软件的质量,而软件测试所需要的资源又是很大的,所以大部分的企业都有专门的软件测试部门,其根据固定的步骤测试软件从而发现软件中的错误,并把这些错误反馈给开发人员进行修改,来减少软件的错误。而随着软件的规模越来越大,测试用例的设计、执行、管理与维护所要消耗大量的人力、物力,测试的成本太大,并且测试资源又是有限的,所以测试用例的约简是非常重要也是必要的。而软件技术的不断发展与完善,传统的测试用例约简算法也将面临新的挑战,既要能够约简测试用例集,又要能都让其拥有足够的检错能力。进行多方面的比较,希望能够找到一个合适的平衡点来弥补以前技术的缺陷。而基于聚类算法的测试用例的选择的基本思想是:属于同一类的测试用例具有相似的行为,而不同类的测试用例的行为差异较大。因此,某个测试用例可以检测某一个故障,那么属于同一类的其它的测试用例也同样可以检测到这一故障。采用基于测试用例的覆盖度的测试用例聚类算法可以有效的对测试用例约简,开始将测试用例分为不同的分类,然后再分类中抽样一部分测试用例,如果这部分测试用例可以定位缺陷,那就认为本类中测试用例大部分可以检测错误,保留本类中所有的测试用例。如果本类中大部分测试用例都不能检测错误,则认为本类不具备检测错误的能力,李鹏宇:基于R语言的测试用例聚类选择程序开发2016届计算机科学与技术专业毕业设计(论文)2311可删除本类所有测试用例。而数据挖掘是处理大数据的有效途径,在软件测试里数据挖掘也具有广阔的应用前景,对于数据挖掘的算法的研究也是尤为重要,因为数据挖掘对象是海量的数据,一个好的算法可以大大的提高计算的速度,减少计算机资源的耗用。数据挖掘算法也是一个非常活跃的领域,不断的有新的算法提出。而分类、聚类算法的研究又是数据挖掘算法活跃的领域,所以对分类、聚类的研究也是非常的重要。所以本次毕设着重算法的研究,应用R语言实现一些聚类算法。国内外研究概况目前,国内外的研究人员也提出了许多测试用例选择技术来约简测试用例集,在约简测试用例选择的领域中也各自都有了突破,也出现了许多成熟并且实用的技术,这些技术的目的就是减少测试用例的数量,以期望获得一个较小的测试用例集。但是这也不是特别的完美,也有可能删除了一些真正可以检测错误的测试用例,而保留了一下不能检测错误的测试用例,因此,我们要在执行测试用例所需要的资源与测试用例自己的错误检测能力两方面做出权衡,这才是现在所有测试用例选择技术的核心问题。而现在大多数技术都没有很好的权衡这两个方面,有些技术只关注测试用例数量的减少,初始的测试用例会根据特定的测试需求来进行约简,使得结果子集达到一定的覆盖度即可。然而一些研究表明,单单的满足覆盖度标准的测试用例虽然能够显著的降低测试的成本,但也会严重丧失错误检测能力,因此,这种方案在一定程度上不可取。而另一方面,很多的技术都关注测试用例子集的检错能力,争取结果子集与初始测试用例的检错能力相同或近似。但这一类技术过于保守,在回归测试过程中,一个测试用例可以发现错误,那么它必然经过程序的修改部分,反之亦然,所以这一类技术会不恰当的选择一些经过程序修改但是结果正确的测试用例,李鹏宇:基于R语言的测试用例聚类选择程序开发