1 / 59
文档名称:

基于Adaboost的场景文本定位研究-计算机科学与技术专业论文.docx

格式:docx   大小:1,728KB   页数:59页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于Adaboost的场景文本定位研究-计算机科学与技术专业论文.docx

上传人:wz_198613 2019/1/13 文件大小:1.69 MB

下载得到文件列表

基于Adaboost的场景文本定位研究-计算机科学与技术专业论文.docx

相关文档

文档介绍

文档介绍:ClassifiedIndex:TP391DissertationfortheMasterDegreeinEngineeringResearchonTextLocationBasedonAdaboostinNaturalImagesCandidate: ZhengLiangSupervisor: YinFangAcademicDegreeAppliedfor: MasterofEngineeringSpecialty: ComputerAppliedTechnologyDateofOralExamination: March,2016University: HarbinUniversityofScienceandTechnology哈尔滨理工大学硕士学位论文原创性声明本人郑重声明:此处所提交的硕士学位论文《基于Adaboost的场景文本定位研究》,是本人在导师指导下,在哈尔滨理工大学攻读硕士学位期间独立进行研究工作所取得的成果。据本人所知,论文中除已注明部分外不包含他人已发表或撰写过的研究成果。对本文研究工作做出贡献的个人和集体,均已在文中以明确方式注明。本声明的法律结果将完全由本人承担。作者签名:郑亮 日期:2016年3月19日哈尔滨理工大学硕士学位论文使用授权书《基于Adaboost的场景文本定位研究》系本人在哈尔滨理工大学攻读硕士学位期间在导师指导下完成的硕士学位论文。本论文的研究成果归哈尔滨理工大学所有,本论文的研究内容不得以其他单位的名义发表。本人完全了解哈尔滨理工大学关于保存、使用学位论文的规定,同意学校保留并向有关部门提交论文和电子版本,允许论文被查阅和借阅。本人授权哈尔滨理工大学可以采用影印、缩印或其他复制手段保存论文,可以公布论文的全部或部分内容。本学位论文属于保密 ,在 年解密后适用授权书。不保密√ 。(请在以上相应方框内打√)作者签名: 郑亮 日期: 2016 年3月 19 日导师签名: 尹芳 日期: 2016 年3月 19 日基于Adaboost的场景文本定位研究摘要随着多媒体网络技术的发展,大量场景图片进入了人们的学习、生活和工作当中,场景中的文本信息作为一种重要的语义信息,对场景的理解、分析和检索有着重要的作用。因为自然场景中文本的颜色五颜六色,字体大小不一,这使得场景中的文本定位比起传统文档文本定位更加具有复杂性,因此场景中的文本定位成为了计算机视觉中的重要研究课题。本文在研究和总结近10年国内外文本定位方法的基础之上,对场景文本定位进行了深入研究,提出一种基于Adaboost的场景文本定位方法,主要包含图像的预处理、生成候选文本区域、特征提取和候选文本区域的分类四部分。在预处理阶段,通过实验比较了灰度化处理的三种方法,最大值法、平均值法和加权平均值法,并对实验结果的优缺点进行对比分析,提出了选用加权平均值的方法对图像进行灰度化处理;提出了一种基于改进的Sobel算子边缘检测算法,实验结果表明,本方法不仅能够有效地提取图像的边缘,而且能够很好地解决边缘检漏问题,并且具有一定的抗噪性能。在生成候选文本区域过程中,本文提出了使用文本尺寸特征和边缘密度特征来表征文本字符特征,实验表明,利用这两种特征对连通区域进行分析与筛选,能够大量地排除明显不属于文本区域的连通区域,最终得到候选文本区域。本文提取了4类场景文本特征,分别是Gabor特征、笔画密度、纹理统计特征和图像导数的方差和期望,实验结果表明,这4类文本特征分别构建的分类器对文本区域的分类都有一定的作用。本文通过改进经典的Adaboost算法,提出基于Adaboost的场景文本定位方法,利用分类与回归决策树((CART,ClassificationAndRegressionTree)的Adaboost算法对4类本文提取的文本特征生成的弱分类器进行组合,生成了一个对场景文本区域具有很强分类能力的场景文本分类器,然后利用Adaboost强分类器对候选文本区域进行筛选,最终获得了正确的文本区域。本文建立的数据库包含了300幅自然场景图像,分类器的训练样本为200幅图像,分类器的测试样本为100幅图像。%,%。实验表明,利用同样的测试样本,I-本文定位方法优于文献所提供的的方法,不仅对场景文本图像中字体、大小和颜色多变的文本具有很好的定位效果,并且具有非常高的召回率和准确率。关键词 文本定位;连通区域;特征提取;候选文本区域II-worktechnology,alargenumberofsceneimagesareintopeople'sstudy,,textinformationinthescen