文档介绍:特定领域低车木ǘ扔胨俣任侍庋芯摘要目前,各国的研究机构和公司都加紧研究面向实用的际酰经过五十多年的艰苦努力,人们在文字识别领域取得了众多成果,逐渐成熟的文字识别技术使得满足金融、邮电通信、新闻出版、办公自动化等领域对实用化际醯钠惹行枨蟪晌?赡堋K淙蛔近几年才开始尝试把际跤τ玫浇鹑谄本莺托畔⒓焖髁煊颍是由于强烈的市场需求的推动,这些研究方向已经逐渐成为文字识别领域的两大应用热点,大大推动了砺酆图际醯慕徊椒⒄埂在金融领域,饕S糜诙越鹑谄本萆系男畔⒔惺侗穑完成自动化的结算、后督等功能;在信息检索领域,主要利用纸质媒介上的信息转换为可供计算机处理的格式,使用户能够方便的检索和访问,同时提供进一步信息挖掘的基础。各方面对此都非常重视,北京邮电大学模式识别实验室笛槭的金融票据际跹芯坎唤鲇胄矶嗥笠岛鸵胁棵耪箍A撕献鳎也受到了国家钅康闹С帧T谡庵直尘跋拢疚牡难芯磕康木是参考国内外最新研究进展,在实验室的技术积累基础之上,在“金融票据低持械某商坠丶际酢钡墓项目的支持下,对金融票据低持械墓丶际踅醒芯亢透慕⒔岷献北京邮电大学博士论文
知识水坝***@pologoogle为您整理
新的信息检索领域的应用,提出相应的解决思路。本文进行的主要杂诤鹤质侗鹫庋桓鐾臣颇J绞侗鸬奈侍饫此担盗费的数量和质量对于系统的识别性能是非常关键的。当训练样本的数量和质量不能满足需要时,我们无法正确估计样本的统计分布,无法得到最优的识别率。本文提出一种新的基于余弦整形变换的手写汉字训练样本生成方法,可有效提高现有手写汉字识别系统的识别性能。通过对原始训练样本进行基于余弦整形变换的样本生成和样本筛选,一定程度上缓解了某些条件下训练样本不足的问题,增强了识别器的扩展能力和鲁棒性。中刺搴鹤直湫挝侍馐鞘中刺搴鹤质侗鹬械墓丶侍猓橐化处理是直接从汉字点阵图像上矫正手写变形、减小属于同一类别的不同模式之间差异的主要途径。但是,在对图像进行规整的过程中,也引进了可能会影响识别精度的锯齿等不利因素。为了更有效的提取手写汉字的特征,提高识别精度,本文提出了一种利用非线性归一化过程产生的坐标变换信息来提取手写汉字有效特征的方法。该方法通过非线性归一化获得各有效像素点在原汉字图像及规整后汉字图像中的坐标变换关系,在原图像上抽取各点特征,在归一化图像上进行网格的均匀划分和特征统计并形成用于分类的特征向量。该方法有效克服了以往先进行归一化预处理方法和动态网格方法的一些不足,兼顾了与传统结构特征提取方法的有效结合。工作如下:摘要
知识水坝***@pologoogle为您整理
芯苛嘶赑和氖中春鹤痔卣餮顾跷侍猓ü卣压缩,使原先的高维特征能够高效地用于实际识别过程,在保证汉字识别率的情况下,特征矢量维数大大降低,使用基于姆椒在一定的压缩比率下,汉字识别率也得到了改善。鹑谄本葜惺中刺褰鹑诤鹤值氖侗鹫饫辔侍猓粲诒尘昂妥形情况都相对复杂的小字符集汉字识别问题,对识别器的区分能力和鲁棒性都有较强的要求。实验表明,使用马氏距离进行分类,通过适当选择参数,可以达到较高的精度,但运算量非常大,难以用于实际系统。本文提出渐进的马氏距离计算方法,并将其应用到金融汉字的识别系统中,在保证识别精度的同时,大大提高了系统的处理速度。在针对实际采集的金融票据中汉字的实验表明,该方法的效果是非常显著的。芯棵嫦蛲枷裥畔⒓焖饔胪枷裥畔⒐说腛技术和系统框架,探索传统际跞绾胃痈咝вτ茫绾斡胄畔⒓焖骱托畔过滤系统紧密结合,提出基本的解决思路。关键词模式识别文字识别训练样本生成加权动态网格特征提取渐进的马氏距离北京邮电大学博士论文摘要
,饥..琾.,,甌疭,:甀琫瓵瑆北京邮电丈学博士论文摘要
·.甈甒琣—;,.瑃.,琣硒畁—廿——’瓵.’
,,,
导师签名:囟聋医墨本人签名::医粗日期:.:埃畆独创性虼葱滦声明本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。关于论文使用授权的说明学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笞袷卮斯娑保密论文注释:本学位论文属于保密在一