文档介绍:摘要汉字有数千年的历史,也是世界上使用人数最多的文字,并且它不同于字母化和拼音化的文字,因此,汉字识别技术研究是社会信息化发展的关键因素。在这个信息爆炸的年代,如何让计算机高效地“理解绱酥嗟奶乇鹗怯∷⑻搴鹤中畔ⅲ源私谑〈量的人力,是汉字识别识别技术的重要问题。提高印刷体汉字识别效果,包括识别率和识别速度,对于办公自动化、机器翻译和人工智能等高科技领域,,从最为影响印刷体汉字识别效果的特征提取和匹配识别两个方面分别进行阐述。文章对这两个方面的算法进行了仔细的研究,同时做出了重要的改进。相比原算法,改进算法在效率上有疚淖酆峡悸橇撕鹤纸峁固卣骱屯臣铺卣鞯挠湃钡悖治隽酥疃嘞秩缃窈鹤质别中常用的特征类型,有繁简度特征、连通体及封闭区域特征、外围及网格特征和汉字纹理特征等。在研究这些特征提取算法的基础上,分析它们存在的问题,并提出了相应的改进算法。这些改进算法一定程度上克服或者减弱了原有的问题,为实现组合优化特征提供了有力保证。另外也提出了汉字不变编码特征和基于汉字笔画类型的特征点特征以及囊恢指慕惴ń辛俗邢傅匮芯浚⒅鹨环治隽怂堑挠湃钡悖攵杂刷体汉字识别提出了对应的问题解决方案。最后提出了一种基于呕跏祭嘀心的改进劾嗨惴ǎ盟惴ㄓ行У亟岷狭嘶志劾嗪突憔劬劾嗨惴ǖ挠诺恪J验表明,该方法具有聚类准确率高,聚类速度快等优点。在基于对汉字特征提取和匹配识别环节的重点研究的基础之上,统筹考虑整个系统关键词:印刷体汉字识别;特征提取;聚类方法;黄ヅ涫侗和理论意义。了很大的提升。本文的主要工作如下:等特征,在很大程度上提升了本套印刷体汉字识别系统的识别效果。谄ヅ涫侗鸹方冢疚亩猿S玫木劾嗨惴ǎ↖、.流程配置,并开发出一套印刷体汉字识别系统,并取得了令人满意的识别效果。
知识水坝***@pologoogle为您整理
.,甅琲琔,甿珹琣,大连理工大学硕士学位论文甀琫,瓹ⅱ鬷,.,,,琧瑃,,瓼,甋皍盨琲琱—,.—
知识水坝***@pologoogle为您整理
篜印刷体汉字识别系统的特征提取和匹配识别研究猰;;琲籉;
作者签名:摹缓炖糒——一日期:肆年—上月崛学位论文题目:血剧垒这整幺蜀,鬟必舭旌。叁盘区砬幺割碰大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。
学位论文题目:哿皿陶&&超掣玺嘘耸羟纪旌豇劢啦圆避巨趔!R日期:超芷年立月—厶期:地芏年—隆籐日大连理工大学学位论文版权使用授权书本人完全了解学校有关学位论文知识产权的规定,在校攻读学位期间论文工作的知识产权属于大连理工大学,允许论文被查阅和借阅。学校有权保留论文并向国家有关部门或机构送交论文的复印件和电子版,可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印、或扫描等复制手段保存和汇编本学位论文。作者签名:导师签名:人选理喝搜妒芯可宦畚
绪论汉字识别的研究意义印刷体汉字识别技术的发展历程汉字已有数千年的历史,是中华民族文化的重要结晶,闪烁着中国人民智慧的光芒。同时也是世界上使用人数最多和数量最多的文字之一。现如今,汉字印刷材料的数量大大增加,一些专业单位如新闻社、图书馆、古籍出版社、档案馆等所接触的印刷材料更是浩如烟海,信息量均是爆炸性增长,毕竟阅读印刷材料更为符合人的自然阅读习惯。然而,汉字是非字母化、非拼音化的文字,因此,如何将汉字快速高效地输入计算机,更是传播与弘扬中华民族悠久历史文化的关键问题5斯ぜ胨俣炔唤雎依投强度大,一般的使用者每分钟只能输入个汉字。这种方法不适用于需要处理大高,利用人工方法进行汉字输入也将面临经济效益的挑战。因此,对于大量已有的文档因此,汉字识别技术也越来越受到人们的重视。汉字识别技术已经呈现出了广泛的应用前景,它主要应用在中文信息处理、办公室自动化、机器翻译、人工智能等高技术面各学科的发展给它的研究提供了工具;另一方面,它的研究与发展也必将促进各学科计算机技术的快速发展和普及,为文字识别技术应运而生提供了必备条件。加上人们对信息社会发展的要求越来越高,文字识别技术的快速发展可想而知。印刷体文字的识别可以说很早就成为人们的梦想,早在年,驮诘鹿竦昧艘幌钣泄淖ɡE访拦椅A私ê迫缪毯!⒂肴站阍龅拇罅勘ǹ又尽⑽募柿虾偷ゾ报表等文字材料输入计算机进行信息处理,从年代就丌始了西文际醯难芯浚是信息处理的一个关键问题,也是关系到计算机技术能否在我国真正普及的关键问题