文档介绍:知识水坝论文
华中科技大学
硕士学位论文
汉字笔迹的笔划提取
姓名:熊鹏
申请学位级别:硕士
专业:计算机软件与理论
指导教师:曹忠升
20080606
知识水坝论文
摘要
在多媒体信息量飞速增长的今天,从包含有汉字信息的图片、视频等媒介
中,进行汉字笔迹的自动识别,成为目前研究的热点。笔划提取是汉字笔迹识
别的一个重要步骤。由于手写汉字具有字量大、书写风格众多、随意性较大和
结构复杂等特点,所以,目前笔划提取还存在许多技术问题,包括汉字分割、
细化和笔划提取等问题,需要进一步研究。
在对汉字书写的特点以及已有的分割方法进行分析的基础上,设计了用密
度聚类来分割汉字的方法。聚类方法以组成汉字的像素点为研究对象,聚类完
成后得到的簇就是分割出来的汉字。实验结果表明,用聚类方法可以有效地解
决汉字粘连等问题。
针对现有的细化算法不能解决细化过程带来的局部结构变形和“伪分支”
的问题,对通用细化算法进行了改进,增加了一些排除规则。实验结果表明,
在改进后算法的效果要比以前好,能够有效地解决原算法存在的结构变形和伪
分支等问题。另外,对轮廓跟踪细化算法作了分析,针对起始点难以确定和跟
踪过程复杂的问题,给出了确定跟踪起始点的方法,并解决了跟踪过程中存在
的一些问题。实验结果表明,轮廓跟踪细化算法能够克服局部结构的变形和“伪
分支”问题。
在笔划提取上,通过分析细化后骨架的交叉点与模糊区域的关系,设计了
合并交叉点并寻找离交叉点最近距离的轮廓点来检测模糊区域的方法。实验结
果表明,该方法能够正确地检测出模糊区域。在检测模糊区域后,分析模糊区
域附近的笔划间的关系,合并笔划段,最后提取出笔划。
关键词:汉字笔迹识别; 密度聚类; 汉字分割; 细化算法; 笔划提取算法
I
Abstract
Writer identification is recognizing Chinese characters written on paper
automatically with the help puter, it has e a white-hot research point in
pattern recognition which is largely different from Printed Chinese Character
Recognition and On-line Handwritten Chinese Character Recognition. Compared
with Printed Chinese Character Recognition, the style of handwritten Chinese
characters is diverse and optional which is hard to find rules in it. On the other hand,
compared with On-line Handwritten Chinese Character Recognition, writer
identification doesn't have any real-time information. As stroke is primitive of
Chinese character, stroke extraction is a significant step in writer identification.
However, stroke extraction is still one of the most challenging research topics
because it involved a large number of characters, considerable writing style and
complex structure. According to the speciality of writer identification, new
algorithms should be proposed.
First, in order to recognize handwritten Chinese characters, dividing document
image into individual characters is a very important step. Upon that density-based
spatial c