文档介绍:身份证图象的压缩
(信息工程学院,电子信息工程陈明佳)
(学号:2000132025)
摘要:本论文提出基于链码的身份证图象文字信息压缩算法,主要是通过数字图象
处理中的基本方法,将身份证数字图象中的诸如姓名、地址的信息提取并以链码的方式编码
保存。在文字信息提取时,提出自适应阈值分割的方法,这是关键的一步。本论文还将用到
如平滑、细化、边界跟踪等处理。
关键词:链码,自适应阈值分割,平滑,细化,边界跟踪
教师点评:论文针对手持式输入扫描设备所获得的身份证扫描图象的压缩问题,提出了
一种不规则分块的自适应阈值分割方法,有效地实现了文字的分割。在此基础上,通过细化
和边界跟踪,形成链码以实现图象压缩的目的,论文论述清晰,实验表述详尽,具有一定的
创新性,其方法还可以应用于其他证件图象的压缩。(点评教师:黄建军,副教授)
一引言
随着计算机技术的蓬勃发展,计算机运算速度不断提升,利用计算机对图象处理已经
得到了比较成熟地发展。正像任何一门学科的产生一样,数字图象处理这门学科的形成也是
和社会生产力发展的需要分不开的。身份证图象的扫描输入可以省去人工记录的工作,但手
持式设备往往存储容量有限或传输带宽较窄,因此,数据量的压缩可以让信息在传输中占用
更少的带宽,同时可以在有限的存储空间保存足够的图象数据。
二基于链码的身份证图象压缩
身份证图象的压缩关键的两个部分就的身份证文字信息的提取和文字信息得编码两
部分,文字信息的提取主要是通过图象的分割和细化、信息的编码是通过链码的方式来实现
的。
§ 自适应阈值分割算法
因为我们希望细化后得到的是能够代表文字笔画的单像素笔画以便于编码,所以应考虑
区域分割,同时,串行的区域分割涉及设定种子点和中间变量的存储问题,比较复杂,为方
便和使用起见,本设计选择了并行的区域分割,也就是阈值分割。在这里所处理的图象(身
份证图象)背景是比较复杂的,除了在预处理中已经去除的网格和噪声点。还有身份证长城
型防伪标记的反光(如图 )所示,这对文字和背景之间的对比度影响是相当大的的。尤
其是防伪标记覆盖文字的一部分,这样文字就处于两种背景的交界位置,用同一阈值去分割,
很大机会只能将文字的一半分为文字,另外一半就被分作了背景。导致这一情况的原因是防
1
伪标记区域中,文字和背景的对比度相对较小。在本设计中,采用自适应阈值的分割方法
来解决这一问题,将图象分成防伪标记区和正常区,在不同的区域单独计算阈值再进行分割,
再把分割后的两个区域合并,这样针对不同的对比度进行分割,得到了较好的效果,具体做
法是设置一个较高的门限将两种区域分开。
§ 迭代阈值选取方法
自适应阈值分割将图象分为防伪标记区和背景区,每
个区域都分别计算自己的全局阈值进行分割,然后再将各
个区域分割的结果相加,才得到最后的结果,在每个区域
全局阈值选取的时候是采用迭代计算阈值的方法得到的。
通过阈值迭代的方式可以通过程序自动搜寻出比较合适
的阈值。此阈值选取方法先用初始的开关函数把原图像素
分成前景、背景两大类,然后分别对其进行积分并将结果
取平均以获取一新的阈值,之后再次按此阈值控制
开关将图像分成前景、背景,并用作新