文档介绍:第 28 卷第 12 期计算机应用研究畅28 畅12
2011 年 12 月 Vol 畅2011No
Application Research puters Dec
基于随机投影的场景文本图像聚类方法研究倡
徐飞, 刘家锋, 张博宇, 吴锐, 赵巍
(哈尔滨工业大学模式识别研究中心, 哈尔滨 150001)
摘要: 图像中的文本字符存在于杂乱的背景之中,拍摄视角的不同使得文本具有较大的几何变形,再加上存
在光照变化、字符颜色不统一等现象会导致背景分离和文本识别困难。为此提出一种基于图像文本区域的图像
聚类方法。该方法首先对自然场景图像中已定位的文本区域提取局部特征描述,并使用随机投影方法将局部特
征矢量集映射为固定维的特征向量,然后对包含图像文本区域的图像进行聚类。这种方法避免了由图像分割与
字符识别带来的困难。实验结果表明,该方法可以对包含文字的自然场景图像有效地进行聚类,聚类的准确率
能达到 86畅66%。
关键词: 图像文本区域; 图像聚类; 随机投影; 局部特征描述
中图分类号: 319 文献标志码: 文章编号: 1001唱3695(2011)12唱4730唱04
TP A
: /. .
doi j issn
Research on clustering of natural scence images with texts
based on random projection
, 唱, 唱, ,
XU Fei LIU Jia feng ZHANG Bo yu WU Rui ZHAO Wei
( Pattern Recognition Research Center, Harbin Institute of Technology, Harbin 150001, China)
Abstract:
Text characters in the images are. always in plex background and the different film perspective, causes the text唱
characters with large geometric deformation The illumination. or the character color is always not uniform leading to difficul
ties in the background. separating, and text recognition This paper proposed a method which was based on the image text area唱
for image clustering Firstly this method extracted local feature description of the targeted text area. in the image and used ran唱
dom projection method to map the local. feature vectors