1 / 10
文档名称:

基于多类 SVM 的新闻政要人物自动标识.doc

格式:doc   页数:10页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于多类 SVM 的新闻政要人物自动标识.doc

上传人:2028423509 2014/3/19 文件大小:0 KB

下载得到文件列表

基于多类 SVM 的新闻政要人物自动标识.doc

文档介绍

文档介绍:
基于多类 SVM 的新闻政要人物自动标识#
冯晓毅,苏雪平,彭进业,吴俊*
(西北工业大学电子信息学院,西安 710129)
5
10
15
20
25
30
35
40
45
摘要:新闻是描述重要人物及相关事件的信息源。面对图文并茂网络新闻数据的飞速增长,
迫切需要自动挖掘新闻字幕中人名与新闻人脸图像之间的一一对应关系的便捷工具。本文针
对由于不同的表情、光照、姿势等因素带来的视觉图像上的差异性问题,提出基于多类 SVM
的新闻政要人物自动标识方法。首先,针对每个人名,找到与该人名相关的数据,该数据由
包含该人名的所有新闻字幕及相应的新闻图像组成;其次,将人脸检测算法应用于新闻图像,
检测出所有的人脸图像。为了减少计算量并提高聚类的准确率,将人脸图像分成两组图像,
第一组人脸图像由新闻图像只包含一个人脸图像组成,并且这些新闻图像相应的新闻字幕只
包含一个人名;第二组人脸图像由剩余人脸图像组成。对第一组人脸图像进行聚类,聚类中
最大类的人脸图像作为该人名的正例图像,对于其他人名,使用相似的方法找到正例图像;
另外将所有人名的第二组人脸图像作为一个图像子集,在该图像子集中,随机挑选部分作为
反例图像;将所有的正例图像和反例图像用于一对多 SVM 训练,得到多类 SVM。最后,
将多类 SVM 用于识别人名的第二组人脸图像,实现新闻政要人物的自动标识。在大约 50
万幅的雅虎新闻图像数据集上进行实验的结果表明,该方法实现了很好的性能。
关键词:主动形状模型;AP 聚类;多类 SVM
中图分类号:TP
Automatic Identification Celebrity from News Image
Collections Based on Multi-class SVM
FENG Xiaoyi, SU Xueping, PENG Jinye, WU Jun
(School of Electronics and Information, Northwestern Polytechnical University, Xi’an 710129,)
Abstract: News is the important information which related to the celebrity and the event. As the
rapid growth of news data, it is urgent need to automatic mining the relations between the face
image of news and the names of the caption. In the paper, in order to automatically identify
celebrity in news images and solve the diversity problem of visual distribution due to different
factors such as expression, illumination and pose, we propose the method of automatic