文档介绍:兰州理工大学
硕士学位论文
基于内容的图像元搜索引擎技术研究
姓名:王健琨
申请学位级别:硕士
专业:计算机应用技术
指导教师:李明
20080326
摘要数字化图像作为多媒体信息的一个重要组成部分,尤其以生动的形象、易于理解的表现形式,使之成为在商业、教育、科技等多方面广泛应用的媒体形式之一。随着网络中图像信息的日益丰富,枷袼阉饕婕撼晌S没Ъ焖魍图像信息的主要工具。但是目前无论是基于网页的图像搜索引擎还是元搜索引擎,其对图像的检索还不能令用户达到十分满意的程度,还存在着很多问题。为了使图像信息得到更快捷、更有效的获取和使用,对于图像搜索引擎的研究是极本文首先概述图像搜索引擎的工作原理和分类:通过对图像搜索引擎的研究和应用现状的分析,指出了现有图像搜索引擎存在的问题及其发展趋势。其次通搜索引擎检索模式的特点和不足。然后分析了元搜索引擎的原理和分类,并结合图像检索的特点提出了并行图像元搜索引擎框架。最后提出一种基于改进的中心点聚类算法和遗传算法的图像元搜索引擎模型。该模型首先通过并行图像元搜索引擎技术爬取图像,将爬取到的图像存储于支持快速相似图像检索的多维索引结构的图像索引数据库中;图像经过向量化表则和适应度函数对检索结果进行优化排序,最后将排序后的更精确的图像集提供关键词:图像搜索引擎;图像检索;特征提取;语义提取;聚类算法;遗传算法为重要的。过描述图像特征信息的三层模型,分析了基于文本、基于内容和基于语义的图像示之后运用改进的行牡憔劾嗨惴ń蟹掷啵缓笸ü厥馍杓频囊糯ū嗦牍给用户。硕十学位论文一
·王譬础·鰃珊恤蚰觚甿,琖¨,,,豫‘·甿鎒,;;;,瑆·‘瓾,俊緄甋畉鴕:瑃.,·,‘·:籉。籹珏.‘
插图索引图像特征的层次模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯并行图像元搜索引擎框架图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图用户界面模块图⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯主调度模块图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯¨⋯⋯·图返回信息处理模块图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图像元搜索引擎系统结构图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯”行牡愀慕惴ê姆咽奔溆胪枷窦笮”冉稀行牡愀慕惴ㄓ雓中心点算法比较⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯图图基于关键字的语义网络⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图元搜索引擎原理图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯任务处理器的功能模块图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图任务分配模块图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图不同迪耴中心点改进算法耗费时间比较⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯硕十学位论文Ⅲ
附表索引表遗传算法参数⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯基于内容的图像元搜索引擎技术研究Ⅳ
导师签名。庞,、作者签名:殳便氓作者签名:互谈氓兰州理工大学学位论文原创性声明和使用授权说明∥⋯/,原创性声明学位论文版权使用授权书本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有库》,并通过网络向社会公众提供信息服务。日期:口月歹日日期:嗄辏耲—目已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。日期:矿移年乱寥权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权兰州理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据
,加上数字摄像设备的普及,在网页上使用图像变得非常普及。图像能极大的丰富网页的可观性,增强用户的对信息的直观认识,已经成为当今网页不可或缺的一部分。这些网页图像成为了用户获取感兴趣图像的一个重要来源。如何根据用户需求有效的搜集这些图像资料成为当前学界研究的一个热点。从而也提出了新的挑战:初始的图像搜索系统通过人工标注进行索引检索,缺点是不仅费时费力,而且由于自然语言的模糊性和人工标注存在偏差,效果很不理想。由此基础上发展的基于内容的图像搜索系统,一定程度上改善了这个问题。但由于目前技术上纯粹利用图像的底层特征去逼近高层语义仍然存在很大的困难,因此基于内容的图像搜索系统存在较大的局限性。对于互联网的图像搜索系统,由于图像周围的语义环境非常丰富,包括标题、图像说明、环绕文本和链接等,这些语