文档介绍:“Web上基于内容的图象检索与基于多视角图象的VR建模”功能说明
“基于内容检索”部分
1 体系结构
2 系统构成
服务器:Web Server,约12000张内容广泛的图片组成的图象库
浏览器:查询前端是用Java语言实现的Applet程序
检索网址: .:8888 (曙光天联Web服务器,测试)
/~cbir/eimgretr (清华PC Linux服务器:英文版)
/~cbir/cimgretr (清华PC Linux服务器:中文版)
3 查询界面与功能
进行一次查询的流程是:Java程序查询界面负责接受用户输入、提取特征、压缩数据,并将最后结果以约定的格式串传送给CGI程序;CGI接受查询请求,将它转化成CbExpr标准查询表达式,并提交给索引搜索引擎检索图象库,返回满足要求的图象的ID号、与查询条件的相似度;CGI再根据查询结果,添加有关信息,动态生成页面,直接返回给用户。
实现了七种特征的前端处理界面,即:主颜色、纹理、色调直方图、轮廓、颜色分布、彩色直方图和主题。
查询前端作为Applet运行于浏览器中,主要有三部分组成:
(1)检索特征预览
全部提供了七种特征,在任意时候只显示其中三个(如上图中所示),用户可用鼠标拖动下面的滑动条以显示别的特征的当前查询值。对每一种特征,都有相应的特证名、Enable选中框和权重滚动条(滚动条前面的Edit 框显示当前的权重值,也可以直接键入)。用户必须选中该特征的Enable框,权重滑动条和对应的特征输入区才可用。在该特征enabled时,鼠标单击这一区域即可激活对应的特征输入模块。
(2)检索控制参数
用户可以选择三种单特征查询组合方式:与、或、权重调节中的一种。他们直接影响对单特征查询结果集的处理:
最大返回结果数。由于图象检索是近似检索,所以查询结果一般都不止一个,我们将满足条件的图片按其相似度从大到小排序,返回前面的若干个。我们规定其合法值是16到100。
最小相似度。图片库中的任意图片与查询条件的相似度在区间[0,1]上,所以应该预定一个阈值,相似度大于它的图片才认为满足条件。在界面上,用户可以输入0到100之间的一个整数。
◆检索精度。即前面所说的epsilon,合法值是0到100。在后台处理时,将它影射到[0,1]区间内。
( 3 ) 特征输入模块
基于内容的图象检索的查询条件提交方式不同于传统的文本检索,针对每一种特征都应设计特定的交互方式。我们约定各个特征的数据交互区域为“工作区”。
4提交特征的分析与实现
主颜色( Dominating Color )
简而言之,主颜色就是图片中占较大比重的颜色。在图象处理学中,主颜色的提取过程是:将图象的各点颜色值( 一般是RGB值)量化到16*16*16的区间内,然后对图象的点聚类。如果某聚类颜色的象素点占图象全部象素的20%以上,就认为该聚类中心颜色是该图的主颜色。可以看出,一幅图片的主颜色可能不止一种。主颜色工作区如下图:
左下部分是主颜色的交互界面。我们实现了两种彩色空间的输入方法:RGB、HSB。由于彩色空间是三维的,无法在平面内同时表示三个分量,所以把颜色的输