文档名称：

科技文章.doc

格式：doc 大小：17KB 页数：4页

下载后只包含 1 个 DOC 格式的文档，没有任何的图纸或源代码，查看文件列表

如果您已付费下载过本站文档，您可以点这里二次下载

预览

下载此文档

科技文章.doc

上传人:wz_198614 2017/11/10 文件大小：17 KB

下载得到文件列表

科技文章.doc

相关文档

文档介绍

文档介绍：科技文章
基于模糊聚类表征的音频例子检索及相关
反馈
吴某某,赵某某
(浙江大学,杭州,310027)
摘要:避免先前基于例子的音频检索要按照监督机制训练不同类别的复杂的音频模板,一种新的基于非监
督机制音频例子快速检索方法被提出来。其步骤如下首先从原始音频流中压缩域特征,然后使用时空约束机制实现压缩域特征的模糊聚类,用聚类质心来表征整个音频例子。
关键词:音频检索时空约束模糊聚类相关反馈中国分类号:
Audio clipretrieval and relevance feedback based onthe
audio representation of fuzzy clustering
WU,ZHAO
(Zhejiang, university,Hangzhou,310027)
Abstract:Avoiding generating audio template by supervised learning and find similar audio clip based on pre-trained audio template, every audio clip is presented by limited number of centroids which is extracted by unsupervised learning algorithm. Audio features such as Centroid, Rolloff, Spectral, Flux and RMS are extracted from each overlapping audio frame in the pressed domain.
Keywords: Audio Retrieval Time-Spatial Constraint Fuzzy Clustering Relevance
作为多媒体重要媒质之一的音频蕴涵了丰富语义,从90年代中期开始的基于内容音频检索就研究如何提取音频信息流中的语义信息,以实现对音频数据进行检索:如在“Muscle Fish”中,等特征被提取,然后归一化欧氏距离用来判别提交的检索音频属于音频数据库中哪一类,这种方法取得了81%左右正确率;系数和1个能量特征,对语音、笑声、雨声和双簧管音等6类不同音频类别构造量化树,将每个量化树作为相应类别音频的模板,然后用余弦距离进行相似度量,%的检索平均正确率;采用监督式的学****机制,从每个音频帧中提取感知和物理特征,为每类音频训练支持向量学****机,取得了平均80%左右检索正确率
[4]
[3]
[1]
[2]
1 音频例子表征与检索
MPEG压缩域音频特征提取
MPEG音频压缩利用了“心理声学模型(psychoacoustics model)”,在MPEG压缩领域上直接提取特征,可以保留这些感知特性,实现对音频语义内容的理解。 1) 压缩域特征高斯化处理
音频例子相似度比较
既然每个音频用K个质心来表征,那么两个音频之间的相似度就可以通过质心来计算。
收稿日期;2003-04-02
基金项目;国家科学基金(6980600)。教育部教师基金,高等