1 / 4
文档名称:

基于矢量量化的时序说话人聚类方法.pdf

格式:pdf   大小:299KB   页数:4页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于矢量量化的时序说话人聚类方法.pdf

上传人:yinjiong623147 2021/4/9 文件大小:299 KB

下载得到文件列表

基于矢量量化的时序说话人聚类方法.pdf

文档介绍

文档介绍:第 卷 第 期 年 月 科 学 技 术 与 工 程 . .
— — ...
基于矢量量化 的时序说话人 聚类方法
陈祝 允 李艳雄 杜佳媛
华南理工 大学 电子与信 息学 院 ,广州
摘 要 针对传统分层 聚类方法运 算速度 较慢 的问题 ,提 出一种 基于 矢量量化 的时序说话人 聚类方 法。首先 对各语 音段 的
特征进行 矢量量化 得到各语 音段的码本 ,然后采用 贝叶斯信息判据计算各码本 之 间的距离 ,最 后按时 间先 后顺序进行 说话人
聚类。采用会议和新 闻语 音数据进行 测试 ,实验结果表 明:会议语 音的说话人 聚类 值为 .% ,新 闻语音 的说 话人聚类
值为 .% ;在处理速度方面 ,该 方法比无矢量量化 时序聚类 方法提 高 了.倍 ,比传统分层聚 类方法提 高 了.倍 。
关键 词 时序说话人聚 类 矢量量化 贝 叶斯信息判据 梅 尔频率倒谱系数
中图法分类号 .; 文献标志码
随着信 息技术 的发展 ,人 们获 取 的语 音 文档 先采用矢量量化对从每个说话人语音段中提取的梅
例如新 闻语音 ,会议语音 ,电话 语音等 越来越丰 尔频率倒谱系数 .,
富¨ 。如何有效管理和使用这些音频数据 已成为 进行压缩 ,然后根据贝叶斯信息判据.
一 个急需解决 的问题。说话人 分割及 聚类 技术 ,进行 时序说话人 聚类
可以有效减轻海量语音文档的管理工作 。其 中,说 ,。作为典
话人聚类是将一个语音文档中由同一个说话人发出 型的说话人特征能对 不同说话人 的特性有 较好反
的语音片段合并起来 ,也就是给每个语音 片段加上 映 ;用矢量量化 的方法可以有效减少特征参数冗余
它所对应说话人身份 的标签。 目前主 流的说话 度 ;利用 判据来检测