1 / 61
文档名称:

基于gmm-ubm的快速说话人识别方法.pdf

格式:pdf   大小:35,502KB   页数:61页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于gmm-ubm的快速说话人识别方法.pdf

上传人:iris028 2021/9/27 文件大小:34.67 MB

下载得到文件列表

基于gmm-ubm的快速说话人识别方法.pdf

相关文档

文档介绍

文档介绍:硕士学位论文
基于 的快速说话人识别方法
王秋雯
哈尔滨工业大学
年 月
国内图书分类号 : 学校代码 :
国际图书分类号 : 密级 :公开
工学硕士学位论文
基于 的快速说话人识别方法
硕 士 研 究生:王秋雯
导 师 :韩纪庆教授
申 请 学 位:工学硕士
学 科 :计算机科学与技术
所 在 单 位:计算机科学与技术学院
答 辩 日 期: 年 月
授予学位单位:哈尔滨工业大学
Classified Index:
.C :
D issertation for the M aster D egree in Engineering
R A PID SPEA K ER REC O G N ITIO N B ASE D O N
G M M -U B M
Candidate :
:
:
:
:
:
:
哈尔滨工业大学工学硕士学位论文
摘 要
文本无 关的说话人识别, 由于其实 际应用下的 灵活性, 而成 为语音识别领
域的研究重点 。自从 年美国国家标准技术研究所 (
, ) 举办的评测中, 高斯混合模型 ——通用背景
模型 ( , ) 作
为基准系 统获得优异识别率后, 该方 向的研究都以 其为基准模型 , 并对其进行
改进 。尽管 说话人识别系统已经取得了 比较令人满意的效果, 但进 行匹配前需
大量的似然 分计算, 由于该因素的影 响使得系统识 别速度明显下 降, 因此实用
性不佳 。本 文的主要目的是在尽量不 降低识别率的 前提下, 减少 计算量以实现
快速说话人识别 。
针对说 话人识别中计算量大 、 运行 速度慢的情况, 本文在基于 树形结构的
核心挑选算法基础上进行改进, 自顶向下搜索 中输出测试语音特征矢量
似然分最 高的分布, 此后与目标说话 人模型匹配时 , 只需计算核 心分布的似然
分进行识别 。改进算法应用到基准系统后, 核心挑选速度提高了 倍。鉴于
特征序列对 最终的识别结果无影响, 因此系统结合矢量序列重排 的剪枝算法后 ,
整个系统速度提高到 倍, 识别率略有降低。为了提高识别率, 论文中将支
持向量机 ( , ) 中径向基核函数引入到说话人识别
中, 识别率提高到与基准系统一致。
本文针 对女性声音在开集识别时识 别率下降明显的情况提出 了概率阈值的
思想, 应用于基准系统后速度有所下降, 识别率提高了 。同时对分段置信
分改进来解 决部分匹配情况对