文档介绍:东北石油大学学生开题报告表
课题名称
基于支持向量机的说话人识别系统径向基核函数算法研究及参数优化
课题来源
实际课题
课题类型
E
指导教师姓名
XXX
学生姓名
XXX
学号
XXXXXX
专业
电子信息工程
开题报告内容:(调研资料的准备,设计目的、要求、思路与预期成果;任务完成的阶段内容及时间安排;完成设计(论文)所具备的条件因素等。)
在毕业设计前期,充分利用图书馆、互联网等获取了支持向量机的相关知识,支持原因及其概述,说话人识别径向基核函数算法研究及参数优化过程中的细节和原理。加之以与导师以及同组同学的讨论,从而确定了题目的设计方案;在后续的设计过程中,我还将继续把握图书馆、互联网等这一重要知识平台获取与设计有关的知识,并加强与导师的沟通,共同解决设计过程中遇到的困难。
本次设计是设计基于向量机的说话人识别系统和实现径向基核函数算法研究与参数优化的过程,在基于说话人识别系统中,如何获得理想的识别率是亟待解决的。核函数是众多影响识别率中最明显的。该系统提高识别率的技术关键是核函数的选取及其参数优化。为此在对三种常用核函数的特点进行研究的基础上,利用网格搜索来分别进行参数优化,通过语音的训练和识别验证其效果。
说话人身份识别属于生物认证技术的一种,是一项根据语音中反映说话人生理和行为特征的语音参数来自动识别说话人身份的技术。过程如图:
预处理特征提取模式匹配后处理
参考模版
由上述过程可以看出,说话人识别过程可分为训练阶段和识别阶段,在训练阶段,系统的每个使用者都得说一定数量的语句,构成一个训练集,系统根据这个训练集得到每个人的特定模版或者模版参量集合。而在识别阶段,从待识别者说出的语音片段中,提取有用的特征参量和在训练中得到的模版进行匹配或者和模版参量比较,根据一定的相似性准择行成判断。
支持向量机方法是建立在统计学****理论的VC维理论和结构风险最小原理基础上根据有限的样本信息在模型的复杂性和无错误识别任意样本的能力之间寻求最佳折衷。所以支持向量机的说话人识别系统是一种更精确的对说话人进行识别的系统。把原问题空间中的训练样本变成特征空间中现行可分的训练样本,是核函数在支持向量机方法的关键而我们用到的则是径向基核函数。
关于参数的选取,在实际应用中,选用参数要根据识别任务来确定,目前参数的选择方法主要有两种;试凑法:在核函数选择以后,首先为惩罚因子C和核函数固有的参数赋一初始值,然后开始测试,根据测试精度重复调整参数值,直至得到满意的测试精度为止。另一种是最优化方法:在数字识别方面总的来讲,最优化方法是一个标准的最小最大化优化问题,可以使用已有的优化工具来实现,难点是如何更新惩罚因子C和核函数。在对核函数特点进行研究的基础上,利用网格搜索法来分别进行参数优选,通过实际语音识别和识别验证识别效果,目前优化参数可以实现识别率》%。
支持向量机诞生后的十几年间,由于其良好的学****性能和推广性能,使其广泛应用在各个领域。但是支持向量机中核函数的参数和惩罚因子C的选取尚缺乏明确的理论依据。以往多采用优化算法进行参数选取,但是也需要预先经验地获得核函数的参数的选取范围。本项目深入地研究了径向基核函数的