1 / 5
文档名称:

病态嗓音特征的神经网络选择.doc

格式:doc   页数:5
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

病态嗓音特征的神经网络选择.doc

上传人:jemsbln680 2014/3/10 文件大小:0 KB

下载得到文件列表

病态嗓音特征的神经网络选择.doc

文档介绍

文档介绍:病态嗓音特征的神经网络选择
于燕平胡维平
摘要:病态嗓音自动检测和评价的关键是有效提取相关的特征,但一般的提取原则是尽可能的把相关特征纳入特征集,其结果就很难避免各种特征的相关和冗余信息,并对随后的识别效率和检测带来负面影响,因此特征优选工作就显得非常重要。本研究对待识别嗓音样本分别提取出两种特征参数(传统声学参数和基于小波变换提出的特征参数)后,利用神经网络分别对这两种特征参数进行了特征选择和优化,并分别对选出的各组特征进行了识别,结果表明基于神经网络的特征选择方法是有效的,从基于小波变换提出的特征中选出的7维特征矢量完全能取代原始特征矢量,%,%的识别结果。
关键词:病态嗓音;神经网络;显著性度量;高斯混合模型;
引言
嗓音的产生是一个复杂的生理、物理过程,由于各种原因造成的嗓音疾病阻碍了人们正常的社会交往和信息交流。如何保留和提高喉发音功能及其检测方法成为了众多信号处理及统计模式识别领域研究者关注的焦点[1]。
建立在声学参数分析基础上的病态嗓音检测与评价始终无法摆脱医生的主观判断。随着计算机技术及统计模式识别的迅猛发展,建立在模型统计基础上的病态嗓音自动检测也迅速成为了研究热点,经过几十年的发展,形成了众多的研究方法[2]。但无论以何种方式提取出的参数总是尽可能的把所有特征纳入特征矢量集,这样就难以避免冗余,使得建立的模型变得复杂,并因某些特征加入而导致识别性能降低。而要使病态嗓音识别应用于临床,我们希望得到的是一组既简单又容易实现的特征。因此对提取出的病态嗓音特征作进一步的优化,选出有效的特征将对病态嗓音的自动检测具有重要的意义。
传统穷举法特征选择方法,由于较多的特征将产生大量的组合,大大的增加了计算量。人工神经网络具有很强的聚类能力和静态分类能力,被广泛用于特征提取、选择和各种分类判决[3]。文中分别用传统声学参数方法与基于小波变换方法提取出病态嗓音特征,利用神经网络对提出的特征进行了特征选择,并对比分析了特征选择前后对病态嗓音的识别性能。
1 数据来源
实验数据来源于临床病例,采集数据时的环境要求在安静的室内进行;采样频率为16 kHz,量化精度16 bit,~3 s;受试声样为元音[a][4],分别对正常人和患有各类喉科疾病的对象进行语音采样。正常对照组242例,年龄18~40周岁,平均年龄25周岁,近期无喉部疾病者;病态嗓音组年龄15~50周岁,平均年龄27周岁,为前来医院就诊临床病例。实验时,将数据库的242例正常嗓音和234例病态嗓音任意分割成两部分,其中取正常嗓音和病态嗓音各80例(近似1/3样本数)作为模型训练集;其余部分作为测试集,分别为162例正常嗓音和154例病态嗓音[5]。
2 基于神经网络特征选择的原理
神经网络模型选择单隐含层前馈网络如图1所示。
图1 单隐含层前馈网络结构图
The chart of the single-layer work of feed-forward
如果有足够的隐层节点,一个单隐含层的网络就足以逼近任意的网络[6],这种网络算法分为两个过程:模式从输入层通过隐含层逐层向输出层传播,误差从输出层经隐含层逐层向后传播。隐层和输出层激活函数使用sigmoid函数,如式(1):
(1)
特征提取的目的