文档介绍:万方数据
一种多路实时语种识别系统设计与实现陈学梁,常振超,杨镇西,张丽第卷第计算机应用研究沂纸换幌低彻こ碳际跹芯恐行模V摘要:对语种识别系统的算法运算量和复杂度进行分析可知:其前端特征提取和预处理部分运算量较小,且算法相对灵活;而后端建模分类部分算法运算量较大且算法相对稳定,是系统实现大规模并行处理的瓶颈。基文章编号:..—基于甋的语种识别系统简介年于此,提出了一种的系统实现架构,对前端特征提取采用浮点兴惴ㄊ迪郑蠖嗽虿捎设计进行算法实现,并对系统进行了性能测试和资源分析,验证了设计的合理性。关键词:多路实时;语种识别:;并行处理中图分类号:文献标志码:痡......电信网下语种识别系统面临实时性的需求,而目前主流系统都是基于实验室环境下通用机平台,难以满足大容量并行处理的需求。。。以通用机平台处理语料为例,在奔湎履够处理大约六路话音,难以满足电信网多路同时话音同时接入的实时处理。因此,需要对系统的实时并行处理能力进行研究和提升。对语种识别系统的算法运算量和复杂度进行分析可知:其前端特征提取和预处理部分袢镆舨问墓程,已加入映射怂懔拷闲。颊鱿低吃怂懔康%左右,且算法相对灵活;而后端部分获取和模分类部分惴ㄔ怂懔拷洗螅颊颊鱿低车ィ宜惴相对稳定,需要频繁进行数据的存储访问,是系统实现大规模并行处理的瓶颈。基于此,本文提出了一种的系统实现架构,对前端特征提取采用浮点兴惴ㄊ迪郑后端则采用设计进行算法实现。基于猄的语种识别系统’煞治R韵铝讲糠郑前段特征提取。它包括语音信号预处理和特征参数提取两个阶段Tご戆ㄓ镆粜藕攀只裳炕、预加重凳.⒓雍好鞔窗长头帧〕,帧移L卣魈崛∈保紫忍崛维的美尔频率倒谱系数—,采用半升正弦倒谱提升和倒谱均值归一化,技术抑制特征域噪声,然后将琈肫经—进行扩展得到的滑动差分倒谱,一起构成维特征参数,最后对这维参数进行能量归一化,并利用语音激活检测技术剔除静音帧和噪声。后端分类识别。它包括模型训练和待测语音分类判决两个阶段。训练阶段需训练用于产生P偷耐ㄓ帽尘模型琔薄:陀糜谇指饔镏的P汀蕖!本质是一个大型的怯筛饔种大量的训练语料通过最大期望惴ㄉ傻挠胗镏治薰氐耐骋槐尘澳P汀8菥验值本文中母咚够旌鲜柚梦。盗凡捎锰湾大学林智仁等人开发的开源软件包。,其输入样本为党噶。乖煸砣缦拢航慷窝盗语音通过最大后验概率琈允视只更新均值,自适应系数覷模型得到该语句的高斯混合模型珿辥,然后将此个高斯分量的均值矢量按序排列组成一个高维矢量,即为缤糽所示。测试时,按上述相同方法得到测试语音段的缓蠼其输入到已训练好的薪蟹掷嗯芯觥的核函数采用度量嗬氲腒狶核函数—’,其表达式为·;收稿日期:——;修回日期:—基金项目:国家“奔苹鹱手钅作者简介:陈学梁,男,河南洛耍呒豆こ淌Γ妒浚饕Q芯糠较蛭狥杓啤⑼ㄐ庞胄畔⑾低常怀U癯一校颖焙5人,博士研究生,主要研究方向为设计、┏侨耍こ淌Γ妒浚要研究方向为语种识别、系统级芯片杓疲徽爬一幽闲孪缛耍彩Γ妒浚饕Q芯糠较蛭S镏质侗稹⑾低臣缎酒设计..猯,—,琙.::,;—猻.,,琣..簃;;,..—
万方数据
㈣⋯—叫到睦型璏”癗“皘..躨管理’橇礁鲇镆舳蔚腉;、分别是其趇撕多路实时语种识别系统总体架构设计叫‘蓄凳’卣鬏龃谰卣驣『。:,。¨埃琹三淌荨肛’/石墨。/箍在对一段语音进行测试