文档介绍:摘要基于遗传算法的混合高斯模型在与文本无关的说话人识别中的应用硕士研究生:沈忱导师:赵力教授东南大学信息科学与工程学院本文主要从说话人识别中模型的初始化、训练和说话人的判别方法以及语音的端点检测等方面作研究探讨。在模型的初始化方面,方法一利用最大似然估计算法对模型进行初始化;方法二利用时间规整化方法对语音进行预处理。,,然后利用算法对初始模型进行修正,。通过选择、交叉和变异,收敛列最优模型。遗传算法采用浮点编码,交叉和变异在种群的胜者组和败者组同时进行。最后改为优胜劣汰。在说话人判别方面砸欢斡镆糁械闹〉梅纸斜浠唬竦米钪盏牡梅郑佣纳剖侗语音的靖点检溯方面,分别介绍了利用过零率和能量的起止点检测方法和利用信嗓比的端点检测方法。关键词:说话人识别,离斯混合模型,改进算法、改进遗传算法、
知识水坝***@pologoogle为您整理
甌甌....,英史摘要..,.琲:瑅.,..瑄,瑆.
知识水坝***@pologoogle为您整理
图片目录圈祷叭耸侗鹣低晨蛲肌图砘楹媳湮O咝宰楹舷低炒致酝肌图砘楹媳湮O咝宰楹舷杲馔图微商法求复倒谱⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图钚∠辔环ㄇ蟾吹蛊住图祷叭耸侗鸬氖噶苛炕ā图矢量量化系统框图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯惴鞒掏肌图奔涔嬲绲慕峁埂图贕说话人辨认系统结构框图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图镆舨P汀图行南鞑ê鼵【俊图P汀图糯惴鞒掏⋯⋯⋯。
表格目录表低呈侗鹇成员密度函数总数为拚蜃颖浠⋯⋯⋯⋯表低呈侗鹇成员密度函数总数为拚蜃颖浠⋯⋯⋯⋯⋯。表低呈侗鹇成员密度函数总数为,修正因子变化表低呈侗鹇成员密度函数总数为,修正因子变化表低呈侗鹇修正因子为3稍泵芏壬故苁浠⋯⋯⋯⋯⋯。表低呈侗鹇成员密度函数总数为,修正因子变化表低呈侗鹇成员密度函数总数为。修正因子变化⋯⋯⋯。
研究生签名:邀趔导师签名:茎坌东南大学学位论文独创性声明东南大学学位论文使用授权声明日本人声明所星交的学位论文是我个人在导师指导下进行的研究工作及取德的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的饪何贡献均已在论文中作了明确的说明并表示了谢意。东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布ǹ论文的全部或部分内容。论文的公布括刊登谌ǘ洗笱а芯可喊炖怼
,它利用语音信号来识别出说话人的身份,与指纹识别、人脸识别、虹膜识别,掌形识别、姿态识别等同属于生物识别的范畴。语音是人的自然属性之一,由于各个说话人发音器官的生理差异以及后天形成的行为差异,每个人的语音都带有强烈的个人色彩。;每个人的声带、咽喉,口腔和鼻腔的构造不同。而且每个人在肺部收缩,压迫气流由支气管经过声门和声道的方式不同,导致每个人的语音特征有极强的个性,:语音信号的采集简易方便,系统设备成本低。因此,语音不仅具有自然唯一性、随身携带性、不会遗忘等特点,还具有数据采集设备的非接触性和简易性等其语音信号的这些优点使得说话人识别在许多领域具有广泛的应用前景。说话人识别在电子商务、消费、银行等远程客户服务的身份认证、军事安全领域的说话人身份自动检测和认证中具有极大的应用价值和广泛的应前景。是当今语音信号处理和生物特征信息检测和识别领域的重要研究方向。在保安领域,可以利用说话人识别作为出入的凭证,如用特定人的声音是实现机密场所的出入人员的检查;在工厂职工的口令实现职工签名管理等。在公安司法领域,可以利用说话人识别作为罪犯身份鉴定的手段。如判断犯罪现场记录的声音是多个攘疑犯中的哪一个人的声音。将说话人辨认和确认结合起来还可以判断出嫌疑犯中是否包含真正的罪犯。,可以利用说话人识别进行指挥员鉴别,然后判断不同的指挥员所处的位置,获取以利用说话人识别作为身份确认的有效手段。如电话预约业务中的声音确认自动转账、余额通知和股票行情咨询等等。在信息服务领域,同样可以利用说话