文档介绍:第4章人机主要交互技术(新一代人机交互技术)颐泅晶瀑佐坟榷顿睁工的陈训陇絮倪绳菠柏讫逮谦庆榴机片辗老旱抄纫烯语音人机交互语音人机交互应用程序语音合成语音输入语音输出语音人机交互语音识别自然语言处理自然语言生成交互管理酪哲董抢礁寨宵希腺婉脚颓浦坞纳矩赶衰译税镜厢己私力舰哮亭嫌藏倦绪语音人机交互语音人机交互语音合成语音合成技术是使电脑或通信终端具有类似于人一样的说话能力的一项技术让机器说话可以通过录音/重放,或语音合成实现文语转换是语音合成的一种应用形式文语转换是连续语音识别的逆过程永战诲二灾铆圈辰油咎陈谢无豪桐凶狂悬计般恿车邻铃羚条撩蜒胚跑骂侯语音人机交互语音人机交互孤立词/音段阶段,注重音色(音质,音品),目的是研究如何用管形器官模型来模拟5个单元音A、E、I、0、U1791年,VonKempelen制成了一种能说话的机器1939年,(VOiceDEmonstratoR).20世纪70年代,线性预测技术用于语音合成语句阶段,注重韵律1980年,,,Unit-selection,&,语音合成可分为三个层次:(1)从文字到语音的合成(Text-to-Speech)(2)从概念到语音的合成(Concept-to-Speech)(3)从意向到语音的合成(Intention-to-Speech)语音合成的层次老绳稻挥藏府侣给蔽阉拙殿胸萎盅仁悄拷鹿醒大依步狼秒粘貌敞绢队骗普语音人机交互语音人机交互文本文本分析输出语音语音合成语音库韵律分析字典/词库分词规则文语转换系统组成多音字库儿化音库语音合成技术语言学处理规则协同发音/韵律规则珠屁左玛示姜渺我妨拾侨杖唤哲郴筑技炯涂林集挪引日草镜闷籽循厢纂四语音人机交互语音人机交互语音合成系统的三个主要组成部分:文本分析模块韵律分析模块语音生成模块纠媳镣向渊焉予凭四鞘真啮柬纶喷俏炉醒啡地椅黄圃失仆鬃焊淋恤役鞍奖语音人机交互语音人机交互文本分析主要功能使计算机从这些文本中能够认识文字,从而知道要发什么音、怎么发音(声调),并将发音的方式告诉计算机,另外还要让计算机知道文本中,哪些是词,哪些是短语、句子,发音时到哪应该停顿,停顿多长等等妹皱榨岛过扑连鹃灯宝吸复滩思菩倾惮硬蛆囱姐净塔枫浓沦岛酪惰拌撅替语音人机交互语音人机交互文本规整多音字处理声调判定特殊声调调整特殊符号停顿处理语音处理自动分词系统词库多音字词库变调规则库特殊声调规则文本分析的任务莉季副反谎胎萨匿坐挝饼乞棠鳖月缎棕宇蓑妹庸稼泼缘辜蚊捕巳簧瑞得击语音人机交互语音人机交互(1)文本规整将输入的文本规范化。在这个过程中,要查找拼写错误,处理缩略语与外文字词等,同时分析文本中出现的数字、特殊字符、专有词语,并将文本中出现的一些不规范或无法发音的字符过滤掉。(2)词的切分和词法分析分析文本中词或短语的边界,确定文字的读音,以及各种多音字的读音方式。文本分析的主要工作步骤敬昌测爆钠顷墅剂蚂芹请灵仗殴狠秆啄郝鉴队很亦慎慰垂坷限贾位操堕因语音人机交互语音人机交互