文档介绍:多媒体应用系统技术
第五章: 音频素材制作与处理
模拟音频、数字音频
1
语音合成技术
2
语音识别技术
3
*
多媒体应用系统技术
模拟音频
模拟信号、数字信号
时间和幅度上都是连
续 信号称为模拟信
号。
幅度是离散 信号称数字信号。
*
多媒体应用系统技术
模拟音频
声音
声源: 正在发声 物体
产生: 声音是由物体振动产生 声波
声波: 是随时间连续改变 物理量,
是连续 模拟信号, 能够用振幅、周期、频率描述
声源振动, 经过空气等介质, 把这种振动以机械波 形式传输, 这就是声波。声波传入人 耳朵, 促进耳膜产生振动, 这种耳膜振动被传导到人 听觉神经, 就产生了对“声音” 感觉
*
多媒体应用系统技术
模拟音频
振幅: 声音波形振动 幅度, 表示声音 强弱,即音量(分贝dB)
周期: 声音波形完成一次全振动经过 时间
频率: 声音波形在一秒钟内完成全振动 次数(赫兹HZ)
亚音信号:频率<20hz
超音频信号:频率> 0
音频信号: 介于中间 信号
人耳听不见
*
多媒体应用系统技术
模拟音频
声音三要素
音强: 声音 强弱, 即音量, 与声波振幅成正比
音调: 声音 高低, 与频率相关
音色: 声音 特色。分纯音和复音(不一样频率、不一样振幅)
*
多媒体应用系统技术
模拟音频
模拟音频 处理
被转换成电信号, 由模拟元部件处理。
模拟音频 特点
频率范围
连续性
音质(与频率范围、设备、噪音等原因相关)
*
多媒体应用系统技术
数字音频
数字音频
以二进制 方法统计 音频, 是模拟音频 数字化表示。
实现: 声卡 (采样、量化、编码)
比较
常见格式: wav(微软), midi(乐器数字接口), cda(cd音乐),mp3,wma(微软, 网络音频格式), ra/rm(real networks)
模拟信号
数字信号
存储
磁带、唱片
光盘、硬盘
编辑
不易
容易
压缩
压缩率有限
压缩率高
*
多媒体应用系统技术
语音合成技术
语音合成
是指利用计算机合成语音 一个技术, 使计算机能够产生高清楚度、高自然度 连续语音, 含有类似于人一样 说话 能力
三个层次
文字到语音、 概念到语音、 意向到语音
文语转换实现
文本分析器
韵律分析模块
语音生成模块
*
多媒体应用系统技术
语音合成技术
文语转换过程
(1)文本分析器依据发音字典, 将文本字符串分解为带有属性标识 词和读音符号
(2)韵律分析: 再依据语义规则和语音规则, 为每一个词、每一个音节确定重音等级和语句结构及语气, 以及多种停顿等。
(3)语音合成
波形编辑合成
参数合成份析
规则合成
语音合成特点
自然度 清楚度 表现力 复杂度
*
多媒体应用系统技术