(二) 参数编码
参数编码利用人的语音生成模型,它仅传递反映语音波形产生的主要变化参量,
在接收端根据发声机制,由传送来的变化参量人工合成语音。它的主要指标为可懂性。
由于描述人类语音生成模型的参数只有十几个,并且考虑到语音的短时平衡性特点
(20ms 内,语音生成模型参数基本不变),所以此类编码系统可将编码速率压缩得很
低,其速率可以达到 2.4Kbps,甚至2.4Kbps 以下。它的主要问题是合成语音质量差,
特别是自然度较低,对讲话的环境噪声较敏感等。线性预测声码器(LPC)及其它各
种改进型都属于参数编码。其原理如图1-1所示:
(三) 混合编码
混合编码是综合波形编码和参数编码的优点而提出的,其复杂程度介于二者之
间。码激励线性预测编码器(CELP)是混合编码的一个典型代表。这类编码器的共
同特点是:先进行线性预测(LP)分析,去掉语音相关性,然后再用合成分析法及感
知权均方误差最小准则分析出合适的、替代余量信号的最佳激励信号源,最后对 LP
参数和激励信号进行编码和传送。由于这些方案的激励模型和误差计算与时域波形相
联系,使合成语音具有较强的跟踪输入语音变化的性能,从而改善了合成语音的质量
及抗噪声的能力。
1.2.4 衡量语音编码性能的主要因素
语音编码研究的基本问题,就是在给定编码速率的条件下,如何能得到尽量好的
重建语音质量,同时应尽量减小编解码延时及算法的复杂度。也可以说,在给定编码
质量、编解码延时及算法复杂度的条件下,如何降低语音编码所需的比特率,增强其
稳定性。这几个因素之间有着密切的联系,并且在不同的应用中对各方面的侧重要求
也有所不同。
(一) 语音质量
语音质量是衡量语音编码算法优劣的重要指标之一。其评价方法可分为主观评定
和客观评定两大类。
客观评定方法用客观测量的手段来评价语音编码质量,常用的方法有信噪比、加
清/浊音判断 基音周期提取 滤波器参数分析
图1-1 LPC原理图 本科毕业设计说明书(论文) 第5 页 共 42页
权信噪比、平均分段信噪比等。他们都是建立在度量均方法的基础上,其特点是计算
简单,但不能全面反映人对语音质量的感觉。尤其不适合中低速率语音编码的评价,
因此该方法主要适用于速率较高的波形编码类算法。主观评定方法符合人们对语音质
量的感觉,目前得到了广泛的应用。其常用方法为平均意见得分(Mean Opinion Score,
简称MOS 得分)。判断韵字测试(Diagnostic Rhyme Test,简称DRT得分),判断满
意度得分(Diagnostic Acceptability Measure,简称 DAM 得分)等。
MOS 分评定法最为常用,它采用五级评分标准:MOS 分在4.0~5.0分为高品质
数字化语音,达到长途电话网的质量要求,常称之为网络质量;MOS 分在 3.5 分左
右为通信质量,这时能感觉到语音质量有所下降,但不影响正常通话;MOS 分在 3.0
分以下为合成语音质量,此时音质较差。
(二) 编码速率
编码速率可以用“比特/秒”(bit/s 或bps)来度量。它代表了编码的总速率。一般
用 I表示。编码速率也可以用“比特/样点”(b/p)度量,它代表了平均每个语音样点
用多少比特编码,一般用 R 表示。I和R 可以通过采样速率 fs 联系起来:
I=R·fs (1.1)
- 上一篇:基于LabVIEW的爆炸温度场测试系统设计+文献综述
- 下一篇:城市轨道交通车站公共区导向标识系统规划
-
-
-
-
-
-
-
上市公司股权结构对经营绩效的影响研究
中国传统元素在游戏角色...
现代简约美式风格在室内家装中的运用
NFC协议物理层的软件实现+文献综述
高警觉工作人群的元情绪...
巴金《激流三部曲》高觉新的悲剧命运
浅析中国古代宗法制度
江苏省某高中学生体质现状的调查研究
g-C3N4光催化剂的制备和光催化性能研究
C++最短路径算法研究和程序设计