【语音噪声滤除算法的研究】王小平.pdf

摘要众所周知,语言是人类进行相互通信和交流的最方便最捷快的手段.在高度发达的信息社会中用数字化的方法进行语言的传递、储存、识别、合成、增强等是整个数字化通信网中最重要的组成部分之一.其中语音增强是语音信号处理的预处理,其主要目的是从带噪语音中提取尽可能纯洁的原始语音信号.影响语音质量的噪声常有:脉冲噪声、周期噪声、宽带噪声、干扰噪声等.噪声来源众多,随应用场合而异,它们的特性也各不相同。再则,语音增强不但与语音信号数字处理有关,而且涉及到人的听觉感知和语音学,即使在实验室仿真条件下,也难以找到一种通用的语音增强算法,能适用于各种噪声环境本课题是应吉林省公安厅的要求而设计的.

前言语音是众多信息载体中具有最大信息容量的信号,具有最高的智能水平,也是人类用来交流的最自然、最有效的手段。但人们在通信过程中不可避免地会受到来自周围环境、传输媒介引人的噪声、通信设备内部电噪声、乃至其它讲话者的干扰。这些干扰最终将使接收者受到的语音已是非纯净的原始语音信号,而是环境噪声污染使许多语音处理系统的性能急剧恶化。例如,语音识别已取得重大进展,正在步人实用阶段。但目前的识别系统大都是在安静环境中工作的,在噪声环境中尤其是强噪声环境,语音识别系统的识别率将受到严重影响,低速率语音编码,特别是参数编码,也遇到类似问题。

从语音产生的机理上看,两者有明显的差异,因而在特征上也有明显区别.浊音在时域上呈现出明显的周期性.在频域上有共振峰结构,而且能量大部分集中在较低频段内。清音则完全不同,它没有明显的时域和频域特征,类似于白噪声.在语音增强中,可以利用浊音的周期性特征,采用梳状滤波器提取语音分量作为一个随机过程,语音信号可以用统计分析特性来描述这是非平稳、非遍历的随机过程,长时间时域统计特性在语音增强中意义不大。其短时谱幅度的统计特性是时变的,只有当分析顿长趋于无穷大时,才能近似地认为它具有高斯分布、高斯统计模型是根据中心极限定理得到的.