【语音噪声滤除算法的研究】王小平.pdf

摘要 众所周知,语言是人类进行相互通信和交流的最方便最捷快的手段.在高度 发达的信息社会中用数字化的方法进行语言的传递、储存、识别、合成、增强等 是整个数字化通信网中最重要的组成部分之一.其中语音增强是语音信号处理的 预处理,其主要目的是从带噪语音中提取尽可能纯洁的原始语音信号.影响语音质量的噪声常有:脉冲噪声、周期噪声、宽带噪声、干扰噪声等.噪声来源众多,随应用场合而异,它们的特性也各不相同。再则,语音增强不但 与语音信号数字处理有关,而且涉及到人的听觉感知和语音学,即使在实验室仿 真条件下,也难以找到一种通用的语音增强算法,能适用于各种噪声环境 本课题是应吉林省公安厅的要求而设计的.
前言 语音是众多信息载体中具有最大信息容量的信号,具有最高的智能水平,也 是人类用来交流的最自然、最有效的手段。但人们在通信过程中不可避免地会受 到来自周围环境、传输媒介引人的噪声、通信设备内部电噪声、乃至其它讲话者 的干扰。这些干扰最终将使接收者受到的语音已是非纯净的原始语音信号,而是 环境噪声污染使许多语音处理系统的性能急剧恶化。例如,语音识别已取得 重大进展,正在步人实用阶段。但目前的识别系统大都是在安静环境中工作的,在噪声环境中尤其是强噪声环境,语音识别系统的识别率将受到严重影响,低速 率语音编码,特别是参数编码,也遇到类似问题。
从语音产生的机理上看,两者有明显的差异,因而在特征上也有明显区别.浊音在时域上呈现出明显的周期性.在频域上有共振峰结构,而且能量大部分集 中在较低频段内。清音则完全不同,它没有明显的时域和频域特征,类似于白噪 声.在语音增强中,可以利用浊音的周期性特征,采用梳状滤波器提取语音分量 作为一个随机过程,语音信号可以用统计分析特性来描述 这是非平稳、非遍历的随机过程,长时间时域统计特性在语音增强中意义不 大。其短时谱幅度的统计特性是时变的,只有当分析顿长趋于无穷大时,才能近 似地认为它具有高斯分布、高斯统计模型是根据中心极限定理得到的. 