基于实值离散Gabor变换的维纳滤波语音增强方法

2022-03-18 08:11:40 | 浏览次数:

摘要:提出了一个新的基于实值离散Gabor变换的维纳滤波语音增强方法,采用高斯窗作为综合窗,利用已有的快速实值离散Gabor变换将语音变换到时频域,然后在联合时频域,采用维纳滤波进行纯净语音的最小均方误差下的最优估计,先验信噪比采用“直接判决”算法,在得到语音增强信号的估计分量后,利用实值离散Gabor逆变换将其还原输出。实验结果表明,在分段信噪比和语音质量评价方面均与经典的维纳滤波方法相比均有提高。

关键词:实值离散Gabor变换;噪声估计;维纳滤波;语音增强

中图分类号:TP391文献标识码:A文章编号:1009-3044(2012)17-4231-04

Speech Enhacement Approach Based on Real-value Discrete Gabor Transform and Spectral Subtraction

ZHANG Man, ZHOU Jian

(MOE Key Laboratory of Intelligence Computing and Signal Processing, Anhui University, Hefei 230039, China)

Abstract: In this paper, we porpose a novel speeeh enhancement method based on Real-value Discrete Gabor Transform,noisy speech is transformed to the joint time-frequency by fast Real-value Discrete Gabor Transform in which the Gaussin is used as the transform kernel function,Optimal pure speech signal estimation under the minimum mean square error based on Wiener filter , a priori SNR got by deci? sion-directed algorithm, the clean speech is got by inverse transform by Real-value Discrete Gabor Transform.Exprimental results show that this method enhances the segSNR and improves the speech quality compare other classical alogorithm of wiener filter.

Key words: mReal-value Discrete Gabor Transform; noise estimate; Wiener filter; speech enhacement

现实世界中,语音信号很难避免受到各种噪声源的污染,语音增强的一个主要目的就是从带噪信号中尽可能的恢复出纯净语音信号。语音增强技术在语音识别、语音编码和人机语音交互等语音处理领域中发挥着重要作用。

基于短时谱估计的语音增强算法由于充分利用了在频域中语音和噪声之间的特征区别和短时(一般认为20ms内)的语音和噪声之间较小的相关性这两点优点,使得基于短时谱估计的语音增强算法在单声道语音增强算法中最常见,其中常见的短时谱算法中常见的有谱减法、维纳滤波法和最小均方误差法等,维纳滤波方法对应的是时域平稳信号的最小均方误差估计,传统维纳滤波处理后的语音一般会残余较多的类似的白噪声,维纳滤波方法的计算会涉及到先验和后验信噪比的计算问题,文献[1-2]中在计算先验性噪比中采用了“直接判决”算法,文献[3]对该此种方法进行了改进。然而,在各种经典和改进的维纳滤波算法中需要将语音从时域变换到频域时,均采用短时加窗傅里叶变换,该文基于以下原因,采用实值离散Gabor变换(RDGT)作为信号分析和处理的工具:第一,与短时傅里叶相比,RDGT由于采用高斯窗函数而具有时频带宽最小的特性,相比短时傅里叶的其他窗函数(如汉明窗)对语音信号分析更加细腻,更易区分语音谱和噪声谱;其次,维纳滤波语音增强要求语音符合在较小窗时间内是平稳信号这一假设,但语音信号本质是非平稳信号,许多文献表明RDGT[4-5]与短时傅里叶相比更适合处理非平稳信号;另外,基于学者陶亮等人的研究[6-9],该文可以通过在RDGT中通过对抽样率参数进行控制而确定最优语音增强效果;最后,在增强后的信号重建时,该文利用RDGT当前最快的算法并行格型快速算法[9]可快速重构语音信号,算法复杂度与短时傅里叶相比更小,且失真度更小(相关实验表明均方误差为10-14数量级)。

该文首先描述实值离散Gabor变换的基本理论,然后介绍结合实值离散Gabor变换与维纳滤波方法在联合时频域进行语音增强,最后为了验证该文提出的算法的有效性,进行了仿真实验,将该文算法与传统的维纳滤波方法进行比较,实验表明该文提出的算法在信噪比和语音主观试听质量上都优于经典算法。

1实值离散Gabor变换(RDGT)

2基于实值离散Gabor变换的维纳滤波语音增强

假设噪声为加性噪声且与短时平稳语音信号相互独立,则含噪声语音信号y(n)可表示为

y(n)=s(n)+d(n)

3实验及性能比较

4结束语

该文提出了一种基于实值离散Gabor变换的维纳滤波语音增强方法,在语音信号分析与处理过程中,可利用RDGT目前最快的算法并行格型快速算法快速分析和重构语音信号,算法复杂度与短时傅里叶相比更小。客观测试结果表明了该文提出的算法在分段信噪比和对数谱距离等方面都优于目前主流流行方法,主观测试结果表明残留“音乐噪声”更小,进一步验证了该文算法的有效性。

参考文献:

[1] Ephraim Y,Malah D.Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator[J].IEEE Transac? tions on Acoustics,Speech,and Signal Processing,1984,32(6): 1109-1121.

[2] Ephraim Y,Malah D.Speech enhancement using a minimum meansquare error log-spectral amplitude estimator[J].IEEE Trans on Acous? tics,Speech,Signal Processing,1985,ASSP-32:443-445.

[3] Cohen I.Speech enhancement using a noncausal a priori SNR estimator[J].IEEE Signal Processing Letters,2004(9):725-728.

[4]陶亮,顾涓涓.实值Gabor变换理论及应用[M].合肥:安徽科学技术出版社, 2005.

[5]陶亮,庄镇泉.用于语音分析的实值离散Gabor变换[J].电声技术,2000(12).

[6] Tao Liang,Kwan Hon Keung. Real Discrete Gabor Expansion for Finite and Infinite Sequences[C]. Switzerland:Proceedings of the 2000 IEEE International Symposium on Circuits and Systems, 2000, 4: 637-640.

[7] Tao Liang,Kwan Hon Keung.Novel DCT-based real-valued discrete Gabor transform and its fast algorithms[C].IEEE Transactions on Sig? nal Processing, Accepted for publication.

[8] Tao Liang,Kwan Hon Keung. Block Time-recursive Real-valued Discrete Gabor Transform Implemented by Unified Parallel Lattice Structures[J]. IEICE Transactions on Information and Systems 2005,E88-D(7):1472-1478.

[9] Tao Liang,Kwan Hon Keung. Parallel lattice structures of block time-recursive discrete Gabor transform and its inverse transform[J].Sig? nal Processing, 2008,88(2):407-414

[10]周健,赵力,陶亮,等.基于实值离散Gabor变换的联合时频域语音增强[J].信号处理, 2010,12(26):1870-1876.

[11] Plapous C,Marro C,Scalart P. Improved signal-to-noise ratio estimation for speech enhancement[J].IEEE Transactions on Audio Speech and Language Processing,2006, 14(6): 2098-2108.

推荐访问: 滤波 离散 变换 语音 增强