基于TMS320VC5416DSP的数字助听器设计
摘 要:整个系统以DSP为核心,结合TI公司高性能立体音频Codec芯片TLV320AIC23构建硬件环境,并在此基础上实现音频双通道方向性选择,多通道压缩算法,噪声消除以及反馈消除等助听器关键算法。该系统功耗低,使用中参数可调节,满足听障患者对听力进行补偿的要求,也为进一步研究助听器高级算法搭建了较好的实验平台。
关键词:助听器; 滤波; 补偿; 自适应
中图分类号:TP3681文献标识码:B
文章编号:1004-373X(2010)08-0169-04
Design of Audiphone Based on TMS320VC5416DSP
WANG Lei, GUAN Ke
(Information Engineering College, Chang’an University, Xi’an 710064, China)
Abstract: The entire system takes DSP as a core, constructs hardware environment in combination with high performance stereo audio codec chip TLV320AIC23 produced by TI Company, and realizes dual-channel audio directional options, multi-channel compression algorithm, and the elimination of noise and feedback on the basis of the hardware environment, The system has low power consumption, adjustable parameters in use to meet the needs of hearing-impaired patients for compensating their hearing, a better experimectal platform is prvided for a further study of high-level algorithm of hearing aids.
Keywords: audiphone; filtering; compensation; self-adaptation
0 引 言
随着社会的发展以及人们对听障患者的日益关注,助听器的发展逐渐受到人们的重视。但由于听力障碍患者病因各异,其听力损失情况存在着较大差异,使得每位患者对于助听器的补偿有着不同的要求。目前,现代助听器技术进入到全数字助听器时代。同时,各种有效提高数字助听器效能的数字信号处理算法也得到更多的重视。在此提出基于TMS320VC5416的数字助听器设计,能满足听障患者对听力的需求。
1 系统构成和工作原理
1.1 系统组成
基于助听器的技术要求,选用TI公司的C54X系列产品TMS320C5416(以下简称C5416)和数字编码器TLV320AIC23(以下简称AIC23)。
数字编码器AIC23是TI公司推出的一款高性能的立体声音频Codec芯片,A/D转换和D/A转换部件集成在芯片内部,采用先进的∑-Δ过采样技术,内置耳机输出放大器。AIC23 DSP Codec工作电压与C5416的核心和I/O电压兼容,可实现与C54x串行口的无缝连接,功耗很低,使得AIC23是一款非常理想的音频模拟器件,可以很好地应用于数字助听器的设计当中。
系统结构如图1所示,主要包括DSP模块、音频处理模块、JTAG接口、存储模块及电源模块等。模拟语音信号通过MIC或LINE IN输入AIC23, 经过模/数转换后通过MCBSP串口输入C5416,经过实际所需的算法进行处理和补偿后,得到听障患者所需要的语音信号,再通过AIC23数/模转换,通过扬声器或耳机输出声音信号。
图1 系统设计原理框图
1.2 C5416与AIC23的接口设计
图2是C5416与AIC23的接口原理图。由于AIC23采样输出的是串行数据,因此需要协调好与之相配的DSP的串行传输协议,MCBSP是最适合做语音信号传输的。将AIC23的第22脚MODE接高电平,接收来自DSP的SPI格式串口数据。数字控制接口(SCLK,SDIN,CS)与MCBSP1连接,控制字共16位,由高位开始传输。数字音频口LRCOUT,LRCIN,DOUT,DIN,BCLK与MCBSP0相连。在工作方式上,DSP为主模式,AIC23为从模式,即BCLK的时钟信号由DSP产生。
串口时钟由BCLKX0,BCLKR0并联到AIC23的BCLK时钟,这样在发送和接收数据时都可产生串口时钟信号。输入/输出同步信号LRCIN与LRCOUT,用来启动串口数据传输,接收DSP的帧同步信号。
BFSX0和BFSR0,BDR0和BDX0分别与AIC23的DIN和DOUT连接来实现DSP与AIC23之间的数字通信。
图2 C5416与AIC23的接口图
2 系统实现
2.1 语音的基本特性
声音是一种波,能被人耳听到声音的振动频率为20 Hz~20 kHz。语音是声音的一种,他是由人的发音器官发出的,具有一定语法和意义的声音。语音的振动频率最高可达15 kHz。
语音按其激励形式的不同分为:浊音、清音、爆破音。而人的声音特性基本是由基因周期和共振峰等因素决定的。当发浊音时,气流通过声门使声带发生振动,产生准周期激励脉冲串。这个脉冲串的周期就称为“基因周期”,其倒数即为“基因频率”。
人类的声道和鼻道都可以看做是非均匀界面的声道管,声道管的谐振频率称为共振峰。改变声道的形状就产生不同的声音。共振峰用依次增加的多个频率表示,如F1,F2,F3,等,称之为第一共振峰,第二共振峰等。为了提高语音接收质量,必须采用尽可能多的共振峰。实际中,头三个共振峰是最重要的,具体情况因人而有差异。
2.2 语音增强
在实际的应用环境中,语音会不同程度的受到环境噪声的干扰。语音增强就是对带噪语音进行处理,降低噪声的影响,改善听觉环境。
实际语音遇到的干扰可能包括以下几类:
(1) 周期性噪声:如电器干扰,发动机旋转引起的干扰等,这类干扰在频域表现为一些离散的窄峰。特别是50 Hz或60 Hz交流声会引起周期噪声。
(2) 冲击噪声:如电火花,放电产生的噪声干扰,这类干扰在时域表现为突然出现的窄脉冲。消除这种噪声可以在时域中进行,即根据带噪语音信号幅度的平均值确定阈值。
(3) 宽带噪声:通常指高斯噪声或白噪声,其特点是频带宽,几乎覆盖整个语音频段。它的来源很多,包括风、呼吸噪声和一般的随机噪声源。
2.3 算法分析
噪声影响使得患者语言识别率大幅下降,去噪和补偿是助听器的重要环节。人耳对于25~22 000 Hz的声音有反应。语音的大部分可用信息只存在于200~3 500 Hz之间。根据人耳感知特性及实验确定,对语音感知,语音识别较为重要的第二共振峰大部分位于1 kHz之上。
2.3.1 周期噪音消除
周期噪声一般是许多离散的谱峰,来源于发动机的周期性运转。电器干扰,特别是50~60 Hz交流声也会引起周期噪声。所以使用带通滤波器可以有效地消除周期噪音以及3 500 Hz以上的高频声音。
IIR数字滤波器在设计上可以借助成熟的模拟滤波器的成果,如巴特沃斯、契比雪夫和椭圆滤波器等,IIR数字滤波器线性差分方程:
Matlab环境下可视化得到滤波器对动态输入数据的实时滤波效果如图3所示。
图3 IIR切比雪夫滤波Matlab仿真图
2.3.2 基于短时谱估计的宽带噪音去除
由于语音信号的短时谱具有较强相关性,而噪声的前后相关性很弱,因此采用基于短时谱估计的方法从带噪语音中估计原始语音。而且人耳对于语音相位感受不敏感,可将估计得对象放在短时谱的幅度上。
2.3.3 谱相减法
谱相减法在无参考信号源的单话筒录音系统中是一个有效的方法。因为噪声是局部平稳的,可认为发语音强的噪声与发语音期间的噪声功率谱相同,因此利用语音前后的“寂静帧”来估计噪声。
谱相减法的原理框图及仿真结果如图4,图5所示,对语音信号加窗处理后,利用已知的噪声功率谱信息对信号进行除噪处理。
图4 谱相减法原理图
图5 谱相减法的Matlab仿真实现
2.4 噪声对消法
噪声对消法是最基本的减谱算法,它的基本原理是从带噪语音中直接减去噪声。由于宽带噪声与语音信号在时域和频域上完全重叠,是比较难去除的。所以需要用到非线性处理,自适应滤波器不断地调节。
图6中一个声道采集带噪语音,另一个声道采集噪声。带噪语音序列S(n)与噪声序列d(n)经傅里叶变换得到频谱分量Sk(w)和Dk(w),噪声分量Dk(w)经过滤波后与带噪语音相减,再加上带噪语音的相位,经傅里叶反变换恢复为时域信号。在强噪音背景时,这种方法可以得到很好的消除噪音效果。
图6 双声道采集系统的噪声对消
在实际中两个采集声道要保证一定隔离,以防止两个声道都采到带噪语音。为了使采集到的噪声更接近于带噪语音中的噪声,自适应滤波器可以很好地实现这一功能。
图7是运用噪声对消法得到的左声道的增强语音示例。
2.4.1 多通道压缩算法
在听力损失的情况下,听阈普遍下移,从而造成听觉动态范围减小。这种动态范围的减小程度与频率有关,一般高频部分损失较大。在数字助听器信号处理算法中,听力补偿算法是其中最核心的一种算法。听力补偿算法的目的是对声音进行压缩放大,将正常人听阈范围内的声音映射至聋人听域内,并尽可能的保持听觉舒适和提高声音的清晰度和辨识度。
图7 自适应滤波左声道Matlab仿真图
利用滤波器将信号分频段处理后再综合,声音信号被分为数个独立的频率区域,这些频率区域被称之为通道。该算法主要致力于在时域对信号进行处理。在各个通道中,根据患者听力损伤的情况,对于不同频段加以不同的放大处理,对不同频率成分使用不同的压缩算法,最后将合成的声音再发送到患者的耳道里。这里应用该方法对信号做了一定的处理,该系统中将中频信号做了适当的放大,收音效果良好。图8为三通道分频合成图。
2.5 系统实现
系统在实现时,通过USB接口将目标板和PC机连接起来。通过CCS对目标工程进行在线调试。
目标工程的主要任务是TMS320C5416初始化、管理板上的资源和完成音频的处理算法。要正确编写采样和输出音频信号的程序,必须对TMS320C5416的McBSP的每个通道包括27个相关的寄存器进行正确的设置,以满足TMS320C5416和其他硬件电路芯片的各种时序要求(位同步、帧同步、时钟信号等)。图9为原始的语音信号在系统中的回放图形,图10为在CCS与DSP硬件连接的原始语音与处理后语音的对比图形。
图8 三通道分频合成Matlab仿真图
图9 语音双声道未处理
图10 语音双声道处理对比图
3 结 语
该课题设计的助听器实现了小型化、集成化、便捷化。系统还可以根据患者的具体需求进行参数的更改和设计,以满足不同患者的需求。随着社会的发展,在某些特定的场合不仅听力有障碍的人,就是听力正常的人也要借助助听器。人类对于助听器的需求会不断更新,对于问题的探索和研究也将与时俱进,使用助听器更好地为人类服务,实现人与自然和谐相处,从而促进社会和谐发展。
参考文献
[1]金亮, 廉小亲. 基于TMS320C5409的语音处理系统\. 北京工商大学学报: 自然科学版, 2005, 23(2): 40-42, 45.
[2]肖宪波, 胡广书, 刘春红. 基于形态学的数字助听器单频段压缩算法\. 清华大学学报:自然科学版, 2005, 45(12): 1680-1683.
[3]宋仲康, 胡智华. 基于TMS320VC5416的音频接口设计\. 电子工程师, 2005(7): 24-26.
[4]贾克明, 陶洪久. 基于DSP的嵌入式语音识别系统的研究与实现\. 武汉理工大学学报:信息与管理工作版, 2006(7): 156-159.
[5]李夕红, 祝忠明. 基于DSP5402的音频处理设计与实现\. 电声技术, 2006(12): 113-116.
[6]肖宪波, 谷子, 胡广书, 等. 数字助听器算法开发平台pDHA的构建和测试\. 北京生物医学工程, 2006, 25(1): 57-60.
[7]陈广飞, 应俊. 数字助听器宽动态压缩算法研究\. 北京生物医学工程, 2006, 25(5): 454-456, 481.
[8]孙红, 张涛. 基于TMS320C5509DSP的无线语音传输采集传输系统\. 微计算机信息, 2007, 23(23): 184-186.
[9]成城, 韩赞东. 基于DSP和ARM的音频处理系统设计\. 微计算机信息, 2007, 23(8): 147-149.
[10]付荣国, 周庆敏. 基于TLV320AIC23和TMS320VC5416的语音系统设计\. 微计算机信息, 2007, 23(35): 192-193.
[11]苏凌旭, 徐智敏.基于TMS320C6713的多路CVSD语音编解码\. 现代电子技术, 2009, 32(19): 76-77.
推荐访问: 助听器 数字 设计 TMS320VC5416DSP