摘要混响时间是一个重要的室内音响参数,它对于预测语音的可懂度具有十分重要的作用,同时也可以应用在语音增强技术中去抑制混响。针对在多数情况下,室内冲激响应并不可以预知,因此必须要从语音信号中进行混响时间盲估计。但是,在目前的解决方法中,经常假设混响在输入信号中占据了绝对主导地位,这样就限制了它们在相对较小的房间和声源与麦克风距离较远时的应用。在本文中,采用了一种新的混响时间盲估计的方法,这种方法首先通过使用一个波束形成器去除直达声和早期回声对输入信号进行预处理,之后利用一个合适的衰减速率的分布去估计混响时间,使得这种盲估计的方法可以独立于房间大小和声源到麦克风的距离。最后,通过计算机仿真证明了这种方法是有效的。25845
关键词 混响时间 盲估计 衰减分布 直达混响声能比
毕业论文设计说明书外文摘要
Title BLIND RT60 ESTIMATION BASED ON THE MICROPHONE ARRAY
Abstract
The reverberation time is an important acoustic parameter of a room. It can be used to predict speech intelligibility, and to suppress reverberation in the speech enhancement techniques at the same time. However, in many cases, room impulse response is not usable. We have to estimate RT60 from a speech signal blindly. In other words, for speech evaluation and speech enhancement techniques, it’s necessary for us to estimate RT60 from the observed reverberate signals. Current ways often implicitly assume that reverberation dominates direct sound, which restricts their applicability to relatively small rooms or distant sound sources. In this paper, we use a new blind RT60 estimation way. This way aims to preprocess the input signal by using a beamformer to cancel direct sound and early echoes, and then estimate the reverberation time by using a proper distribution of decay rates. Finally, we can use the observed data to go on the experimental evaluation and prove the availability of this method.
Keywords reverberation time blind estimation decay distribution direct-to-reverberate ratio
目 次
1 引言 1
1.1混响时间盲估计的意义 1
1.2 混响时间盲估计的发展现状 1
1.3本文的主要工作与结构安排 2
2 混响时间盲估计原理 4
2.1 房间脉冲响应模型 4
2.2 混响衰减速率估计 5
2.3 基于房间大小和源距离的鲁棒性分析 9
3 实验数据采集 12
3.1 实验数据采集过程 12
3.2 实验数据预处理 17
4 实验结果与评估 20
4.1 波束形成提高混响 20
4.2 负侧方差分布 22
结论 26
致谢 27
参考文献 28
附录A 实验数据采集方案 30
1 引言
1.1 研究混响时间盲估计的意义
混响时间或者说RT60是在描述室内音响特性的一个重要参数,用来描述室内的声音衰减快慢的程度。混响时间是指声音停止以后,声能经过来回反射,声音的能量衰减了60dB(也就是相当于平均声能密度下降到原来的 )所需的时间[2]。其中,混响声音是由于从声源到麦克风的声音信号的多路径传播引起的,如图1.1所示,混响语音也可以描述为远处有明显的回声和染色的现象。混响问题是对声音信号的处理以及室内声学来说都是十分重要的,适当的混响能够使得声音清晰,但是相反,混响大会产生大量的负面影响。在生活中,如果说话者与麦克风的距离相对来说很远的时候,麦克风所采集的信号可能会包括一些混响声音,太大的混响会影响语音的清晰度和可懂度,也可能进一步会影响到所用到的语音信号处理系统的性能。另外,混响时间在评定语音的可理解性方面具有十分重要的作用,此外也作为一种先进的知识在消混响,源分离以及自动语音识别领域占据着重要位置。我们知道,人类的听觉系统通常会被认为具有回声抑制和去除混响的能力,但是当声音是由麦克风捕捉到的时候这种回声抑制和去除混响的能力是不存在的,比如在免提电话装置中就不存在这种能力。此外,混响的特性是来源于房间脉冲响应,诸如混响时间,定义,清晰度指数,和中心时间之类的。也有一些信号相关性的办法,例如,调制传递函数和语音传输指数。特别地,在室内声学中,混响时间也可以用来作为实物的数量。 基于麦克风阵列的室内混响时间盲估计技术研究:http://www.751com.cn/tongxin/lunwen_19811.html