其中, 是房间脉冲响应在时间域t和频率域f的能量包络, 是在频率域f的衰减速率, 是初始功率谱密度。因此,与频率相关的室内衰减模型(5)可以通过取自然对数的方法进行线性变换,可以得到式(6):
(6)
2.2 混响衰减速率估计
在这个部分中我们开始学习分析房间的衰减速率,并且这个衰减速率实际上是从无回声的和混响的语音信号所获得的。线性最小二乘拟合法在这里被施加到时间-频率包络的自然对数中去估计相关于频率的衰减速率 。注意到,在STFT域的匹配具有一种平滑随机衰变的最佳结构的效果。因为我们的讨论是在适用于全带宽和子带信号的基础上建立起来的,因此在后续的论文中,为了符号看起来更加简单方便一些,频率f参数已经可以被省略了。此外,在后面的文章中,我们会假设频点与频点之间是相互独立分布的。
从前面的讨论中,我们已经知道了,混响语音是可以被看成为无回声的语音信号和房间脉冲响应的卷积。我们假设无回声的语音信号和房间脉冲响应中间已经包含了互不相关的白噪声序列,它们相对应的能量包络为 和 。我们用 来表示混响语音信号的能量包络:
(7)
现在观察到了两个重要的的特性:(1)语音的停顿是没有瞬时起始点的,这是因为声源语音信号中会常常因为语音信号所处的环境从而最终会平滑地衰减到零。我们将这个特性称为语音端点衰减现象。(2)当声源语音信号为零的时候,室内脉冲响应才可以会被感测的到。将上面的两种观察到的特性结合起来,可以注意到,在声源语音信号的停顿中,由麦克风测量得到的信号是包含了语音端点衰变与房间衰变的卷积的结果。如果声源语音信号中包含了任何一个瞬时的端点,这些语音停顿中必定将会包含房间的衰减。另外,在一个语音端点之后 基于麦克风阵列的室内混响时间盲估计技术研究(3):http://www.751com.cn/tongxin/lunwen_19811.html