麦克风阵列已广泛应用于各种音频视频会议、语音识别及增强等领域。具体而言,声源DOA估计在监视,跟踪,电话会议和助听器都具有广泛的应用。在军事方面声源测向技术也被广泛地应用在飞机,火炮、狙击手探测等方面。声源定位技术是基于麦克风阵列的阵列信号处理的关键技术之一,是语音信号处理领域的一个新的研究热点。虽然声源DOA估计是一个成熟的领域,但是挑战未解决的问题仍旧是后续研究的课题。其中之一的矛盾就是当源的数量超过麦克风时确定DOA。33695
最近,一种基于独立分量分析的DOA估计方法(ICA)已经被提出[14-15]。它直接从分离矩阵估计DOA估计ICA通过利用分离矩阵与源混合过程相关的事实。由于这种方法是基于ICA,它只允许M>N的情况,然而,它仍然不能应用当M<N。论文网
当麦克风少于源的时候,尤其是在有噪声和混响的情况下,确定语音信号的DOA很困难。语音信号在时频域上已知具有不平稳性和稀疏性。大量研究已利用这两个属性来解决语音信号的DOA估计。大多数的研究通过假定“一个单频点仅由一个源占用”进一步简化问题。通过使用这一假设,文献中基于一个峰值对应相对振幅和延迟参数的二文直方图在每个时频点进行估计DOA[1]。在同样的假设下,我们可以从聚类质心聚类归一化时频点并估计DOA[2]。也可以通过从相同源的时频点得出平均协方差矩阵来假设调频源和DOA[3]。为了解决源的先验知识问题,另一篇文献用相关性测试来选择只包含一个主要来源的一阶时频点[4]。对源没有先验知识的情况下,其中提出的和起始点检测类似的噪声基底跟踪和相关性测试有力地说明了只有一个来源的时频点占主导地位。
DOA的另一个问题估计是混响。虽然人类能够在很严重的混响环境中分辨声源,但是目前的DOA估计技术只能处理适量的混响。文献表明,人类有这样的能力由于优先效应:当波达的声音和随后的声音之间的滞后明显地短(<40毫秒),所有的声音融合成一个单一的声音导致波达感知的方向完全由先到的声音(起始点)决定的[5]。我们可以用3个麦克风应用优先效应检测起始点来估计两个源的DOA[6]。另一个需要注意的问题是噪声的存在。由于语音信号在时频域上的稀疏性,有些时频点只包含噪声,因此,使用噪底跟踪消除这些时频点有利于提高DOA估计准确性。
- 上一篇:遗传算法的国内外研究现状概述
- 下一篇:无线通信技术国内外研究现状
-
-
-
-
-
-
-
java+mysql车辆管理系统的设计+源代码
当代大学生慈善意识研究+文献综述
乳业同业并购式全产业链...
河岸冲刷和泥沙淤积的监测国内外研究现状
中考体育项目与体育教学合理结合的研究
酸性水汽提装置总汽提塔设计+CAD图纸
杂拟谷盗体内共生菌沃尔...
大众媒体对公共政策制定的影响
十二层带中心支撑钢结构...
电站锅炉暖风器设计任务书