1.3 论文主要研究内容 本文对基于双耳线索的多声源语音定位方法进行了研究。 以往的研究采用了ITD和IID两种线索进行声源定位。从技术角度来看,IID线索与方位的关系过于复杂,并不适合直接用于定位[10]。 因此, 本文首先改进了以往基于 ITD和 IID的定位算法, 去除了 IID线索,简化了模型,同时利用三次样条差值的方法提升了 ITD的精度,使得相邻角度之间 ITD更加容易区分。 基于空间线索的双耳语音信号分离通常都是将空间线索作为分离的主要线索,即先定位后分离。理论研究表明,分离过程能有效地改善定位结果。因此本文考虑将定位和分离两个模块进行融合。首先对混合语音进行初次定位,在此基础上,基于合理的分离组合方式,将 TF 感知单元进行初步分离重组,源Z自L751W文~论`文]网[www.751com.cn,重组后的 TF 感知数据块用于提取空间线索并进行二次定位, 这样定位和分离两个模块形成了迭代结构, 进行相关数据的融合,可以得到更好的定位结果。
1.4 论文组织结构 本文分 5 章来论述,各部分的主要内容如下: 第一章为绪论,主要介绍了声源定位与语音分离技术的研究背景和意义,国内外近年来的研究现状,并简要描述了论文的主要研究内容。 第二章介绍了双耳语音处理技术的基础理论,从人耳的听觉生理结构到空间听觉,以及双耳声源定位线索,包括耳间时间差、耳间强度差和双耳互相关函数。接着叙述了双耳语音信号的采集,从与头相关传递函数到人工头采集双耳信号的基础知识。最后概述了基于双耳空间定位的语音分离理论,对比分析了原有的语音分离定位算法和迭代的语音分离算法,并提出实验性能评估的依据。 第三章提出了基于 ITD的双耳声源定位算法, 介绍了双耳信号的预处理和特征提取,并对 ITD的定位算法提出了改进。 第四章提出了声源定位和语音分离的迭代方法。此方法将分离后的语音重新提取空间线索并进行更精确地定位,再根据修正后的定位结果重新分离混合语音。论文中详细叙述了迭代的框架结构,重定位与重分离的方法,最后对算法进行了仿真和评估。 第五章对全文进行总结,并提出对将来研究方向的展望。 基于迭代结构的双耳声源定位算法研究(3):http://www.751com.cn/tongxin/lunwen_52063.html