5.2 样本制作 21
5.3 matlab仿真 22
6 体会与收获 23
结 论 24
致 谢 25
参考文献 26
1 引言
1.1 研究背景和意义
通信的发展日新月异,随着信息的发送接收形式及效率的优化,对语音信号的有效处理及定位问题也成为人们研究的热点问题之一。当今社会,声音以各种形式在丰富着人们的生活,带给人们愉快的享受。如车载电话中定位说话人的语音的方向进而进行语音增强;视频会议[1]中定位说话人,完成波束自动控制自动控制摄像头;工业降低噪声[2] 创造和谐温馨的工作环境和居民生活环境,机器人听觉[3]领域对情感机器人的改进等。而这些都是以声源定位为前提实现的,可见有效的声源定位对当今快速发展的通信行业有着重大的研究意义。论文网
声源定位不仅应用于可知声源,对于不可知声源同样发挥着不可小觑的作用。在视觉不可察觉的角度范围中,如单方向视角看不到的或是被一些障碍物遮掩了的声源,通过声源定位技术我们仍可以实现其定位从而分辨或者寻找目标。声源定位突破了可见的限制,有着衍射与透射的特性,因而在恶劣的环境条件下,它优于依靠电磁传播与可见光线目标探测的方法,仍可以无干扰的进行声源探测。
此外,声源定位良好的隐蔽性也使其倍受青睐。如雷达探测需要先发射一个信号,通过目标的反射回波来确定目标的位置信息。声源探测则可以不需要发出检测信号,直接利用接收到的声源发出的声音信号来进行识别与检测,大大降低了被发现的概率,声纳探测系统就是一个很好的应用例子。另外,声源定位的设备要求往往比激光、电磁波定位技术所需的设备成本要求低,有着较高的生活实用推广价值。
要得到有效的声源分离,传统的单麦克风传感器有着致命的缺点,当所需采集的语音信号存在来自四面八方的噪声,或者是存在多源的情况时,信源信号和噪声的信号往往在时间和频谱上出现交叠,很难有效的分离目标信号,使得声源探测举步维艰。麦克风阵列[4-9]系统则可以有效分离多个语音源且在一定程度上防止了杂乱无章的噪声及混响对语音定位研究的影响。其最基本的原理是基于一组传感器对于同一信号输出的差别来进行测向,是指一组空间摆放位置不同的麦克风元,采集到混合声音信号后,对各个麦克风元的输出进行分析处理,最终得出信源方位的装置。
由于阵列系统的优势所在,阵列被应用到多个领域,如雷达的相控阵阵列,狙击手定位系统、声纳探测阵列系统、医学检验、地震的检测等。阵列测量系统还拥有着波束测量活动性高、空间分辨率高的优点,使得阵列系统在稍微复杂的场合已经代替了传统的测量传感器并逐渐成为主流技术。
在阵列的应用中,利用谱聚类[10-16]的声源定位方法可以克服了声音信号在时域上的重叠及频谱上的交叠,将单纯的时域声音研究转化为时频域的研究,由于语音信号的时频稀疏性及频率上的错频正交性,因而在时频域中可以有效分离声源信号。
基于这些技术的发展和人们对通信的需求,麦克风阵列的基于互谱聚类的声音定位的研究显得尤为重要且有着影响现代通信产业链的意义。良好的声源定位应用于国防安全,科技开发,医疗保障等领域中,显现着长远的经济效益和良好的社会效益。