摘要针对现有话音活动检测算法在低信噪比环境下抗噪性能不佳这一情况,本文为话音活动检测研究提供了一种具有鲁棒特性的双麦克风算法,该算法适用于检测随机方向传来的话音。基于复指数二阶和四阶累积量的统计特性,得到话音活动检测的度量标准。通过将这一统计特性应用在复子带域上,该算法能够有效地检测话音段并且将其从非谐波噪声中区分开来。计算机仿真结果表明,所提出的方案在区分语音段和非语音段是可行的,对于高斯型噪声以及真实记录的噪声甚至在低噪声情况下都有较好的检测能力。25846
关键词 话音活动检测 高阶统计量 累积量 双麦克风
毕业论文设计说明书外文摘要
Title A DUAL-MICROPHONE SUBBAND-BASED VOICE ACTIVITY DETECTOR USING HIGHER-ORDER CUMULANTS
Abstract
The performance of the existing speech activity detection algorithm is not good
For the low SNR environment. So this paper proposes a robust dual-microphone algorithm for Voice Activity Detection (VAD) suitable for detecting speech arriving from random directions. The algorithm is based on the use of higher order statistics (HOS) in the complex subband domain in order to effectively detect voicing segments and distinguish them from nonharmonic noise. Metrics based on new established properties of the 2nd and 4th-order cumulants of complex exponentials are derived. The pros and cons of each of these are analyzed and validated through simulation in various SNR conditions. The results show the proposed scheme is effective in discriminating voiced speech segments, and is robust to Gaussianlike and real-life recorded noises, even in low SNR.
Keywords VAD HOS cumulants dual-mics
目 次
1 绪论…1
1.1 课题研究内容及意义 1
1.2 话音活动检测发展现状及问题 2
1.3 本文主要工作和结构安排 2
2 话音活动检测原理 4
2.1 二阶和四阶统计量… 4
2.2 指数延迟信号的交叉累积量… 5
2.3 基于子带的话音活动检测度量标准 6
2.4 基于帧的话音活动检测度量标准… 7
2.5 话音活动检测算法… 8
3 实际数据采集与处理… 10
3.1 数据采集过程… 10
3.2 实测数据预处理 15
4 实验仿真与评估… 17
结论 26
致谢 27
参考文献28
1 绪论
1.1 本课题研究内容及意义
语音,顾名思义就是语言的声音,它是由发声器官发出的,包含着一定的语言意义,承载着某些社会功能,是人与人之间沟通交流的最基本手段。为了更好地获取语音信号中所包含的信息,需要对语音信号进行适当的处理,这些处理手段包括语音识别、语音增强、语音合成等。因此语音信号处理就显得尤为重要,话音活动检测作为语音信号处理的一项重要环节,更具备其不可替代的重要作用。
语音活动检测(Voice Activity Detection, VAD)又称语音端点检测,语音边界检,是指在噪声环境中检测语音的存在与否,通常在处理接收到的一段声音信号的时候,需要判断其中是否含有除了噪声以外的有用语音信号,然后再判断对这段声音信号需不需要处理,从而能够排除无用噪声信号的干扰,提高语音处理的正确率,缩短语音处理所需的时间提高工作效率。近年来出现了许多基于不同特性的话音活动检测算法,包括最大似然估计[1]、倒谱特性[2]、基于谱熵的低信噪比算法[3]、基于软计算算法[4]等,虽然这些算法在实验室等较为安静的地方都取得了不错的检测率,但是在实际情况中由于环境噪声等各种因素的影响,话音活动检测率下降非常明显,因此作为语音处理系统的前端,话音活动检测的重要性不言而喻,后续工作能否进行,直接与话音活动检测准确率相挂钩,如何快速并且正确检测出语音端点仍然是当今世界的一项难题。
- 上一篇:基于麦克风阵列的室内混响时间盲估计技术研究
- 下一篇:基于幅度差及相位差融合的多通道声源分离技术研究
-
-
-
-
-
-
-
中考体育项目与体育教学合理结合的研究
大众媒体对公共政策制定的影响
酸性水汽提装置总汽提塔设计+CAD图纸
电站锅炉暖风器设计任务书
乳业同业并购式全产业链...
河岸冲刷和泥沙淤积的监测国内外研究现状
当代大学生慈善意识研究+文献综述
java+mysql车辆管理系统的设计+源代码
十二层带中心支撑钢结构...
杂拟谷盗体内共生菌沃尔...