4 语音信号时间域特征提取及端点检测程序设计 15
4.1 语音WAV文件的格式及读取 16
4.1.1 语音WAV文件的格式 16
4.1.2 语音WAV文件的读取与绘制 17
4.2 语音时域特征参数的提取 20
4.2.1 语音信号短时平均能量的提取与绘制 20
4.2.3语音信号短时平均过零率的提取与绘制 21
4.3 语音波形的平移 22
4.4 语音信号的端点检测 25
4.5 界面设置 26
4.6 软件测试结果分析 28
总结 29
致谢 30
参考文献 31
1 绪论
1.1 语音信号处理研究现状
1.2本文研究内容及意义
语音信号是一种携带着各种信息的非平稳的时变信号。在语音识别、语音编码、语音增强和语音合成等语音处理中都需要提取语音中包含的各种信息。一般来说,人们进行语音分析处理出于两种目的:一个目的是分析语音信号,提取特征参数,用于后续处理;另—个目的是加工语音信号,例如在语音合成中对分段语音进行平滑拼接,以获得主观音质较高的合成语音;在语音增强中对含噪语音进行背景噪声抑制,来获得相对“干净”的语音,这方面的应用同样也是建立在分析并提取语音信号信息的基础上的。总而言之,分析语音信号的目的就在于方便有效地提取并表示语音信号中所携带的信息[2,3]。 源:自~751-·论`文'网·www.751com.cn/
本文研究的内容主要如下:
(1)研究语音信号特点,提取短时平均能量及短时平均过零率特征参数。
(2)绘制出语音信号波形,并综合绘制短时能量、短时过零率两种特征参数曲线。
(3)对比语音波形、短时能量和短时过零率曲线,分析语音信号的特点和规律。
(4)结合短时能量和短时过零率对语音信号进行端点检测,区分静音段、辅音段和浊音段。
1.3本文组织结构
本文章节安排如下:
第一章:绪论部分。主要概述了语音信号处理的研究现状及本文研究的内容和意义,并对本文内容安排进行了介绍。
第二章:语音信号处理基础知识,介绍语音信号的一些基本知识、人类发生器官如何发出声音和汉语语音的一些特点。
第三章:语音信号时域分析,介绍了语音信号的时间域特征、语音信号的预处理,主要介绍语音的两个重要参数短时能量和短时过零率,以及利用这两个参数进行端点检测语音段和静音段的原理和方法。文献综述
第四章:论述了应用短时能量、短时过零率进行语音信号端点检测的软件设计方法,并对实验结果进行了分析。
2 语音信号处理的基础知识
2.1 语音信号的波形特性
语音信号的数字化表示是语音信号的数字处理的基础,模拟语音信号经过A/D转换就可以得到离散的数字化的语音信号。语音的数字化采样值以文件形式存储到计算机中,就可以利用相关工具软件或自编程序读出并显示在电脑屏幕上,得到语音时域波形,便于观察。论文网
图2-1是女声“基于语音的”的时域波形图,采样频率为8kHz。图中横轴为采样序号。图2-1的横轴压缩轴较短,所以只能看到语音轮廓,无法识别波形具体细节。图2-2是该语音的时域波形放大图。从图中看出语音信号具有很强的“时变特性”,有些波形周期性很强,有些则表现为噪声特性,而且这两个特性也在不断的变化着[20]。但在较短时间内,语音信号的特征基本可认为保持不变,这就是研究语音信号数字处理的基础——语音信号的“短时平稳性”;进行语音分析处理时一般截取具有短时平稳性的一段语音,称作一“帧”,这段语音的长度为帧长,帧长一般取10~30ms[20]