波形编码、参数编码和混合编码,构成了语音编码的三大主要方式。他们都是从不同的角度来对语音信号进行编码。根据语音信号的波形特征来进行编码,是为了保持波形的不变性,最充分的保持原有信号特征。或者对语音信号进行分析,提取特征参数来进行编码由特征参数来恢复信号,值就是参数编码,与波形编码相区别他不用考虑语音信号波形特征而更加注重语音传输前后人耳的听觉感知的差异。而混合编码是这两者的综合,它在注重人耳的听觉感知的同时,也更注重了语音传输的数据量问题,实现两者的相对平衡,提高语音编码的效率。
语音信号压缩其实是利用了人耳的听觉惰性,即人耳并不能分辨语音信号中的所有信息,不能被分辨的部分我们可以将之视为冗余信息。经可能多的去除冗余信息可大幅减少语音信号传输的数据量,即实现了语音信号的压缩。对有用信息的最大保留可得到高质量的语音。
目前,语音合成技术的研究目的是实现文本到语音的快速转换。其中语音合成是该技术的众多模块中最重要的一个部分。
语音识别以说话人语音为研究对象,具有重要的应用价值,包含在模式识别中,其涉及诸多领域例如设计人的生理学、心理学、语言学、的特征研究,计算机科学的算法以及信号处理等,甚至优势还需考虑人的表情语言、肢体语言等,语音识别的终极目标是实现人机间的高效的自然语言通信。
1.2 国内外研究现状及论文选题意义
1.3 论文主要研究内容及结构安排
语音信号数字模型的建立是十分重要的,它是很多其他语音信号处理技术的基础和前提。本文主要研究语音信号的数字化模型建立与对该模型的特征参数提取。在结构上,本文第一章首先介绍了语音信号处理技术的发展简史及各项语音处理技术。第二章分别从语音信号的时域和频域特性来分析语音信号,并分析其中各参数所能表征的语音信号的特性。第三章分别介绍了语音信号中的LPCC和MFCC特征参数原理、思想以及提取流程。第四章用Matlab语音工具箱来仿真语音信号时域特征,频域特征,并对语音信号进行线性预测分析,最终实现对语音信号线性预测倒谱(LPCC)参数和MFCC参数的提取。
第二章 语音信号分析
2.1 概述
要实现对语音信号的快速高效处理,我们首先要对语音信号进行分析,只有从语音分析中找到可表示语音信号本质特征的参数,我们才能改进语音信号处理技术。该技术的改进可提高语音通信效率、改善语音合成的质量和提高语音识别的准确性等。因此语音信号分析对语音信号处理在实际中的应用具有重要意义。
现在的语音信号分析技术中,通常用到的分析方法是“短时分析”。我们知道语音信号表现为一种随时间变化的动态信号,从时域角度分析时,语音信号中表征其本质特征的参数也是动态变化的,所以整体而言语音信号的动态变化是一个非平稳态过程。对平稳信号所用稳数字信号技术对这样的语音信号并不适用。但在一个短时间范围内时,语音信号的特性基本可以认为是不变的,即语音信号具有短时平稳特性。所以在“短时”的基础上,我们就可以实现对语音信号的处理,这就需要我们将语音信号分段,对每一段来分析其特征,每一段我们称之为一帧。
2.2 语音数字化和预处理
要实现对语音信号分析和特征参数提取,我们必须进行一些共同的短时分析,这包括了对语音信号的数字化、端点检测、预加重、加窗和分帧等,这些都是短时分析中的主要步骤,在语音信号分析技术中发挥着重要作用。