图 4-10 系统回放模块前面板 30
图 4-11 语音信号频谱分析程序框图 30
图 4-12 语音信号功率谱及倒频谱分析程序框图 31
图 4-13 语音信号自相关性分析程序框图 31
图 4-14 语音信号加窗分析程序框图 32
1 绪论
1.1 语音特征提取的发展
语音特征提取作为语言研究中的一个重要领域,在很早就被提出并进行研 究。
20 世纪 40 年代 potter 等人的 Visible Speech 以及 Dudley 的声码器标志着语 音特征提取快速发展的开始。
20 世纪 50 年代 Bell 实验室的戴维斯等人成功研究出了能够识别 10 个英文 字母的语音识别系统—Audry 系统。
20 世纪 50 年代奥利孙和贝拉利用 8 个带通滤波器提取频谱参数成功研制出 了一台简单的语音打字机。
20 世纪 60 年代语音特征提取进入正轨,临界频带理论的提出,快速傅里叶 变换,数字滤波器等相关处理方式的出现将语音特征提取推向的高峰。同一时间 断第一个利用 16 通道滤波器,基浊音检测及一台 PC 机的语音识别系统由 Mit 的 Gold 等人研究成功。
20 世纪 70 年代后,语音识别技术得到了快速的发展。研究重点渐渐转向了 对各种参数的线性或非线性的处理。为了有效的解决语音特征的提取及信号得不 到等长匹配的问题提出了 LPC(linear Prediction Coding)线性预测编码技术,技 术和动态时间规整 DTW(Dynamic Time Warping)技术。使得语音信号采集进入 了新篇章。另外 VQ(矢量量化)理论在语音编码中的应用及 HMM(隐马尔科 夫模型)技术的初步成果使得语音特征提取技术得到极大的突破。论文网
20 年代 80 年代在人工神经网络、VQ、HMM 等理论技术的支持下语音特征 处理技术得到了飞速的发展[1]。
20 年代末期,语音信号的提取渐渐进入了实用化的阶段,取得了很多突破 性的进展。为了将语音识别等功能从实验室走进生活。各种语音统计模型及语音 算法的研究成为了众多人研究重点。
发展到现在,我国在语音特征提取及应用也有了很大的进步。在我国主要分 为两类研究方向:
一、对于学生群体来说追求低成本简洁方便为重中之重,于是基于声卡及
LabVIEW 或者 MATLAB 来对语音信号进行采集与处理得到了很大的应用。
二、利用硬件系统进行开发,基于数据采集卡以及 DSP,GPLD 的结合运用。 虽然成本较高却高效可靠。
所以由于各种条件上的限制,使得语音特征提取及应用在我国虽然有很大的 进步却不能广泛的普及。
1.2 语音特征提取的应用
语音特征提取技术是计算机智能接口与人机交互的重要手段之一[1]。对处于 时代浪潮的语音识别、语音跟踪定位、语音输入输出等起到很重要的垫脚石作用。 就语音识别而言,市场前景广泛,在很多高端领域有着关键性的竞争力。而语音 识别的成功与否就在于语音特征参数提取的精度高低。
随着语音特征提取技术的进步,语音识别技术越来越接近人们的正常生活。 声控电话(最常见的在现在很火的美国苹果公司的 Siri)、声控智能玩具、银行 服务等。
在学习领域也有很占有很大的比重如口语自动翻译,利用语音特征提取技 术、语音合成技术使得跨国家跨语言的交流不再是空想。目前美国、日本、欧洲 包括我国的中科院共同参与的 CSTAR 计划,正在将开展多种语言语音自动翻译 的研究作为重中之重。