结 论 31
致 谢 32
参考文献33
1 绪论
人类生活在一个充满声音的世界,叽叽喳喳的鸟叫、淅淅沥沥的小雨、悦耳动听的歌声都是环绕在人们耳边的美妙声音。当然,生活中也充斥着一些恼人的噪音。在日常生活中,人们接触最多的恐怕还是语音,从人类会开口说话以来,语言就成为了人们沟通的重要工具。随着时代的变迁,文明的创造,文化的发展,即使人们可以用文字表达思想,语言都是不可或缺的存在。一个人的声音可以最直接地呈现他的情绪,或激动或愤怒或哀伤。而这些情绪的表达都离不开语音的声学特性和表征语音本质特征的参数。随着现代社会各种信息的日益膨胀,人们急需对这些信息进行高效的处理,语音信号便是需要重点处理的对象之一。语音信号处理涵盖面非常之广,它与多门学科密切相关,相辅相成,其中不乏通信与信息科学、计算机科学、人工智能和模式识别之类的热门学科[ ]。
1.1 基频检测的定义
人类以婴儿的姿态降生在这个世界,生理器官生而优越于其它生物,其中就包含发音器官。人类可以用丰富的语言表达自己的喜怒哀乐,与他人进行情感的沟通和思想的碰撞,知识和文化便在这样的过程中形成和积累,可以说文化的传播和社会的进步离不开丰富的语言。
人发出声音时,声带不一定会振动,这是一件很神奇的事情,和人体发音器官的构造有关。如果声带振动,则认为是浊音,否则为清音。浊音就像大当家一样,语音信号中的能量大都被它占据,并且它具有较明显的周期性。而清音占据的能量非常少,它的时域波形图和白噪声的很像,从时域上看不出周期性。人发浊音时,气流通过绷得很紧实的声带,在气流的冲击下,声带就会产生振动。伴随声带振动的就是准周期性的激发气流,图1.1展示了其典型波形。基频即为声带振动的频率。本文主要研究的就是语音信号中浊音的基频。
图1.1 典型的声门脉冲串波形
声带虽然是每个人都具备的发音器官,但是声带的物理特性却是各有各的不同,比如声带的长短不一、厚薄不均都会给基频打上专属个人的标签。此外,说话人的性别和年龄也是影响基频的重要因素。生活经验表明,男性的声音比较低沉,而女性和儿童的声音比较尖细,这就是基频给他们的发音带来的影响。在语音信号处理技术中,基音频率的评估被称作基频检测,最终想要得到的是精确表征声带振动频率变化情况的轨迹曲线,但是通常情况下这是难以实现的,所以要使基频轨迹曲线尽可能地接近声带振动频率的准确值[ ]。
1.2 研究意义
在语音信号处理的领域中,表征语音基本特征的参数的提取是很关键的步骤。特征参数携带了语音的根本特质,对语音信号进行处理的主要任务和最终目标就是提取这些参数。只有准确的参数提取才能为后续的工作提供保障。语音信号的参数是相当繁多的,而基频就是其中最具代表性的特征参数之一。基频的应用十分广泛,在语音信号处理技术领域的地位不可撼动,甚至发音系统疾病的诊断、听觉残障者的语言指导等领域都需要基频检测技术的支持。基频的重要性不言而喻。
本文研究的是汉语语音的基频检测,汉语语音的特征就是—声母、韵母和声调。基频在汉语语音中的表现就是声调,人们无法确定没有声调的汉字所表达的意思。众所周知,多音字在汉语中被普遍使用,有时候,同一个字在不同的声调下表示完全不一样的意思。例如“干活”和“干净”中的“干”的声调不一样,表达的词义也不同。那么,此时汉字的声调就具有了辨别词义的用途。故而基频携带了辨义的信息,基频的提取是汉语语音的处理中相当重要的环节。