2.1 情感语音库的分类 4
2.2 语音库原则及获取方法 5
3 语音情感分析及前端处理 6
3.1语音情感分析原理概述 6
3.2 语音信号预处理 8
4 语音信号的特征参数选择 12
4.1 短时能量 12
4.2 短时平均过零率 15
4.3 语音信号的清浊音判断 16
4.4 基音频率 19
4.5 不同情感状态下语速 24
4.6 共振峰特征分析 25
结论 29
致谢 30
参考文献 31
附录(matlab程序) 32
A 预加重 32
B分帧 33
C短时能量和短时过零率 33
D清浊音判断 34
E matlab基音频率计算思想 37
F matlab对praat中基频数据处理 38
G matlab对praat中第一共振峰数据处理 40
1 绪论
1.1 选题的背景及意义
随着计算机技术的高速发展,计算机在人类的工作,生活和学习中起着越来越重要的作用,人类对计算机的依赖性在不断加强,因此人们对计算机的要求也越来越高。人类与计算机交流的语言有低级的机器语言也有高级语言,但近几年众多研究人员的研究方向倾向于让计算机和人类进行语言上的交流,让计算机可以感知人类语言中的情感因素,以往对计算机的要求仅仅是追求智能,现在则更加的追求心智,让计算机可以从人的声音中判断出其情感。研究表明,在人机交互中需要解决的问题实际与人和人交流中的重要因素是一致的,关键的都是“情感智能”的能力。计算机要能更加主动的适应操作者的需要,首先必须能识别操作者的情感,而后再根据情感的判断调整交互对话的方式。目前,关于情感信息处理的研究正在不断深入之中,其中语音信号中的情感信息处理的研究也越来越受到人们的重视。
情感在人类的感知,决策等过程扮演着重要的角色。长期以来情感智能研究只存在于心理学和认知科学领域,随着人工智能的发展,情感智能跟计算机技术结合产生了情感计算,这就为情感识别提供了更广阔的空间。语言是人类交际最重要的交流工具,人类的语言中不仅包含了文字符号信息,而且还包含了人们的感情和情绪等信息。例如,同样一句话,因为说话者所具有的情感不同,在听者的感觉上就会有较大的差异,所谓“听话听音”就是这个道理。然而,传统的语音信号处理技术把这部分信息作为噪声去掉了。实际上,语音信号中不仅包含文字信息,还包含语调和情感信息。所以分析和研究语音信号中的情感特征,判断人说话中的喜怒哀乐是一个重大课题。
语音情感识别在现实生活中具有重大意义,如果这项技术发展完善将在各个领域产生重大影响。情感识别不仅用在人机交互领域,还可用于语音识别,提高语音识别的鲁棒性;可以将其用于自动远程电话服务中心,及时发现客户的不满情绪并做出自我调整,对服务业将有重大影响;还可用于智能教学,如老师可以根据学生的语音判断出学生的情感状态,及时调整教学方法以寻求学生喜欢的学习方式,提高教学质量;同时情感识别还可用于犯罪心理检测[3],如当警察在审判犯人时,可通过语音识别出犯人的情感,及时了解犯人陈述的真实性;在神经医学方面,情感识别也将会发生重大影响,特别是精神分裂,抑郁症方面。自动语音情感识别的研究,不但可以推动计算机技术的进一步发展,也将大大提高人们的工作和学习效率,更高效的帮助人们解决问题,同时也将进一步的丰富人们的生活,提高人们的生活质量。由此可以看出,语音情感识别这项技术有广阔的发展前景。