毕业论文

打赏
当前位置: 毕业论文 > 电子通信 >

MATLAB和PRAAT汉语普通话情感识别(3)

时间:2018-07-13 14:44来源:毕业论文
1.2 国内外 研究现状 及面临的问题 1.3 本论文主要完成的工作 本文结合前人有关情感语音识别的的相关成果,根据语音情感识别的基本原理,应用计算机分


1.2 国内外研究现状及面临的问题
1.3 本论文主要完成的工作
本文结合前人有关情感语音识别的的相关成果,根据语音情感识别的基本原理,应用计算机分析软件对影响语音情感的主要特征因素进行数值分析和研究。
本文主要研究内容包括以下几个方面:
1、情感因素提取方法的理论分析;
2、计算机软件(Matlab、Praat、Excel)对提取方法的实现;
3、语音情感特征因素的可靠性分析。
本文开展的研究需要对多个语言情感因素提取编程和分析,包括:
matlab中基音频率检测整体思想的实现;
praat软件精确计算基音频率;
通过praat和MATLAB提取主要振峰参数;
通过统计学分析原理对特征因素提取算法进行可靠性分析。
2情感语言基础
2.1 情感语音库
2.1.1 情感语音模型及语音库的分类
在人类与除其自身的外界事物接触时,由于外界事物的刺激,以及我们对外界的体验,促使我们产生一定自己特有的看法,情绪情感也由此诞生,这些全都是人们的本能反应。因为情感本身及其复杂,包含很多的不确定因素,所以要对情感进行一个很准确的识别就显得非常困难。目前,对于一个情感分类比较普遍适用、精确的方法尚不存在。国内这一领域的研究院和个人做了长期大量相关的科学工作,虽至今还没得到被广泛认同的理论和模型,但是有些理论和模型是大家比较认可的。
第一种是基本情感和复合情感理论,这种模型的分类依据主要是靠人的情感的纯净度进行判断,并将其分为基本或复合的情感[7]。人们和其他动物所共有的适应社会生存的情感叫基本情感,而从这些所衍生出来的新情感则称之为复合情感。带有情感的语音中可以既存在基本情感,也存在复合情感。然而,学术界对基本情感的定义至今还没有统一的定论,现在工程界和心理学界常用的是Ekman提出的751种基本情感模型,包括高兴,愤怒,惊奇,厌恶,悲伤,恐惧。目前一些被主流学者公认的基本情感大致如下:愤怒(Anger、高兴(happiness)、悲伤(Sadness)、厌恶(Disgust)等。
第二种是情感轮模型。在该模型中情感被假定为分布在一个坐标轴类似的圆形结构上,以原点为中心,由中心向四周分别指向分布不同的语音情感,其上的距离则代表着情感的不同强度,目前比较先进的模型使用的是三文圆锥行模型 [9]。目前一些较为简单的如激活度-效价空间理论(arousal-valence space)、激励-评估-控制空间理论(valence-activation-dominance space)和情感轮理论(emotion wheel)等模型已经被广泛使用。其中,激活度-效价空间理论如图1所示:激活度文由纵坐标表示,代表感情的强烈度;效价文由横坐标表示,代表情感的正负面程度。[10]
  情感轮模型
图1 情感轮模型
第三种是激励一评价一强度情感空间模型
将基本情感,混合情感的分布看作是离散的存在,因为存在很大的不完整性所以本文便不再做过多的介绍。
不同的情感语言模型各有千秋:从模型复杂度而言,离散描述模型较为简洁、易懂,有利于相关研究工作的着手和开展,而文度模型却要面对定性情感状态到定量空间坐标之间如何相互转换的问题;离散型情感模型具有较为明显的局限性,突出表现为对于情感不能全面的描述,在日常生活中人们的感情体验是多样化的,并不能由离散型情感模型所全面表述,因为其之恩能够表达单一有限的情感,甚至是复杂而模糊的[13]。离散情感模型与自发情感描述上有着很大的距离。可是文度情感模型却能以精确地数值解决离散情感的模糊表达问题,它能够连续的反应不同情感之间的中间变化过程,有效的解决了自发情感表述的难题[14]。以下我们就将用表格(见表2)的形式将各自的好坏呈现给读者: MATLAB和PRAAT汉语普通话情感识别(3):http://www.751com.cn/tongxin/lunwen_19691.html
------分隔线----------------------------
推荐内容