“not” 这些特征,并将这些特征的情感极性得分值加和来作为整个文本的情感特征, 显然,
它无法检查出“not my tasty” 等情感转换信息, 这就是造成情感分类结果异常的重要原因。
解决极性转移问题一般可以分成两种方法:一种是基于规则的方法(Rule Based Polarity
Shifting Detect),一种是基于统计学习的方法(Statistical Learning Based Polarity Shifting
Detect) 。
1. 基于规则的极性转移分析方法
基于规则的极性转移分析方法是利用启发式语法规则来计算极性转移。Das 和Chen[16]
通过对每个特征词加上否定后缀从而产生特有否定后缀词的方法来检测否定极性的转移
现象。 例如情感文本“I do not like this bag” ,添加否定后缀后成就变成 “I like_not this book”。
Pang[4]
等人在电影评论语料中使用了该方法,实验结果显示,对情感分类的性能提高该方
法非常有限。Na[13]
等在电影语料集上分析了否定极性转移对情感分析的影响,并使用特殊
的语义标注方法捕捉否定极性转移,Kenndy and Inkepn[15]
,详细讨论了“上下文极性转移
词” (Contextual Valence Shifters),将极性转移词主要分成三类:否定极性转移词(Negations)、
极性加强词(Intensifiers)和极性减弱词(Diminishers)。
2. 基于统计学习的极性转移分析方法
基于统计的学习方法,是对情感文本极性转移现象进行监督的统计学习方法检测。
Ikeda[6]
通过对外部情感词典和样本标签来捕捉单词和句子级别的极性变换,具体思想是:
判断当前句子的单词在情感字典的极性是否与该句子本身极性一致,若一致,则认为单词不存在极性转移,否则认为存在转移现象,该思想的缺点是需要依赖外部的情感字典。Li
提出了一种基于特征选择的极性转移检测器算法,其具体思想是:通过特征选择方法将训
练样本自动切分两部分,一部分为极性转移部分,另一部分为非极性转移部分,然后通过
训练极性转移分类器检测原始样本中存在的极性转移句子。[14]
S.Orimaye 首次提出了句间
极性转移检测算法,该算法利用层次聚类算法将句间的极性转移分成三类,并利用K 近邻
算法剔除文档中的句间的极性不一致句子。[18]
3. 两种极性转移解决方法比较
基于统计学习的方法,利用监督的学习来检测句间极性的不一致性,能够较好的检测
其隐性的极性转移。该方法需要语料训练,如何得到或者自动产生关于极性转移的语料成
为该方法的核心问题。缺点就是与基于规则的检测方法相比,该方法不够直接和简便。
基于Web架构的互联网评论观点挖掘系统设计(3):http://www.751com.cn/jisuanji/lunwen_14838.html