情感文本分类(sentiment classification)是情感分析的核心内容之一,它可以看作一类特殊的文本分类问题。传统的文本分类主要指对文本按照主题进行分类,而情感文本分类的任务是对包含主观信息的文本按照情感进行分类。它在学科上涉及到人工智能、自然语言处理、模式识别、机器学习、信息检索、数据挖掘等多项基础研究,具有重要的学术研究价值。
2.1.1 情感分析的简单性分类
情感分析通常分成两类问题,肯定的和否定的。通常将产品的评论用作训练和测试使用的数据。由于网上的评论是靠评论者们划分等级来评定的,例如1-5星的评分,通过星级来区分正面和负面的评价。例如,一个4或5星级的审查,被认为是一个积极的评价,与1-2星级的评论被认为是一种负面的评价。大多数的研究论文不使用中性类,是因为这使得分类问题相当容易,但它是可以使用中性类,例如,设定所有3星级评论为中性类。