观点文本分类的应用现状
近几年来,观点文本分类引起了各行各界的关注和学者们的研究,也在各个领域中起到了重要作用。具有代表性的工作有:
Morinaga[24]等人开发了声誉分析系统(Reputation Search Engine),这个系统可以根据用户给出的产品名称,从互联网上搜索到相关观点,并标出了每个观点的情感极性。
Tong[25]提出了情感时间线(sentiment time line)的检测跟踪系统。系统跟踪是直接对电影在线评论,而且带上正面和负面的数量上的统计。
Das[26]等人对网络上的股票行情进行的评论进行文本分类,然后对以后的行情进行预测。
Dave[27]等人研发出了Review Seer,这软件可以对产品的观点句子进行分类,并按照这些句子的倾向进行排序。
Liu[5]等人研发了名叫opinion observer的系统,利用网上顾客的评论提取消费者对其的评价,最后对评论做了主观的处理。
Chesley[28]等人把动词和形容词作为主要的特征,将文本分类正面和负面评论。
Yu[29]等人研发的系统可以自动的抽取具有主观意见的单词。首先用贝叶斯分类器将文本分成主观性文本和客观性文本;然后使用无监督统计方法从文本中找出主观性的句子;最终找出主观句子,然后进行文本极性分类。
近几年情感分类研究的发展,文献[30][31]与文献[32][33]也是对观点文本分类进行了研究。他们大多采用了找出两个领域文本特征词之间的联系,然后利用机器学习的方法对一个领域的文本进行训练,然后对其它领域的文本进行测试。最终分类的正确率往往不是很高,但指出了一种解决跨领域观点文本分类的方法。