Joachims比较了SVM、NB、KNN及DT等几种文本分类方法,实验表明SVM性能最优[40]。此后,SVM在文本分类方面的研究深度和宽度都逐渐扩大。Tong&Koller研究了SVM主动学习策略,并将其运用到文本分类,用于克服训练语料缺乏的瓶颈[41]。Leopold&Kindermann等比较了不同的文本表示模型对SVM分类性能的影响[43]。Siotas&Florence为提出了基于语义核函数的SVM分类器,实验表明该方法取得了更好的分类效果[44]。
3 SVM应用于情感分类
文本的情感分类与传统的文本分类,有许多相似之处。目前情感分类的方法与基于主题的文本分类方法类似。Pang比较了NB、ME、SVM对英文影评情感分类的作用,发现SVM效果最优[12]。张素智等结合了SVM与KNN,提出了KSVM的情感分类算法,得到了较好的情感分类效果[45]。王文华等提出了利用SVM算法识别属性词和情感词的搭配,并取得了不错的情感分类效果[46]。连凯提出了结合基于SVM机器学习的情感分类方法与基于2-POS模型的句子主观性分析方法进行中文评论的情感分类,实验表明其提出的方法能够有效地判别评论的情感倾向[47]。白鸽等比较了NB、ME、SVM对中文评论的情感分类效果,实验表明SVM效果最好[48]。刘志明等通过实验证明了采用SVM和IG,以及利用TF-IDF作为特征权重的结合对于微博的情感分类效果最优[49]。
参考文献
[1] 王素格. 基于Web的评论文本情感分类问题研究[D].上海.上海大学.2008.1-5
[2] 王洪伟,刘勰,尹裴,廖雅国. Web文本情感分类研究综述[J].情报学报,2010,29(05) :931-938.
[3] 张彦博. 文本情感分类的研究[D]. 北京.交通大学.2010.1-10.
[4] Rakesh Agrawal, Sridhar Rajagopalan, Ramakrishnan Srikant and Yirong Xu . Mining newsgroups using networks arising from social behavior[A]. In Proceeding of the 12 WWW Conference[C]. Budapest, Hungary ,2003:529-535.
[5] Chambers N.,Tetreault J.,and Allen J., Approaches for automatically tagging
affect[A]. In Proceeding of the AAAI Spring Symposium on Exploring Attitude and Affect in Text: Theories and Applications[C]. US. Stanford,2004 :143-158.
[6] 夏火松,彭柳艳,余梦麟. 自动情感文本分类综述[J].情报学报.2011,30(5):530-539.
[7] 邹嘉彦. 评述新闻报道或文章色彩-正负两极性自动分类的研究[A]. 自然语言理解与大规模内容计算-全国第八届计算语言学联合学术会议[C]. 北京:清华大学出版社, 2005:21-23
[8] Janyce M. Wiebe, Rebecca F. Bruce, and Thomas P. O’Hara. Development and use of a gold-standard data set for subjectivity classifications[A]. In Proceedings of the Association for Computational Linguistics[C]. College Park, Maryland, 1999:246-253.
[9] Ellen Riloff and Janyce Wiebe. Learning extraction patterns for subjective expressions[A]. In Proceedings of Conference on Empirical Methods in Natural Language Processing[C].USA:ACL, 2003:105-112.
[10] Wiebe, Janyce, Theresa Wilson, Rebecca F. Bruce, Matthew Bell, and Melanie Martin. Learning subjective language[J]. Computational Linguistics, 2004. 30 (3): 277–308.
[11] Peter D. Turney. Thumbs up or thumbs down? semantic orientation applied to unsupervised classification of reviews[A]. In Proceedings of Annual Meeting of the Association for Computational Linguistics[C].Philadelphia, Pennsylvania, 2002:417-424.
[12]