(3)归纳结果。将最终结果以直观的类似表格形式展现,针对某个特定特征,对应的给出评价数量、好评和差评数量,并且如果用户需要可以点击查看其中的每一条评价。如图1-1:
最后,我们通过对从网上获取的三种商品的评价情况进行实验,验证获取的商品特征及最终结果的查全率与查准率,以对系统的实用性进行鉴定,并对其中存在的问题予以记录,在进一步的工作中不断的改进,使系统更具有实用价值。
2 相关工作
我们的工作与Dave、Lawrence和Pennock在[1]中关于评论的语义分类联系密切。通过使用从一些网站获得的已经对每条评论做好分类(比如赞和贬,或者其他的定量或者二值评级)的训练语料集,他们设计并且实现了很多建立情感分类器的方法。他们展示了这些分类器在测试用例上的良好工作。他们还使用他们的分类器对通过搜索引擎进行网络搜索得出的结果进行语句分类。不过,分类器表现的很一般,因为这些句子比评论包含的信息少了太多。我们的工作在三个主要方面与他们的不同:
(1)我们关注的不是将每条评论作为一个整体分类,而是对评论中的每个句子进行分类。在一个评论中可能有一些对某些商品特征进行肯定的句子同时也有对其他特征进行否定的句子。
(2)文献[1]中的工作并不是从顾客们已经表达了观点的句子中挖掘商品特征。
(3)我们的方法不需要通过语料集来完成这项任务。
在文献[2]中,Morinaga等比较了同一系列产品中不同的商品评价来得出目标商品的声誉。但是他们没有总结评价,没有挖掘出评价者已经表达了观点的商品特征。尽管他们确实找到了一些能够指明声誉的常用短语,但是这些短语可能不是指商品特征(例如“不工作”,“一般般”和“没问题”)。在[3]中,Cardie等讨论了观点倾向信息抽取。他们想要通过建立观点的总结表达来实现问题解决。他们提出了使用观点倾向的“情景模版”来当作一个或一系列文本中提出的观点的总结表达。我们与他们有所不同,我们的目标是识别出商品特征以及顾客关于这些特征的观点来自动的生成总结,并且不使用任何模版。
我们的工作同样与如下技术相关但不同于它们:主题类型分类、情感分类、文本总结和术语查找。我们在下面对它们进行讨论。
2.1 主题类型分类
类型分类将文本分成不同的风格,比如:社论、小说、新闻、诗歌等等。尽管有些类型分类的技术可以识别表达了观点的文件[4],但是却无法给出观点是肯定的还是否定的。我们的工作需要决定一个观点是否是肯定的并且在语句级别上进行而不是在文件级别上。
文献[5]是一项更加接近的工作,作者们研究了句子的主题分类并且总结出一个句子中形容词的存在和类型直接说明了句子是主观的还是客观的。不过他们的工作没有针对与我们鉴别主观句子语义倾向的目的,也没有找出观点中所提到的商品特征。
2.2 情感分类
Hearst和Sack[6]关于对整个文件基于情感的分类使用了认识语言学的模型。Das和Chen使用了手工编制的辞典,配合一些评分方法对一个投资者公告上的股票帖子进行分类。Huettner和Subasic[7]也手动构造了一个词语判别式辞典并使用模糊逻辑去情感分类。Tong[9]制作了情感时间线,它追踪网上关于电影的讨论并且随着时间推移显示肯定和否定消息的数量,通过寻找消息中的指明了作者关于这部电影的态度的特定短语(如:“优秀的演出”,“强大的视觉冲击”,“不均匀的剪辑”)来进行分类。每个短语必须人工添加到特殊的辞典中,并且人工给出肯定和否定的标签。这个辞典与依赖于领域(如电影)并且对于新的领域必须重建。