但是,由于目前缺乏有效的监控过滤机制及其背后巨大的商业利益的驱使,商家以及其他利益相关者往往会发布一些与事实不符、过分夸张或诋毁的评论信息。同时,由于发布渠道的非规范化,发布形式的“无门槛”化,使得现有评论信息的质量存在较大的问题;基于上述原因,导致了目前商品评论信息的可信度普遍较低。而低可信度的商品评论信息无论是对消费者购买决策的做出还是相关领域的研究成果的推广都带来了诸多不利影响,会引起误导消费者做出正确的购买决策,扰乱市场稳定性等一系列问题。如何保证商品评论信息的质量成为了亟待解决的问题。
当前,商品评论研究作为一个新兴的热点研究领域,相关研究成果不断增多。其中观点挖掘、情感倾向性分析等方面的理论、方法和技术的研究都获得了较大发展。但是在商品评论信息可信度方面的研究还比较少。本文立足于解决商品评论信息可信度量化这一关键问题,旨在使用机器学习的方法识别出可信度高、过滤掉可信度低的评论信息,进而实现保护消费者权益,文持市场稳定性,防止已有的研究成果由于没有高质量的数据而无法得到很好地推广与应用的目的。
1.1.2 研究意义
随着互联网信息技术的快速发展及电子商务的迅速普及,在线商品评论信息获得的关注度不断提升,随之产生了大量不可信的评论信息,干扰了目前的研究工作,也对消费者做出正确的购买决策造成了不良影响。
(1)理论意义
如果信息资源本身存在质量问题,即使研究方法再科学,相关挖掘工作也不能向用户提供高质量的分析结果,已有研究成果也无法得到很好地推广与应用。目前对于商品评论信息可信度的评价大部分还处于理论探讨阶段,少数研究主要集中在国外,选取的语料为英文评论信息,提出的商品评论信息质量评价标准也大都是依据观察和经验得到的,缺乏有效的理论依据,所以存在偏差。本课题的研究内容与方法涉及图书情报、语言学、统计学与计算机等相关学科,为解决在线商品评论信息可信度量化提供了一种新的研究思路和方法,并且拓展了图书情报档案领域的文本挖掘的范围,将其延伸到 Web 资源中的商品评论信息的分析中,进一步丰富了网络信息资源可信度的理论与方法研究。
(2)实际应用意义
对于消费者而言,可信度较高的商品评论信息可以提供相对可靠的参考依据以便帮助他们做出正确的购买决策;对于商家来说,可信度较高的评论信息可以作为客户的意见反馈,商家通过它可以了解用户的需求,从而及时调整销售策略并为商品的研发与升级提供最准确、最直接的市场依据;对于网站运营者而言,去除可信度过低的评论信息后,网站用户在决策过程中会受到较少的噪声影响,进而提高了网站的声誉,增加了用户粘性;同时,本研究还能指导各级工商管理部门进行商品评论信息真实性和可靠性的判断,从而为电子商务交易市场中商品评论信息审核提供理论和方法依据。
1.2 研究现状
1.2.2 商品评论信息可信度计量研究现状
1.2.3 现有研究存在的问题
(1)在关于评论信息可信度定义方面,由于评论信息形式的多样性、评论对象的复杂性,特别是随着互联网技术发展日新月异,在线信息的表现方式、涵盖内容不断更新,目前为止,学术界对于在线评论信息可信度的定义并没有达成一个统一的意见。
(2)在评论信息可信度影响因素方面,研究成果大都是针对某些相对比较宽泛的影响因素进行探讨,例如:文本内容特征、情感倾向性特征、时效性特征等,并没有结合现有评论的主流表达形式将这些特征值进一步细化为更具体的因素进行探讨;除此之外,在对影响因素进行探讨时,大都将影响因素看作是独立的,没有考虑可信度影响因素之间的相互作用对可信度的影响。 基于SVR支持向量回归模型的在线商品评论信息可信度分析研究(3):http://www.751com.cn/shuxue/lunwen_11331.html