(2)指示词的数据来源
指示词的获取可以通过两个途径:一是通过手机的详细参数获得手机相关属性的度量单位;二是通过评论者对手机外观、性能、使用方法的评论获取评价词汇,本文以COAE2008任务3[ ]提供的手机评论文本为这类指示词的数据来源。
2.4.2 中文商品评论中类的定义
在课题组对商品评论信息情感倾向性分析的前期研究中,一条商品评论中与情感倾向性分析相关的内容可以抽象为四类概念,即:评论者,评论对象,评论,指示词。本文以手机领域作为评论对象,构建中文商品评论本体,可分为四类,即评论者,评论对象,评论,指示词。层次结构图2.4:
2.4 中文商品评论中类的层次结构
(1)评论对象的类及其层次结构设计
本文采用自顶向下的方法,从手机领域的基本概念出发,逐层深入确定各层子类的概念。
本文参考了中关村手机频道提供的手机详细参数,并根据品牌知名度和中关村提供的关注度排行,参考了Iphone 4S、三星Galaxy 2、诺基亚Lumia 800三款产品官方网站提供的参数和技术指标作为中文商品评论本体中与手机相关概念的来源。
根据手机所属商品领域的特点,并借鉴静态聚合子网络分类体系,将中文商品评论中与评论对象相关的概念分为四类:1、整体,即对手机的综合评价,例如“Iphone 4S可以说是一款经典的产品”就是对Iphone 4S整体的评价;2、组件,即手机的构成部件如键盘、屏幕、摄像头等;3、外观,即手机外观设计;4、功能,指手机提供的如拍照功能、录音功能的各种功能;5、属性,指手机的各项参数,如CPU频率、摄像头像素、屏幕尺寸等。因此手机领域的概念提取可以分为五类:手机类、手机组件类、手机外观类、手机功能类、手机属性类。图2.5为手机领域中文商品评论本体中的评论对象的层次结构。
图2.5 手机领域中文商品评论本体中的评论对象的层次结构
图2.6为手机领域的中文商品评论本体的评论对象分类。
图2.6 手机领域的中文商品评论本体的评论对象分类
(2)指示词类的层次结构设计
指示词是中文商品评论重要的构成部分,能够显示评论的情感倾向和显性的表达评论对象,直接影响评论对象的抽取。根据指示词的用途可将指示词分为参数指示词、外观指示词和意见指示词。图2.7为指示词类的层次结构图:
图2.7 指示词类的层次结构图
① 参数指示词:指中文商品评论中用于度量手机属性参数的词汇,如“克”用于指示“手机重量”,“mm”用户指示“手机尺寸”,“像素”用于指示“摄像头像素”等;
② 外观指示词:指中文商品评论中能够指示手机外观的词汇,如“外观”、“造型”、“外形”等;
③ 意见指示词:指中文商品评论对评论对象表达出来的情感倾向、褒贬态度,如“大/小”指示手机的尺寸,“高/低”指示手机摄像头的像素。
本文以中关村在线手机频道提供的详细参数,参考Iphone 4S、三星Galaxy 2、诺基亚Lumia 800官方网站的参数作为参数指示词的来源,并从中关村在线对以上三款手机的商品评论中获取外观指示词和意见指示词,详细如表2.1所示: CRFs模型面向情感分析的领域知识库构建研究(7):http://www.751com.cn/jisuanji/lunwen_9141.html