义原一方面作为描述概念的最基本单位,另一方面,义原之间又存在复杂的关系。在Hownet中,一共描述了义原之间的如下几种关系:
a) 上下位关系(由概念的主要特征体现,请参看《网管理工具》)
b) 同义关系(可通过《同义、反义以及对义组的形成》获得)
c) 反义关系(可通过《同义、反义以及对义组的形成》获得)
d) 对义关系(可通过《同义、反义以及对义组的形成》获得)
e) 部件-整体关系(由在整体前标注%体现,如“心”,“CPU”等)
f) 属性-宿主关系(由在宿主前标注&体现,如“颜色”,“速度”等)
g) 材料-成品关系(由在成品前标注?体现,如“布”,“面粉”等)
h) 施事/经验者/关系主体-事件关系(由在事件前标注*体现,如“医生”、“雇主”等)
i) 受事内容领属物等-事件关系(由在事件前标注$体现,如“患者”,“雇员”等)
j) 工具-事件关系(由在事件前标注*体现,如“手表”,“计算机”等)
k) 场所-事件关系(由在事件前标注@体现,如“银行”,“医院”等)
l) 时间-事件关系(由在事件前标注体现,如“假日”,“孕期”等)
m) 值¬-属性关系(直接标注无须借助标识符,如“蓝”、“慢”等)
n) 实体-值关系(直接标注无须借助标识符,如“矮子”,“傻瓜”等)
o) 事件-角色关系(由加角色名体现,如“购物”,“盗墓”等)
p) 相关关系(由在相关概念前标注#体现,如“谷物”,“煤田”等)
可以看出,义原之间组成的是一个复杂的网状结构,而不是一个单纯的树状结构。不过,义原关系中最重要的还是的上下位关系。根据义原的上下位关系,所有的“基本义原”组成了一个义原层次体系。
2.3 Hownet的知识描述语言
Hownet对概念的描述是要着力体现概念与概念和概念的属性与属性之间的相互关系,因此,知网对于概念的描述必然是复杂的"这就必须有一套明确的规范,否则便无法保证描述的复杂度和描述的一致性。
概念描述既有总的、一般性的描述,也有因不同类别的细节性描述。但是,描述的方法和规定又必须保证能够最大限度地表现概念与概念和概念的属性与属性之间的相互关系。事实证明满足复杂性和一致性统一的要求的可行途径是设计一种知识词典的描述语言。Hownet建设的过程也是设计与建立这样的描述语言的过程。Hownet的描述语言(Knowledge Dictionary Mark-up Language,KDML)包含下列几部分:近1500个特征及动态角的词汇色、标志符号和标点、词序[21]。
2.4 Hownet的记录格式
Hownet是知网系统的基础文件。在这个文件中每一个词语的概念及其描述形成一个记录。每一种语言的每一个记录都主要包含项内容。其中每一项都由两部分组成,中间以“=”分隔。每一个“=”的左侧是数据的域名,右侧是数据的值。它们排列如下[22]:
NO.—词汇的序号,这个是一个词语区别与其他词语的最根本的标志。W—X— 词语,这个表示词语本身。E—X—词语用法的举例。G—X—词语的词性标记。DEF—词语表示的概念的定义,这个是最重要的部分。其中,C表示汉语,E表示英语。 基于Hownet的情感词典构建研究(6):http://www.751com.cn/jisuanji/lunwen_9268.html