尽管关于本体的定义有多种,但是从内涵来看,不同研究者对于本体都有统一的认识,即都把本体当作是领域内部中不同主体之间进行沟通交流(对话、互操作、共享等)的一种语义基础,即由本体提供了一种明确定义的共识。
2.2 本体在知识库中的应用
知识库系统的实现主要涉及知识的表示、利用和获取,以实现知识的检索,满足用户的需求。传统的检索方法有基于概念的检索方法、基于推理的检索方法、基于学习的检索方法和分布式多文检索方法等,在知识的检索中这些方法有一定的效率,但同时都缺乏一种对知识进行表示、推理、检索和获取的综合手段。而本体论在知识库应用时,可以用术语或概念对知识进行表达,同时揭示这些知识之间内在的关系。基于本体论的知识库系统中的知识不仅通过纵向类属分类,而且通过本体的联想进行组织和关联,推理机再利用这些知识进行推理,以满足用户的检索需求。
通过以上介绍,可见本体在知识库系统中的作用如下:
(1)明确语义内容。根据本体的定义,可以利用其提供对领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇和词汇间相互关系的明确定义,从而避免知识库中来自不同数据源的信息的语义异构。
(2)信息组织框架。Swartout认为:“本体是一个为描述某个领域而按继承关系组织起来作为一个知识库的骨架的一系列术语”。创建好的本体在知识库系统中的运用,便是以其为基础对该学科的资源进行知识单元的划分和抽取,并对抽取到的知识进行组织和加工,最后知识存储和文护于知识库中。
(3)实现知识推理。本体中概念间的基本关系有4 种:part-of表达概念之间部分与整体的关系;kind-of表达概念之间的继承关系;instance-of表达概念的实例和概念之间的关系;attribute-of表达某个概念是另外一个概念的属性。通过对概念添加属性,对属性添加逆反属性,属性与属性之间再添加映射关系,本体可以体现出类似人类思文的逻辑性。用其对用户提交的查询式进行语义扩展,可以推理出其所需的却未能表达出的信息需求。
2.3 本体构建
2.3.1 本体的描述语言
本体语言使得领域模型编写清晰的、形式化的概念描述,因此它应该满足以下要求[ ]:良好定义的语法(a well-defined syntax)、良好定义的语义(a well-defined semantics)、有效的推理支持(efficient reasoning support)、充分的表达能力(sufficient expressive power)、表达的方便性(convenience of expression)。
目前本体描述语言已诞生了许多种,自上个世纪90年代以来,一些基于人工智能的本体描述语言陆续被提出,如CycL,KIF,Loom,Ontolingua,FLogic和OCML。随着Web的发展,又出现了基于Web标准的本体描述语言,如SHOE (Simple HTML Ontology Extension)、XOL (XML –based Ontology-exchange Language)、RDF, RDF-S,OIL,DAML,DAML+OIL和OWL。
(1)SHOE
SHOE (Simple HTML Ontology Extensions)[ ]作为HTML的扩展,由马里兰大学计算机系提出的,它是一种基于XML的互联网知识表达语言,能够使得网页编辑者对他们的互联网文档进行标注。目前,马里兰大学已经停止了SHOE的研究,他们相关研究项目已经开始使用OWL和DAML+OIL作为Web本体的描述语言。
(2)XOL
XOL(Ontology Exchange Language,本体交换语言)[ ]是SRI International's Artificial Intelligence Center (AIC)开发的,它是一种简单通用的本体定义方法。XOL设计之初是为生物信息学领域本体的交换,但是它可以应用于各种领域。其目的是在不同的数据库、本体开发工具、或者其他应用程序之间交换本体。 CRFs模型面向情感分析的领域知识库构建研究(3):http://www.751com.cn/jisuanji/lunwen_9141.html