模式识别与人工智能 第2页
开发工具和环境可以分为三类:外壳(骨架系统)、表示语言、开发工具箱(开发环境)。
外壳给知识工程师提供现成的实现KB系统的骨架,只要按骨架规定的表示方式编写专门知识,就可形成应用领域的KB系统。
表示语言类工具为知识工程师提供面向知识处理的高级编程语言。
开发工具箱(开发环境)为KB系统的生命周期——开发、运行、文护、评价、进化等各个阶段提供工具,甚至可以提供多种外壳和表示语言,以及综合它们建立复杂KB系统的手段。
6 定性物理:定性演算(定性变量、算术规则、定性微分、定性方程及其求解),定性演算的模糊性;定性行为和定性状态,状态转变规则,定性行为的预言(推理),存在的问题和改进方法。
答:
答:1 定性物理:定性物理是一种典型的深法,目的在于使用应用领域的基本原理和尝试对物理系统的行为作定性推理。物理系统可以是自然的或人工的遵守物理定理的任何系统。
2 定性变量:定性推理用来做比实际数字更不精确信息(如正负号、相对大小、值变化方向等)的推断。在定性物理研究中,作定性描述的参数称为定性变量或量(quantity),量之间关系可用定性方程或定性不等式表示。
定性演算:定性演算就是关于值间隔(而不是值)的运算。
算术规则:具体可以参照76-77页有关定性算术规则的描述。
定性微分:定性物理研究关注物理世界的行为,而行为又直接与变化关联。但量(定性变量)值(+,0,-)仅描述了世界的状态而非变化,所以定性微分是重要的,因为它指出了变化的方向。我们约定以[dx]指示的符号,称为定性微分。
定性方程及其求解:以定性变量和它们的定性微分作为参数的方程可以作为控制量变化的定性规则。所以,包括定性微分的方程,均可用于表示关于行为的知识。
定性方程可以通过一下三种方式获得(具体可以参照p78页):
(1)微分方程。
(2)变量间从属关系的定性描述。
(3)对线性方程求导。
求解方法具体参照p78页3 求解关于定性方程的系统 这一小节。
3 定性行为与定性状态:首先定性物理系统X可定义为一个有限的变量集:X={x1,x2,x3,…,xn},X的定性行为可定义为一个按时间顺序的定性状态序列。定性状态定义为系统变量定性值分配的一个组合,可能的值分配组合个数为,其中为可取的定性值的个数。
状态转变规则(具体可以参照p80-81):
连续性规则
微分规则
零变规则
变零规则
瞬变规则
定性行为的预言(推理),存在的问题和改进方法(可以参照):
依据状态转变规则,可以预言系统的下一状态。但显然,定性描述因丢失了定量信息而无法区别这些情况,使行为的预言呈现出不精确性。
定性预言的能力可以用以下两个概念来衡量:健全性和完备性。一般来说,完备性已可达到,但健全性尚不能达到。
定性预言的另一个严重的问题是复杂性,模糊性和复杂性是紧密相关的,提高定性预言的精度和效率的关键在于克服模糊性。
以下有几种方法(需要具体参看p82):
引入变量排序知识。
将状态的描述(变量集)分解为子部分。
引入高阶倒数
五不发生行为。
层次抽象。
7 基于功能的因果建模方法和结果发现,与简单因果网和定性物理的比较。
答:
1)基于功能的因果建模:物理系统(设备)的建模按结构、功能和行为的描述进行。
结构:设备的结构描述包括两个项目:组成设备的子设备(部件)的列表,设备可实现的功能。
功能:设备某功能的描述包括三个项目:条件(使能),功能实现的结果,执行功能的手段。
行为:行为的描述表示为因果网的片断,由节点和链组成。每个节点为一陈述性语句(可以是谓词表达式),用以说明系统状态和状态的变化。初始(顶层)节点往往指示行为的中间和最终结果。链指示因果关系,并加注解说明发生因果关联的理由。注解可以是指针,指向下一层次(更详细)的功能或行为描述;也可以是领域的基本知识。
基于功能的因果建模方法有以下特点:
设备的功能化表示。以设备的结构(组成和可实现功能)来刻画设备是什么样的,而以功能(条件、结果、手段)和行为(因果网片断)来刻画设备是如何工作的。
模块化描述。任何子设备均可以用执行同样功能的别的子设备取代。
自顶向下地分层表示和理解设备行为。即从最抽象的表示和理解逐步深入到最细节。这种方式允许人们根据他们的需要,对设备行为的理解深入到任何适当的层次,而更下层的可以不必考察。
以结构、功能、行为作为组织因果知识的索引。
2)基于功能的推理——结果发现
由于设备的功能和行为表示已经包含了大量关于设备正常行为或异常行为的因果描述,基于这种表示的推理实际上就是把与当前所考察设备的特别行为(正常或异常)相关的因果描述从知识库中收集起来(以结构、功能和行为作索引),并由此生成相应于特别初始条件的因果网。所以,这样的推理称为结果发现。对应于不同的初始条件,推理系统将生成(装配出)不同的因果网,以便解释初始条件下的设备行为。
结果发现的算法如下:
指定设备的初始条件。包括异常的状态变量值(正常的变量值由推理系统自动填入―――缺省值)、失去的功能、异常的功能。
决定推理的起点。首先从知识库搜索满足初始条件的功能或行为,形成起点列表,然后删除冗余。
构造因果网,以描述给定初始条件物理系统行为。从推理起点,以功能描述中的手段项、行为描述中的指针型注释(因果链上),不断扩充描述行为的因果网片断,直到最低层知识。
3)与简单因果网和定性物理的比较
基于功能的因果模型改变了传统的由简单因果链构成因果网的方式,而以更为有效的方式来组织。整个因果网层次地分解为片断,作为物理系统各层次部件行为的描述;结构、功能、行为则作为索引去快速地收集相关的因果网片断。基于这种模型的推理,并非简单地搜索因果网中的路径,而是先将层次存放的相关因果网片断搜索到,再装配成适合于特别初始条件的特别因果网。这种方法与定性物理方法的不同之处是,它不需要推导出因果关系,而只是收集已存在的因果关系(视为已通过定性物理方法推导出的结果),比定性物理方法高效得多。
8 深、浅层知识及推理的区别,深、浅层推理的综合方式和自适应学习;动态系统的适应性多级诊断建模方法的知识表示,诊断过程和自适应学习。
答:
深、浅层知识及推理的区别(P71,P72)
浅层知识指经验知识,往往表示的是事物见现象上的关联,并不揭示事物的本质。基于浅层知识的启发式推理称为浅层推理。
关于应用领域的基本原理和常识能够揭示事物的本质,称为深层知识,基于深层知识的推理称为深层推理。
大量的研究表明,尽管浅层知识易于且主要表示为规则形式,而深层知识易于并主要表示为框架和语义网形式,但不是绝对的,反之亦可。换言之,深层和层知识的区别不在于表示形式而在于知识的特性本省(或者说是语义而不是句法上的不同)。从语义角度,浅层知识又称编译知识,是专家运用领域深层知识解决问题的过程中高度概括并经反复验证和精化后产生的知识。解决问题效率高,但复杂情况下由于提炼的不完备造成知识的不完善。
深、浅层推理的综合方式(P96)
深层知识的量往往很庞大,而基于深层知识的推理步有很精细,可想而知,其推理效率是相当低下的。相比之下,浅层知识相当精炼,效率高,但具有脆弱性。所以,应综合深、浅层推理,即以浅层推理为核心和主干,并将深层推理作为补充和后盾。另外,深层推理也应在浅层推理的指导下进行。例如,可通过浅层推理得出部分解答或将解答限制在一定的范围内在驱动深层推理,以大大提高深层推理的效率。而深层推理的结果又可为浅层推理所用
自适应学习(P96)
将深浅层推理综合来解决问题,我们会得到四个层次的知识和推理:经验性关联,不精确模型,定性物理模型,定量模型。后三层为深层知识。知识的分层给自适应创造了条件,这种学习方式是值系统在遇到新问题是,只能依赖于深层知识去推理,这时系统问题求解性能下降表现为效率低下。但一旦问题求解成功,问题求解涉及的知识就可以归纳、整理&编辑,形成新的浅层知识――经验性关联,或精化原有的经验性关联知识。结果以后遇到类似问题,就可依赖新的知识,表现为较好的自适应能力。
动态系统的适应性多级诊断建模方法的知识表示,诊断过程和自适应学习(P97,P98,P99)
深层知识由被诊断系统之结构和行为来表示;一个多级仿真器基于被诊断系统的定性和定量知识,用于辅助确认或删除假设的故障点;而机器学习则展示为由深到浅的知识的迁移和抽象。
知识表示
深层知识描述被诊断系统的结构和行为:结构的描述包括构成系统的部件及其联接关系;行为描述则指出部件的输入、输出特性、它们的关系、部件应实现的功能和其他可观察到的特性。
结构表示
结构知识服务于仿真&决定部件行为间的因果关系。结构表示建立在一个参数化的部件类型库基础上。具体的部件是部件型的例示。部件型又分为两类:基本部件、组合部件。后者又有内部结构,从而形成对系统结构的层次描述。
行为表示
行为知识用于仿真,定义为定量或定性计算函数,用于描述部件的输出和状态参数如何随输入参数的值而改变。这些函数附加于部件型的(基本部件和组合部件)描述体。
因果网
因果网隐含于结构的描述中,每个部件的输出点,可视为该因果网中的节点。节点i和节点j之间的联接弧意指i直接影响j。由于被诊断系统为多层结构,因果网也相应地分解为多个层次。属于同上一层的部件的所有下层部件的输出点构成解释上层部件行为的因果网。
浅层知识表示为故障症状(SYM)与最特别(但不必是底层)的部件之异常特性(MSP)之间的关联,特性表示为输出或状态参数。
诊断过程
诊断过程是一个自顶层结构到底层结构的自顶向下的分层推理过程。在每层结构中,先作浅层推理,若不成功,再作深层推理。
浅层推理
浅层是基于SYM和MSP之间的直接关联知识作推理。被诊断系统分层,所以前曾推理也按结构的层次加以组织。
深层推理
无论在哪一结构层,只要浅层推理无法确定故障部件,就转入深层推理(在同一结构层)。按这层结构项应的因果网,找出可能引起SYM的所有因果链。然后按一定的策略决定因果链上的某个测试点,在调用仿真器计算测试点期望值,与实测值作比较,逐步缩小故障范围到某一部件。
深、浅层推理综合
推理综合的总的原则是先浅后深,适用于每个结构层;无论浅、深层推理,找到故障部件后,只要是非基本部件,就要深入到下一结构层次。
自适应学习
(1)基于深层知识的诊断成功是,把故障部件的异常特性(MSP)与(SYM)直接关联而形成浅层知识(表示为规则),并累计使用该关联知识查出故障的次数。由于同一SYM可因不同的MSP引起,优先取计数最高的可能故障部件作检测。
(2)故障行为仿真后。低层结构中部件的测试往往困难且代价高。为此可以设计一些计算函数来仿真部件的故障行为。若仿真结果与实测不符,说明实际故障并非由设想的原因引起。
9 基于概念模型的问题求解建模的三种方法和主要差别,常见任务和功能化体系结构方法。
答:
设计问题求解行为模型的最重要方面是概念模型,可以把概念模型视为描述领域专家问题求解过程的本体论,它提供基本术语和术语合成法则去面熟问题求解涉及的实体、它们的属性和关系以及在求解问题中所起的作用。概念模型课归纳为三个主要范畴:基于表示、方法和任务的概念模型。
1)。基于表示的概念模型
这种概念模型直接反映与推理机关连的符号级表示,是涉及符号级表示语言和推理机制的基础,第一代KB系统及工具的概念模型均属于这种类型。
2)。基于方法的概念模型
这种概念模型面向知识级建模分析,提供预先定义的方法,使用户建模的注意力集中在获取实现方法所需的领域特有知识,而不是规则和框架等符号级表示结构。这种概念模型提供一组基本术语去描述在特别应用领域中实现方法的有关知识。
3)。基于任务的概念模型
这种概念模型不面向通用的问题求解方法,而只面向特别种类的任务;直接刻画任务结构而非执行任务的方法,因而可避免因用户不能正确理解问题求解方法而产生的问题。
主要差别:
基于表示的概念模型的主要弱点在于完全面向符号级建模分析,忽略了人的认识行为处于知识级这一特点。所以,在使用这些工具建模(建立知识库)时,知识级分析完全时用户(知识工程师)的事情,而且用户必须清醒地认识到他做地知识级分析结果能手工地转变为符合概念模型指定的符号级表示形式。若用户不能充分理解工具隐含的概念模型,就会发生知识级分析的结果与符号级实现的严重失配。此外知识级分析的一个重要方面是决定问题求解的方法,但这些工具不提供任何支持手段,严重影响的KB系统的开发。
基于方法的概念模型的主要缺点是应用领域与概念模型的失配问题。用户必须认识到由概念模型预先确定的问题求解方法适合于手头的问题,并有能力正确而一致地使用概念模型提供的基本术语;否则不足以开发好的问题求解模型。
按基于特种任务的概念模型来建立问题求解模型的主要缺点在于,手头要解决的问题必须适合于概念模型。由于概念模型几乎完全确定了问题求解的控制流程,用户只能填充细节内容,而不能改变流程的结构化组织,所以这种建模方式只适合于很受限制的范围。当然,若实际问题刚好适合于概念模型,则用户不须自行设计控制流程的结构化组织,只要直接填入内容知识(模型的细节)即可。这时,领域专家只需稍加训练,就能自行设计问题求解的过程模型——在包含概念模型的知识获取工具指导下填入内容知识,而免除知识工程师的介入。这种方式可显著提高知识获取的自动化程度(不需知识工程师介入),是知识获取研究追求的目标。但是这样的机遇很少,除非专门为手头任务设计这种获取工具。
为了克服基于预先固定的概念模型来设计KB系统而产生的失配问题,Chandrasekaran提出了以常见任务方法去实现问题求解的功能化体系结构。这种方法要求以功能单元来构造基于知识的问题求解系统,而不是以预先固定的概念模型强加于系统。为实现智能软件的重用和加速KB系统的开发,可以将每个功能单元的实现视为常见任务的历史,并为每个任务提供开发工具(包括知识表示语言和推理机)。鉴于复杂的问题求解任务场可以层次的分解为子任务,只要预先建立一个范围充分广阔的常见任务集,就可以通过组合应用适当的任务来快速设计KB系统。
常见任务可以从三个方面加以定义:
任务的功能——描述要解决的问题之类型和特征。特征包括输入信息和输出结果的特征、所使用知识的特征等。
知识的表示和组织——包括定义表示知识的基本术语和组织方式(合成法则),这实际上是定义了一种知识表示语言。
控制策略——定义使用知识去实现信息处理功能的推理机制。
常见任务实际上定义了一个涉及功能单元大额外壳(shell),也可视为给予任务的概念模型,只不过任务的粒度小的多。由此,涉及KB系统的第一步就是层次分解手头的问题求解任务,知道每个字任务成为常见任务;然后按每个常见任务外壳提供的表示语言获取和表示知识,将常见任务外壳例示为执行具体子任务的功能单元;这些功能单元联合起来就形成了所需KB系统的功能化体系结构。
Chandrasekaran认为诊断推理中常涉及四个常见任务:层次分类;诱导装配;假设匹配;数据库推理。
功能化结构体系结构方式的评价。一常见任务法实现功能化体系结构的核心思想是,基于知识的问题求解系统可以由功能单元来构造,而功能单元是常见任务在特别应用领域中的例示。每个功能单元包含解决某一特别子问题的领域知识,这些知识以常见任务指定的形式表示和组织,并以相应的推理控制方式使用。以功能化体系结构方式构造KB系统有如下优点:
多样性。(P118,字太多省略… 下同)
模块化。
知识获取。
推理解释。
推理效率。
系统设计。
然而以功能化体系结构方式构造KB系统也存在着一些缺点:
失配问题。
不完备性。
难以使用。
我们认为,功能化体系结构方式只有功能单元组成的单一层次的表示结构,是引起这些缺点的原因。若功能单元能够通过组合下层基本元素(控制和推理元素)来构造而不是作为固定shell的例示,这些缺点就消失了。因为功能单元不再有强加的预先固定的概念模型,常见任务的分类的粒度也不成为问题,因为可按需从下层基本元素来构造;下层基本元素肯定比由基本元素构造的常见任务少的多,用户只需花费少量时间就能学会基本元素的定义和合成法则。
10 知识级建模方法KADS:知识获取的采矿观和建模观,建模观的关键——获取概念模型,KADS的中间模型、专门知识建模方法、解释模型和结构保留设计。
答:
采矿观 代表传统知识获取观点,这种观点把知识获取视为从领域专家诱导出知识并将其传送到KB系统的过程。KB系统成为由知识工程师制作的用以填充知识的容器,知识工程师为开矿者,领域专家的大脑为矿藏。这意味着,领域专家求解问题所需的知识已经存在于大脑中,知识工程师只需通过与领域专家会谈就可获取到知识,再转变其为KB系统所使用的形式。
建模观 把开发KB系统视为建模活动,KB系统不再简单地只是填充知识的容器,而是以特定的方式模拟人问题求解行为或真实世界中系统行为的模型。
建模观的关键——获取概念模型 建模观最关键的就是获取概念模型。这分为两种方式:提供概念模型和建模语言。建模语言供知识工程师用以构造概念模型,使其与应用领域牲和问题求解任务的要求匹配。建模语言分为知识级和符号级两类,由于符号级建模语言抽象级太低,难以使用,所以开发知识级建模语言成为主流。
概念模型可类比于关系数据库中的概念模式,目的在于对系统行为涉及的对象和操作进行抽象而直观的描述。概念模型不涉及物理实现,所以使用的描述语言并非是关于计算结构和技术的形式语言,而是面向人思文方式的认识观念的语言。
KADS的中间模型 生命周期是软件开发方法论的基础,按KADS观点,KB系统的生命周期由相继的苦干所谓的中间模型来控制。中间模型导致了知识工程任务的分解:每个模型均强调被建KB系统的某一方面,而忽略其它方面,从而复杂的知识工程过程可以按任务各个击破。
专门知识建模方法 建模考虑两个关键因素:1,对知识类型的区分,即按人的认识论观点来切分专门知识的范畴,2分层组织各种类型的知识。KADS区分了四个范畴的知识:
领域-对应用领域作表态的原理性描述
推理-使用领域知识作揄的知识。
任务-表示问题求解任务结构的知识
策略-对问题求解作动态规划的知识
解释模型 解释模型是缺少领域层的专门知识模型。典型的解释模型描述一个常见任务的揄知识和任务知识,由于这些知识以应用领域无关的术语描述,能够重用于不同的应用领域。
结构保留设计 所谓结构保留指知识概念模型的元素与符号级表示结构之间存在对应性,从而KB系统的实现可视为加符号级信息到概念模型的过程。
11 非单调推理的形式方法(包括封闭世界假设、谓词完备和缺省推理),数据从属和理由文持,从属制导回溯。
答:
11.1非单调推理的形式方法
11.1.1封闭世界假设 Closed World Assumption, CWA
(1)CWA
CWA是一种对由某基本信念集Δ定义的一个理论τ(Δ)作完备化的方法。
即τ(Δ)是完备的,意指包含了每一个基础原子公式或其反。
Eg: {P(A), P(B), Q(A)} 是不完备的,因为没有Q(B)或﹃Q(B)
(2)扩充集
为完备τ(Δ)而生成的扩充集,每个基础原子公式的取反均是假设的暂时信念。
记为Δasm
Eg: Q(B) 不属于τ(Δ) 令Δasm = {﹃Q(B)}
则CWA(Δ) =τ(Δ∪Δasm)
(3)性质
CWA非单调,因为一旦有新的基础原子公式加入Δ,则为完备τ(Δ)而生成的扩充集就必须收缩(删除错误假定的项)。
Eg: 有Q(B)加入τ(Δ),则删除τ(Δ)中的﹃Q(B)
CWA的作用是完备化数据库系统,它不能保证CWA(Δ)是一致的。(即不保证加入Δasm的全真)。
(4)试图解决不一致性的定理(p160页)
11.1.2谓词完备
(1)谓词完备方法将满足一阶谓词的对象限制性为仅仅由Δ说明必须满足该谓词的那些。
Eg:
Δ = {P(A)},则有充分条件 ∨x(x=A→P(x))
谓词完备方法假设P(x)的必要条件也成立,即∨x(P(x)→x=A)
这称为谓词P的完备公式,它使Δ中的P的定义完备化。
11.1.3缺省推理
(1)在缺乏信息时,一个有效的作法就是根据已有信息和经验作有益的猜测,只要不发生反面的证据,构造这些猜测的过程称为缺省推理。
常见的缺省推理方法有最有可能的缺省推理、限制。
(2)限制 Circumscription :类似谓词完备把满足Δ中谓词的对象限制在由Δ说明必须满足那些对象范围内,但取消了包含的公式必须是子句且对P单一的要求。