贝叶斯决策分析及其改进
作者简介:孙敬波(1974-),男,山东省济宁市人,济宁师专助教,中国科学院研究生学院软件学院在读硕士。研究方向:系统分析。
R(αk|x)= m i n
i=1,2..α
R(αi|x),则α=αk
3.限定一类错误率条件下使另一类错误率为最小的两类决策
在两类别决策问题中,有犯两种错误的可能性,一种是在采取决策w1时其实际自然状态为w2;另一种是在采取决策
w2时其实际自然状态为w1,这两种错误的概率分别是p(w2)·p2(e)和p(w1)·P1(e),最小错误率贝叶斯决策是使这两种错
误率之和p(e)为最小。由于先验概率对具体问题来说往往是确定的,所以一般称P1(e),P2(e)为两类错误率。实际中,
有时要求限制其中某一类错误率不得大于某个常数而使另一类错误率尽可能的小。这样的决策可以看成在P2(e)=ε0
条件下,求P1(e)极小值的条件极值问题。可以用条件极值的Lagrange乘子法。建立的数学模型为
γ=P1(e)+λ(P2(e)-ε0)其中λ是Lagrange乘子,目的是求γ的极小值。当求的最佳的λ及两类决策的分界面t时能
使γ极小,此时的决策规则为
如果λp(x|w2)><p(x|w1),则x属于
w1
w2
4.最小最大决策
从最小错误率和最小风险贝叶斯决策中可以看出其决策都是与先验概率p(wi)有关的。如果给定的x,其p(wi)不
变,按照贝叶斯决策规则,可以使错误率和风险最小。但是如果p(wi)是可变的,或事先对先验概率毫不知道的情况下,
若再按某个固定的p(wi)条件下的决策进行就往往得不到最小错误率或最小风险。而最小最大决策就是考虑在p(wi)变
化的情况下,如何使最大可能的风险为最小,也就是在最差的条件下争取到最好的结果。
对于两类问题假设损失函数为
λ11———当x∈w1时决策为x∈w1;λ21--当x∈w1时决策为x∈w2;
λ22———当x∈w2时决策为x∈w2;λ12--当x∈w1时决策为x∈w2;
通常作出错误决策比作出正确决策所带来的损失要大,即λ21>λ11及λ12>λ22。
再假定决策域 和 已经确定,则风险R可按公式得出
R=∫R(α(x)|x)p(x)dx=∫ R(α1|x)p(x)dx+∫ R(α2|x)p(x)dx=∫ [λ11p(w1)p(x|w1)dx+λ12p(w2)p(x|w2)]dx
+∫ [λ21p(w1)p(x|w1)+λ22p(w2)p(x|w2)]dx
我们的目的是分析风险R与先验概率p(w1)之间的关系。最小最大决策的任务就是寻找贝叶斯风险为最大时的决策域
R1或R2,它对应于
(λ11-λ22)+(λ21-λ11)∫ p(x|w1)dx-(λ12-λ22)∫ p(x|w2)dx=0的解。风险R为:
R=λ22+(λ12-λ22)∫ p(x|w2)dx=α
因此在做最小最大贝叶斯决策时,若考虑p(w1)有可能改变或对先验概率毫不知晓的情况下,应选择贝叶斯风险R
为最大值时的p(w1)来设计分类器,此时能保证其风险相对于其它的p(w1)为最大,而能保证在不管p(w1)如何变化,使
最大最小风险为最小,我们称这样的决策为最小最大决策。
5.序贯分类法
上述的分类决策都认为d个特征都同时给出且不考虑获取特征所花的代价。而在实际的应用中却要考虑获取特征
的代价。因此可能出现这样的情况,获取k个特征(k<d)后就能做判断为合理。这是因为其余的d-k个特征的加入使
分类错误降低而造成的代价的减少补偿不了获取这些特征所花费的代价。解决上述问题的方法可用序贯分类方法,就
是先用一部分特征来分类,逐步加入特征以减少分类损失。而每步都要衡量加入新特征所花费的代价和所降低分类损
失的大小,以便决定是否继续再加入新的特征。为此要计算停止损失和继续损失,并加以比较。当停止损失等于最小损
失时就作出分类决策。但是这种计算方法的计算量和存储量都要求很大。
6.用上述的决策对观察向量x进行分类是分类器设计的主要问题。分类器就是一个和一系列的判别函数(或决策
面)。
二、贝叶斯决策的改进
贝叶斯决策属于风险型决策,决策者虽不能控制客观因素的变化,但却可掌握其变化的可能状况及各状况的分布概
率,并利用期望值即未来可能出现的平均状况作为决策准则。由于决策者对客观因素变化状况的描述不确定,所以在决
策时会给决策者带来风险。但是完全确定的情况在现实中几乎不存在,尤其在波动性很大的证券市场中就更不可能了。
不确定性是生活中的常态,贝叶斯决策不是使决策问题完全无风险,而是通过其他途径增加信息量使决策中的风险减
小。由此可以看出,贝叶斯决策是一种比较实际可行的方法。
为了对贝叶斯决策方法有清晰的认识,我们对其解题思路做一简要描述(忽略一些具体操作),它主要是由以下几步
完成的。
—21—
决策问题转化成收益矩阵,通过对收益矩阵的分析,得出各行动方案的期望值,按照一定的准则选出最优方案。
2·以各状况下最大收益值或效用值为基础,求出MaxE(x),以此作为完全确定情况下的收益值,用该值减去最优方
案的期望值得出完全信息价值(EVPⅠ),根据完全信息期望值判断是否需要补充信息量。
3·在第2步得到肯定回答后,首先在预先后验分析中从理论上把各种可能的抽样方案及结果列举出来,计算各种抽
样方案的抽样信息期望值EVSI=EVPI-R(n),其中R(n)为抽样风险,其大小是样本大小的函数。
4·以EVSI-C(其中C为抽样成本)作为标准选取最大值对应的抽样方案为最优抽样方案。
5·按照理论上得出的最优抽样方案进行抽样,然后,根据贝叶斯理论公式推导出后验概率分布的数字描述,最后,以
此为依据按照贝叶斯决策准则选出最优方案。
从贝叶斯决策的解题步骤可以看出,该方法是以贝叶斯理论为基础的,由贝叶斯定理可以推出通过抽样增加信息量
可以减小决策风险的结论,这一结论保证了贝叶斯决策的科学性。除此以外,贝叶斯决策通过对完全信息价值、抽样信
息价值及抽样信息价值减去抽样成本等指标的考察,又从经济的角度保障了该方法的可行性。由此似乎可以认为,贝叶
斯决策是一种兼科学性和实效性于一身的非常完善的决策方法。但仔细观察我们会发现其本身仍存在两点不足需要我
们对其进行改进。
(一)首先,在贝叶斯决策分析中,判断是否进行实际抽样是以其具有的经济价值(即EVSI-C最大)为唯一标准,但
在实际的决策分析中,决策者除了要考虑抽样是否有经济效益外,他更关心通过抽样是否能够改变其最终决策结果,即
根据后验概率选择的最佳方案是否不同于先验概率下的最佳方案。对他们来说,如果在经过抽样补充后的后验概率下
的最佳方案仍然是先验概率下的最佳决策方案,即使最终的EVSI-C大于0,抽样也没有实际意义,因为抽样要花费一定
的时间,在不断变化的当今社会,时间可能会使一个优的方案不再优,即使不考虑时间因素与投资时机的影响,单纯从抽
样费用出发,在先后验最佳方案相同的情况下,由于后者的抽样要花费人力、物力、财力等费用,其成本大于前者而收益
在实际中不会有所变动,两者综合起来的结果是不抽样比抽样有效率。
基于上述考虑,贝叶斯决策分析应该在第四步加上一点,即比较在理论上按最佳抽样方案抽样后的后验最佳方案与
先验最佳方案是否一致,如果一致就无需再进行下面的操作。除此之外,还可以用以下方法对贝叶斯方法进行改进。
在得到先验的最佳方案以后,可用最佳方案与其他任一方案一起算出转折概率,如下例:
状态A状态B
方案1 500 100
最佳方案350 150
转折概率的计算为:500P+100(1—P)=350P+150(1-P)
P=0.25
当P>0.25,方案Ⅰ属于最佳方案。如果经过先后验分析发现后验概率中状态A的概率大于0.25,即抽样将改变最
后的决策选择时,可以进行实际抽样,否则,即使抽样能够很大程度地提高状态变量分布的最确性,而且EVSI-C也大于
0,抽样也没有意义。以上只是就最佳方案与某一个Ⅰ方案的分析,其它方案的做法也一样,只不过在方案个数较多时,
转折概率的个数增多,做判断时要逐个进行,但与由于没有有效地控制而抽样造成地浪费来说,其复杂程度还是可以接
受的,而且在现实中,我们可以选择的方案个数也不会很大。
(二)其次,在贝叶斯最小风险决策中虽然考虑了损失而使风险达到最小,但是没有考虑是否达到了期望收益和期望
效用的大小。虽然该方法依据贝叶斯理论,通过抽样和其它技术使概率分布状况的准确性得以提高,因此减少了决策风
险,但是风险始终没有消除。而我们知道高收益经常是与高风险相伴随的,单独考虑任何一个都不是完全的,最终都可
能出现与投资者初衷不一致的结果。
为了使贝叶斯决策方法更完善,在实际当中更可行,应该对其决策准则进行改进。改进原先只用期望受益和期望效
用的判断准则,或只以最小风险为判断准则,形成以期望受益与期望效用与风险综合后的指标为标准的决策准则。由此
综合指标的形式为分析的重点,对于决策者来说,其对风险的偏好程度的不同来影响综合指标的具体形式。假定综合指
标的形式为αE(x)-(1-α)σ(x),如果他属于风险追求型,他就会愿意承担较大的风险以获取较高的收益,在综合指标
中。值就会偏小一些,从式中可以看出小的α说明σ(x)给其带来的负面影响较小一些。如果决策者属于风险厌恶型,在
肯定能取得某一固定收益与在承担一定风险的条件下取得较多收益的两种决策中,他会选择前一种,(下转第25页)
—22—
少重要用户的机房设置了双路电网供电,目的是一主一备:一路市电供电时,另一路市电处于等待状态。
有一些用户希望将两路市电同时接到UPS上:一路接整流器,另一路接旁路,如图3所示。认为这样的连接更加可
靠。其原因是:当市电1有故障时,市电2可以通过旁路继续给负载供电;而当市电2有故障时,UPS仍可继续供电。但
仔细分析一下就可以发现这样所谓的“一主一备”并没有什么好处,首先是它背离了原来一主一备的初衷,将两路市电同
时使用了;其次也没有充分利用UPS的优势。从这个观点来看,有没有接旁路这一路市电的情况都一样,都能正常供电。
当连接整流器的一路市电1有故障而电池能量又被放完时,UPS就会自动将负载切换到旁路市电上,由市电2直接向负
载提供没有被加工过的能量。
从另一个方面来说,上述接法使UPS失去了一些宝贵的保护负载的能力,即只在市电1故障时起作用,当市电2故
障且电池放完电时就不起作用了。此外,在安装时增加了安装器材和工时,需要双倍拉向UPS的开关、电缆或保险器。
如果将两路市电在输入配电柜在进行“互投”,就会使UPS处于100%的应用中,如图4所示。不论哪一路市电故障,
都能保证UPS有输入电压,只要UPS的逆变器不损坏,用电设备就会始终工作在理想市电的环境下,这一方面减少了电
池深度放电的次数,另一方面减少了旁路供电的次数,同时也简化了装机手续,节省了安装器材,可以最大限度地保证用
户的安全用电。
(责任编辑 杜 华)
(上接第22页)在综合指标中。α会偏大一些,对应一定的σ(x)会给决策者带来较大的负效用。如果决策者对风险无所
谓,对于在确定条件下取得一定收益与在有风险条件下取得较多收益的策略没有特别的偏好,两个方案给他带来效用是
一样的。反映到综合指标的系数上α=0.5。综合指标除了假定的形式外,还可以以分数的形式出现,如βE(x)/α(x),式
中的β系数代表决策者的风险偏好系数,对于风险追求型的,其值小于0.5,对于风险厌恶型的,其值大于0.5,而对风险
无所谓的决策者而言,其值等于0.5。
贝叶斯决策的决策准则得到改进后,由此得出的最佳方案就是在风险一定情况下收益最大的方案,或者在收益一定
的情况下风险最小的方案,为了分析的一致性,在计算EVPI时也应该以综合指标为基础。由于EVSI本身就已经考虑了
抽样风险,所以不用再对其进行改进。还有一点要注意的是,前面提到的对贝叶斯决策的第一个缺陷进行改进的第二种
方法中也要相应地进行调整,在计算转折概率计算时,以综合指标取代收益值。
贝叶斯决策方法作为一种风险型决策方法,在实际中的应用较广泛,但我们除了要掌握它的基本内涵及解题步骤
外,也要了解其存在的缺陷,本文就针对贝叶斯方法中存在的两个问题进行了分析,并分别提出了改进方法,以使其在实
际应用中更趋科学性。
参考文献:
[1]边启攵聿祺,张学工.模式识别[J].清华大学出版社,(第二版)2002.
[2]吴海春.管理统计决策分析[M].西南财经大学出版社,1991,(04).
[3]严武,程振源,李海东.风险统计与决策分析[M].经济管理出版社,1999,(06).220
贝叶斯决策分析及其改进下载如图片无法显示或论文不完整,请联系qq752018766