1.2.2 类条件概率
在已知的特征空间中,类条件概率密度 是出现特征值 的概率密度,指第 类样品的属性 是如何分布的。若分类只利用它的一个特征来进行,即 ,并知道这两类的类条件概率密度函数分布,如图 所示,正常药品的属性分布是概率密度函数 ,异常药品的属性分布是概率密度函数 。
图1类条件概率
1.2.3 后验概率
后验概率是指在呈现状态 时,该样品分属各类别的概率,被识别对象作为归属的依据可以是这个概率值。由于呈现这一 值对于不同类型的待识别对象都存在着,那么它分别属于各类型的概率可用 表示。可以利用贝叶斯公式来将这种条件概率计算出来, 被称为状态的后验概率。
(4)
表示在出现 的情况下,样品为 类的概率。在这里我们要将条件概率这个概念弄清楚。条件概率的通用符号是 ,即在“ ”后边出现 的条件,前面的 为某个事件,即在某条件 下出现某个事件 的概率。
1.2.4 和 与 和 的区别
① 和 是在同一条件 下,比较 与 出现的概率,若 ,则可以下结论,在 条件下,事件 出现的几率比较大,如图 所示的两类情况下,则有 。
② 与 都是指各自条件下出现 的可能性,两者之间没有联系,比较两者没有意义。 和 是在不同条件下讨论的问题,即使只有两类 与 , 。但是不能只由于 的原因,就觉得第一类事物是 的几率较大[8]。只有将先验概率这一因素考虑后,才能决定在条件 下,判为 类或 类的可能性比较大。 图2后验概率分布图
1.3 基于最小错误率的贝叶斯决策
假设有一个待识别的特征值 后,每个样品 有 个特征,即 ,通过样品库,将先验概率 和类别条件概率密度函数 计算出来,得出当呈现状态 时,该样品分别属于各个类别的概率,并且识别对象判属的依据可以用这个概率值表示。从后验概率分布图2可见,在 值小时,药品被判为正常是比较合理的,判断错误的可能性小。后验概率的大小判决是基于最小错误率的贝叶斯决策的基础。而且又可以根据类别数目将这个规则写成不同的几种等价形式。
① 两类问题:
若每个样品属于 , 类中的一类,已知两类的先验概率分别为 , ,两类的类条件概率密度为 , 。则给一 ,判断 的类别。由贝叶斯公式可知
(5)
由全概率公式可知 (6)
其中 为类别。
对于两类问题
(7)
所以用后验概率来判别为
(8) 贝叶斯分类器及其应用研究+源码+文献综述(3):http://www.751com.cn/tongxin/lunwen_1530.html