(2)条件概率分布
条件概率和条件概率分布是用来刻画变量之间和事件之间关系的基本工具。设A,B为两个随机事件且P(B)>0,在给定事件B发生的情况下,事件A发生的条件概率定义为:
(2.1)
(3)链规则
记个变量X,Y的联合分布为P(X,Y),按照条件分布的定义,可得
P(X,Y)=P(X)P(Y|X) (2.2)
将其推广到n个变量的联合分布 有
(2.3)
式中,将一个联合分布分解为一系列条件分布的乘积,称之为链规则。
(4)条件独立
设A,B为同一随机试验的两个不同时间,当事件A和事件B互相独立时,如果下式成立:
(2.4)
当P(B)>0时,由上式可得P(A)=P(A|B)。所以A与B互相独立的直观含义是:事件B发生或者不发生,都不对事件A发生的概率产生影响,即不改变事件A的信度。
推广到3个事件的情况,分别记为事件A,B和C,假定P(C)>0,我们称事件A与B在给定C时相互条件独立,如果下式成立:
(2.5)
当 时,由上式可得 。所以事件A与B在给定C时相互条件独立的直观意义是:在已知事件C发生的前提下,事件B发生或者不发生,都不对事件A发生的概率产生影响,即不改变事件A的信度;同样,事件A发生或者不发生,都不对事件B发生的概率产生影响,即不改变事件B的信度。
综合以上分析,如果变量间存在独立关系,利用链规则,就可以将联合概率分布分解成一系列复杂度较低的条件概率的乘积,从而有效降低模型的复杂度,提高推理的效率。 贝叶斯网络参数学习中的连续变量离散化方法研究(3):http://www.youerw.com/jisuanji/lunwen_18940.html