概率无向图模型

概率无向图模型又称为马尔科夫随机场, 是一个由无向图表示的联合概率分布.

概率图模型的定义

图是由结点和连接结点的边组成的集合, 结点和边分别记作vvee, 结点和边的集合分别记作VVEE, 图就记作G=(V,E)G=(V,E).

概率图模型是由图表示的概率分布, 假设YY是一组随机变量, 联合分布P(Y)P(Y). 由无向图G=(V,E)G=(V,E)按照下面的方式表示概率分布P(Y)P(Y):

  • 在图GG中, 结点vVv\in{V}表示一个随机变量YvY_v, 因此随机变量组YY就为Y=(Yv)vVY=(Y_v)_{v\in{V}}

  • eEe\in{E}表示随机变量之间的概率依赖关系

无向图的马尔科夫性

对于给定的联合分布概率P(Y)P(Y)和对应的无向图GG, 定义无向图表示的随机变量之间的三种马尔科夫性:

  • 成对马尔科夫性

    uuvv是无向图GG中任意两个没有边连接的结点, 对应的随机变量分别为YuY_uYvY_v, 其他所有结点为OO, 对应的随机变量组YOY_O.

    成对马尔科夫性是指: 给定随机变量组YOY_O的前提下, 随机变量YuY_uYvY_v是条件独立的, 即有:

    P(Yu,YvYO)=P(YuYO)P(YvYO)P(Y_u,Y_v|Y_O)=P(Y_u|Y_O)P(Y_v|Y_O)

  • 局部马尔科夫性

    uu是无向图中任意一个结点, WW是与vv有边连接的所有结点, OO是除uuWW以外的其他所有结点, 局部马尔科夫性指的是: 在给定随机变量组YWY_W的条件下随机变量YvY_v和随机变量组YOY_O是条件独立的, 即有:

    P(Yu,YOYW)=P(YuYW)P(YOYW)P(Y_u,Y_O|Y_W)=P(Y_u|Y_W)P(Y_O|Y_W)

    又因为:

    P(Yu,YOYW)=P(YuYO,YW)P(YOYW)P(Y_u,Y_O|Y_W)=P(Y_u|Y_O,Y_W)P(Y_O|Y_W)

    P(YOYW)>0P(Y_O|Y_W)>0时, 有:

    P(YuYW)=P(YuYO,YW)P(Y_u|Y_W)=P(Y_u|Y_O,Y_W)

  • 全局马尔科夫性

    结点集合AABB在无向图中被结点集合CC分开, 全局马尔科夫性是指: 给定随机变量组YCY_C, 随机变量组YAY_AYBY_B是条件独立的, 即有:

    P(YA,YBYC)=P(YAYC)P(YBYC)P(Y_A,Y_B|Y_C)=P(Y_A|Y_C)P(Y_B|Y_C)

以上就是定义的关于概率无向图的三种马尔科夫性, 而且这三种马尔科夫性的定义是等价的.

概率无向图模型的定义

联合概率分布P(Y)P(Y), 由无向图表示, 结点表示随机变量, 边表示随机变量之间的关系. 如果联合概率分布P(Y)P(Y)满足成对, 局部或全局马尔科夫性, 就称此联合概率分布概率无向图模型, 也称为马尔科夫随机场.

概率无向图模型的因子分解

我们希望将整体的联合概率分布写成若干个子联合概率的乘积形式, 也就是将联合概率进行因子分解, 以便于模型的学习与计算. 而概率无向图的最大特点就是易于进行因子分解.

首先定义的概念:

  • 无向图中任何两个结点均有边连接的结点子集称为团

  • 最大团

    对于无向图中的一个团, 如果不能再加进任何一个结点使其称为一个更大的团, 称此时的团为最大团

因子分解就是将概率无向图模型的联合概率分布表示成: 使用一个函数, 对于若干个最大团, 关于每个最大团的随机变量的函数的乘积的形式.

给定概率无向图模型, 假设CC是无向图上的其中的一个最大团, YCY_C表示CC对应的随机变量, 那么概率无向图模型的联合概率分布P(Y)P(Y)可写作图中所有最大团CC上的函数ΦC(YC)\Phi_C(Y_C)成绩的形式, 即有:

P(Y)=1ZCΦC(YC)P(Y)=\frac{1}{Z}\prod\limits_{C}\Phi_C(Y_C)

其中ZZ是规范化因子: Z=YCΦC(YC)Z=\sum\limits_{Y}\prod\limits_{C}\Phi_C(Y_C)

函数ΦC(YC)\Phi_C(Y_C)称为势函数, 要求是严格正的, 通常定义为指数函数:

ΦC(YC)=exp(E(YC))\Phi_C(Y_C)=\exp(-E(Y_C))

最后更新于