最后更新于4年前
这里的概率计算问题指的是:
给定条件随机场输入序列和输出序列, 计算条件概率, 以及相应数学期望的问题.
像HMM一样, 使用前向-后向向量, 递归地计算以上概率及期望值.
对于每个位置, 定义前向向量, 注意这是一个向量, 长度为状态可以取的状态数量, 即维向量, 每个向量定义为:
对于初始情况, 定义向量在初始状态位置上为1, 其他位置都为0.
表示在位置上, 标记为并且到位置之前的所有位置上为标记序列对应的前半部分状态的非规范化概率. 上式又可表示为:
对于每个位置, 定义后向向量, 向量的长度与前向向量相同:
表示在位置上标记为且从到的后部分标记序列对应的非规范化概率
根据前向-后向向量的定义, 计算状态序列在位置上标记的条件概率:
在位置和位置标记和的条件概率:
其中
计算特征函数关于联合分布和条件分布的数学期望.
特征函数关于条件分布的数学期望为:
另外, 假设经验分布为, 特征函数关于联合分布的数学期望为:
对于给定的观测序列和状态序列, 可以通过一次前向扫描计算和, 一次后向扫描计算, 从而得到所有概率和特征的期望.