十二、条件随机场

条件随机场（CRF）是给定一组输入随机变量条件下，另一组输出随机变量的条件概率分布概率，其特点是假设输出随机变量构成马尔可夫随机场。条件随机场可以用于不同的预测问题。在这里，我们研究的是线性链条件随机场在标注问题的应用。

0条件随机场的主要学习内容

1）概率无向图模型

2）条件随机场的定义与形式

3）条件随机场的概率计算问题

4）条件随机场的学习算法

5）条件随机场的预测算法

1前期准备工作

首先，我们来看看什么是随机场。随机场是由若干个位置组成的整体，当给每一个位置中按照某种分布随机赋予一个值之后，其全体就叫做随机场。举例说明一下：假如我们有一句话，共十个词需要进行词性标注，这十个词每个词的词性我们可以在已知的词性集合（名词，动词，...）中去选择。当我们为每个词选好词性后，这就形成了一个随机场。

马尔可夫随机场：简单的说，就是假设随机场中某个位置的赋值仅仅与和它相邻的位置的赋值有关，和与其不相邻的位置的赋值不相关。比如第三个词的词性除与自己本身的位置有关外，只与第二个词和第四个词的词性有关。下面我们从图论来详细介绍马尔可夫随机场。

1.1概率无向图模型^[1]

概率无向图模型，又称为马尔可夫随机场^[1]，是一个可以由无向图表示的联合概率分布。图是由结点及连接结点的边组成的集合，结点和边分别记作v和e，结点和边的集合分别记作V和E，图记作G=(V,E)。无向图是指边没有方向的图。

我们希望将整体的联合概率写成若干子联合概率的乘积的形式，也就是将联合概率进行因子分解，这样便于模型的学习与计算。而概率无向图模型的最大特点就是易于因子分解。

1.2概率无向图模型的因子分解^[1]

在讲概率无向图模型的因子分解之前，我们需要先知道无向图中的团与最大团是什么？其实无向图G中任何两个结点均有边连接的结点子集称为团，若C是无向图G的一个团，并且不能加进任何一个G中的结点使其成为更大的团，则称此C为最大团。

举例说明：

将概率无向图模型的联合概率分布表示为其最大团上的随机变量的函数的乘积形式的操作，称为概率无向图模型的因子分解^[1]。

2条件随机场的定义与形式

2.1条件随机场的定义^[1]

条件随机场是给定随机变量X条件下，随机变量Y的马尔可夫随机场，这里主要介绍定义在线性链上的特殊的条件随机场，称为线性链条件随机场^[1]。线性链条件随机场可以用于标注等问题。在条件概率模型P(y|x)中，Y是输出变量，表示标记序列，X是输出变量，表示需要标注的观测序列，也把标记序列称为状态序列（参见隐马尔可夫模型）。