nlp基础—9.条件随机场模型(CRF算法)

article/2025/11/6 21:20:55

文章目录

- - 引言
  - 一、概率无向图模型
  - - 1. 概率无向图模型的定义
    - 2. 概率无向图模型的因子分解
  - 二、条件随机场的定义与形式
  - - 1. 条件随机场的定义
    - 2. 条件随机场的参数化形式
    - 3. 条件随机场的简化形式
    - 4.条件随机场的矩阵形式
  - 三、条件随机场的三个基本问题
  - - 1.概率计算问题
    - 2. 学习问题
    - 3. 预测问题

引言

CRF算法与HMM算法在分词方面的应用相当于在隐变量序列输出后再进行一定的调整。CRF算法的知识体系如下：
在这里插入图片描述
本文首先介绍概率无向图模型，然后叙述条件随机场的定义与各种表示方法，最后介绍条件随机场的三个基本问题：概率计算问题、学习问题和预测问题。

一、概率无向图模型

1. 概率无向图模型的定义

概率图模型是由图表示的概率分布。概率图模型分为有向图（贝叶斯网络）与无向图（马尔科夫随机场）。概率无向图模型是一个可以由无向图表示的联合概率分布。概率无向图模型的最大特点是易于因子分解。
概率无向图模型的定义为:设有联合概率分布 $P (Y)$ ，由无向图 $G = (V, E)$ 表示，在图 $G$ 中，结点表示随机变量，边表示随机变量之间的依赖关系。如果联合概率分布 $P (Y)$ 满足成对、局部或全局马尔可夫性，就称此联合概率分布为概率无向图模型( probability undirectedgraphical model)，或马尔可夫随机场(Markov random field)。
下面分别介绍无向图表示的随机变量之间存在的成对马尔可夫性、局部马尔可夫性和全局马尔可夫性。

成对马尔可夫性:

$P(Y_u,Y_v|Y_O)=P(Y_u|Y_O)P(Y_v|Y_O)$
局部马尔可夫性:

全局马尔可夫性:

2. 概率无向图模型的因子分解

下面分别给出团与因子分解的定义。无向图 $G$ 中任何两个结点均有边连接的结点子集称为团。
在这里插入图片描述
将概率无向图模型的联合概率分布表示为其最大团上的随机变量的函数的乘积形式操作，称为概率无向图模型的因子分解。

$\psi_C(Y_C)=exp\{-E(Y_C)\}\\\psi_C(Y_C)称为势函数$

二、条件随机场的定义与形式

1. 条件随机场的定义

一般的条件随机场定义为：
在这里插入图片描述
该公式表示:对任意一个节点 $v$ ，给定其他所有节点时 $v$ 的分布等于给定与它直接相连的节点时 $v$ 的分布(局部马尔科夫性)。

线性链条件随机场定义为：
在这里插入图片描述

线性链条件随机场的一个重要应用是标注问题与找最佳路径(对其他模型所出的标注进行纠正)。

2. 条件随机场的参数化形式

在这里插入图片描述

$t_k$ 为转移特征，依赖于当前和前一个位置； $s_l$ 为状态特征，依赖于当前位置。通常 $t_k$ 与 $s_l$ 取值为1或0；当满足特征条件时，取值为1，否则为0。条件随机场完全由特征函数 $t_k$ 与 $s_l$ 以及对应的权值 $\lambda_k$ , $u_l$ 确定。