条件随机场CRF的理解

article/2025/11/6 21:23:25

1.个人理解和总结

  1. 对比HMM的状态转移概率矩阵和发射概率矩阵CRF有自己的定义在边上的特征函数(相当于转移概率)和定义在节点上的特征函数(相当月发射概率)
  2. 序列标注HMM可以根据转移概率矩阵和发射概率矩阵计算出隐状态序列概率,(齐次马尔科夫假设:当前状态只与前一状态有关,观测独立性假设:观测序列的状态只与这一时刻的隐状态相关),而CRF则是计算概率图中所有最大团的特征函数来模拟出隐状态序列概率

2.巨人的肩膀

非常感谢博文的原作者,刘启林的精彩总结
CRF条件随机场的原理、例子、公式推导和应用

条件随机场(Conditional Random Field,CRF)是自然语言处理的基础模型,广泛应用于中文分词、命名实体识别、词性标注等标注场景。

条件随机场CRF与深度学习结合,产生了BiLSTM-CRF、BiLSTM-CNN-CRF等模型,在中文分词、命名实体识别、词性标注也取得不错的效果。

条件随机场CRF与Attention机制结合,又发展成了Transformer-CRF、BERT-BiLSTM-CRF等模型,使中文分词、命名实体识别、词性标注效果又有显著提高。

本文先引出条件随机场CRF的场、随机场、团、最大团等相关基础概念;接着介绍CRF的原理,重点阐述了线性链条件随机场的原理;然后介绍CRF在中文分词、命名实体识别、词性标注的具体应用;最后对CRF进行总结,指出图模型之间的演化关系,及CRF模型的发展简史。

本文结构如下:

一、CRF基础
1、无向图
2、马尔可夫随机场
3、最大团
4、无向图的因子分解

二、CRF原理
1、条件随机场
2、线性链条件随机场
3、线性链条件随机场公式
4、条件随机场例子

三、CRF应用
1、中文分词
2、命名实体识别
3、词性标注

四、CRF总结
1、CRF的概括总结
2、图模型之间的关系
3、CRF的发展简史


直接上PPT。

CRF条件随机场的原理、例子、公式推导和应用


一、CRF基础

CRF基础的目录


1、无向图

什么是图?什么是无向图?

什么是图?什么是无向图?


2、马尔可夫随机场

什么是场?什么是随机过程?

什么是场?什么是随机过程?

什么是随机场?什么是马尔可夫随机场?

什么是随机场?什么是马尔可夫随机场?


3、最大团

什么是团?什么是最大团?

什么是团?什么是最大团?


4、无向图的因子分解

Hammersley-Clifford 定理如下:

无向图的因子分解

举个无向图的因子分解的例子。

无向图的因子分解的例子


二、CRF原理

CRF原理的目录


1、条件随机场

2001年,John Lafferty, Andrew McCallum 和 Fernando Pereira,在论文《 Conditional Random fields :Probabilistic Models for Segmenting and Labeling Sequence Data》提出条件随机场。

提出条件随机场。

条件随机场

条件随机场定义如下:

条件随机场定义


2、线性链条件随机场

线性链条件随机场

线性链条件随机场的定义如下:

线性链条件随机场的定义

线性链条件随机场CRF的图结构

线性链条件随机场CRF的图结构


3、线性链条件随机场公式

线性链条件随机场公式

特征函数定义如下:

特征函数

为了简单起见,将转移特征和状态特征及其权值用统一符号表示。条件随机场简化公式如下:

条件随机场简化公式


4、条件随机场例子

例2:已知中文文本"刘启林”,采用IOB标注方法,求实体标注序列为{ B,I,I }的概率。

求实体标注序列为{ B,I,I }的概率

例1的几何描述如下:

例1的几何描述


例1的标注序列为{B、I、I}的联合概率分布如下:

例1的标注序列为{B、I、I}的联合概率分布


三、CRF应用

CRF应用的目录


1、中文分词

刘启林:中文分词的原理、方法与工具134 赞同 · 7 评论文章

基于CRF由字构词方法的基本思想,基本原理如下:

基于CRF中文分词的基本思想,基本原理

CRF中文分词的图结构如下:

CRF中文分词的图结构


2、命名实体识别

刘启林:中文命名实体识别NER的原理、方法与工具144 赞同 · 13 评论文章

基于CRF的命名实体识别过程如下:

基于CRF的命名实体识别

CRF命名实体识别的图结构如下:

CRF命名实体识别的图结构


3、词性标注

基于CRF词性标注方法的基本思想,基本原理如下:

基于CRF词性标注的基本思想,基本原理

CRF中文词性标注的图结构如下:

CRF中文词性标注的图结构


四、CRF总结

CRF总结的目录


1、CRF的概括总结

CRF的概括总结


2、图模型之间的关系

朴素贝叶斯、HMM、逻辑回归、CRF等图模型关系如下:

朴素贝叶斯、HMM、逻辑回归、CRF等图模型关系

朴素贝叶斯、HMM、逻辑回归、CRF对比如下表所示:

朴素贝叶斯、HMM、逻辑回归、CRF对比

更多HMM可参考:

刘启林:HMM隐马尔可夫模型的例子、原理、计算和应用302 赞同 · 36 评论文章

更多LR逻辑回归模型可参考:

刘启林:LR逻辑回归模型的原理、公式推导、Python实现和应用101 赞同 · 12 评论文章


3、CRF的发展简史

CRF的发展简史

机器学习阶段:CRF

深度学习阶段:BiLSTM-CRF、BiLSTM-CNN-CRF

Attention阶段:Transformer-CRF、BERT-BiLSTM-CRF

条件随机场CRF一直是标注问题的基础模型。


由于能力和水平的限制,我的可能是错的。


参考文献:

1、王元等, 数学大词典(第二版), 科学出版社[M], 2017.09

2、John Lafferty, Andrew McCallum, and Fernando Pereira, "Conditional Random Fields:

Probabilistic Models for Segmenting and Labeling Sequence Data", June 2001.

3、李航, 统计学习方法(第2版), 清华大学出版社[M], 2019.05

4、宗成庆, 统计自然语言处理(第2版), 清华大学出版社[M], 2013.08

5、Charles Sutton and Andrew McCallum, An Introduction to Conditional Random Fields, 2011


http://chatgpt.dhexx.cn/article/BTvmVjD1.shtml

相关文章

条件随机场的简单理解

目录 什么是条件随机场 条件随机场长怎么样 如何构建特征函数 前向—后向算法 条件随机场的概率计算问题 条件随机场的预测问题 什么是条件随机场 条件随机场的定义 条件随机场总的来说就是只要满足“条件随机场”这个条件,就可以根据定义的模型去求解我们需…

nlp基础—9.条件随机场模型(CRF算法)

文章目录 引言一、概率无向图模型1. 概率无向图模型的定义2. 概率无向图模型的因子分解 二、条件随机场的定义与形式1. 条件随机场的定义2. 条件随机场的参数化形式3. 条件随机场的简化形式4.条件随机场的矩阵形式 三、条件随机场的三个基本问题1.概率计算问题2. 学习问题3. 预…

条件随机场模型

条件随机场模型(Conditional Random Fields, CRF) 条件随机场是给定一组输入随机变量条件下,另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔可夫随机场。线性链条件随机场,是输入序列对输出…

CRF 条件随机场

目录 1. 基本概念 1.1 各种随机场 1.2 CRF模型的训练原理 1.3 条件随机场的参数化形式 1.4条件随机场对应的简化概率表达 2. 例子 定义CRF中的特征函数 从特征函数到概率 CRF与逻辑回归的比较 CRF与HMM的比较 HMM和CRF区别 3. Tensorflow实现 tf.contrib.c…

NLP之条件随机场

条件随机场(conditional random fields, CRFs)由J. Lafferty等人(2001)提出,近几年来在自然语言处理和图像处理等领域中得到了广泛的应用。 CRF是用来标注和划分序列结构数据的概率化结构模型。言下之意,就…

条件随机场CRF

1 条件随机场CRF:从条件随机场到线性链条件随机场 条件随机场(Conditional Random Fields, 以下简称CRF)是给定一组输入序列条件下另一组输出序列的条件概率分布模型,在自然语言处理中得到了广泛应用。 1.1 什么样的问题需要CRF模型 这里举一个简单的…

条件随机场的肤浅理解

条件随机场(Conditional Random Field,CRF)是自然语言处理的基础模型,是一个无向图概率模型。经过长期的发展目前已经广泛应用于词性标注、图像分类等众多场景。 一、基本概念 随机场 : 给定一组随机变量: X { X 1 , X 2 , X …

条件随机场详解

为了更好地理解条件随机场,这里主要以命名实体识别为例子,介绍如何和LSTM结合,进行NER。 首先什么是NER,就是针对一句话的每个词,都标注出它们的词性,比如输入一句"Dog play football"&#xff…

条件随机场(CRF)

目录 1.定义 1.1 图 1.2 概率图模型(PGM) (1)有向图的联合概率: (2)概率无向图模型: 1.3 马尔可夫性 1.4 团与最大团 1.5 概率无向图模型的联合概率分布 1.6 条件随机场 …

条件随机场 (CRF)

背景 CRF和HMM是有相似性的,最后都是使用Verterbi算法来进行最优状态转移序列的确定。CRF主要用于序列标注问题。 本质:通过1D卷机学习近邻信息,然后输入到CRF定义好的计算方式中。 一些实现的库,并不能主观反应出CRF的计算方式&…

条件随机场简介(Conditional Random Fields, CRF)

首先,我们来看看什么是随机场。随机场是由若干个位置组成的整体,当给每一个位置中按照某种分布随机赋予一个值之后,其全体就叫做随机场。以词性标注为例:假如我们有一个十个词组成的句子需要做词性标注,这十个词每个词…

简单理解条件随机场CRF

一、条件随机场是什么? 什么是条件随机场?我们先从它的命名开始说起,为什么是条件随机场这么奇怪的名字,为什么不叫飞机场、火葬场?通常数学上的命名是简单而直白的,大家听我一一解释。 条件 “条件”指…

条件随机场(CRF)的详细解释

条件随机场(CRF)由Lafferty等人于2001年提出,结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,常用于标注或分析序列资料,如自然语言文字或是生物序列。近年来在分词、词性标注和命名实体识别等序列标注任务中取得了很好…

RBM理论推导

RBM(Restricted Boltzmann Machine) 上面这个图就是一个RBM模型,它包括三个部分,最下面的可视层(visible layer),中间的权重连边(无向),上面的隐藏层&#xf…

受限玻尔兹曼机RBM简述与Python实现

生成式模型 生成式模型的理念大同小异,几乎都是用一个模型产生概率分布来拟合原始的数据分布情况,计算两个概率分布的差异使用KL散度,优化概率模型的方法是最小化对数似然,可以用EM算法或梯度优化算法。 今天表现比较好的生成模…

RBM系列1:预备知识

受限玻尔兹曼机是一种可用随机神经网络来解释的概率图模型。它由Smolensky于1986年在玻尔兹曼机(BM)的基础上提出,所谓“随机”,是指这种网络中的神经元是随机神经元,其输出只有两种状态(激活和未激活&…

深度学习20-限制玻尔兹曼机RBM

玻尔兹曼机来源于玻尔兹曼分布,而玻尔兹曼分布的创立者是路德维希玻尔兹曼,这个原理来源于他首次将统计学用于研究热力学,即物质的状态概率和它对应的能量有关。比如,我们常用熵来形容物体的混乱程度,同时如果我们的定…

【深度学习】受限玻尔兹曼机 (RBM) 初学者指南

一、说明 受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)是一种基于能量模型的人工神经网络。它只有一个隐层,将输入层和隐层中的每个神经元互相连接,但不同层的神经元之间没有连接。RBM是一种无向的概率图模型&am…

matlab rbm 语音,Deep Belief Network 学习笔记-RBM

Deep Belief Network 学习笔记-RBM By Placebo (纯属个人笔记) 第一次知道deep learning,是上学期dengli博士来实验室的一次报告,他讲到,当神经网络的层数大于2时(即一个hidden层,一个输出层,不算输入层,之…

受限玻尔兹曼机(RBM)

受限玻尔兹曼机(RBM) 一起读懂传说中的经典:受限玻尔兹曼机 https://mp.weixin.qq.com/s?__bizMzA3MzI4MjgzMw&mid2650731098&idx1&snc7391caee3a567b4b046406d53f022f2&chksm871b3624b06cbf320f3725fe452d291e04a4a8c1beda…