条件随机场模型

article/2025/11/6 21:28:35

条件随机场模型(Conditional Random Fields, CRF)

条件随机场是给定一组输入随机变量条件下,另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔可夫随机场。线性链条件随机场,是输入序列对输出序列预测的判别模型,形式为对数线性模型,其学习方法通常是极大似然估计或正则化的极大似然估计。

1、条件随机场模型概念

条件随机场,设X与Y是随机变量,P(Y|X)是在给定X的条件下Y的条件概率分布。若随机变量Y构成一个由无向图G=(V, E)表示的马尔可夫随机场,即:
P ( Y v ∣ X , Y w , w ≠ v ) = P ( Y v ∣ X , Y w , w ∼ v ) P(Y_{v}|X,Y_{w}, w≠v)=P(Y_{v}|X,Y_{w}, w\sim v) P(YvX,Yw,w=v)=P(YvX,Yw,wv)
对任意结点v成立,则称条件概率分布P(Y|X)为条件随机场。式中 w ∼ v w\sim v wv表示在无向图G=(V, E)中与结点v有边链接的所有结点w, w ≠ v w≠v w=v表示结点v以外的所有结点, Y v , Y u 与 Y w Y_{v}, Y_{u}与Y_{w} Yv,YuYw为结点v, u与w对应的随机变量。

2、线性链条件随机场

线性链条件随机场,设 X = ( X 1 , X 2 , . . . , X n ) X=(X_{1},X_{2},...,X_{n}) X=(X1,X2,...,Xn) Y = ( Y 1 , Y 2 , . . . , Y n ) Y=(Y_{1},Y_{2},...,Y_{n}) Y=(Y1,Y2,...,Yn)均为线性链表示的随机变量序列,若在给定随机变量序列X的条件下,随机变量序列Y的条件概率分布P(Y|X)构成条件随机场,即满足马尔可夫性 P ( Y i ∣ X , Y 1 , . . . , Y i − 1 , Y i + 1 , . . . , Y n ) = P ( Y i ∣ X , Y i − 1 , Y i + 1 ) P(Y_{i}|X, Y_{1},...,Y_{i-1}, Y_{i+1}, ..., Y_{n})=P(Y_{i}|X, Y_{i-1}, Y_{i+1}) P(YiX,Y1,...,Yi1,Yi+1,...,Yn)=P(YiX,Yi1,Yi+1)
i = 1 , 2 , . . , n ( 在 i = 1 和 n 时只考虑单边) i=1,2,..,n (在i=1和n 时只考虑单边) i=1,2,..,n(i=1n时只考虑单边)
则称P(Y|X)为线性链条件随机场。在标注问题中,X表示输入观察序列,Y表示对应的输出标记序列或状态序列。

3、马尔可夫随机场

马尔可夫随机场(Markov random field)又称为概率无向图模型(probabilistic undirected graphical model)是一个可以由无向图表示的联合概率分布。

设有联合分布P(Y),由无向图G=(V, E)表示,在图G中,节点表示随机变量,边表示随机变量之间的依赖关系。如果联合概率分布P(Y)满足成对、局部或全局马尔可夫性,就称此联合概率分布为马尔可夫随机场(概率无向图模型)

其中,Y是一组随机变量,由无向图G=(V, E)表示概率分布P(Y),即在图G中,结点 v ∈ V v\in V vV表示一个随机变量 Y v Y_{v} Yv, Y = ( Y v ) v ∈ V Y=(Y_{v})_{v\in V} Y=(Yv)vV;边 e ∈ E e\in E eE表示随机变量之间的概率依赖关系。

4、马尔可夫性

(一)成对马尔可夫性:设u和v是无向图G中任意两个没有边链接的结点,结点u和v分别对应随机变量 Y u Y_{u} Yu Y v Y_{v} Yv。其他所有结点为O,对应的随机变量组是 Y O Y_{O} YO。成对马尔可夫性是指给定随机变量组 Y O Y_{O} YO的条件下随机变量 Y u Y_{u} Yu Y v Y_{v} Yv是条件独立的,即
P ( Y u , Y v ∣ Y O ) = P ( Y u ∣ Y O ) P ( Y v ∣ Y O ) P(Y_{u},Y_{v}| Y_{O}) = P(Y_{u}|Y_{O})P(Y_{v}|Y_{O}) P(Yu,YvYO)=P(YuYO)P(YvYO)

(二)局部马尔可夫性:设 v ∈ V v\in V vV是无向图G中任意一个结点,W是与v有边连接的所有结点,O是v,W以外的其他所有结点。v表示的随机变量是 Y v Y_{v} Yv,W表示的随机变量组是 Y W Y_{W} YW,O表示的随机变量组是 Y O Y_{O} YO。局部马尔可夫性是指在给定随机变量组 Y W Y_{W} YW的条件下随机变量 Y v Y_{v} Yv与随机变量组 Y O Y_{O} YO是独立的即
P ( Y v , Y O ∣ Y W ) = P ( Y v ∣ Y W ) P ( Y O ∣ Y W ) P(Y_{v}, Y_{O}| Y_{W}) = P(Y_{v}|Y_{W})P(Y_{O}|Y_{W}) P(Yv,YOYW)=P(YvYW)P(YOYW)
P ( Y O ∣ Y W ) > 0 P(Y_{O}|Y_{W})>0 P(YOYW)>0时,等价地
P ( Y v ∣ Y W ) = P ( Y v ∣ Y W , Y O ) P(Y_{v}|Y_{W}) = P(Y_{v}|Y_{W}, Y_{O}) P(YvYW)=P(YvYW,YO)

(三)全局马尔可夫性:设几点集合A,B是在无向图G中被结点集合C分开的任意结点集合。结点集合A,B和C所对应的随机变量组分别是 Y A Y_{A} YA, Y B Y_{B} YB Y C Y_{C} YC。全局马尔可夫性是指给定随机变量组 Y C Y_{C} YC条件下随机变量组 Y A Y_{A} YA Y B Y_{B} YB是条件独立的,即
P ( Y A , Y B ∣ Y C ) = P ( Y A ∣ Y C ) P ( Y B ∣ Y C ) P(Y_{A}, Y_{B}| Y_{C}) = P(Y_{A}|Y_{C})P(Y_{B}|Y_{C}) P(YA,YBYC)=P(YAYC)P(YBYC)

5、线性链条件随机场整体流程

线性链条件随机场用于标注问题,在条件概率模型P(Y|X)中,Y是输出变量表示标记序列,X是输入变量表示需要标注的观测序列。也把标记序列称为状态序列。
学习时,利用训练数据集通过极大似然估计或正则化的极大似然估计得到条件概率模型 P ^ ( Y ∣ X ) \hat{P} (Y|X) P^(YX);
预测时,对于给定的输入序列x,求出条件概率 P ^ ( y ∣ x ) \hat{P} (y|x) P^(yx)最大的输出序列 y ^ \hat{y} y^

Reference

1.《统计学习方法》,李航著
2.《机器学习》,周志华著


http://chatgpt.dhexx.cn/article/8Yo1VMvU.shtml

相关文章

CRF 条件随机场

目录 1. 基本概念 1.1 各种随机场 1.2 CRF模型的训练原理 1.3 条件随机场的参数化形式 1.4条件随机场对应的简化概率表达 2. 例子 定义CRF中的特征函数 从特征函数到概率 CRF与逻辑回归的比较 CRF与HMM的比较 HMM和CRF区别 3. Tensorflow实现 tf.contrib.c…

NLP之条件随机场

条件随机场(conditional random fields, CRFs)由J. Lafferty等人(2001)提出,近几年来在自然语言处理和图像处理等领域中得到了广泛的应用。 CRF是用来标注和划分序列结构数据的概率化结构模型。言下之意,就…

条件随机场CRF

1 条件随机场CRF:从条件随机场到线性链条件随机场 条件随机场(Conditional Random Fields, 以下简称CRF)是给定一组输入序列条件下另一组输出序列的条件概率分布模型,在自然语言处理中得到了广泛应用。 1.1 什么样的问题需要CRF模型 这里举一个简单的…

条件随机场的肤浅理解

条件随机场(Conditional Random Field,CRF)是自然语言处理的基础模型,是一个无向图概率模型。经过长期的发展目前已经广泛应用于词性标注、图像分类等众多场景。 一、基本概念 随机场 : 给定一组随机变量: X { X 1 , X 2 , X …

条件随机场详解

为了更好地理解条件随机场,这里主要以命名实体识别为例子,介绍如何和LSTM结合,进行NER。 首先什么是NER,就是针对一句话的每个词,都标注出它们的词性,比如输入一句"Dog play football"&#xff…

条件随机场(CRF)

目录 1.定义 1.1 图 1.2 概率图模型(PGM) (1)有向图的联合概率: (2)概率无向图模型: 1.3 马尔可夫性 1.4 团与最大团 1.5 概率无向图模型的联合概率分布 1.6 条件随机场 …

条件随机场 (CRF)

背景 CRF和HMM是有相似性的,最后都是使用Verterbi算法来进行最优状态转移序列的确定。CRF主要用于序列标注问题。 本质:通过1D卷机学习近邻信息,然后输入到CRF定义好的计算方式中。 一些实现的库,并不能主观反应出CRF的计算方式&…

条件随机场简介(Conditional Random Fields, CRF)

首先,我们来看看什么是随机场。随机场是由若干个位置组成的整体,当给每一个位置中按照某种分布随机赋予一个值之后,其全体就叫做随机场。以词性标注为例:假如我们有一个十个词组成的句子需要做词性标注,这十个词每个词…

简单理解条件随机场CRF

一、条件随机场是什么? 什么是条件随机场?我们先从它的命名开始说起,为什么是条件随机场这么奇怪的名字,为什么不叫飞机场、火葬场?通常数学上的命名是简单而直白的,大家听我一一解释。 条件 “条件”指…

条件随机场(CRF)的详细解释

条件随机场(CRF)由Lafferty等人于2001年提出,结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,常用于标注或分析序列资料,如自然语言文字或是生物序列。近年来在分词、词性标注和命名实体识别等序列标注任务中取得了很好…

RBM理论推导

RBM(Restricted Boltzmann Machine) 上面这个图就是一个RBM模型,它包括三个部分,最下面的可视层(visible layer),中间的权重连边(无向),上面的隐藏层&#xf…

受限玻尔兹曼机RBM简述与Python实现

生成式模型 生成式模型的理念大同小异,几乎都是用一个模型产生概率分布来拟合原始的数据分布情况,计算两个概率分布的差异使用KL散度,优化概率模型的方法是最小化对数似然,可以用EM算法或梯度优化算法。 今天表现比较好的生成模…

RBM系列1:预备知识

受限玻尔兹曼机是一种可用随机神经网络来解释的概率图模型。它由Smolensky于1986年在玻尔兹曼机(BM)的基础上提出,所谓“随机”,是指这种网络中的神经元是随机神经元,其输出只有两种状态(激活和未激活&…

深度学习20-限制玻尔兹曼机RBM

玻尔兹曼机来源于玻尔兹曼分布,而玻尔兹曼分布的创立者是路德维希玻尔兹曼,这个原理来源于他首次将统计学用于研究热力学,即物质的状态概率和它对应的能量有关。比如,我们常用熵来形容物体的混乱程度,同时如果我们的定…

【深度学习】受限玻尔兹曼机 (RBM) 初学者指南

一、说明 受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)是一种基于能量模型的人工神经网络。它只有一个隐层,将输入层和隐层中的每个神经元互相连接,但不同层的神经元之间没有连接。RBM是一种无向的概率图模型&am…

matlab rbm 语音,Deep Belief Network 学习笔记-RBM

Deep Belief Network 学习笔记-RBM By Placebo (纯属个人笔记) 第一次知道deep learning,是上学期dengli博士来实验室的一次报告,他讲到,当神经网络的层数大于2时(即一个hidden层,一个输出层,不算输入层,之…

受限玻尔兹曼机(RBM)

受限玻尔兹曼机(RBM) 一起读懂传说中的经典:受限玻尔兹曼机 https://mp.weixin.qq.com/s?__bizMzA3MzI4MjgzMw&mid2650731098&idx1&snc7391caee3a567b4b046406d53f022f2&chksm871b3624b06cbf320f3725fe452d291e04a4a8c1beda…

人工智能(pytorch)搭建模型13-pytorch搭建RBM(受限玻尔兹曼机)模型,调通模型的训练与测试

大家好,我是微学AI,今天给大家介绍一下人工智能(pytorch)搭建模型13-pytorch搭建RBM(受限玻尔兹曼机)模型,调通模型的训练与测试。RBM(受限玻尔兹曼机)可以在没有人工标注的情况下对数据进行学习。其原理类似于我们人类学习的过程&#xff0c…

受限玻尔兹曼机(RBM)原理总结

https://blog.csdn.net/l7H9JA4/article/details/81463954 授权转发自:刘建平《受限玻尔兹曼机(RBM)原理总结》 地址:http://www.cnblogs.com/pinard/p/6530523.html 前 言 本文主要关注于这类模型中的受限玻尔兹曼机(Restrict…

特征工程(七)—特征学习RBM

1、MNIST数据集 """ MNIST数据集,包括6000个0-9手写数字图像,以及学习的真实值此处使用很低级的特征,而不是解释性很好的特征。每一个数据点包括784个特征(灰度图像的像素值) """impor…