nlp基础—9.条件随机场模型(CRF算法)

article/2025/11/6 21:20:55

文章目录

      • 引言
      • 一、概率无向图模型
        • 1. 概率无向图模型的定义
        • 2. 概率无向图模型的因子分解
      • 二、条件随机场的定义与形式
        • 1. 条件随机场的定义
        • 2. 条件随机场的参数化形式
        • 3. 条件随机场的简化形式
        • 4.条件随机场的矩阵形式
      • 三、条件随机场的三个基本问题
        • 1.概率计算问题
        • 2. 学习问题
        • 3. 预测问题

引言

  CRF算法与HMM算法在分词方面的应用相当于在隐变量序列输出后再进行一定的调整。CRF算法的知识体系如下:
在这里插入图片描述
本文首先介绍概率无向图模型,然后叙述条件随机场的定义与各种表示方法,最后介绍条件随机场的三个基本问题:概率计算问题、学习问题和预测问题。

一、概率无向图模型

1. 概率无向图模型的定义

  概率图模型是由图表示的概率分布。概率图模型分为有向图(贝叶斯网络)与无向图(马尔科夫随机场)。概率无向图模型是一个可以由无向图表示的联合概率分布。概率无向图模型的最大特点是易于因子分解。
  概率无向图模型的定义为:设有联合概率分布 P ( Y ) P(Y) P(Y),由无向图 G = ( V , E ) G=(V,E) G=(V,E)表示,在图 G G G中,结点表示随机变量,边表示随机变量之间的依赖关系。如果联合概率分布 P ( Y ) P(Y) P(Y)满足成对、局部或全局马尔可夫性,就称此联合概率分布为概率无向图模型( probability undirectedgraphical model),或马尔可夫随机场(Markov random field)。
  下面分别介绍无向图表示的随机变量之间存在的成对马尔可夫性、局部马尔可夫性和全局马尔可夫性。

成对马尔可夫性:
在这里插入图片描述
在这里插入图片描述

P ( Y u , Y v ∣ Y O ) = P ( Y u ∣ Y O ) P ( Y v ∣ Y O ) P(Y_u,Y_v|Y_O)=P(Y_u|Y_O)P(Y_v|Y_O) P(Yu,YvYO)=P(YuYO)P(YvYO)
局部马尔可夫性:
在这里插入图片描述
全局马尔可夫性:
在这里插入图片描述

2. 概率无向图模型的因子分解

  下面分别给出团与因子分解的定义。无向图 G G G中任何两个结点均有边连接的结点子集称为
在这里插入图片描述
将概率无向图模型的联合概率分布表示为其最大团上的随机变量的函数的乘积形式操作,称为概率无向图模型的因子分解。
在这里插入图片描述
ψ C ( Y C ) = e x p { − E ( Y C ) } ψ C ( Y C ) 称 为 势 函 数 \psi_C(Y_C)=exp\{-E(Y_C)\}\\\psi_C(Y_C)称为势函数 ψC(YC)=exp{E(YC)}ψC(YC)

二、条件随机场的定义与形式

1. 条件随机场的定义

  一般的条件随机场定义为:
在这里插入图片描述
该公式表示:对任意一个节点 v v v,给定其他所有节点时 v v v的分布等于给定与它直接相连的节点时 v v v的分布(局部马尔科夫性)。

  线性链条件随机场定义为:
在这里插入图片描述
在这里插入图片描述
线性链条件随机场的一个重要应用是标注问题与找最佳路径(对其他模型所出的标注进行纠正)。

2. 条件随机场的参数化形式

在这里插入图片描述
在这里插入图片描述
t k t_k tk为转移特征,依赖于当前和前一个位置; s l s_l sl为状态特征,依赖于当前位置。通常 t k t_k tk s l s_l sl取值为1或0;当满足特征条件时,取值为1,否则为0。条件随机场完全由特征函数 t k t_k tk s l s_l sl以及对应的权值 λ k \lambda_k λk, u l u_l ul确定。

3. 条件随机场的简化形式

  在条件随机场的参数化形式的基础上,对同一特征的各个位置求和,将局部特征函数转化为一个全局特征函数,这样就可以将条件随机场写成权值向量和特征向量的内积形式。
在这里插入图片描述

4.条件随机场的矩阵形式

在这里插入图片描述

三、条件随机场的三个基本问题

1.概率计算问题

  条件随机场的概率计算问题是给定条件随机场 P ( Y ∣ X ) P(Y |X) P(YX),输入序列 x x x和输出序列 y y y,计算条件概率 P ( Y i = y i ∣ x ) P(Y_i=y_i|x) P(Yi=yix) P ( Y i − 1 = y i − 1 , Y i = y i ∣ x ) P(Y_{i-1}=y_{i-1},Y_i=y_i|x) P(Yi1=yi1,Yi=yix)以及相应的数学期望的问题。条件随机场的概率计算算法是前向-后向算法。

2. 学习问题

  条件随机场的学习问题是求定义在时序数据上的对数线性模型参数 w w w。条件随机场的学习算法是改进的迭代尺度法与拟牛顿法。

3. 预测问题

  条件随机场的预测问题是给定条件随机场 P ( Y ∣ X ) P(Y|X) P(YX)和输入序列(观测序列) x x x,求条件概率最大的输出序列 y ∗ y^* y,即对观测序列进行标注。条件随机场的预测算法是维特比算法(动态规划)。


如果对您有帮助,麻烦点赞关注,这真的对我很重要!!!如果需要互关,请评论或者私信!
在这里插入图片描述



http://chatgpt.dhexx.cn/article/DwhfAMyB.shtml

相关文章

条件随机场模型

条件随机场模型(Conditional Random Fields, CRF) 条件随机场是给定一组输入随机变量条件下,另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔可夫随机场。线性链条件随机场,是输入序列对输出…

CRF 条件随机场

目录 1. 基本概念 1.1 各种随机场 1.2 CRF模型的训练原理 1.3 条件随机场的参数化形式 1.4条件随机场对应的简化概率表达 2. 例子 定义CRF中的特征函数 从特征函数到概率 CRF与逻辑回归的比较 CRF与HMM的比较 HMM和CRF区别 3. Tensorflow实现 tf.contrib.c…

NLP之条件随机场

条件随机场(conditional random fields, CRFs)由J. Lafferty等人(2001)提出,近几年来在自然语言处理和图像处理等领域中得到了广泛的应用。 CRF是用来标注和划分序列结构数据的概率化结构模型。言下之意,就…

条件随机场CRF

1 条件随机场CRF:从条件随机场到线性链条件随机场 条件随机场(Conditional Random Fields, 以下简称CRF)是给定一组输入序列条件下另一组输出序列的条件概率分布模型,在自然语言处理中得到了广泛应用。 1.1 什么样的问题需要CRF模型 这里举一个简单的…

条件随机场的肤浅理解

条件随机场(Conditional Random Field,CRF)是自然语言处理的基础模型,是一个无向图概率模型。经过长期的发展目前已经广泛应用于词性标注、图像分类等众多场景。 一、基本概念 随机场 : 给定一组随机变量: X { X 1 , X 2 , X …

条件随机场详解

为了更好地理解条件随机场,这里主要以命名实体识别为例子,介绍如何和LSTM结合,进行NER。 首先什么是NER,就是针对一句话的每个词,都标注出它们的词性,比如输入一句"Dog play football"&#xff…

条件随机场(CRF)

目录 1.定义 1.1 图 1.2 概率图模型(PGM) (1)有向图的联合概率: (2)概率无向图模型: 1.3 马尔可夫性 1.4 团与最大团 1.5 概率无向图模型的联合概率分布 1.6 条件随机场 …

条件随机场 (CRF)

背景 CRF和HMM是有相似性的,最后都是使用Verterbi算法来进行最优状态转移序列的确定。CRF主要用于序列标注问题。 本质:通过1D卷机学习近邻信息,然后输入到CRF定义好的计算方式中。 一些实现的库,并不能主观反应出CRF的计算方式&…

条件随机场简介(Conditional Random Fields, CRF)

首先,我们来看看什么是随机场。随机场是由若干个位置组成的整体,当给每一个位置中按照某种分布随机赋予一个值之后,其全体就叫做随机场。以词性标注为例:假如我们有一个十个词组成的句子需要做词性标注,这十个词每个词…

简单理解条件随机场CRF

一、条件随机场是什么? 什么是条件随机场?我们先从它的命名开始说起,为什么是条件随机场这么奇怪的名字,为什么不叫飞机场、火葬场?通常数学上的命名是简单而直白的,大家听我一一解释。 条件 “条件”指…

条件随机场(CRF)的详细解释

条件随机场(CRF)由Lafferty等人于2001年提出,结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,常用于标注或分析序列资料,如自然语言文字或是生物序列。近年来在分词、词性标注和命名实体识别等序列标注任务中取得了很好…

RBM理论推导

RBM(Restricted Boltzmann Machine) 上面这个图就是一个RBM模型,它包括三个部分,最下面的可视层(visible layer),中间的权重连边(无向),上面的隐藏层&#xf…

受限玻尔兹曼机RBM简述与Python实现

生成式模型 生成式模型的理念大同小异,几乎都是用一个模型产生概率分布来拟合原始的数据分布情况,计算两个概率分布的差异使用KL散度,优化概率模型的方法是最小化对数似然,可以用EM算法或梯度优化算法。 今天表现比较好的生成模…

RBM系列1:预备知识

受限玻尔兹曼机是一种可用随机神经网络来解释的概率图模型。它由Smolensky于1986年在玻尔兹曼机(BM)的基础上提出,所谓“随机”,是指这种网络中的神经元是随机神经元,其输出只有两种状态(激活和未激活&…

深度学习20-限制玻尔兹曼机RBM

玻尔兹曼机来源于玻尔兹曼分布,而玻尔兹曼分布的创立者是路德维希玻尔兹曼,这个原理来源于他首次将统计学用于研究热力学,即物质的状态概率和它对应的能量有关。比如,我们常用熵来形容物体的混乱程度,同时如果我们的定…

【深度学习】受限玻尔兹曼机 (RBM) 初学者指南

一、说明 受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)是一种基于能量模型的人工神经网络。它只有一个隐层,将输入层和隐层中的每个神经元互相连接,但不同层的神经元之间没有连接。RBM是一种无向的概率图模型&am…

matlab rbm 语音,Deep Belief Network 学习笔记-RBM

Deep Belief Network 学习笔记-RBM By Placebo (纯属个人笔记) 第一次知道deep learning,是上学期dengli博士来实验室的一次报告,他讲到,当神经网络的层数大于2时(即一个hidden层,一个输出层,不算输入层,之…

受限玻尔兹曼机(RBM)

受限玻尔兹曼机(RBM) 一起读懂传说中的经典:受限玻尔兹曼机 https://mp.weixin.qq.com/s?__bizMzA3MzI4MjgzMw&mid2650731098&idx1&snc7391caee3a567b4b046406d53f022f2&chksm871b3624b06cbf320f3725fe452d291e04a4a8c1beda…

人工智能(pytorch)搭建模型13-pytorch搭建RBM(受限玻尔兹曼机)模型,调通模型的训练与测试

大家好,我是微学AI,今天给大家介绍一下人工智能(pytorch)搭建模型13-pytorch搭建RBM(受限玻尔兹曼机)模型,调通模型的训练与测试。RBM(受限玻尔兹曼机)可以在没有人工标注的情况下对数据进行学习。其原理类似于我们人类学习的过程&#xff0c…

受限玻尔兹曼机(RBM)原理总结

https://blog.csdn.net/l7H9JA4/article/details/81463954 授权转发自:刘建平《受限玻尔兹曼机(RBM)原理总结》 地址:http://www.cnblogs.com/pinard/p/6530523.html 前 言 本文主要关注于这类模型中的受限玻尔兹曼机(Restrict…