条件随机场详细推导

article/2025/11/6 21:28:33

条件随机场

  • 条件随机场简介
    • 1.条件随机场简介
  • 条件随机场举例
    • 2.条件随机场举例
  • 条件随机场三个基本问题及推导
    • 3.条件随机场三个基本问题及推导
  • 参考文献

条件随机场简介

1.条件随机场简介

马尔可夫随机场:设有联合概率分布P(Y),由无向图G=(V,E)表示,在图G中,结点表示随机变量,边表示随机变量之间的依赖关系。如果联合概率分布P(Y)满足成对、局部或全局马尔可夫性,就称此联合概率分布为概率无向图模型,或马尔可夫随机场。
条件随机场:设X和Y是随机变量,P(Y|X)是在给定X的条件下Y的条件随机分布,若随机变量Y构成一个由无向图G=(V,E)表示的马尔可夫随机场,即:
alt
对任意结点v成立,则称条件概率分布P(Y|X)为条件随机场。
线性链条件随机场:设X=(X1,X2,…,Xn),Y=(Y1,Y2,…,Yn)均为线性链表示的随机变量序列,若在给定随机变量序列X的条件下,随机变量序列Y的条件概率分布构成条件随机场,即满足马尔可夫性
alt
则称P(Y|X)为线性链条件随机场。
与马尔可夫随机场定义联合概率分布的方式类似,条件随机场 使用势函数和图结构上的团来定义条件概率P(y|x).给定观测序列x,线性链条件随机场主要包含两种关于标记变量的团,即单个标记变量{yi}以及相邻的标记变量{yi-1,yi}
在条件随机场中,通过选用指数势函数并引入特征函数,条件概率被定义为
alt
其中tk为转移特征函数,sl为状态特征函数

条件随机场举例

2.条件随机场举例

参考李航老师书中非规范化条件概率例子

条件随机场三个基本问题及推导

3.条件随机场三个基本问题及推导

条件随机场简化形式为:
alt
条件随机场的矩阵形式:
条件随机场可以用矩阵表示。假设P(y|x)是线性链条件随机场,引入特殊的起点和终点状态标记y0=start,yn+1=stop,这时P(y|x)可以通过矩阵形式表示。
对观测序列的每一个位置i,定义一个m阶矩阵(m是标记yi取值的个数)
alt
即矩阵中的每一个元素为yi-1,yi的非规范化概率。

alt
其中
alt
(1)条件随机场概率计算问题
条件随机场的概率计算是给定条件随机场P(Y|X),输入序列x和输出序列y,计算条件概率P(Yi=yi|x),P(Yi-1=yi-1,Yi=yi|x)以及相应的数学期望的问题。
采用前向和后向算法。
定义前向向量αi(x)
alt

alt

alt

alt
(2)学习问题
条件随机场模型实际上是定义在时序数据上的对数线性模型。学习方法包括极大似然估计和正则化的极大似然估计。具体优化实现算法有改进的迭代尺度法,梯度下降法等。李航老师书中已有IIS的推导。下面我将通过梯度下降法来做推导。
对于学习问题的推导,等我闲下来会补充上去-----------------待补充
(3)条件随机场的预测问题
CRF预测问题就是给定条件随机场P(Y|X)和输入序列x,求使得条件概率P(y|x)最大的状态序列,即对观测序列进行标注。条件随机场的预测算法采用viterbi算法。
alt
所以,条件随机场的预测问题就是求非规范化概率最大的最优路径问题。

alt
对于某一个样本的非规范化概率为
alt
条件随机场中的viterbi算法描述的问题是,求到第i个位置的非规范化概率的最大值,进而得到其最优路径。
在第一个位置的各状态的非规范化概率为
alt
在第二个位置的各状态的非规范化概率最大值为
alt

alt

进而得到i位置的前一个节点下标,用

alt

参考文献

[1] 李航.《统计学习方法》


http://chatgpt.dhexx.cn/article/72poObj5.shtml

相关文章

经典算法: 条件随机场(conditional random field, CRF)

1. 引言 条件随机场,conditional random field,CRF,是给定一组输入随机变量的条件下,输出随机变量的条件概率分布模型。 条件随机场和隐马尔可夫模型的联系: 可以看到,条件随机场是一种无向图。 2. 概…

条件随机场原理介绍

1. 引言 条件随机场(Conditional random field,CRF)是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔可夫随机场。条件随机场常用于序列标注问题,比如命名实体识别…

条件随机场(CRF)概述

转自:原文链接 条件随机场是一种判别模型,用于预测序列。他们使用来自先前标签的上下文信息,从而增加了模型做出良好预测所需的信息量。在这篇文章中,我将讨论一些将介绍 CRF 的主题。我会过去: 什么是判别分类器&am…

条件随机场CRF的理解

1.个人理解和总结 对比HMM的状态转移概率矩阵和发射概率矩阵CRF有自己的定义在边上的特征函数(相当于转移概率)和定义在节点上的特征函数(相当月发射概率)序列标注HMM可以根据转移概率矩阵和发射概率矩阵计算出隐状态序列概率&am…

条件随机场的简单理解

目录 什么是条件随机场 条件随机场长怎么样 如何构建特征函数 前向—后向算法 条件随机场的概率计算问题 条件随机场的预测问题 什么是条件随机场 条件随机场的定义 条件随机场总的来说就是只要满足“条件随机场”这个条件,就可以根据定义的模型去求解我们需…

nlp基础—9.条件随机场模型(CRF算法)

文章目录 引言一、概率无向图模型1. 概率无向图模型的定义2. 概率无向图模型的因子分解 二、条件随机场的定义与形式1. 条件随机场的定义2. 条件随机场的参数化形式3. 条件随机场的简化形式4.条件随机场的矩阵形式 三、条件随机场的三个基本问题1.概率计算问题2. 学习问题3. 预…

条件随机场模型

条件随机场模型(Conditional Random Fields, CRF) 条件随机场是给定一组输入随机变量条件下,另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔可夫随机场。线性链条件随机场,是输入序列对输出…

CRF 条件随机场

目录 1. 基本概念 1.1 各种随机场 1.2 CRF模型的训练原理 1.3 条件随机场的参数化形式 1.4条件随机场对应的简化概率表达 2. 例子 定义CRF中的特征函数 从特征函数到概率 CRF与逻辑回归的比较 CRF与HMM的比较 HMM和CRF区别 3. Tensorflow实现 tf.contrib.c…

NLP之条件随机场

条件随机场(conditional random fields, CRFs)由J. Lafferty等人(2001)提出,近几年来在自然语言处理和图像处理等领域中得到了广泛的应用。 CRF是用来标注和划分序列结构数据的概率化结构模型。言下之意,就…

条件随机场CRF

1 条件随机场CRF:从条件随机场到线性链条件随机场 条件随机场(Conditional Random Fields, 以下简称CRF)是给定一组输入序列条件下另一组输出序列的条件概率分布模型,在自然语言处理中得到了广泛应用。 1.1 什么样的问题需要CRF模型 这里举一个简单的…

条件随机场的肤浅理解

条件随机场(Conditional Random Field,CRF)是自然语言处理的基础模型,是一个无向图概率模型。经过长期的发展目前已经广泛应用于词性标注、图像分类等众多场景。 一、基本概念 随机场 : 给定一组随机变量: X { X 1 , X 2 , X …

条件随机场详解

为了更好地理解条件随机场,这里主要以命名实体识别为例子,介绍如何和LSTM结合,进行NER。 首先什么是NER,就是针对一句话的每个词,都标注出它们的词性,比如输入一句"Dog play football"&#xff…

条件随机场(CRF)

目录 1.定义 1.1 图 1.2 概率图模型(PGM) (1)有向图的联合概率: (2)概率无向图模型: 1.3 马尔可夫性 1.4 团与最大团 1.5 概率无向图模型的联合概率分布 1.6 条件随机场 …

条件随机场 (CRF)

背景 CRF和HMM是有相似性的,最后都是使用Verterbi算法来进行最优状态转移序列的确定。CRF主要用于序列标注问题。 本质:通过1D卷机学习近邻信息,然后输入到CRF定义好的计算方式中。 一些实现的库,并不能主观反应出CRF的计算方式&…

条件随机场简介(Conditional Random Fields, CRF)

首先,我们来看看什么是随机场。随机场是由若干个位置组成的整体,当给每一个位置中按照某种分布随机赋予一个值之后,其全体就叫做随机场。以词性标注为例:假如我们有一个十个词组成的句子需要做词性标注,这十个词每个词…

简单理解条件随机场CRF

一、条件随机场是什么? 什么是条件随机场?我们先从它的命名开始说起,为什么是条件随机场这么奇怪的名字,为什么不叫飞机场、火葬场?通常数学上的命名是简单而直白的,大家听我一一解释。 条件 “条件”指…

条件随机场(CRF)的详细解释

条件随机场(CRF)由Lafferty等人于2001年提出,结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,常用于标注或分析序列资料,如自然语言文字或是生物序列。近年来在分词、词性标注和命名实体识别等序列标注任务中取得了很好…

RBM理论推导

RBM(Restricted Boltzmann Machine) 上面这个图就是一个RBM模型,它包括三个部分,最下面的可视层(visible layer),中间的权重连边(无向),上面的隐藏层&#xf…

受限玻尔兹曼机RBM简述与Python实现

生成式模型 生成式模型的理念大同小异,几乎都是用一个模型产生概率分布来拟合原始的数据分布情况,计算两个概率分布的差异使用KL散度,优化概率模型的方法是最小化对数似然,可以用EM算法或梯度优化算法。 今天表现比较好的生成模…

RBM系列1:预备知识

受限玻尔兹曼机是一种可用随机神经网络来解释的概率图模型。它由Smolensky于1986年在玻尔兹曼机(BM)的基础上提出,所谓“随机”,是指这种网络中的神经元是随机神经元,其输出只有两种状态(激活和未激活&…