PCNN

article/2025/7/20 9:59:57

Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks

1. 关键字

关系抽取远程监督

2. 摘要

本文提出了PCNNs,用来解决远程监督关系抽取中的两个问题:一个是在对齐知识图谱时的错误标注问题,一个是使用NLP工具提取特征时的错误传播问题。对于前者,方法是将对齐问题转化为多实例学习问题,从而将实例标签的不确定性纳入了考虑范围;对于后者,采用成对的最大池化层来自动学习相关的特征。

3. 问题

错误标注问题

用远程监督的方法来做关系抽取,需要一个知识图谱来启发式地对齐文本,如果对齐失败,就会出现错误标注的问题。

在关系抽取领域,由于监督方法将关系抽取看作一个多分类问题,所以有一个难点就是如何在已知关系的前提下生成训练样本。Mintz等人提出一个假设,如果在知识图谱中两个实体存在某种特定关系,那么所有包含这两个实体的句子都表达出了这种关系。这个假设有效地为任一关系生成了大量训练样本。但是,很明显,这个假设是有问题的,如果句子中存在“乔布斯”和“苹果”这两个实体,该句子既可能表达出“创始人”这一关系,还可以表达出“离开”这一关系。这就是错误标注问题。

错误传播问题

从监督数据中抽取特征用的都是NLP工具,工具本身不可避免的错误会导致错误传播和累积。一般情况下,关系抽取的语料都是来自于网络,句子长度也都超过40,McDonald证明,句法分析的准确率会随着句子加长而显著降低。所以,错误传播不仅存在,而且会变得严重。

4. 方法论

为了解决错误标注问题,Riedil等人针对多实例学习提出了一个松弛的远程监督假设。在多实例学习中,训练集由一些包(bag)组成,并且每个包中又包含了一些实例(instance)。这些包的标签是已知的,但是包中实例的标签是未知的。多实例学习将实例标签的不确定性纳入了考虑范围,从而聚焦于对包的区分。

为了解决错误传播问题,本文扩展了Zeng等人的方法,由于单个最大池化层将急剧减少隐藏层的尺寸,所以用来捕获细粒度特征过于粗糙,并且也不足以捕获到两个实体之间的结构化信息,本文在单个最大池化层的基础上提出成对最大池化层

5. 模型结构

1573022-20190928232353551-1287769849.png

向量表示

词向量通过look up预训练词向量得到,同时,使用了位置特征来指定实体对,该特征同样被转化为向量。

  • 词嵌入:使用skip-gram模型来训练词向量
  • 位置嵌入:位置特征被定义为句子中当前词到实体\(e_1\)\(e_2\)的距离

每个句子的长度为\(s\),每个词的词向量维度为\(d_w\),加上两个位置特征\(2*d_p\),于是一个词向量的维度就为\(d_w+2*d_p\).

卷积

由于是给整个句子预测关系,所以需要使用所有局部特征并且做一个全局预测,卷积就是一个很好地合并所有特征的方法。

一个句子的维度是\(s*d\),其中\(d\)是词向量的维度。卷积和的尺寸为\(w*d\),当剩下长度不足\(w\)的时候,填充0,于是卷积结果的长度为\(s+w-1\).

当然,为了捕捉到不同的特征,将使用n个卷积核,于是卷积结果为\(c=\{c_1, c_2, ..., c_n\}\)\(c\)的维度为\(n*(s+w-1)\).

成对最大池化

为了捕获到两个实体间的结构化信息,一般的方法都考虑实体的内部上下文外部上下文,其中内部上下文包含了两个实体里面的字,外部上下文则是两个实体周围的字。

于是,根据句子中给定的两个实体的位置将句子划分为三段,这样每个过滤器卷积的结果就被分为三个部分:\(\{c_{i1}, c_{i2}, c_{i3}\}\),然后分别在这三段上分别取最大值。于是,最终最大池化的向量长度是固定的,为过滤器数量的三倍。

softmax输出

最后经过softmax并输出,需要注意的是,训练是由dropout层的,但是测试的时候就不需要了。

转载于:https://www.cnblogs.com/flyangovoyang/p/11604446.html


http://chatgpt.dhexx.cn/article/38XMxnsc.shtml

相关文章

【NLP】基于神经网络PCNN(Piece-Wise-CNN)的关系抽取模型

背景 关系抽取是信息抽取的基本任务之一,对于知识库的构建以及文本的理解十分重要,在自然语言处理的一些任务,如问答,文本理解等得到了广泛的应用。 这里介绍的关系抽取主要指的是实体之间的关系抽取,实体是之前NER任…

PCNN 脉冲耦合神经网络整理

PCNN 脉冲耦合神经网络 脉冲耦合神经元模型 神经元的输入有哪些? 首先来看看这个神经元的图示的左边,有 Y Y Y和 F F F。 Y Y Y为这个神经元之前输出的数值,就是说这个模型需要进行多次的运算,每次的运算需要上一次运算的值来做…

关系抽取之分段卷积神经网络(PCNN)

文章目录 远程监督PCNN关系抽取PCNN方法论向量表达卷积层分段最大池化层Softmax层多实例学习 Reference Tensorflow2.2实现,见github仓库。 远程监督 关系抽取训练集标注成本高,一般使用远程监督方法(半监督)自动标注数据。远程监…

脉冲耦合神经网络(PCNN)阅读笔记

摘要 本文采用高级视觉模型来描述灵长类视觉系统中的信息传递和连接。信息链接方案,如状态相关模块化和时间同步,被视为视觉系统使用期望组合信息的方法,以填充缺失信息和删除不需要的信息。研究了使用基于生理学理论模型的链接方法结合当前…

PCNN的知识抽取

PCNN是一个结构简单的CNN网络, 它最初被用于在已知实体对位置时, 辨别实体对关系的网络. 上图是论文里带的PCNN结构图. PCNN的输入由两部分构成, 一部分是词本身的词向量word, 另一部分是词相对于实体词的位置信息position. PCNN优秀的地方就在于加入了位置信息, 具体如下: 1.…

基于PCNN脉冲耦合神经网络的图像分割

目录 1.算法描述 2.仿真效果预览 3.MATLAB核心程序 4.完整MATLAB 1.算法描述 脉冲耦合神经网络(PCNN-Pulse Coupled Neural Network)与传统神经网络相比,有着根本的不同。PCNN有生物学的背景,它是依据猫、猴等动物的大脑皮层上…

【MATLAB图像融合】[13]PCNN脉冲耦合神经网络基本原理

→这是一篇学习笔记。 →但考虑要发出来,还是排版了,请放心食用。 PCNN在图像融合中应用广泛 1、脉冲耦合的神经元之间有有耦合和无耦合两种形式。,有耦合的神经元之间存在能量传播,产生同步脉冲发放,从而将输入相似的…

【图像特征提取】基于matlab脉冲耦合神经网络(PCNN)图像特征提取【含Matlab源码 1868期】

⛄一、脉冲耦合神经网络(PCNN)图像特征提取简介 1 引言 随这生物神经学的迅速发展及其研究的进一步深入,国外对一种叫做第三代人工神经网络的模型——脉冲耦合神经网络模型——PCNN(Pulse Coupled Neural Network)模型…

脉冲耦合神经网络(PCNN)-pulse coupled neural network

摘要 本文采用高级视觉模型来描述灵长类视觉系统中的信息传递和连接。信息链接方案,如状态相关模块化和时间同步,被视为视觉系统使用期望组合信息的方法,以填充缺失信息和删除不需要的信息。研究了使用基于生理学理论模型的链接方法结合当前图…

NTFS 数据流隐写学习

NTFS 数据流隐写学习 —— 概念学习: NTFS文件系统中存在NTFS数据流文件也被称为 Alternate data streams(ADS), 是NTFS磁盘格式的一个特性之一每个文件都有主文件流和非主文件流,主文件流能够直接看到;…

CTF隐写知识

通用知识 通用软件 010或winhex或HxD或HexEditXP 一.在文件中加入字符 jpg文件头 FF D8 jpg 文件尾 FF D9 FF D9后面的都是增加的内容; 增加的可能是字符串,也可能是另一个文件(就是把多个文件的十六进制放在一起) 二.ZIP格式文件分离 十…

图片隐写术总结

0x00 前言 之前还没有见到drops上有关于隐写术的总结,我之前对于隐写术比较有兴趣,感觉隐写术比较的好玩。所以就打算总结总结一些隐写术方面的东西。写的时候,可能会有错误的地方,请不吝赐教,谢谢。 本篇章中用到的隐…

图像隐写分析——生成含密图像 Stego Image

文章目录 一 图像隐写分析的数据集二 含密图像展示三 结语 一 图像隐写分析的数据集 小编本科毕设的题目是《基于深度学习的图像隐写分析》,图像隐写分析问题本质上是一个二分类(binary classifier)问题,即判断一张图片中是否含有…

图片LSB信息隐写

LSB(全大写)有时也指Least Significant Byte,指多字节序列中最小权重的字节。指的是一个二进制数字中的第0位(即最低位) RGB色彩模式是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化…

F3隐写

F3隐写 文章目录 F3隐写1. 引言2. 实验环境3. 实现使用的现有外部库4. 实现思路> **预处理**> **DCT量化**>**秘密信息嵌入**> **Z字形序列化**>**Huffman编码**>**反Z字形序列化**>**提取秘密信息** 5.验证6. 总结 1. 引言 数字隐写技术是一种在数字媒体…

TTL隐写

#拿到一个长成这样的文件,里面是意义不明的数字 63 63 63 255 63 63 63 255 63 63 63 255 63 63 63 255 63 63 63 255 63 63 63 255 63 127 63 255 63转换为2进制,并设置为8位数的2进制,就会有很神奇的事情发生 with open(C:/Users/brighten…

深度学习之图像隐写去除(DDSP模型 Steganography Removal)

文章目录 一 前言二 论文内容2.1 Abstract2.2 Introduction2.3 Background2.3.1 Prior Work2.3.2 Super Resolution GAN 超分辨率GAN 2.4 Data2.5 Deep Digital Steganography Puricication (重头戏)2.5.1 Autoencoder Architecture2.5.1 GAN Training 2.6 Result 三 训练结果四…

SRNet隐写分析网络模型 (pytorch实现)

文章目录 一 SRNet隐写分析模型介绍二 SRNet网络概述三 训练结果展示 一 SRNet隐写分析模型介绍 SRNet模型是宾汉姆顿大学(Binghamton University)Jessica教授团队于2018年提出的图像隐写分析网络模型,应该说是当时SOTA(state-of-the-art)的隐写分析网络模型了&…

GIF隐写

CTF DAY1的倒数第二题: 首先 打开图片 发现打不开 用010 Editor 发现图片开头少了文件头 添加文件头 使得图片能够看到 这时候打开图片 发现 密码一闪而过 这时候 用到另一个软件 Namo_Gif 打开刚刚已经恢复好的GIF 可以清楚的看到每一帧 对于每一帧 修改他…

隐写术--总结

文章来源:http://bobao.360.cn/learning/detail/243.html 1.增加数据的方式 隐藏信息 另存为.zip后解压,正常的.JPG图片在文本编辑器(winhex)中,16进制是以FF D9结尾 原理:a.先制作一个1.zip 把含有隐藏…