文本匹配、文本相似度模型之RE2

article/2025/6/17 16:35:28

简单有效的文本匹配,具有更丰富的对齐功能

github: https://github.com/daiyizheng/shortTextMatch/blob/master/src/DL_model/classic_models/models/RE2.py

本文作者提出了一种快速、强神经网络的通用文本匹配方法。保持序列间对齐可用的三个关键特征:原始点方向特征、先前对齐特征和上下文特征,同时简化所有其余组件。在自然语言推理、意译识别和答案选择任务上达到了很好的性能。

RE2架构如下图所示。embedding层首先映射离散token。然后由encoder层、alignment层和fusion层组成的多个相同结构的块对序列进行连续处理。这些块由增强的残差来连接。pooling层将顺序表示聚合成向量,最后由prediction层处理这些向量以给出最终的预测。

Augmented Residual Connections

为了提供更丰富的对齐功能,RE2采用了增强残差连接来连接连续的block。对于长度为 l l l的序列,我们将第n个bloc的输入和输出表示为 x ( n ) = ( x 1 ( n ) , x 2 ( n ) , . . . , x l ( n ) ) x^{(n)} = (x^{(n)}_1 , x^{(n)}_2 , ... , x^{(n)}_l) x(n)=(x1(n),x2(n),...,xl(n)) o ( n ) = ( o 1 ( n ) , o 2 ( n ) , . . . , o l ( n ) ) o^{(n)} = (o^{(n)}_1 , o^{(n)}_2 , ... , o^{(n)}_l) o(n)=(o1(n),o2(n),...,ol(n)),其中,设 o ( 0 ) o^{(0)} o(0)是零向量的序列。第 n b l o c k x ( n ) n block x^{(n)} nblockx(n)(n≥2)的输入是第 1 b l o c k x ( 1 ) 1 block x^{(1)} 1blockx(1)的输入的串联,以及前两个block的输出的求和。

其中 ; ; ;表示连接操作

Alignment Layer

对齐层将两个序列的特性作为输入,并计算对齐后的表示作为输出。长度为 l a l_a la的第一个序列的输入表示为 a = ( a 1 , a 2 , … , a l a ) a = (a_1, a_2,…, a_{l_a}) a=(a1,a2ala),长度为lb的第二个序列的输入记为 b = ( b 1 , b 2 , … ( b l b ) b = (b_1, b_2,…(b_{l_b}) b=(b1,b2(blb) a i a_i ai b j b_j bj之间的相似度 e i j e_{ij} eij被计算为投影向量的点积:

F F F是一个恒等函数或单层前馈网络。这个选择被视为一个超参数。

输出向量 a ′ a' a b ′ b' b是由其他序列表示的加权和计算出来的。该总和由当前位置与其他序列中相应位置之间的相似度评分进行加权。

Fusion Layer

融合层从三个角度比较局部和对齐的表示,然后将它们融合在一起。第一个序列 a ‾ \overline{a} a的融合层输出由

式中,G1、G2、G3、G为参数独立的单层前馈网络, ⋅ \cdot 为逐元乘法。减法运算符强调两个向量之间的差异,而乘法则强调相似性。 b ‾ \overline{b} b的公式类似,此处省略。

Prediction Layer

预测层将来自池化层的两个序列 v 1 v1 v1 v 2 v2 v2的向量表示作为输入,并根据Mou et al.(2016)预测最终目标。

H H H是一种多层前馈神经网络。在一个分类任务中, y ^ ∈ R C \hat{y} \in R^C y^RC表示所有类的非归一化预测得分,其中 C C C为类的数量。预测的类是 y ^ = a r g m a x i y i \hat{y} = argmax_i y_i y^=argmaxiyi。在回归任务中, y ^ \hat{y} y^是预测的scala值。

在像意译识别这样的对称任务中,预测层的对称版本被用于更好的泛化

简化的预测层可以表示为

自然语言推理的结果

释义识别的结果

结论

提出了一种高效的通用文本匹配方法RE2。经过充分研究的数据集上实现了SOAT,三个不同的文本匹配任务,得到只有少量的参数和非常高的推理速度。突出了三个关键特征,即先前的对齐特征、原始的点方向特征和序列间对齐的上下文特征,并简化了大多数其他组件。该模型速度快,性能强,适用于广泛的相关应用。


http://chatgpt.dhexx.cn/article/8X0ycDOK.shtml

相关文章

RE2,C++正则表达式库实战

RE2简介 RE2是,一个高效、原则性的正则表达式库,由Rob Pike和Russ Cox两位来自google的大牛用C实现。他俩同时也是Go语言的主导者。Go语言中的regexp正则表达式包,也是RE2的Go实现。 RE2是,一个快速、安全,线程友好,PC…

DB9接口定义

注意上表是公头的引脚定义,公头与母头的引脚编号是轴对称的,因此将公头和母头连接时是相同序号的引脚相连接。 作为串口使用时要注意,公头的2号是RXD,因而母头的2号是TXD,公头的3号是TXD,因而母头的3号是RX…

LIN DB9定义

没找到合适的图片所以用上图代替,在LIN中,图中CAN_H(7)为LIN线, GND(3)接地. 实物图如下

DB9串口接口定义

公头 母头 定义不同 连线都是2 3 5 但是 公头 2是RXD 3是Txd 母头 2是TXD 3是RXD而且两者的排列顺序,画pcb时注意 以上是公头接线方法~ 母头原理图接线 交叉 但是上图的db9的原理图是母的画法啊,应该是直接从ad的库中调去的,ad的库中只有着一种画法 例子…

DB9定义图

DB9接口定义图

DB9接口定义 串口接口定义 MAX232电路

我们知道老式电脑主板上面都会有9针的串口,即使到了现在, 很多人还是用串口来通信,这是做嵌入式与工控的一上很好的上位要与下位机通信的方案, 因为他接口简单,编程容易。 我们来讲一下定义: 首先普通主…

计算机九针孔什么接口,db9接口-USBCAN-I设备的DB9针串口头中的针脚是如何定义的-电气资讯 - 电工屋...

db9接口定义RXD和TXD接线的颜色怎么接 1)使用串口直通线。 设计电路时,单片机的RXD连接电路板DB9的TXD,单片机的TXD连接电路板DB9的RXD,具体实现可在232电平转换芯片处反接。 (2)使用串口交叉线。 设计电路时,因为串口线已做交叉&…

RS-232C接口定义(DB9)

RS-232C接口定义(DB9)引脚 定义 符号 1 载波检测 DCD(Data Carrier Detect) 2 接收数据 RXD(Received Data) 3 发送数据 TXD(Transmit Data) 4 数据终端准备好 DTR(Data Terminal Rea…

DB9 ------ 接口定义

下图是母座和公座的接口定义: 特别提醒:以上是公座和母座的接口定义,如果是串口线,RXD就变成TXD,以此类推。 转载于:https://www.cnblogs.com/god-of-death/p/9368120.html

硬件DB9接口定义

DB9接口定义及串口芯片定义连接 双向同头线交叉,双向异头线直通

RS232 DB9引脚定义

DB9 各引脚定义 1 DCD 载波检测 2 RX 接收数据 3 TX 发送数据 4 DTR 数据终端准备好 5 GND 地信号 6 DSR 数据准备好 7 RTS 请求发送 8 CTS 清除发送 9 RI 振铃提示 RS232常用的是Rx、Tx和GND这三条线 也就是 2-RX 3-TX 5-GND引脚,RS23…

db9串口(db9串口定义及颜色)

串口(DB9)连接线的制作方法是什么?串口(DB9)连接线的制作 (2)DB9:在AT机及以后,不支持20mA电流环接口,使用DB9连接器,作为提供多功能I/O卡或主板上COM1和COM2两个串行接口的连接器 串口显示器-DB9串口有什么用&#xf…

DB9串口定义及含义

原文:http://hi.baidu.com/askhua520/item/e4736b27213cf9d2a417b65f RS232接口是1970年由美国电子工业协会(EIA)联合贝尔系统、调制解调器厂家及计算机终端生产厂家共同制定的用于串行通讯的标准。   它的全名是“数据终端设备&#xff08…

傅里叶变换的性质

第三章:3.7 傅里叶变换性质(二) https://blog.csdn.net/einstellung/article/details/77619150 该篇博文末尾处总结的傅里叶变换的图非常好,贴一下,以备查询。

傅里叶变换尺度变换性质_ENVI基础操作——傅里叶变换

点击上方蓝字关注我吧 傅里叶变换是将图像从空间域转换到频率域,首先把图像波段转换成一系列不同频率的二维正弦波傅里叶图像;然后,在频率域内对傅里叶图像进行滤波、掩膜等各种操作,减少或者消除部分高频或低频成分;最…

傅里叶变换的缩放性质

傅里叶变换的缩放性质 简介代码结果1.缩放前后小孔2.缩放前后频谱 简介 \qquad 傅里叶变换的缩放性质是其最基本的性质之一。假设图像 g ( x , y ) g(x,y) g(x,y)是一个关于 x x x和 y y y的二维信号,那么它们在空域作缩放变换之后,频域坐标也会发生缩放…

傅里叶变换性质----Leson Chap3_8-9

1、线性特性 2、延时特性 3、频移特性 4、尺度变换 5、奇偶虚实性 6、对称特性 当f函数是偶函数,f(-w)f(w). 7、微分特性 8、积分特性 在工程应用中,多次做积分比较少,多次做微分很多。 9、频域微积分特性 工程中,一般实数函数…