NLP基础知识点:ROUGE

article/2025/10/7 20:23:06

ROUGE: A Package for Automatic Evaluation of Summaries

1. 简介

ROUGE 指标由 Chin-Yew Lin 提出, 主要用于评估机器翻译和文章生成摘要的质量,其全称是 (Recall-Oriented Understudy for Gisting Evaluation)
它主要基于召回率n-gram

2. 预备知识:召回率(Recall)与F1值

先复习一下召回率(Recall)的概念
召回率即查全率,是所有正例被正确预测的比例。
这里放上西瓜书的上对查准率与查全率的定义
在这里插入图片描述
F1值是综合考虑了查准率和查全率的性能度量。
在这里插入图片描述

3. 论文部分

NMT中漏翻会导致低召回率

论文中介绍了四种ROUGE的形式

  • ROUGE-N: 在 N-gram层面上计算召回率
  • ROUGE-L: 考虑了机器译文和参考译文之间的最长公共子序列
  • ROUGE-W: 改进了ROUGE-L,用加权的方法计算最长公共子序列
  • ROUGE-S: ROUGE-S 也是对 N-gram 进行统计,但是其采用的 N-gram 允许"跳词 (Skip)",即单词不需要连续出现。

3.1 ROUGE-N: N-gram Co-Occurrence Statistics在这里插入图片描述

N / n N/n N/n为n-gram的长度
R e f e r e n c e S u m m a r i e s ReferenceSummaries ReferenceSummaries 为样本的一段参考摘要(一段话由多个句子组成), S S S为其中的一个句子。
C o u n t m a t c h ( g r a m n ) Count_{match}(gram_n) Countmatch(gramn)是候选摘要和一组参考摘要中共同出现的n-grams的最大数量。

下面示例来自于知乎
生成文本:“I love China very much”(1-gram有5个词组,2-gram有4个)
参考文本:“I love my hometown very much”(1-gram有6个词组,2-gram有5个)
1-gram下两者的公共词组有{‘I’, ‘love’, ‘very’, ‘much’}4个,ROUGE-1=4/6
2-gram下两者的公共词组有{‘I love’, ‘very much’}2个,ROUGE-2=2/5。

上述情况为用一个候选摘要与一个参考摘要进行评估的计算公式
假设有 M 个reference,ROUGE-N 会分别计算candidate summary和这些reference的 ROUGE-N 分数,并取其最大值。
This procedure is also applied to computation of ROUGE-L , ROUGE-W , and ROUGE-S.
在这里插入图片描述

3.2 ROUGE-L: Longest Common Subsequence

3.2.1 Sentence-Level LCS

X是一个reference summary sentence(长度为m), Y是一个candidate summary sentence(长度为n)
LCS(X, Y)是X,Y的最长子序列长度。
在这里插入图片描述
R l c s R_lcs Rlcs为召回率, P l c s P_lcs Plcs为准确率, F l c s F_lcs Flcs为F1度量的一般形式。

ROUGE-L还以自然的方式捕捉句子级结构。
下面给出一个例子:
在这里插入图片描述
使用S1作为参考,S2和S3作为候选句,S2和S3将有相同的ROUGE-2评分,因为它们都有一个bigram,即“the gunman”。
但这两句话的语义,可以说是恰恰相反的。
在ROUGE-L中,令 β \beta β=1,S2 = (2x0.75x0.75)/(0.75+0.75) = 0.75,S3 = (2x0.5x0.5)/(0.5+0.5) = 0.5
根据ROUGE-L,候选句S2的得分更高,这和人的认知也是一致的。

然而,LCS有一个缺点,它只计算主要的在序列中的词;因此,其他可选的LCSes和较短的序列不会反映在最终得分中。
例如再来一个句子S4. the gunman police killed
S3和S4的ROUGE-2得分是相同的,这显然是不合理的。

3.2.2 Summary-Level LCS

使用union LCS(union longest common subsequence)评估一个reference summary sentence和每个candidate summary sentence的匹配程度。
r i r_i ri:reference summary sentence
c j c_j cj: candidate summary sentence
一个reference summary有u个句子,总计有m个词
一个candidate summary有v个句子,总计有n个词
计算公式如下:
在这里插入图片描述
在这里插入图片描述
论文中指出参数 β \beta β在国际评比中一般设为∞,所以F值一般由召回率R确定。
L C S U ( r i , C ) LCS_U(r_i, C) LCSU(ri,C) r i r_i ri和候选summary C的union LCS的召回率
下面用一个具体例子来说明union LCS如何计算。
ri = w1 w2 w3 w4 w5
C中有2个句子,c1 = w1 w2 w6 w7 w8 ,c2 = w1 w3 w8 w9 w5
LCS(r1, c1) = “w1 w2”, LCS(r1, c2) = “w1 w3 w5”.
union LCS = “w1 w2 w3 w5”
L C S U ( r i , C ) = 4 / 5 LCS_U(r_i, C) = 4/5 LCSU(ri,C)=4/5


http://chatgpt.dhexx.cn/article/NhBLtsLP.shtml

相关文章

自动文摘评测方法:Rouge-1、Rouge-2、Rouge-L、Rouge-S

关于ROUGE ROUGE(Recall-Oriented Understudy for Gisting Evaluation),在2004年由ISI的Chin-Yew Lin提出的一种自动摘要评价方法,是评估自动文摘以及机器翻译的一组指标。 ROUGE基于摘要中n元词(n-gram)的共现信息来评价摘要&a…

warmup_csaw_2016

文章目录 一、查看文件二、拖入IDA pro 中反编译三、编写代码总结 一、查看文件 先file ./warmup_csaw_2016查看文件类型再checksec --filewarmup_csaw_2016检查一下文件保护情况。 二、拖入IDA pro 中反编译 用IDA Pro 64bit打开warmup_csaw_2016后按 F5 反汇编源码并查看…

linux-centOS7.9通过docker安装cwmp server:drumsergio/genieacs

一、安装环境 #查看centOS版本 [rootMiWiFi-R4CM-srv network-scripts]# cat /etc/redhat-release CentOS Linux release 7.9.2009 (Core) #自动查找最新安装包并升级 [rootMiWiFi-R4CM-srv ~]# sudo yum upgrade 二、关闭firewalld、NetworkManager、selinux 关闭防火墙、…

MCP\eMCP\uMCP

MCP\eMCP\uMCP MCP是什么?MCP的结构详细的介绍具体的厂商及搭配参考 MCP是什么? MCP,即Multi-Chip-Package简称,中文意思是多制层封装芯片,即记忆体NOR Flash、NAND Flash、Low Power SRAM及Pseudo SRAM等堆叠封装成一…

关于CWMP基础(二)----TR069通信流程

1.通信流程图 建立TCP连接SSL初始化,进行加密建立安全机制由CPE端发起HTTP请求,发送Inform报文,开始建立CWMP连接。Inform中使用Eventcode字段描述发送Inform请求的原因 如 6 CONNECTION REQUEST ,表示ACS要求建立连接。如果ACS通…

网络协议篇之CWMP协议(三)—— RPC方法

一、CWMP方法 ACS对CPE的管理和监控是通过一系列的操作来实现的,这些操作在CWMP协议里称为RPC方法。主要方法的描述如下: Get:ACS使用该方法可以获取CPE上参数的值。 Set:ACS使用该方法可以设置CPE上参数的值。 Inform&#xf…

OpenWrt开发必备软件模块——网络管理(CWMP、SSH、QoS、SMTP、NTP、uHTTPd)

一、CWMP简介 CWMP(CPE WAN Management Protocol)是一个面向终端设备的网管技术规范。这个技术规范提供了对下一代网络中家庭网络设备进行管理配置的通用框架、消息规范、管理方法和数据模型。它由宽带(Broadband)论坛管理和发布…

CWMP(TR069)协议标准学习

协议栈分层 网关和ACS管理平台之间终端管理相关的管理接口协议栈层次如下图: 其中RPC层定义了网关远程管理中的远程调用方法集。 SOAP协议层定义了用来编译RPC方法的标准XML句法,其要求如下: 应支持SOAP 1.1。XML Schema文件头、SOAP信包头…

Openwrt常用软件模块之CWMP

Openwrt常用软件模块之CWMP CWMP概述 CWMP(CPE WAN Management Protocol)是一个面向终端设备的网管技术规范。这个技术规范提供了对下一代网络中家庭网络设备进行管理配置的通用框架、消息规范、管理方法和数据模型 。 它由宽带(Broadband&a…

MPC

文章目录 前言1. 背景 Background1.1 滚动时域控制 Receding Horizon Control1.2 线性模型预测控制 Linear Model Predictive Control1.3 非线性模型预测控制 Nonlinear Model Predictive Control1.4 线性鲁棒模型预测控制 Linear Robust Model Predictive Control1.4.1 反馈预…

基于CWMP(TR069)协议ACS服务器的搭建

Linux上安装openacs Openacs的安装分为四大步: 1.安装jdk 2.安装jboss 3.安装mysql 4.部署openacs JDK简介 Java DevelopmentKit(JDK)是由Sun公司发布的针对Java开发人员发布的免费软件开发工具包(SDK, Software development kit)。自Java推出以来,JDK已…

CWMP\TR069协议学习随笔1——入门基础知识及环境搭建

什么是CWMP(TR069) CWMP是由数字用户线路DSL——Digital Subscriber’s Line论坛(之后更名为broadband-forum)发起开发的技术规范之一,编号为TR-069,所以又被称为TR-069协议 CWMP协议基础概念 CWMP的全称…

网络协议篇之CWMP协议(一)—— CWMP(TR-069)基础

一、CWMP(TR-069)概述 CWMP(CPE WAN Management Protocol,CPE广域网管理协议)是由DSL(Digital Subscribers Line,数字用户线路)论坛发起开发的技术规范之一,编号为TR-069…

CWMP

http://blog.163.com/yuan_zhch/blog/static/1937900462012111113320220/ TR-069简介 转 2012-12-01 23:33:20| 分类: CWMP相关 |字号 订阅 http://hi.baidu.com/huiweics 相关缩略语 ACS:Auto-Configuration Server (自动配置服务器&a…

网络协议篇之CWMP协议(二)—— CWMP(TR-069)业务流程

一、 CWMP(TR-069)业务流程 软件架构以及协议的具体解析过程 二、 CWMP(TR-069)通信过程 我们来看一个tr069协议完整的通信过程. (1) 建立TCP连接。 (2) SSL初始化,建立安全机制。 (3) CPE发送Inform报文&#xff0…

关于CWMP基础(一)----(TR069)

CWMP(TR069) 概述TR069协议族主要功能网络架构关于RPC协议基础RPC协议的处理流程回路:SOAP协议基础CWMP基本功能 概述 1.为什么需要TR069? 随着VoIP、IPTV等越来越多IP终端设备的普及(尤其在家庭中的普及)&#xff…

CWMP (TR-069)技术介绍

CWMP (TR-069)技术介绍-新华三集团-H3C 目 录 CWMP (TR-069) CWMP(TR-069)概述 CWMP网络框架 CWMP基本功能 CWMP实现机制 CWMP (TR-069) CWMP(TR-069)概述 CWMP(CPE WAN Management Protocol,CPE广域网管理…

CWMP协议简介

CWMP协议 1、概念2、网络架构3、协议栈结构协议各层概要 4、基本功能①ACS和CPE自动连接,CPE可以通过发送Inform报文自动连接ACS②支持ACS对CPE的自动配置③支持对CPE系统镜像文件和配置文件的上传/下载管理④支持ACS对CPE状态和性能的监控 5、TR-069主要方法①CPE …

神经网络算法详解 01:人工神经网络基础

本文介绍了人工智能的发展历史,基本概念,应用领域;神经元模型,神经元的学习规则以及神经网络工作原理。本系列文章来自阿里云大学人工智能学习路线中的《神经网络概览及神经网络算法详解》课程。 系列文章: 【神经网络…

神经网络算法总结

文章目录 前馈神经网络1. 单层前馈神经网络(单层感知器)2. 多层感知器 反馈神经网络径向基函数网络(RBF网络)1. 径向基函数2. 径向基函数网络的结构3. 径向基函数网络原理 Hopfield网络1. Hopfield网络结构2. Hopfield神经网络的两…