自动文摘评测方法:Rouge-1、Rouge-2、Rouge-L、Rouge-S

article/2025/10/7 20:27:06

关于ROUGE

ROUGE(Recall-Oriented Understudy for Gisting Evaluation),在2004年由ISI的Chin-Yew Lin提出的一种自动摘要评价方法,是评估自动文摘以及机器翻译的一组指标。

ROUGE基于摘要中n元词(n-gram)的共现信息来评价摘要,是一种面向n元词召回率的评价方法。基本思想为由多个专家分别生成人工摘要,构成标准摘要集,将系统生成的自动摘要与人工生成的标准摘要相对比,通过统计二者之间重叠的基本单元(n元语法、词序列和词对)的数目,来评价摘要的质量。通过与专家人工摘要的对比,提高评价系统的稳定性和健壮性。

ROUGE准则由一系列的评价方法组成,包括ROUGE-N(N是n-gram中n,取值有1,2,3,4),ROUGE-L,ROUGE-S, ROUGE-W,ROUGE-SU等。在自动文摘相关研究中,一般根据自己的具体研究内容选择合适的ROUGE方法。

ROUGE-N

ROUGE-N在Chin-Yew Lin的论文中是这样定义的:
在这里插入图片描述
分母是人工摘要(也就是标准摘要)中n-gram的个数,分子是人工摘要和机器生成的自动摘要共现(重合)的n-gram的个数。可以看出,ROUGE与召回率的定义很相似。

举例:

机器生成的自动摘要:
the cat was found under the bed
人工生成的标准摘要:
the cat was under the bed

如果我们只考虑单个单词,自动摘要和标准摘要之间的重叠单词数量为6。但是,这并不能作为度量标准。为了获得良好的定量值,我们实际上可以使用二者共线的n-gram数来计算精度和召回率。

ROUGE背景下的精度与召回

上面的例子中,ROUGE-1的值可以很容易计算出来,为 6 6 {6 \over 6} 66,这个值与召回率是一样的,也就是 r e c a l l = 6 6 recall={6 \over 6} recall=66

这意味着标准摘要(人工生成)中的所有单词都已被机器生成的自动摘要捕获。但是,有可能机器生成的摘要可能非常长,可以很容易捕获标准摘要中的所有单词。但是,系统摘要中的大部分单词可能都是无用的,使得摘要不必要地冗长。这就是精确度发挥作用的地方。在精确度方面,您实际测量的是, 机器生成的自动摘要中有多少实际上相关或需要?精度测量为:
n u m b e r _ o f _ o v e r l a p p i n g _ w o r d s t o t a l _ w o r d s _ i n _ m a c h i n e _ s u m m a r y number\_of\_overlapping\_words \over total\_words\_in\_ machine\_summary total_words_in_machine_summarynumber_of_overlapping_words
分子是机器摘要和标准摘要共现的单词个数,分母是机器摘要中单词的个数。
在这个例子中 p e r c i s i o n = 6 7 = 0.86 percision={6 \over 7} = 0.86 percision=76=0.86

这仅仅意味着系统摘要中的7个单词中的6个实际上是相关的或需要的。如果我们有以下标准摘要,而不是上面的示例: the tiny little cat was found under the big funny bed
那么这时精确度变为: p e r c i s i o n = 6 11 = 0.55 percision={6 \over 11} = 0.55 percision=116=0.55

现在,这看起来不太好,是吗?那是因为我们在摘要中有不少不必要的词。当您尝试生成简洁的摘要时,精确度方面变得非常重要。因此,最好同时计算Precision和Recall,然后报告F-Measure。如果您的摘要在某种程度上可以通过某些约束来使摘要简洁或者是对精确度要求不高,那么您可以考虑仅使用Recall。其实现在的摘要评测任务一般只考虑recall。

ROUGE-2该如何计算?

自动摘要的Bigrams:
the cat, cat was, was found, found under, under the, the bed

标准摘要的Bigrams:
the cat, cat was, was under, under the, the bed
故ROUGE-2的值为 4 5 {4 \over 5} 54,也就是 r e c a l l = 4 5 = 0.8 recall={4 \over 5}=0.8 recall=54=0.8。此时 p e r c i s i o n = 4 6 = 0.67 percision={4 \over 6} = 0.67 percision=64=0.67

ROUGE-N优点

直观,简洁,能反映词序。

ROUGE-N缺点

区分度不高,且当N>3时,ROUGE-N值通常很小。

应用场景

ROUGE-1:短摘要评估,多文档摘要(去停用词条件);
ROUGE-2: 单文档摘要,多文档摘要(去停用词条件);

ROUGE-L

L即是LCS(longest common subsequence,最长公共子序列)的首字母,因为Rouge-L使用了最长公共子序列。Rouge-L计算方式如下图:
在这里插入图片描述
其中 L C S ( X , Y ) LCS(X,Y) LCS(X,Y) X 和 Y X和Y XY的最长公共子序列的长度, m , n m,n m,n分别表示人工标准摘要和机器自动摘要的长度(一般就是所含词的个数), R l c s , P l c s R_{lcs},P_{lcs} RlcsPlcs​ 分别表示召回率和准确率。最后的 F l c s F_{lcs} Flcs​ 即是我们所说的 R o u g e − L Rouge-L RougeL。在DUC中, β \beta β被设置为一个很大的数,所以 R o u g e − L Rouge-L RougeL几乎只考虑了 R l c s R_{lcs} Rlcs,与上文所说的一般只考虑召回率对应。

优点

使用LCS的一个优点是它不需要连续匹配,而且反映了句子级词序的顺序匹配。由于它自动包含最长的顺序通用n-gram,因此您不需要预定义的n-gram长度。

缺点

只计算一个最长子序列,最终的值忽略了其他备选的最长子序列及较短子序列的影响。

应用场景

单文档摘要;短摘要评估。

Rouge-S

使用了skip-grams,在参考摘要和待评测摘要进行匹配时,不要求gram之间必须是连续的,可以“跳过”几个单词,比如skip-bigram,在产生grams时,允许最多跳过两个词。比如“cat in the hat”的 skip-bigrams 就是 “cat in, cat the, cat hat, in the, in hat, the hat”。

优点

考虑了所有按词序排列的词对,比n-gram模型更深入反映句子级词序。

缺点

若不设定最大跳跃词数会出现很多无意义词对。若设定最大跳跃词数,需要指定最大跳跃词数的值。

应用场景

单文档摘要;ROUGE-S4,ROUGE-S9: 多文档摘要(去停用词条件);

参考
https://blog.csdn.net/qq_25222361/article/details/78694617
https://blog.csdn.net/lcj369387335/article/details/69845385
http://text-analytics101.rxnlp.com/2017/01/how-rouge-works-for-evaluation-of.html


http://chatgpt.dhexx.cn/article/STQ04Tqf.shtml

相关文章

warmup_csaw_2016

文章目录 一、查看文件二、拖入IDA pro 中反编译三、编写代码总结 一、查看文件 先file ./warmup_csaw_2016查看文件类型再checksec --filewarmup_csaw_2016检查一下文件保护情况。 二、拖入IDA pro 中反编译 用IDA Pro 64bit打开warmup_csaw_2016后按 F5 反汇编源码并查看…

linux-centOS7.9通过docker安装cwmp server:drumsergio/genieacs

一、安装环境 #查看centOS版本 [rootMiWiFi-R4CM-srv network-scripts]# cat /etc/redhat-release CentOS Linux release 7.9.2009 (Core) #自动查找最新安装包并升级 [rootMiWiFi-R4CM-srv ~]# sudo yum upgrade 二、关闭firewalld、NetworkManager、selinux 关闭防火墙、…

MCP\eMCP\uMCP

MCP\eMCP\uMCP MCP是什么?MCP的结构详细的介绍具体的厂商及搭配参考 MCP是什么? MCP,即Multi-Chip-Package简称,中文意思是多制层封装芯片,即记忆体NOR Flash、NAND Flash、Low Power SRAM及Pseudo SRAM等堆叠封装成一…

关于CWMP基础(二)----TR069通信流程

1.通信流程图 建立TCP连接SSL初始化,进行加密建立安全机制由CPE端发起HTTP请求,发送Inform报文,开始建立CWMP连接。Inform中使用Eventcode字段描述发送Inform请求的原因 如 6 CONNECTION REQUEST ,表示ACS要求建立连接。如果ACS通…

网络协议篇之CWMP协议(三)—— RPC方法

一、CWMP方法 ACS对CPE的管理和监控是通过一系列的操作来实现的,这些操作在CWMP协议里称为RPC方法。主要方法的描述如下: Get:ACS使用该方法可以获取CPE上参数的值。 Set:ACS使用该方法可以设置CPE上参数的值。 Inform&#xf…

OpenWrt开发必备软件模块——网络管理(CWMP、SSH、QoS、SMTP、NTP、uHTTPd)

一、CWMP简介 CWMP(CPE WAN Management Protocol)是一个面向终端设备的网管技术规范。这个技术规范提供了对下一代网络中家庭网络设备进行管理配置的通用框架、消息规范、管理方法和数据模型。它由宽带(Broadband)论坛管理和发布…

CWMP(TR069)协议标准学习

协议栈分层 网关和ACS管理平台之间终端管理相关的管理接口协议栈层次如下图: 其中RPC层定义了网关远程管理中的远程调用方法集。 SOAP协议层定义了用来编译RPC方法的标准XML句法,其要求如下: 应支持SOAP 1.1。XML Schema文件头、SOAP信包头…

Openwrt常用软件模块之CWMP

Openwrt常用软件模块之CWMP CWMP概述 CWMP(CPE WAN Management Protocol)是一个面向终端设备的网管技术规范。这个技术规范提供了对下一代网络中家庭网络设备进行管理配置的通用框架、消息规范、管理方法和数据模型 。 它由宽带(Broadband&a…

MPC

文章目录 前言1. 背景 Background1.1 滚动时域控制 Receding Horizon Control1.2 线性模型预测控制 Linear Model Predictive Control1.3 非线性模型预测控制 Nonlinear Model Predictive Control1.4 线性鲁棒模型预测控制 Linear Robust Model Predictive Control1.4.1 反馈预…

基于CWMP(TR069)协议ACS服务器的搭建

Linux上安装openacs Openacs的安装分为四大步: 1.安装jdk 2.安装jboss 3.安装mysql 4.部署openacs JDK简介 Java DevelopmentKit(JDK)是由Sun公司发布的针对Java开发人员发布的免费软件开发工具包(SDK, Software development kit)。自Java推出以来,JDK已…

CWMP\TR069协议学习随笔1——入门基础知识及环境搭建

什么是CWMP(TR069) CWMP是由数字用户线路DSL——Digital Subscriber’s Line论坛(之后更名为broadband-forum)发起开发的技术规范之一,编号为TR-069,所以又被称为TR-069协议 CWMP协议基础概念 CWMP的全称…

网络协议篇之CWMP协议(一)—— CWMP(TR-069)基础

一、CWMP(TR-069)概述 CWMP(CPE WAN Management Protocol,CPE广域网管理协议)是由DSL(Digital Subscribers Line,数字用户线路)论坛发起开发的技术规范之一,编号为TR-069…

CWMP

http://blog.163.com/yuan_zhch/blog/static/1937900462012111113320220/ TR-069简介 转 2012-12-01 23:33:20| 分类: CWMP相关 |字号 订阅 http://hi.baidu.com/huiweics 相关缩略语 ACS:Auto-Configuration Server (自动配置服务器&a…

网络协议篇之CWMP协议(二)—— CWMP(TR-069)业务流程

一、 CWMP(TR-069)业务流程 软件架构以及协议的具体解析过程 二、 CWMP(TR-069)通信过程 我们来看一个tr069协议完整的通信过程. (1) 建立TCP连接。 (2) SSL初始化,建立安全机制。 (3) CPE发送Inform报文&#xff0…

关于CWMP基础(一)----(TR069)

CWMP(TR069) 概述TR069协议族主要功能网络架构关于RPC协议基础RPC协议的处理流程回路:SOAP协议基础CWMP基本功能 概述 1.为什么需要TR069? 随着VoIP、IPTV等越来越多IP终端设备的普及(尤其在家庭中的普及)&#xff…

CWMP (TR-069)技术介绍

CWMP (TR-069)技术介绍-新华三集团-H3C 目 录 CWMP (TR-069) CWMP(TR-069)概述 CWMP网络框架 CWMP基本功能 CWMP实现机制 CWMP (TR-069) CWMP(TR-069)概述 CWMP(CPE WAN Management Protocol,CPE广域网管理…

CWMP协议简介

CWMP协议 1、概念2、网络架构3、协议栈结构协议各层概要 4、基本功能①ACS和CPE自动连接,CPE可以通过发送Inform报文自动连接ACS②支持ACS对CPE的自动配置③支持对CPE系统镜像文件和配置文件的上传/下载管理④支持ACS对CPE状态和性能的监控 5、TR-069主要方法①CPE …

神经网络算法详解 01:人工神经网络基础

本文介绍了人工智能的发展历史,基本概念,应用领域;神经元模型,神经元的学习规则以及神经网络工作原理。本系列文章来自阿里云大学人工智能学习路线中的《神经网络概览及神经网络算法详解》课程。 系列文章: 【神经网络…

神经网络算法总结

文章目录 前馈神经网络1. 单层前馈神经网络(单层感知器)2. 多层感知器 反馈神经网络径向基函数网络(RBF网络)1. 径向基函数2. 径向基函数网络的结构3. 径向基函数网络原理 Hopfield网络1. Hopfield网络结构2. Hopfield神经网络的两…

卷积神经网络有哪些算法,卷积神经网络算法实现

卷积神经网络通俗理解 。 卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(FeedforwardNeuralNetworks),是深度学习(deeplearning)的代表算法…