文本摘要生成评价指标——rouge

article/2025/10/7 18:27:13

文本摘要生成评价指标——rouge

    • rouge的作用:
    • rouge的内容:
    • rouge的类别:
    • rouge的使用:
    • rouge-N的理解:
    • Rouge-L的理解

rouge的作用:

-Rouge的全名是Recall-Oriented Understudy for GistingEvaluation,单看名字就会发现Rouge是由召回率演变而来的指标,用于衡量模型生成摘要文本的质量。 Rouge是文本自动摘要领域摘要评价技术的通用指标之一,通过统计模型生成的摘要与人工摘要之间重叠的基本单元,评判模型生成摘要的质量。

rouge的内容:

  • 我在进行文本摘要相关工作时,发现很多学者在进行文本摘要任务时,所采用的rouge任务不尽相同,有的学者使用Rouge-2、Rouge-4 和Rouge-SU4作为评价指标,对摘要结果进行评价;有的学者采用:ROUGE-1、ROUGE-2、ROUGE-L这三个值作为评价指标对得出的摘要进行评价。
  • rouge的计算公式如下所示:

在这里插入图片描述

  • 式(3)中 n 代表比较文本单元的长度,Countmatch 代表的是同时出现在标准摘要和机器生成的摘要的文本的数目。ROUGE-L表示的是标准摘要和本文生成的摘要的最长公共子序列的长度占标准摘要的比例。
  • 基于公式:ROUGE-1衡量一元词匹配情况,ROUGE-2衡量二元词匹配情况,ROUGE-L记录最长的公共子序列,以此类推即可。

rouge的类别:

  • Rouge其实是一组评价指标的统称,包含Rouge-N, Rouge-L, Rouge-W, Rouge-S四个指标。

rouge的使用:

需要选择适合的场景来使用适合的rouge评价指标。不同的摘要任务下,选择合适的Rouge指标。

  • 单文档摘要任务中,ROUGE-2, ROUGE-L, ROUGE-W,以及ROUGE-S表现很好 ;
  • 在短摘要/标题式摘要任务中,ROUGE-1, ROUGE-L, ROUGE-W, ROUGE-SU4,以及ROUGE-SU9表现很棒 ;
  • 在多文档摘要任务中,当停用词被排除在匹配之外时,ROUGE-1, ROUGE-2, ROUGE-S4,ROUGE-S9, ROUGE-SU4, 以及ROUGE-SU9表现不错 ;
  • 排除停用词通常能改善相关性评估 使用多个reference(ideal 摘要)可以改善相关性评估。

rouge-N的理解:

在这里插入图片描述

  • Rouge-n统计了pred和ideal两个字符串的n-gram重叠单元的数量,并计算了重叠单元在ideal字符串中的占比,作为召回率。
  • 以短摘要/title摘要任务为例:

ideal摘要:“武汉长江大桥”
pred摘要:“武汉市长江大桥”

在这里插入图片描述

  • 如有多个ideal摘要,怎么计算?分别计算每个ideal摘要和pred摘要的Rouge值,并取其中最大值,作为当前pred摘要的Rouge值。

Rouge-L的理解

  • 最长公共子序列,Longest Common Subsequence(LCS)
  • LCS和最长公共子串不同,不要求连续,保序即可 Rouge-N 只关注匹配单元的数量,像词袋一样,不关注词序 Rouge-L 关注词序
    在这里插入图片描述
  • 注:lcs经过了去重
  • ideal摘要:“矿泉水和纯净水的所含物质不同”
  • pred摘要:“矿泉水含有丰富的矿物质元素,纯净水不含矿物质”

在这里插入图片描述

  • 代码示例:
from rouge import Rouge
rouge=Rouge()
rouge_scores=rouge.get_scores("Installing collected packages","Installing ")
print('rouge_scores:',rouge_scores)
rl_p=rouge_scores[0]['rouge-l']['p']
print("rouge_scores rl_p",rl_p)
  • 输出结果:
rouge_scores: [{'rouge-1': {'r': 1.0, 'p': 0.3333333333333333, 'f': 0.4999999962500001}, 'rouge-2': {'r': 0.0, 'p': 0.0, 'f': 0.0}, 'rouge-l': {'r': 1.0, 'p': 0.3333333333333333, 'f': 0.4999999962500001}}]
rouge_scores rl_p 0.3333333333333333Process finished with exit code 0

http://chatgpt.dhexx.cn/article/DdggIQQn.shtml

相关文章

Rouge的安装与使用

这个坑实在太深了,总结几位大佬博客,汇总了可能出现的问题。愿为后人照福吧。 步骤 1. 需要安装perl解释器(ubuntu 系统已自带, 通过perl -v可查看当前版本); 2. 需要额外安装perl解释器的XML::DOM模块以及DB_File模块,而XML::…

ROUGE评测标准

简介 ROUGE 指标的全称是 (Recall-Oriented Understudy for Gisting Evaluation),主要是基于召回率 (recall) 的。ROUGE 是一种常用的机器翻译和文章摘要评价指标。 ROUGE-N ROUGE-N 主要统计 N-gram 上的召回率 公式的分母是统计在参考译文中 N-gram 的个数&am…

python中rouge是什么程序_rouge与pyrouge使用事项

1.rouge介绍 ROUGE评价方法与pyramid,BLUE方法一起作为评价自动摘要质量的内部评价方法的三大中流砥柱。 ROUGE:recall-oriented understand for gisting evalution 2004年,Chin-Yew Lin 提出 基本思想 由多个专家分别生成人工摘要,构成标准摘要集,将系统生成的自动摘要与人…

rouge安装

环境:Linux;需要root权限 1、检查是否有perl。输入perl -v。我的版本是5.26 2、安装XML::Parser 解压后进入XML::Parser目录下;输入命令 perl Makefile.PL make sudo make install 出现问题缺少Expat,直接install失败了&…

安装rouge和pyrouge

先rouge https://blog.csdn.net/Hay54/article/details/78744912 再pyrouge https://blog.csdn.net/MerryCao/article/details/49174283 具体流程: 一,ROUGE ROUGE是由微软亚洲研究院知识挖掘组(The Knowledge Mining group at Microsoft Research Asia)…

文本摘要评测工具ROUGE的搭建和测试

文本摘要任务中最常用的评价方法是ROUGE(Recall-Oriented Understudy for Gisting Evaluation)。ROUGE受到了机器翻译自动评价方法BLEU的启发,不同之处在于,采用召回率来作为指标。基本思想是将模型生成的摘要与参考摘要的n元组贡献统计量作为评判依据。…

NLP基础知识点:ROUGE

ROUGE: A Package for Automatic Evaluation of Summaries 1. 简介 ROUGE 指标由 Chin-Yew Lin 提出, 主要用于评估机器翻译和文章生成摘要的质量,其全称是 (Recall-Oriented Understudy for Gisting Evaluation) 它主要基于召回率和n-gram 2. 预备知…

自动文摘评测方法:Rouge-1、Rouge-2、Rouge-L、Rouge-S

关于ROUGE ROUGE(Recall-Oriented Understudy for Gisting Evaluation),在2004年由ISI的Chin-Yew Lin提出的一种自动摘要评价方法,是评估自动文摘以及机器翻译的一组指标。 ROUGE基于摘要中n元词(n-gram)的共现信息来评价摘要&a…

warmup_csaw_2016

文章目录 一、查看文件二、拖入IDA pro 中反编译三、编写代码总结 一、查看文件 先file ./warmup_csaw_2016查看文件类型再checksec --filewarmup_csaw_2016检查一下文件保护情况。 二、拖入IDA pro 中反编译 用IDA Pro 64bit打开warmup_csaw_2016后按 F5 反汇编源码并查看…

linux-centOS7.9通过docker安装cwmp server:drumsergio/genieacs

一、安装环境 #查看centOS版本 [rootMiWiFi-R4CM-srv network-scripts]# cat /etc/redhat-release CentOS Linux release 7.9.2009 (Core) #自动查找最新安装包并升级 [rootMiWiFi-R4CM-srv ~]# sudo yum upgrade 二、关闭firewalld、NetworkManager、selinux 关闭防火墙、…

MCP\eMCP\uMCP

MCP\eMCP\uMCP MCP是什么?MCP的结构详细的介绍具体的厂商及搭配参考 MCP是什么? MCP,即Multi-Chip-Package简称,中文意思是多制层封装芯片,即记忆体NOR Flash、NAND Flash、Low Power SRAM及Pseudo SRAM等堆叠封装成一…

关于CWMP基础(二)----TR069通信流程

1.通信流程图 建立TCP连接SSL初始化,进行加密建立安全机制由CPE端发起HTTP请求,发送Inform报文,开始建立CWMP连接。Inform中使用Eventcode字段描述发送Inform请求的原因 如 6 CONNECTION REQUEST ,表示ACS要求建立连接。如果ACS通…

网络协议篇之CWMP协议(三)—— RPC方法

一、CWMP方法 ACS对CPE的管理和监控是通过一系列的操作来实现的,这些操作在CWMP协议里称为RPC方法。主要方法的描述如下: Get:ACS使用该方法可以获取CPE上参数的值。 Set:ACS使用该方法可以设置CPE上参数的值。 Inform&#xf…

OpenWrt开发必备软件模块——网络管理(CWMP、SSH、QoS、SMTP、NTP、uHTTPd)

一、CWMP简介 CWMP(CPE WAN Management Protocol)是一个面向终端设备的网管技术规范。这个技术规范提供了对下一代网络中家庭网络设备进行管理配置的通用框架、消息规范、管理方法和数据模型。它由宽带(Broadband)论坛管理和发布…

CWMP(TR069)协议标准学习

协议栈分层 网关和ACS管理平台之间终端管理相关的管理接口协议栈层次如下图: 其中RPC层定义了网关远程管理中的远程调用方法集。 SOAP协议层定义了用来编译RPC方法的标准XML句法,其要求如下: 应支持SOAP 1.1。XML Schema文件头、SOAP信包头…

Openwrt常用软件模块之CWMP

Openwrt常用软件模块之CWMP CWMP概述 CWMP(CPE WAN Management Protocol)是一个面向终端设备的网管技术规范。这个技术规范提供了对下一代网络中家庭网络设备进行管理配置的通用框架、消息规范、管理方法和数据模型 。 它由宽带(Broadband&a…

MPC

文章目录 前言1. 背景 Background1.1 滚动时域控制 Receding Horizon Control1.2 线性模型预测控制 Linear Model Predictive Control1.3 非线性模型预测控制 Nonlinear Model Predictive Control1.4 线性鲁棒模型预测控制 Linear Robust Model Predictive Control1.4.1 反馈预…

基于CWMP(TR069)协议ACS服务器的搭建

Linux上安装openacs Openacs的安装分为四大步: 1.安装jdk 2.安装jboss 3.安装mysql 4.部署openacs JDK简介 Java DevelopmentKit(JDK)是由Sun公司发布的针对Java开发人员发布的免费软件开发工具包(SDK, Software development kit)。自Java推出以来,JDK已…

CWMP\TR069协议学习随笔1——入门基础知识及环境搭建

什么是CWMP(TR069) CWMP是由数字用户线路DSL——Digital Subscriber’s Line论坛(之后更名为broadband-forum)发起开发的技术规范之一,编号为TR-069,所以又被称为TR-069协议 CWMP协议基础概念 CWMP的全称…

网络协议篇之CWMP协议(一)—— CWMP(TR-069)基础

一、CWMP(TR-069)概述 CWMP(CPE WAN Management Protocol,CPE广域网管理协议)是由DSL(Digital Subscribers Line,数字用户线路)论坛发起开发的技术规范之一,编号为TR-069…