Pairwise-ranking loss代码实现对比

article/2025/10/20 16:08:04

Multi-label classification中Pairwise-ranking loss代码

定义

在多标签分类任务中,Pairwise-ranking loss中我们希望正标记的得分都比负标记的得分高,所以采用以下的形式作为损失函数。其中 c + c_+ c+是正标记, c − c_{-} c是负标记。

引用了Mining multi-label data1中Ranking loss的介绍,令正标记的得分都高于负标记的得分。
在这里插入图片描述
根据上述的定义,我们对Pairwise-ranking loss修改为以下的形式:

J = ∑ i = 1 n ∑ j = 1 c + ∑ k = 1 c − max ⁡ ( 0 , 1 − f j ( x i ) + f k ( x i ) ) J=\sum_{i=1}^{n} \sum_{j=1}^{c_{+}} \sum_{k=1}^{c_{-}} \max \left(0,1-f_{j}\left(\boldsymbol{x}_{i}\right)+f_{k}\left(\boldsymbol{x}_{i}\right)\right) J=i=1nj=1c+k=1cmax(0,1fj(xi)+fk(xi))

代码优化

我写了两版代码,使用三层for循环的版本,以及使用一层for循环+矩阵运算的版本。当样本大小为1w时,代码二只需要1.3s,代码一需要13s。

注意:代码基于pytorch,其中的函数会进行解释

环境:i7-6700HQ, python3.6.5, pytorch 1.4.0+cpu

先准备测试数据

import torch
torch.manual_seed(1)
from time import time
batch = 10000
clsnum = 10
y_true = torch.randint(0,2,(batch,clsnum)) # 生成(10000,10)的0-1构成的向量作为真实标记
y_pred = torch.rand((batch,clsnum)) # 生成(10000,10)的0~1构成的向量作为预测标记
代码一(for循环版本)
st = time()
sum_one = 0
for i in range(y_pred.size(0)):true_index = (y_true[i] == 1.0).nonzero().flatten()false_index = (y_true[i] == 0.0).nonzero().flatten()for j in true_index:for k in false_index:val = 1 - y_pred[i, j] + y_pred[i, k]if val > 0:sum_one += valelse:sum_one += val * 0
end = time()
print(end-st) # 14.33322787284851
print(sum_one)# tensor(223758.5938)
代码二(矩阵运算版本)
st = time()
sum_one = 0
for i in range(y_pred.size(0)):true_index = (y_true[i] == 1.0).nonzero().flatten()false_index = (y_true[i] == 0.0).nonzero().flatten()# 若正标记有n个,负标记为m个。生成n*m矩阵,用来进行正标记与负标记的运算。ot = 1 - y_pred[i, true_index].view(-1,1).repeat((1,false_index.size(0))) + y_pred[i, false_index].view(1,-1).repeat((true_index.size(0),1))sum_one += torch.clamp(ot,0.0).sum() # 将小于0的元素变为0。end = time()
print(end-st) # 2.101431131362915
print(sum_one)# tensor(223755.8438)

疑问

sum_one的值两次计算的结果是不同的,很奇怪。

补充

检索中的Pairwise-ranking loss

在评论区指出了我所关注的是多标签分类,而面向检索中的Pairwise-ranking loss的公式是不一致的。

引用一下刘铁岩老师的Learning to rank for information retrieval2中关于检索任务的Pairwise-ranking loss的定义,对于文档库中的两个文档 x u x_u xu x v x_v xv。 pairwise方法不注重预测每个文档相关性的准确程度,而是注重两个文档之间的相对顺序。
在这里插入图片描述

度量学习中的Pairwise-ranking loss

度量学习:学习衡量样本之间的距离/相似性。我认为检索中的ranking loss是度量学习的特例,而度量学习中的Pairwise-ranking loss的目标是,给定一个样本 r a r_a ra和另外两个正负样本 r p , r n r_p, r_n rp,rn,使得 r a r_a ra r p r_p rp的距离更近, r a r_a ra r n r_n rn的距离更远。引用《Understanding Ranking Loss, Contrastive Loss, Margin Loss, Triplet Loss, Hinge Loss and all those confusing names》3 的图片。
在这里插入图片描述

引用


  1. Tsoumakas G, Katakis I, Vlahavas I. Mining multi-label data[M]//Data mining and knowledge discovery handbook. Springer, Boston, MA, 2009: 667-685. ↩︎

  2. Liu T Y. Learning to rank for information retrieval[J]. 2011. ↩︎

  3. https://gombru.github.io/2019/04/03/ranking_loss/ ↩︎


http://chatgpt.dhexx.cn/article/bcwU1GMM.shtml

相关文章

【论文笔记】API-Net:Learning Attentive Pairwise Interaction for Fine-Grained Classification

API-Net 简介创新点mutual vector learning(互向量学习)gate vector generation(门向量生成器)pairwise interaction(成对交互) 队构造(Pair Construction)实验结果总结 简介 2020年…

白话点云dgcnn中的pairwise_distance

点云DGCNN中对于代码中pairwise_distance的分析与理解 2021年5月7日:已经勘误,请各位大佬不惜赐教。 一点一点读,相信我,我能讲清楚。 这个是本篇文章所要讨论的代码段 总体上把握,这个代码计算出了输入点云每对点之…

推荐系统[四]:精排-详解排序算法LTR (Learning to Rank): poitwise, pairwise, listwise相关评价指标,超详细知识指南。

搜索推荐系统专栏简介:搜索推荐全流程讲解(召回粗排精排重排混排)、系统架构、常见问题、算法项目实战总结、技术细节以及项目实战(含码源) 专栏详细介绍:搜索推荐系统专栏简介:搜索推荐全流程讲解(召回粗排精排重排混排)、系统架构、常见问题、算法项目实战总结、技术…

【torch】torch.pairwise_distance分析

every blog every motto: You can do more than you think. https://blog.csdn.net/weixin_39190382?typeblog 0. 前言 记录torch.pairwise_distance 1. 一维 1.1 元素个数相同 1.1.1 元素个数为1 生成代码: t torch.randn(1) f torch.randn(1)计算代码,下…

pairwise损失_triplet损失_提升精排模型的trick

01标签 import torch import torch.nn as nn# 输入x是一个二维张量,每一行表示一个样本的分数,每一列表示一个特征或维度 x torch.tensor([[0.5, 0.7], [0.9, 0.8], [0.6, 0.4], [0.3, 0.6], [0.8, 0.7], [0.4, 0.5]])# 标签y是一个一维张量&#xff0c…

LTR (Learning to Rank): 排序算法 poitwise, pairwise, listwise常见方案总结

目录 1 Learing to Rank介绍2 The Pointwise Approach3 The Pairwise Approach3.1 RankNet 4 The Listwise Approach4.1 直接优化评测指标4.1.1 LambdaRank4.1.2 LambdaMART 4.2 定义Listwise损失函数4.2.1 ListNet4.2.2 ListMLE 5 排序评估指标5.1 Mean Reciprocal Rank (MRR)…

【论文精读】Pairwise learning for medical image segmentation

Published in: Medical Image Analysis 2020 论文:https://www.sciencedirect.com/science/article/abs/pii/S1361841520302401 代码:https://github.com/renzhenwang/pairwise_segmentation 目录 Published in: Medical Image Analysis 2020 摘要 一…

pairwise相似度计算

做了一个比赛,其中为了更好的构建负样本,需要计算不同句子之间的相似性,句子大概有100w,句子向量是300维,中间踩了很多坑,记录一下。 暴力计算 最简单的idea是预分配一个100w x 100w的矩阵,一…

如何计算 Pairwise correlations

Pairwise Correlation的定义是啥?配对相关性?和pearson correlations有什么区别? Pairwise Correlation顾名思义,用来计算两个变量间的相关性,而pearson correlations只是计算相关性的一种方法罢了。 1、pearson相关系…

再谈排序算法的pairwise,pointwise,listwise

NewBeeNLP干货 作者:DOTA 大家好,这里是 NewBeeNLP。 最近因为工作上的一些调整,好久更新文章和个人的一些经验总结了,下午恰好有时间,看了看各渠道的一些问题和讨论,看到一个熟悉的问题,在这…

【推荐】pairwise、pointwise 、 listwise算法是什么?怎么理解?主要区别是什么?

写在前面:写博客当成了学习笔记,容易找到去完善,不用于商业用途。通过各种途径网罗到知识汇总与此,如有侵权,请联系我,我下掉该内容~~ 排序学习的模型通常分为单点法(Pointwise Approach&#…

软件测试用例设计之Pairwise算法

Pairwise算法简介 Pairwise是L. L. Thurstone(29 May1887 – 30 September 1955)在1927年首先提出来的。他是美国的一位心理统计学家。Pairwise也正是基于数学统计和对传统的正交分析法进行优化后得到的产物。 测试过程中,对于多参数参数多值的情况进行测试用例组…

磁盘配额中quotacheck不能创建aquota.user和aquota.group文件的问题

在centos6.5学习中有关磁盘配额的内容中,发现quotacheck -augv 命令无法创建aquota.group 和aquota.user文件, 操作系统挂载在/home下,经排查发现是SELinux的问题,使用setenforce 0命令将其关闭后,重新执行quotacheck…

Linux从入门到精通(八)——Linux磁盘管理

文章篇幅较长,建议先收藏,防止迷路 文章跳转Linux从入门到精通(八)——Linux磁盘管理goLinux从入门到精通(九)——Linux编程goLinux从入门到精通(十)——进程管理goLinux从入门到精…

Linux:Quota 的基本命令​​​​​​​

在开始进行 quota 的实作之前,我们得来了解一下 quota 要使用的指令啰! 基本上分为两种,一种是查询功能(quota, quotacheck, quotastats, warnquota, repquota),另一种则是编辑 quota 的内容( …

01_Linux系统管理_基础知识_高级文件系统管理_磁盘配额(quota)

环境 虚拟机:VMware-10.0.7 build-2844087Linux系统:CentOS 6.8远程工具:Xshell 6 (Build 0197) 01_Linux系统管理_基础知识_高级文件系统管理_磁盘配额 一、什么是磁盘配额(quota) 磁盘配额概念 对用户和用户组使用磁…

linux 系统配额管理功能,磁盘配额管理_Linux教程_Linux公社-Linux系统门户网站

在多用户系统中,如果没有对用户使用的磁盘空间做出限制,用户无限制地存放数据和文件,可能会导致系统磁盘空间告警。如果存放的是无用数据,就会导致磁盘空间白白浪费。磁盘配额可以限制用户或组在磁盘上存放文件的空间,…

Linux复习笔记

Linux复习笔记 常识说明 目录结构 Linux以树型结构管理文件,其最上层文件夹为 / ,也就是根目录。 如图所示,图中展示了一部分文件夹的结构: 所有的文件夹都属于根目录的子文件夹。 安装好系统后,根目录会挂载到一…

linux对目录空间使用限制,Linux quotacheck命令使用详解:检查磁盘的使用空间和限制...

quotacheck命令通过扫描指定的文件系统,获取磁盘的使用情况,创建、检查和修复磁盘配额(quota)文件。执行quotacheck指令,扫描挂入系统的分区,并在各分区的文件系统根目录下产生quota.user和quota.group文件,设置用户和…

Linux常用命令——quotacheck命令

在线Linux命令查询工具(http://www.lzltool.com/LinuxCommand) quotacheck 检查磁盘的使用空间与限制 补充说明 quotacheck命令通过扫描指定的文件系统,获取磁盘的使用情况,创建、检查和修复磁盘配额(quota)文件。执行quotach…