ICCV2021涨点神器:新方式在视觉类领域提升精度(附源代码)

article/2025/6/26 18:19:44

关注并星标

从此不迷路

计算机视觉研究院

7f204af5dcf829f4118c10c42808e970.gif

11aac9799580e7402540a7e3bc710162.gif

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

计算机视觉研究院专栏

作者:Edison_G

基于非局部的块设计用于捕获计算机视觉任务中的远程时空依赖性。尽管表现出出色的性能,但它们仍然缺乏对图像或视频元素之间丰富的结构化信息进行编码的机制。

f77c198d74b3898c3e298dc3d545b19b.png

论文:https://arxiv.org/abs/2108.02451

源代码:https://github.com/zh460045050/SNL_ICCV2021

前言

4441fb954e12b28e6ca41fabc9c9bc80.png

基于非局部的块设计用于捕获计算机视觉任务中的远程时空依赖性。尽管表现出出色的性能,但它们仍然缺乏对图像或视频元素之间丰富的结构化信息进行编码的机制。

在今天的分享中,为了从理论上分析这些基于非局部的块的属性,研究者提供了一个新的视角来解释它们,研究者将它们视为在全连接图上生成的一组图过滤器。具体地,在选择Chebyshev Graph滤波器时,可以导出统一的formulation,用于解释和分析现有的nonlocal-based blocks(例如,非局部块,非函数阶段,双重注意力块)。此外,通过考虑谱的特性,研究者提出了一种高效且稳健的谱非局部块,与现有的非局部块相比,当插入深度神经网络时,该块可以更稳健和灵活地捕获远程依赖关系。实验结果证明了新提出的方法在图像分类、行为识别、语义分割和行人重识别任务上的明显改进和实际适用性。

背景

为什么提出Non-local?

计算机视觉领域,尤其对于动态视频序列中,帧内帧间的依赖关系十分重要。尤其像下图中视频的行为分类任务,全局内容的理解以及不同帧间的联系对于分类结果导向作用很强。现在比较通用普遍的做法是,通过循环卷积网络联系t和t-1,或者通过更深的网络增大感受野提高对全局内容的理解。

40f5062a9356ed3b96940ab7faa0c3bf.png

尽管如此,这种方式仍旧是比较local的,不论时间方向或者空间位置。甚至,最大的问题是:没法进行远距离信息的来回传递;而且deeper网络计算量大但效率低,梯度优化起来也比较困难。

因此,针对远距离信息传递问题,提高长距离依赖,本论文从传统的非局部均值滤波方法中受到启发,提出了卷积网络中的non-local,即:某一像素点处的响应是其他所有点处的特征权重和,将每一个点与其他所有点相关联,实现non-local 思想。

4ab51a8b2328ab861d7bd77a1a68eeca.png

Non-local其实可以被认为是channel level和spatial level的泛化。这种方式通过注意力加强距离依赖,更是直接实现了全局的联系性。既有attention的思想也有context联系的思想。基于这个non-local,后面相继又有几个网络结构提出来,本质还是做注意力机制,只不过操作不一样,或者是改进版的。像刚刚说的,CCNet, GCNet。可以看上图。另外,想说一点注意力的见解。形如resnet,alexnet等通用网络结构中,我们可以理解为空间或者通道间的所有位置,其重要性均等,即权重都为1。而注意力机制的根本目的,就是对原本平均分配的权重通过手动或者自学习的方式进行非等份分配。

所以,从这个角度看,挂在嘴边的先验知识或是上下文关系(local, global, context)都可以理解为对原本等价权重的非等份分配。在诸如SENet,CBAM中,通过网络训练的方式得到权重;而人为先验,是不是就是手动的权重分配,针对我们觉得重要的部分进行高权重赋值然后操作?

——引自《知乎:起舞的跳跳虫》

新框架

7d6b2a9d21a5b00a145f07118409f2c6.png

上图,非局部块的空间 (A) 和光谱 (B) 视图。粉红色点表示特征图中的每个补丁,“Aggregation”表示计算加权平均值作为下面方程的分子。虚线箭头表示“copy”,实线箭头表示“feed forward”。绿色条是节点特征,长度表示它们的强度(最佳颜色视图)。

e0d0dfd406535dd2b79c9855f8d2f8b0.png

为了从理论上分析这些nonlocal-based blocks的属性,研究者提供了一个新的视角来解释它们,将它们视为在全连接图上生成的一组graph filters。具体地,在选择Chebyshev graph filter时,可以导出统一的formulation,用于解释和分析现有的nonlocal-based blocks(例如,非局部块,非函数阶段,双重注意力块)。

此外,通过考虑谱的特性,提出了一种高效且稳健的spectral nonlocal block,与现有的nonlocal blocks相比,当插入深度神经网络时,该模块可以更稳健和灵活地捕获远程依赖关系。

f55ced69b814c462ad61222c89b985a5.png

实验

图像分类上的性能表现:

216041d420bd6b6ced3e4d9e5e9185a3.png

fa166e5974343ba96ac0e433893f2249.png

行为识别上的性能表现:

d17b989270b5804cdbd6789439273c7a.png

语义分割上的性能表现:

59b6f7e2da208eb2702096910c69691a.png

© THE END 

转载请联系本公众号获得授权

5797607e3c2b2066e433276c21155d50.gif

计算机视觉研究院学习群等你加入!

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

92b43dfd4b86cca46208e88a8edf72f0.png

扫码关注

计算机视觉研究院

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

 往期推荐 

🔗

  • ResNet超强变体:京东AI新开源的计算机视觉模块!(附源代码)

  • YOLOS:通过目标检测重新思考Transformer(附源代码)

  • 自己觉得挺有意思的目标检测框架,分享给大家(源码论文都有)

  • CVPR2021:IoU优化——在Anchor-Free中提升目标检测精度(附源码)

  • 多尺度深度特征(上):多尺度特征学习才是目标检测精髓(干货满满,建议收藏)

  • 多尺度深度特征(下):多尺度特征学习才是目标检测精髓(论文免费下载)

  • ICCV2021目标检测:用图特征金字塔提升精度(附论文下载)

  • CVPR21小样本检测:蒸馏&上下文助力小样本检测(代码已开源)


http://chatgpt.dhexx.cn/article/sW4pt37k.shtml

相关文章

自媒体如何涨粉?这4个技巧

自媒体怎么引流?这4个技巧,0基础也能操作。经常会有很多朋友跟我吐槽,为什么自己明明花了很多心思做自媒体,但流量就是提不上来?其实,自媒体的引流的思路非常简单:内容 平台!文章引流…

抖音配音都有哪些软件好用?好的配音可以快速热门涨粉丨国仁网络资讯

刷抖音的时候,你是不是经常刷到这种视频: 想知道这样的AI配音是怎么做到的吗? 其实都是配音软件合成的,不仅能够支持AI配音,还有各种方言、各种声色都可以在配音软件中找到哦! 今天就给大家推荐几款抖音配音神器,各种语言、各种声音应有尽有,赶紧来get一款适合你的吧…

虾皮店铺有哪些涨粉方法?知虾数据教你八招快速涨粉技巧

做shopee电商平台,通常排名靠前的产品店铺,粉丝体量都很大。那么虾皮粉丝有没有用?如何快速涨粉呢?接下来知虾数据教你几个方法。 第1个方法,直接关注同行店铺的粉丝 操作很简单,打开虾皮手机APP&#xff…

自媒体人涨粉攻略:3个免费的有效渠道,快收好

做自媒体,粉丝就是收益的基础,也是很多自媒体工作者的绩效考核标准。但是做自媒体,涨粉可谓是头号难题,尤其是在想要不花钱的基础上。别急,今天小编就给大家分享一篇自媒体涨粉攻略,3个免费但有效的渠道&am…

公众号加粉php源码,微信公众号全自动推广系统PHP源码_快速增加粉丝订阅数吸粉神器...

源码说明 会员推广联盟源码,本推广系统是一套使用PHPMYSQL开发而成的广告链接智能推广程序,可用于 公众号、网店、网站、产品单页等多种类型的网站、单页进行推广! 带安装和使用教程,附送快速吸引大批推广员来帮你推广的方法和宣传用的软件 更新说明 1、…

技术小白教你如何做一个画蛋蛋的H5-涨粉神器-教你如何从1000到1W粉

 DEMO 好了~我们来看看我们要做的效果~上demo~ 扫描公众号 – >> 回复 “蛋” 点击蓝色字就可以进去了,进去试试吧 目录 微信JSSDK接入 canvas 如何让用户关注 函数记录 微信JSSDK接入 关于微信JSSDK接入,…

美食博主如何选厨房家电?这台冰箱可是我的涨粉神器

作为一名美食博主,我体验过不同的美食文化,得出的结论就是,无论哪种美食,美味的秘诀不仅在于烹饪技巧,更在于食材选用的新鲜程度。这也直接影响着我对厨房家电的选择要求,特别是冰箱,我一定要选…

涨粉神器,粉丝零距离交流!CSDN APP迎来更新

是的,CSDN APP又更新了,研发小哥哥辛苦了!CSDN APP基本做到了每周一更,第一时间解决用户反馈,还未下载的小伙伴可以扫描下方二维码直达! 你喜欢的功能都来了!CSDN App更新! 支持分享…

直播预售+涨粉神器,创客匠人教你如何快速裂变涨粉

在线教育、知识付费,是目前大众获取知识、自我提升的重要渠道。通过互联网线上工具,人们可以随时随地地利用碎片化时间进行充电,在家也能与名师、同好者们进行互动交流。 因此,也有越来越多教培机构、讲师等内容创业者开始将业务…

Java学习一阶段-Eclipse介绍与安装

Eclipse的介绍与安装 Eclipse简介 Eclipse 是一个开放源代码的,基于 Java 的可扩展开发平台。Eclipse官方版是一个集成开发环境(IDE),可以通过安装不同的插件实现对其它计算机语言编辑开发,如C、Php、Python等等。 Eclipse的下载 下载时需要访…

eclipse视图介绍

1,eclipse创建java web项目 2,视图切换,debug,javaee,java,java项目用java窗口,web项目用javaee,debug时候用debug窗口 可以从上图直接切换,或者点击红圈标出的&#xff…

Eclipse的介绍和使用

一:编码区域字体大小的设置: window——preferences——General——Appearance——Colorsand——Basic选择Text Font再按Edit... 二:设置代码的自动补全快捷键: window——preferences——Keys——ContentAssist——Binding——O…

Eclipse的来源及使用简介

Eclipse是现在一个比较大型的开源组织,其主要是以推广Java标准以及IDE为主 Eclipse前世今生 Eclipse如果翻译为中文实际上的含义是“日食”(遮盖一切太阳的光芒),而当时面对SUN公司而言,这就是一个赤裸裸的挑衅&#x…

eclipse介绍,环境配置,mysql安装

J2EE 前言:时隔一个月没有发表博文了,jsp之后的文章后面再做补充,今天博文内容是J2EE基础之开发环境,我也会新建一个J2EE专栏,欢迎大家订阅支持。 目标:J2EE基础最后的一个学习结果是使用自己开发的框架完…

Eclipse的视图介绍

------------------------------Eclipse视图介绍-------------------------------------------- Eclipse的组成 整体叫做视图,每一个小玩意叫做视图。 在eclipse中要想爽一下,必须先要有项目(工程)。 1. 视图,视窗,当前视图 视图由视窗组成 调用视窗 –--》window (…

简要介绍Eclipse

我使用的是Eclipse开发环境,也有其他的开发环境比如Android Studio,myEclipse等等吧。使用Eclipse也有一段时间了,对其比较熟悉 首先,新建一个Android项目。 然后就一直点下一步,最后finish就可以了 新建好工程的文件就…

Eclipse开发工具介绍

Eclipse是一个基于Java的、开放源码的、可扩展的应用开发平台,它为编程人员提供了一流的Java集成开发环境(Integrated Development Environment,IDE)。在Eclipse的官方网站中提供了一个Java EE版的Eclipse IDE。应用Eclipse IDE for Java EE,既可以创建Java项目,也可以创…

Eclipse的介绍与安装

Eclipse简介 Eclipse 是一个开放源代码的,基于 Java 的可扩展开发平台。Eclipse官方版是一个集成开发环境(IDE),可以通过安装不同的插件实现对其它计算机语言编辑开发,如C、Php、Python等等。 Eclipse的下载 下载时需要访问网址 http://…

Eclipse 菜单介绍

介绍 Eclipse 是一个开放源代码的、基于 Java 的可扩展开发平台。Eclipse 是 Java 的集成开发环境(IDE),当然 Eclipse 也可以作为其他开发语言的集成开发环境,如C,C,PHP,和 Ruby 等。Eclipse 附…

eclipse介绍与使用

文章目录 一、视窗和视图二、如何显示行号三、空间的基本配置四、快捷键的使用五、构造方法和get,set方法的自动生成六、打jar包并使用jar包七、如何制作帮助文档八、导入和删除项目九、调试 一、视窗和视图 二、如何显示行号 右键左边空白处,单击show line number …