【InternImage】Exploring Large-Scale Vision Foundation Models with Deformable Convolutions

article/2025/10/11 3:47:24

InternImage

基于Deformable Conv的大规模基础模型

特点：

采用Deformable Conv V3 【v2 19论文】
CNN模型

背景

大规模的ViT模型借助模型能力在超大规模数据集上取得了非常高的性能，然而大规模CNN模型研究才刚刚开始。
近期CNN研究倾向于使用大的卷积kernel，以获得更大的感受野和大范围依赖。该文提出了基于Deformable Conv的大规模CNN模型，不仅有大的感受野适应下游密集识别任务，而且可以自适应Spatial维度特征聚集，计算高效，取得了ViT相当的性能。适用于分类、分割和检测任务，并在COCO上取得了SOTA的结果。

动机

Vit和CNN核心算子
算子特性对比，灰色表示固定权重的kernel，绿色表示自适应权重的kernel。

算子	长距离依赖	自适应Spatial特征聚集	计算/内存高效
global aggregation of multi-head self-attention (MHSA)	$\checkmark$	$\checkmark$
Swin transformer -Local Window MHSA		$\checkmark$	$\checkmark$
大Kernel卷积	$\checkmark$		$\checkmark$
动态稀疏kernel-Deformable Conv V2	$\checkmark$	$\checkmark$	$\checkmark$

结果

不同Backbone对比
在这里插入图片描述

在这里插入图片描述

细节

Deformable-Conv V2
$y(p_0)=\sum_{k=1}^{K}w_km_kX(p_0+p_k+\Delta{p_k})$

$K$ 为采样点数量， $p_0$ 为当前像素， $m_k$ 为尺度放缩参数， $\Delta{p_k}$ 为第k个格点的偏移量。

Deformable Conv V3

引入Depth-wise 和Point-wise Conv 提高权重共享效率
将spatial aggregation 操作分组
将Element-wise Sigmoid 换成softmax ，提高训练稳定性
稀疏kernel 更高效

$y(p_0)=\sum_{g=1}^{G}\sum_{k=1}^{K}w_gm_gkX_g(p_0+p_k+\Delta{p_{gk}})$

G表示aggregation分组数

模型堆叠策略

代码

未开源

http://chatgpt.dhexx.cn/article/1n6T3yeJ.shtml

相关文章

ImageMol

ImageMol

ai圈也是卷的狠啊~~ 又发现一个全球首个分子图像自监督学习框架来也分子是维持物质化学稳定性的最小单位。对分子的研究，是药学、材料学、生物学、化学等众多科学领域的基础性问题。分子的表征学习（Molecular Representation Learning）是…

阅读更多...

Morphological image processing

Morphological image processing

目录基本思想： 一.集合论基础 1.集合的概念 2.集合间的关系和运算二.二值形态学的基本运算 1.腐蚀 （1）概念 （2）结构元素形状对腐蚀运算结果的影响 （3）腐蚀运算在物体识别中的应用 2…

阅读更多...

实用的图片批量压缩优化工具

实用的图片批量压缩优化工具

ImageOptim ImageOptim 支持 PNG/JPEG/GIF 动画，本质是各种影像优化工具的图形前端：AdvPNG、OptiPNG、Pngcrush、JpegOptim、jpegtran、Gifsicle 和 PNGOUT素材。 ImageOptim软件非常小！ 2.6M而已ImageOptim操作非常非常非常快捷&#xff01…

阅读更多...

【UNI APP】globalData全局变量

【UNI APP】globalData全局变量

uni-app 在app.vue文件export default里面定义globalData，在当前文件（app.vue）里面获取globalData需要用this.$options.globalData获取，其他文件则用getApp（）.globalData获取。 this.$options是用来获取自…

阅读更多...

uniapp 全局数据（globalData）的设置，获取，更改

uniapp 全局数据（globalData）的设置，获取，更改

因为uniapp基本上都是将页面，或者页面中相同的部分，进行组件化，所以会存在父，子，（子，父）之间的传值的情况，但在某些情况下，可以选择将内容设置为一个全局的变…

阅读更多...

微信小程序定义和调用全局变量globalData

微信小程序定义和调用全局变量globalData

先看看文件结构： 1.现在app.js里面定义globalData对应的全局变量 2.然后在其他js文件进行调用。例如在photo.js里面要注意的是需要在文件开始的时候初始化 app这个对象 //获取应用实例 const app getApp()

阅读更多...

微信小程序：globalData和Storage数据存储的错误示例

微信小程序：globalData和Storage数据存储的错误示例

前言在小程序登录是，将返回的用户数据，存储在globalData中和storage中。 // 存储的数据是一个对象 wx.setStorageSync(userAuthData, user.data.data); this.globalData.userAuthData user.data.data; 之前，数据更新了，为了避…

阅读更多...

uni-app之全局变量globalData的使用

uni-app之全局变量globalData的使用

一般访问请求的时候,baseurl我们都会用变量来代替,所以我们一半会把大量这种常用的,但是又不会经常变动的数据变成一个常量--globalData export default {onLaunch: function() {},onShow: function() {console.log(App Show)},onHide: function() {console.log(App Hide)},glo…

阅读更多...

微信小程序中的共享数据 : globalData

微信小程序中的共享数据 : globalData

和vue中的vuex作用相同，都是用于设置给所有页面都可以使用的数据的。 globalData在app.js中，它是一个对象，在里面设置要使用到的共享数据。我们在其他页面要使用globalData中的数据时，首先如下： let app getApp() …

阅读更多...

在uniapp中监听globalData中的值变化

在uniapp中监听globalData中的值变化

小程序里怎么去监听app.js里的globalData数据变化呢 1、先再app.vue 中定义一个全局数据对象globalData，再对象里定义好相应的属性与属性值 globalData：{count:0 },methods:{watch:function(method,istr){var objthis.globalDataconsole.log(obj)Objec…

阅读更多...

微信小程序中全局共享数据globalData的使用

微信小程序中全局共享数据globalData的使用

1.全局共享数据全局共享数据的两种方式通过Vue原型共享数据通过globalData共享数据vuex本地存储 1)在Vue实例原型属性上添加属性,其他任何页面预想使用,直接使用this获取到, 比如: 主要代码:(在入口文件mian.js中) import request from ./utils/request Vue.prototype.re…

阅读更多...

Vue全局共享数据之globalData，vuex，本地存储使用方法

Vue全局共享数据之globalData，vuex，本地存储使用方法

目录一、globalData 二、vuex存储方式 1.vue2用法，2.vue3用法三、本地存储 uniapp的数据缓存写在最前面，把vue能用到的存储方法都整理拿出来，方便阅读以及工作用。🍉🍉🍉可以收藏起来即拿即用 Vue全局共…

阅读更多...

微信小程序 | 12.生命周期、globalData全局数据

微信小程序 | 12.生命周期、globalData全局数据

文章目录 1.小程序的生命周期2.全局数据globalData3.globalData的应用3.1.搭配app.js的onLaunch()存储openid3.2.轮询globalData3.2.1.问题描述 3.2.2.解决方式：轮询globalData 1.小程序的生命周期小程序生命周期(onLaunch、onShow、onHide、onReady、onLoad、onU…

阅读更多...

uniapp 全局静态数据（globalData）的修改和使用

uniapp 全局静态数据（globalData）的修改和使用

uniapp 全局静态数据（globalData）的修改和使用全局静态数据： 在App.vue中的调用： this.globalData.systemTitle在App.vue中的修改： this.globalData.systemTitle res.title在pages中调用： let title…

阅读更多...

微信小程序全局变量（globalData）和缓存（StorageSync）的区别和用法

微信小程序全局变量（globalData）和缓存（StorageSync）的区别和用法

globalData和storage的区别一、app.globalData 是全局变量，下次进入的时候，就要重新获取，一般用于： 1、保存一些可能涉及安全类的数据，例如资源类，每次需要很准确的，就建议用全局变量。 2、…

阅读更多...

【分布式】什么是分布式技术？

【分布式】什么是分布式技术？

背景： 初代的服务器架构往往比较简单，应用程序、数据库、文件、代码等所有资源都放在一台服务器上，也就是单机结构。随着企业业务量的增多，一台服务器已经难以满足数据处理的需求了，那么对单机进行“复制粘贴”&#…

阅读更多...

(分布式网络)基于残差网络的多光谱全色图像分布式融合框架

(分布式网络)基于残差网络的多光谱全色图像分布式融合框架

贡献： ①基于分布式框架(distributed framework)和residual learning，提出了一种鲁棒性强、泛化性能提高的RDFNet泛锐化模型。 ②提出了一种新的三分支泛锐化结构，其中两个分支分别用于提取MS和PAN图像特征。其中最重要的是第三个分支&…

阅读更多...

分布式-分布式服务

分布式-分布式服务

微服务API 网关网关的概念来源于计算机网络，表示不同网络之间的关口。在系统设计中，网关也是一个重要的角色，其中最典型的是各大公司的开放平台，开放平台类网关是企业内部系统对外的统一入口，承担了很多业务&#xf…

阅读更多...

C++实现轻量级RPC分布式网络通信框架

C++实现轻量级RPC分布式网络通信框架

前言： 2022/4/14更新： 在我重新回顾这篇文章的时候，我觉得里面内容有点乱，主要还是因为RPC里面涉及到很多概念和知识点。本来代码内容就已经挺抽象了，还要结合各种概念，让人难以阅读，所以特地…

阅读更多...

C++实现分布式网络通信RPC框架

C++实现分布式网络通信RPC框架

分布式网络通信rpc框架项目是分布式网络通信rpc框架（项目源代码链接） 博文中提到单机服务器的缺点： 硬件资源的限制影响并发：受限于硬件资源，聊天服务器承受的用户的并发有限模块的编译部署难：任何模块小…

阅读更多...

推荐文章