rethinking the inception architecture for computer vision

rethinking the inception architecture for computer vision

article/2025/11/9 5:35:16

Google在GoogleNet中提出了inception概念之后，又提出了inception_2,inception_3，都在这篇论文中谈及。

文章地址为http://arxiv.org/pdf/1512.00567v3.pdf

四个通用的设计原则（General Design Principles):

1. Avoid representational bottlenecks，especially early in the network。

2.Higher dimensional representations are easier to process locally within a network。

3. Spatial aggregation can be done over lower dimensional embeddings without much or any loss in representational power。

4.Balance the width and depth of the network 。

Factorizing Convolutions with Large Filter Szie(对大尺寸的过滤器进行分解）这样可以减少参数个数和计算量，训练速度更快。

1.Factorization into smaller convolutions

5*5的卷积是3*3的卷积的25/9=2.78倍的时间开销。

将原本5*5的卷积用一个多层网络（两层的3*3的卷积）来替代，参数更少，同样的输入

2.Spatial factorization into asymmetric convolutions

将一个3*3的卷积用两层网络来替代，3*1加1*3的两层架构，计算量减小33%，如果用两层2*2卷积来替代，计算量减小11%。

所以，后面就用1*n和n*1来替代n*n的卷积，实验中发现，这种分解方法在网络的前面几层效果不好，但在中间时效果非常好（如果是m*m的特征图谱，m的范围在12到20之间），在这里是在7*7的卷积上用1*7加7*1替代效果最好。

Utility of Auxiliary Classiﬁers（辅助分类器的利用）

这个在v1版本里就有用到，在inception_4a/output和inception_4e/output后池化卷积全连接后做loss和top_1，top_5的计算。

Efﬁcient Grid Size Reduction

http://chatgpt.dhexx.cn/article/sa1OmS5E.shtml

相关文章

(Inceptionv3)Rethinking the Inception Architecture for Computer Vision

(Inceptionv3)Rethinking the Inception Architecture for Computer Vision

翻译论文汇总：https://github.com/SnailTyan/deep-learning-papers-translation Rethinking the Inception Architecture for Computer Vision 摘要对许多任务而言，卷积网络是目前最新的计算机视觉解决方案的核心。从2014年开始，深度卷积网…

阅读更多...

View Synthesis

View Synthesis

一、SynSin: End-to-End Synthesis from a Single Image （CVPR2020） 该论文给出了一个视角图片生成的方法，其pipeline如下图： 首先将图片输入特征和深度网络得到特征map和深度图，接着通过相机参数变换为带特征的点云&…

阅读更多...

Intention Oriented Image Captions with Guiding Objects

Intention Oriented Image Captions with Guiding Objects

Intention Oriented Image Captions with Guiding Objects 原文地址时间：2019 CVPR Intro image caption的过程缺少可控性，一张图片中可以包括很多个目标，但是一个描述只能包括其中一小部分尽管我们能找到并分类出所有目标，…

阅读更多...

Interact as You Intend: Intention-Driven HOI Detection

Interact as You Intend: Intention-Driven HOI Detection

IEEE多媒体汇刊Author:Bingjie Xu, Junnan Li, Yongkang Wong摘要为了与物体交互，人类会根据自己的意图引导注意力和移动身体。具体而言，提出的human intention-driven的HOI检测（iHOI）框架根据人体关节到物体实例的相关距离进行…

阅读更多...

【Inception-v3】《Rethinking the Inception Architecture for Computer Vision》

【Inception-v3】《Rethinking the Inception Architecture for Computer Vision》

CVPR-2016 在 CIFAR-10 上的小实验可以参考博客【Keras-Inception v3】CIFAR-10 文章目录 1 Background and Motivation2 Advantages / Contributions3 Innovations4 Method4.1 Factorizing Convolutions with Large Filter Size4.1.1 Factorization into smaller convolutions…

阅读更多...

DynamicViT

DynamicViT

又搬来了来自清华大学与UCLA的工作，提出了一种基于动态token稀疏化的高效视觉transformer，通过分层剪枝66%的输入tokens，可减少31%~37%的FLOPs，并将模型运行速度提高了40%以上，保证精度下降在0.5%以内，可应…

阅读更多...

involution理解

involution理解

最好的参考来自论文作者的知乎：CVPR 2021 | involution：超越convolution和self-attention的神经网络新算子其他餐卡： https://zhuanlan.zhihu.com/p/400402288 https://zhuanlan.zhihu.com/p/356960359 https://blog.csdn.net/P_LarT/articl…

阅读更多...

网络中的pvid与native vlan(本征vlan）区别以及详解

网络中的pvid与native vlan(本征vlan）区别以及详解

一：pvid与native vlan分别属于华为和思科交换里面的概念，虽然说法不同，但是本质都是缺省vlan 缺省vlan默认为1，各个端口都有一个缺省的vlan，该值支持修改。 2.作用概念，pvid存在于trunk中，且&…

阅读更多...

VTP、PVID、ACCESS、trunk

VTP、PVID、ACCESS、trunk

一、VTP详解 VTP有server、client、transparent三种模式、VTP多用于在多vlan的网络环境中，在核心交换机或者根节点交换机中配置Server，在下层的交互机中配置client，VTP在服务模式下，可以创建、删除、修改VLAN，并且转发…

阅读更多...

不同VLAN下实现网络互相通信（配置port trunk pvid vlan进行数据转发）

不同VLAN下实现网络互相通信（配置port trunk pvid vlan进行数据转发）

1. 两台交换机同一网段，不同VLAN实现网络互通，逻辑拓扑图如下： 需求：实现VLAN 10与VLAN20之间的PC网络互通在LSW 12交换机进行如下命令行配置： <HuaWei>system-view #切换系统视图 [Huawei]sysname…

阅读更多...

VLAN Tag，PVID

VLAN Tag，PVID

VLAN(Virtual Local Network，虚拟局域网)，对于VLAN的划分方法有很多种：基于端口划分，基于MAC地址划分，基于网络协议划分，基于IP地址划分，基于策略划分等等。但是就上述而言，对VLAN的…

阅读更多...

trunk vlan pvid 学习实验整理 2

trunk vlan pvid 学习实验整理 2

实验总结： trunk vlan vlan1 vid pvid 等关系。实验场景二： 上述条件不变【实验场景一】，将PC1 加入vlan10 [SW1]interface Ethernet 0/0/1 [SW1-Ethernet0/0/1]port link-type access [SW1-Ethernet0/0/1]port default vlan 10 >>…

阅读更多...

trunk vlan pvid 学习实验整理 1

trunk vlan pvid 学习实验整理 1

实验总结： trunk vlan vlan1 vid pvid 等关系。实验场景一： 将PC1/PC2/PC3,都置于同一网段：192.168.1.0/24 1.PC1 不加入任何vlan，PC2 不加入任何vlan，PC3加入vlan10 2.trunk链路允许vlan 10 20通过。配置&#xf…

阅读更多...

PVID(pvid vlan是什么意思)

PVID(pvid vlan是什么意思)

26tpwinet如何设置端口pvid25口设置为trunk口？ 首先你要确定你的电脑有没有USB转com口线，或者你的笔记本是否支持com口如果你是win7系统确实没有超级终端那么你可以下一个SecureCRT，然后在设备管理器里面看一下自己是COM几口，波…

阅读更多...

PVID和VID的理解

PVID和VID的理解

VID解释 VID（VLAN ID）是VLAN的标识，在交换机里面用来划分端口。比如一个交换机有8个端口，现在将port1，port2，port5三个端口的VID设置成1111，那么这三个端口就能接收vlantag1111的数据包。　　…

阅读更多...

2、PVID（本征VLAN）实验配置步骤

2、PVID（本征VLAN）实验配置步骤

实验拓扑图： 实验配置思路： 将VLAN10配置为本征VLAN 本征VLAN通过Trunk接口时不打tag标记实验摘要重点命令： [SW1]int g0/0/1 //进入接口 [SW1-GigabitEthernet0/0/1]port trunk pvid vlan 10 //将VLAN10设置为本征VLAN [SW1-Gig…

阅读更多...

华为交换机PVID与VLAN ID及TAG 、UNTAG学习记录

华为交换机PVID与VLAN ID及TAG 、UNTAG学习记录

一、PVID和VLAN ID 1、PVID是端口的属性，端口的标识，具有唯一性，交换机默认未配置Vlan的情况下，因为全局vlan1的原因，所有端口的PVID都是1。如下图： 2、交换机里面display port vlan命令可以查看未配置状态…

阅读更多...

switch中的PVID、VID、untag、tag概念

switch中的PVID、VID、untag、tag概念

以openwrt为例，下图是mt7621（glinet mt1300）中switch配置图该switch一共有7个port，一个连接CPU，还有6个可供外部使用，上图只显示了6个port； 一个switch可以设置多个VLAN（虚拟局域网…

阅读更多...

springboot @Qualifier 注解的作用

springboot @Qualifier 注解的作用

Qualifier 注解的用法和要解决的问题现在这两个类都实现了同一个接口。 controller 要注入这个接口启动服务日志显示在容器中找到俩个实现类 spring不知道要实现那个 1 有两种方式既然spring不知道那就直接指明你要实现的类直接注入实现类这样有点粗鲁也能解决问题。…

阅读更多...

Spring中的@Qualifier注解

Spring中的@Qualifier注解

国庆期间闲来无事，写了一个简单的小程序，小程序名称叫做 IT藏经楼。目的是分享这些年自己积累的一些学习材料，方面大家查找使用，包括电子书、案例项目、学习视频、面试题和一些PPT模板。里面所有材料都免费分享。目前小程序中只发…

阅读更多...

推荐文章