BoF and Bos

article/2025/11/6 3:24:44

Bag of freebies

采用一些方法使模型有更高的准确度但是不增加模型的复杂度和模型的推理代价

  • PS:数据增强应该在图像标准化(normalization)之前完成;

  • Library:

    • Albumentations arxiv github docs
    • Augmentor arxiv github docs
      • Biomedical image augmentation using Augmentor
  • 数据增强 [awesome data augmentation]

    • Photometric distortion (色泽扭曲)

    • 亮度、对比度、色调、饱和度、噪声

    • Geometric distortion (几何扭曲)

      • 随机缩放、剪切、翻转、旋转
    • 模拟遮挡 (information dropping) (focus model to learn less discriminative object part)

      • random erase [AAAl 2020] [arxiv] [github] [blog]

        • 在原图 / 目标区域中随机选择一个矩形区域,使用随机数填充

        • 提高模型的鲁棒性

        • 涉及三个参数:1. erasing probability §; 2. erasing area ratio (sl and sh);(决定了模拟的遮挡程度) 3. erasing aspect ratio;

        • 论文中给出的参数建议:

          picture

        • IRE, ORE, I+ORE

      • CutOut [arxiv] [github] [blog]

        • 论文中作者尝试遮挡训练所得激活图中的高激活部分(most discriminative)(adversarial erasing method),但实际效果和随机选择区域遮挡相近;

        • 随机选择一个固定大小的正方形区域,然后采用全0填充

        • 如果选择的区域越界,仅保留区域内的部分,变相地实现了任意面积的遮挡;但是RE保障了选择的必然是规则矩形

        • RE和CutOut的效果需要在实际任务中尝试,可以二者兼而有之

      • hide-and-seek [arxiv] [github]

        • 将原图划分为若干份(grids of size s * s),然后对划分的每一份依概率进行隐藏**(采用整个数据集的均值来填充,也就是在标准化后这部分为0,code中是以0表示)**,可以模拟出RE和CutOut的效果;

        • 对于video而言,以一定帧数为单位划分并以一定概率隐藏;

      • GridMask [arxiv] [github] [blog]

        • Key: 避免连续区域的过度删除和保留

          • ~~控制被删除区域的密度和大小主要靠上面r, d, x, y四个参数控制,其中r是保留区域比率,在论文中是一个固定值。d决定了删除区域的大小,在论文中是一个区间的random值。x, y是删除区域的边长,在论文中是random(0,d-1)的一个值。~~cifar10中r=0.4。

          **(code 此处的random均对于mini-batch内的不同图片而言,同一图片(grid mask)中是相同的)**d表示一个单元的大小,是一个区间内的random值,mini-batch中的每一层均不同;删除部分在该单元内的位置是random的,st_w, st_h表示左上角位置;

          (emmmm, 感觉github上的代码有点问题,与文中叙述不太相符)

          l = d * self.ratio
          # grid的删除区域大小
          for i in range(0, hh//d):lu = d*i + st_hld = lu+self.llu = np.clip(lu, d*i, d*(i+1))ld = np.clip(ld, d*i, d*(i+1))for j in range(0, hh//d):ru = d*j + st_wrd = ru+self.lru = np.clip(ru, d*j, d*(j+1))rd = np.clip(rd, d*j, d*(j+1))mask[lu:ld:, ru:rd] *= 0
          
        • picture

        • 使用GridMask的策略主要有两种,作者通过实验发现,第二种更有效(code使用策略2)
          1.设置一个恒定的概率p,这样我们就有机会对每个输入图像应用gridmask
          2.使gridmask的概率随训练时间线性增加,直到达到一个上界P。

        • grid的最小单元一般不要大于最小目标框太多,否则效果可能不理想。

  • Feature map (特征图上进行数据增强) (Regularization method)

    • Dropout
    • DropConnect
    • DropBlock
    • Spatial Dropout
    • DropPath
  • 结合多图像

    • [blog: Mixup, Cutout, CutMix]

    • Mix-Up [arxiv] [ICLR 2018]

      • Image = 0.9X + 0.1Y, label = [0.9, 0.1]
    • CutMix [arxiv] [github] [ICCV 2019 oral talk]

      • 将一部分区域随机填充训练集中的其他数据的区域像素值

      • CutMix和CutOut是填充区域像素值的区别

      • Mixup和CutMix是混合两种样本方式上的区别,mixup是将两张图按比例进行插值来混合样本,cutmix是采用cut部分区域再补丁的形式去混合图像,不会有图像混合后不自然的情形

      • Lambda ~ beta distribution

      • picture

        picture

      • picture

      • picture

    • AugMix [arxiv] [github] [ICLR 2020]

    • RandAugment [arxiv] [github] [ICLR 2020]

    • Mosaic [blog]

      • 将四张图片进行随机剪裁,再拼接到一张图上作为训练数据,吩咐了图片的背景,并且变相得提高了batch size;

      • picture

    • Bilateral bluring

    • [ ]

  • activation function

    • ReLU, leaky-ReLU

    • Parametric-ReLU

    • ReLU6

    • SELU

    • Swish

    • Wish

  • Normalization of the network activations

    • Batch Normalization
    • Cross-gpu Batch Normalization (CGBN or SyncBN)
    • Filter Response normalization (FRN)
    • Cross-Iteration Batch Normalization (CBN)
  • Skip-connections

    • Residual connections
    • Weighted residual connections
    • Multi-input weighted residual connections
    • Cross stage partial connections (CSP)
  • Data imbalance between differnt classes

    • hard negative example mining (two-stage)
    • online hard example mining (two-stage)
    • focal loss (one / two stage) [arxiv]
    • label smoothing (used to one-hot representation)
  • Objective function bounding bbox regression

    • zhihu: IoU, GIoU, DIoU, CIoU

    • IoU loss

      • 考虑预测的边界框和 ground truth 间的IoU

      • loss = -ln(IoU) / loss = 1 - IoU

        • 如果两个框没有相交,则 IoU=0,没有梯度回传,无法进行学习训练且无法度量两个不相交的bbox之间的距离;

        • IoU无法精准地反应两者的重合度;

          picture

    • GIoU (Generalized Intersection over Union) loss [arxiv] [CVPR 2019]

      • 先计算两个框的最小闭包区域面积Ac,再计算闭包区域中不属于两个框的区域占闭包区域的比重;

        picture

      • GIoU也是一种距离度量,作为损失函数的话,[公式],满足损失函数的基本要求(backpropagated);1. 当两框完全不相交时,预测框会不断向目标框移动;2. 当两框出现覆盖情况时,GIoU退化为IoU;

      • IoU取值[0,1],但GIoU有对称区间,取值范围[-1,1]

      • picture

    • DIoU loss (distance iou) [arxiv] (AAAI2020)[zhihu: DIoU + CIoU]

      • CIoU, DIoU在同一文章中提出,该文强调框回归三要素:重合面积,中心点距离,长宽比
      • IoU and GIoU
          1. 收敛速度缓慢;2. 回归不准确
        • 惩罚项:度量目标框和预测框之间中心点的归一化距离
          • picture
          • b 和 bgt 分别表示预测框和ground truth 的中心点,p(.)表示欧式距离,c 表示覆盖两个边界框的最小矩形的对角线长度
        • 特性和优越性
          • DIoU直接最小化两框之间的距离,收敛速度更快
          • DIoU在两框出现包含情况时,仍可以快速回归,不会像GIoU一样退化为IoU loss;
        • 该文提出DIoU应用于NMS (IoU - distance penalization <= theta)
    • CIoU loss

      • DIoU + 长宽比的一致性(惩罚项)
        • pic
        • pic
        • pic
      • [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9741Ry8y-1596531232099)(https://github.com/ganjf/object-detection/blob/master/picture/IoU%20loss%20exp.png?raw=true)]

Bags of specials [blog]

指 plugin module 或后置方法以些许推理代价的增加换取模型准确率的提升。比如扩大感受野,引入注意力机制,或者增加特征融合容量

  • 常用的用于增大感受野的结构

    • SPP (spatial pyramid pooling)(SPM)

      • 输出一维特征向量,不适用于FCN
    • ASPP

      • dilated convolution operation
    • RFB

  • 注意力机制

    • Squeeze-and-Excitation (SE) (channel-wise attention)
    • Spatial Attention Module (SAM) (point-wise attention)
      • 不影响模型在GPU上的推理速度
  • 特征融合

    • skip connection
    • hyper-column
    • FPN
    • SFAM
      • Use SE module to execute channel-wise level re-weighting on multi-scale concatenated feature maps.
    • ASFF
      • Use softmax as point-wise level re-weighting and then add feature maps of different scales.
    • BiFPN
      • Multi-input weighted residual connections to execute scale-wise level re-weighting.
  • Post-processing method’

    • NMS

    • soft NMS

      • 解决对象遮挡问题
    • DIoU NMS

      • add the information of the center point distance to the BBox screening process on the basis of soft NMS.


http://chatgpt.dhexx.cn/article/ZiiEcLeF.shtml

相关文章

Boost 作为客户端 boost

系列文章目录 lotus Boost 作为客户端 系列文章目录前言一、同步区块高度二、boost 初始化1. 生成钱包地址2. boost设置默认钱包地址 三、boostx向存储市场添加资金四、发单五、离线交易参考 前言 Boost 作为客户端 一、同步区块高度 可以远程调用其它api&#xff0c;也可以…

DART booster

XGBoost基本上都是组合大量小学习率的回归树。在这种情况,越晚添加的树比越早添加的树更重要。 Rasmi根据深度神经网络社区提出一个新的使用dropout的boosted trees,并且证明它在某些情况有更好的结果。 以下是新的tree boosterdart的介绍。 原始文章 特征 Drop Trees是…

boost::format

实在不好意思&#xff0c;原本计划每天一篇&#xff0c;这几天工作遇到问题&#xff0c;只好改为“不定期”一篇&#xff0c; 今天是format library&#xff0c;其实N天前我已经看过了&#xff0c;也动手实验了一下&#xff0c;现在才来把笔记补上。 用过MFC或ATL中的CString的…

adboost

要明确Adaboost是一种算法。 介绍一下Adaboost的历史。 Adaboost的前身的Boosting算法。 Boosting是一种提高任意给定学习算法准确度的方法。它的思想起源于Valiant提出的PAC(Probably Approximately Correct)学习模型。Valiant和Kearns提出了弱学习和强学习的概念,识别错误…

buuctf easymd5

点击f12&#xff0c;查看源代码看看有没有消息 Hint&#xff1a;select * from ‘admin’ where password md5($pass,ture) 我们要让passwordmd5($pass,ture) mysql里面&#xff0c;在用作布尔型判断时&#xff0c;以数字开头的字符串会被当做整型数。 要注意的是这种情况是必…

fastboot与fastbootd介绍

fastboot与fastbootd介绍 前言一、fastboot和fastbootd介绍二、fastbootd与fastbootd区别参考文献 前言 在项目中遇到使用fastboot刷机场景&#xff0c;刷vendor分区出现异常&#xff0c;从而对fastboot和fastbootd有一个更深入的了解&#xff0c;进行一个总结。 一、fastbo…

Everything+Wox

Everything可对磁盘上文件/文件夹进行快速查找 Wox可对应用程序/网站进行快速启动 两者最好结合使用&#xff08;结合使用&#xff0c;两个软件都必须都启动&#xff09; Everything 下载地址&#xff1a;https://www.voidtools.com/zh-cn/ Wox 下载地址&#xff1a;https://gi…

wox wpm 安装 有道插件

1. wox 安装插件 可以通过右键点击setting&#xff0c;到官网上安装&#xff0c;也可以采用简单的方法&#xff1a; wpm install 有道翻译注意&#xff0c;选择有道翻译即可。 2. 英译汉 yd china3. 汉译英

Wox使用指南

下载安装 从下载地址下载最新版本的 wox &#xff0c;我下载的是 exe 版的 Wox-1.3.578.exe 下载以后直接安装即可&#xff0c;不会有选择项&#xff0c;安装成功以后会在屏幕上出现一个搜索框&#xff0c;默认失去焦点以后搜索框就会消失&#xff0c;可以在系统状态栏的 wox 图…

实用工具 Wox

今天分享一个我一直在用&#xff0c;并且让我爱不释手的一个工具软件&#xff0c;Wox。 Wox 是一款国产开源免费的软件快捷启动工具&#xff0c;它可以快速搜索并打开你电脑上的程序、文件、或是查词翻译、网站查找等其他操作&#xff0c;同时还支持插件安装。 Tips: 如果你需…

使用Python编写Wox插件

最近正再使用Wox&#xff0c;这个软件还挺高效的&#xff0c;而且还能自己编写一些插件&#xff0c;这里打算自己写点插件用用. Wox官网 Plugin (wox.one)插件,此外官方也提供了编写文档&#xff0c;编写插件 GitBook (wox.one)提供Python和C#两种优秀的语言编写方案。我这里就…

Wox插件之程序员不安装会死系列

Wox 安装 在操作系统上&#xff0c;可快速启动、计算、查找程序、文件等&#xff0c;同时也提供了一系列插件&#xff0c;使用起来非常的方便。默认启动 Wox 快捷键 Alt Space&#xff0c;当然你也可以自己设置自己喜欢的快捷键 Wox下载地址&#xff1a;下载地址 不安装会…

快速搜索Wox工具之Everything Client没有运行报错,解决办法!

一直在用的一款快速搜索神器——Wox&#xff0c;但是在使用过程中出现一个报错&#xff01; 报错如下&#xff1a; Everything Client 没有运行令我很烦&#xff0c;百度了一下&#xff0c;试了很多方法&#xff0c;还是不能发挥它的最大功效。 由于我是一个好学的人&#xff…

Wox - 开源免费强大的快捷启动器辅助工具,快速高效率打开软件/搜索文件!

在日常的电脑操作中&#xff0c;我们常常花很多时间重复做着一件事情&#xff1a;退回桌面/开始菜单->寻找软件图标->点击启动。但如果你喜欢高效的键盘操作&#xff0c;那么你需要一款好用的快速启动器软件。 我们曾介绍过 RunZ、Launchy、AltRun、Executor、Alfred 等…

自己做一个wox主题

wox WoX是运行正常的Windows启动器。它是Alfred和Launchy的替代方案。如果需要长名称&#xff0c;可以将其称为Windows omni-eXecutor。 如何替换样式 众所周知&#xff0c;wox自带主题比较丑&#xff0c;所以可以自己写 打开wox配置目录C:\Users\{{user_name}}\AppData\Lo…

wox开机自启_Wox具有一切支持的Windows启动器

Wox是用于Windows的由插件驱动的启动器&#xff0c;支持文件和Web搜索以及其他操作&#xff0c;您都可以通过点击程序的热键来访问它们。 它的核心功能类似于Windows上的其他文件启动器(如Launchy)所提供的功能。您可以使用快捷键Alt-Space调出程序的提示&#xff0c;并且可以立…

Everything+Wox介绍和使用方式

EverythingWox介绍和使用方式 相信很多人都会遇到这种情况&#xff0c;文件夹都放在不同的磁盘中&#xff0c;想要寻找会忘记文件夹存、图片等放的位置&#xff0c;这时候很多人都会运用Windows自带的搜索引擎搜索文件夹&#xff0c;而自带的搜索功能速度慢的感人&#xff0c;…

windows装机必备:文件查找神器Everything + Wox

问题背景 我们通常也不会花费大量地时间去整理文件&#xff0c;这导致我们想使用某个文件时难以找到&#xff0c;而Windows 操作系统不会给文件建立索引&#xff0c;这使得我们使用Windows自带的搜索功能时要消耗大量的时间。 比如我现在要在我的电脑上查找名为“学生成绩.tx…

WOX快速搜索

WOX wox和mac上的Aflred类似&#xff0c;虽然在功能上稍有逊色&#xff0c;但是还是可以给我们使用windows电脑带来很多福利。首先你不需要在桌面放一堆应用软件的快捷方式&#xff0c;桌面可以非常干净整洁&#xff0c;想要打开某个应用只需要叫出wox&#xff0c;输软件首字母…

WOX配置常用搜索引擎

我下载的Wox-1.4.1196自带了百度搜索的触发关键字。altspace唤出wox后&#xff0c;输“bd 搜索词”即可通过默认浏览器打开该搜索词的百度搜索网页。但是只有渣度怎么能够呢&#xff1f;通过如下方法可添加大陆其他搜索的触发关键字&#xff1a; 一些我常用的搜索的URL&#xf…