多尺度(multi-scale)目标检测方法

article/2025/9/29 23:59:01

文章目录

  • 1、多尺度图像预测
  • 2、金字塔特征预测
    • 2.1 FPN
    • 2.2 SSD
  • 3、bounding box设计

1、多尺度图像预测

将图片进行不同尺度的缩放,得到图像金字塔,然后对每层图片提取不同尺度的特征,得到特征图。最后对每个尺度的特征都进行单独的预测
特点:不同尺度的特征都可以包含很丰富的语义信息,精度高 ,但 速度慢

2、金字塔特征预测

将输入图片转变成feature map,在feature map层面上来进行尺度变化,采用不同 的方法进行不同尺度 特征的融合,以实现多尺度检测。

2.1 FPN

特征金字塔网络:将低层的特征高层的特征融合起来,在不同的特征层都单独进行预测。

2.2 SSD

从网络不同层抽取不同尺度的特征,然后在这不同尺度的特征上分别进行预测。低层的特征对于小物体检测比较有效。

3、bounding box设计

利用RPN网络生成不同尺度的anchor,实现 多尺度目标检测。faster RCNN 和 SSD都用到了这方法。
faster rcnn中 RPN 从单个feature map上面预测,是二分类(是|不是目标);SSD中 RPN从多个特征图上面预测,是(N+1)分类(N个类别+1个背景)。
在这里插入图片描述
(b) 对应 Faster R-CNN, (c ) 对应 SSD, (d) 对应 FPN

参考:https://www.zhihu.com/question/309488424
https://www.zhihu.com/question/309488424


http://chatgpt.dhexx.cn/article/vlI2ehfZ.shtml

相关文章

多尺度与多分辨率的理解

我一开始以为 多尺度与多分辨率 是一样的意思。后来看到了xiaowei_cqu博客的一篇文章“【OpenCV】SIFT原理与源码分析:DoG尺度空间构造”(以下简称,xiaowei一文),才发现我的理解有误。 尺度空间(scale space)理论 …

多尺度深度特征(上):多尺度特征学习才是目标检测精髓(干货满满,建议收藏)...

计算机视觉研究院专栏 作者:Edison_G 深度特征学习方案将重点从具有细节的具体特征转移到具有语义信息的抽象特征。它通过构建多尺度深度特征学习网络 (MDFN) 不仅考虑单个对象和局部上下文,还考虑它们之间的关系。 公众号ID|ComputerVisionG…

计算机视觉CV领域中多尺度特征的概念

知乎:深度学习中的多尺度模型设计 知乎:计算机视觉中的多尺度模型都有哪些设计? CSDN:多尺度理解 什么是多尺度? 所谓多尺度,实际就是对信号的不同粒度的采样。 通常在不同的尺度下我们可以观察到不同…

收藏吧 少年

程序员珍藏的东西会是什么?呵呵,除了平时写的代码,就是那些百看不厌的电子书了。 昨天很郁闷,我用了5年的移动硬盘,莫名奇妙的坏掉了。里面40G的资料全部报销了。 为了不再重蹈覆辙,我决定把重要的电子书…

一个程序员的多年珍藏--收藏

2010 - 01 - 15 [置顶] 一个程序员的多年珍藏(1月23日最新更新) 文章分类:Java编程 程序员珍藏的东西会是什么?呵呵,除了平时写的代码,就是那些百看不厌的电子书了。 昨天很郁闷,我用了5年的移动硬盘,莫名奇妙的坏掉了…

一个程序员多年的收藏

程序员珍藏的东西会是什么?呵呵,除了平时写的代码,就是那些百看不厌的电子书了。 昨天很郁闷,我用了5年的移动硬盘,莫名奇妙的坏掉了。里面40G的资料全部报销了。 为了不再重蹈覆辙,我决定把重要的电子书都…

转的一杂谈

网站架构(页面静态化,图片服务器分离,负载均衡)方案全解析 文章分类:综合技术 1、HTML静态化其实大家都知道,效率最高、消耗最小的就是纯静态化的html页面,所以我们尽可能使我们的网站上的页面采用静态页面来实现&…

PHP面试题(一)

1.用php打印前一天的时间,格式是2018-01-01 08:00:00? $adate("Y-m-d H:i:s",strtotime("-1 day"));print_r($a) 2.echo、print_r、print、var_dump的区别? echo、print是php语句,var_dump和print_r是函数…

Java高级必备

一、ES篇 1、概述 特点功能场景竞品分析对比 2、基本概念 IK分词器索引(类数据库)映射(类表设计)文档(数据) 3、高级特性 映射高级 地理坐标点数据类型动态映射 DSL高级聚合分析智能搜索 4、实战 写优化读优…

靠着这Java面试210题,成功拿下了10多家国内知名大厂Offer,10万字精华全部分享给大家

写在前面 我坚信,机会永远属于有准备的人,我们与其羡慕他人的成功,不如从此刻起,积累足够多的知识和面试经验,为将来进入更好的公司做好充分的准备! 如何让面试官在短短的几十分钟内认可你的能力? 如何在最短的时间内收获Java技术栈最核心的知识点 这份内容可以算是呕心沥血…

笔记总结备份

目录 文章目录 目录前言版本控制常用git 命令 操作系统系统机器数时间管理早期的 Linux 时间系统 中断内存管理内存分区malloc申请一块内存的背后原理RTOS 系统栈和协议栈寄存器磁盘调度算法虚拟内存页面置换算法分段段页式 Volatile(可见性)Atomic &…

MySQL常见面试题总结

MySQL常见面试题总结5---性能优化 单表优化设计字段索引查询SQL:充分利用索引,减少IO和全表扫描引擎事务锁定表使用外键Java方面 读写分离缓存批量读取和延迟修改分库分表垂直拆分水平拆分表分区 分库分表导致的问题事务一致性问题(见分布式事…

Java并发编程实战_盖兹

文章目录 第一部分 基础知识第1章 简介1.1 并发简史1.2 线程的优势1.3 线程带来的风险1.4 线程无处不在(框架线程或类线程并发注意点) 第2章 线程安全性2.1 什么是线程安全性2.2 原子性2.3 加锁机制内置锁:Synchronized关键字可重入锁:获取锁的操作粒度是…

算法(上)

算法 文章目录 算法1. 数组1. 剑指Offer:数组旋转2. 剑指Offer:调整数组顺序使奇数位于偶数前面3. 剑指Offer: 顺时针打印矩阵4. 剑指Offer: 数组中出现次数超过一半的数字5. 剑指Offer:丑数6. 剑指Offer: 数组中的逆序对7. 剑指O…

面试八股知识总结

问题 序列化变量的声明和定义C语言宏中“#”和“##”区别C中extern "C" 的作用了解C中编译时的优化C的特点是什么C的异常处理机制C和C,java的区别C 11 nullptr 和 NULL#ifdef、#else、#endif和#ifndef的作用C 语言的关键字 static 和 C 的关键字static有什…

数据结构学习笔记(参考书籍:大话数据结构和CSDN)

有些解释内容为搬运,如有侵权,联系删除!!! 数据结构 线性表 顺序存储 优点:无须为表中元素之间的逻辑关系而增加额外的存储空间;可以快速的存取表中任一位置的元素。 缺点:插入…

常用汉字5000个(按拼音)

2019独角兽企业重金招聘Python工程师标准>>> 阿,啊,哀,唉,挨,矮,爱,碍,安,岸,按,案,暗,昂,袄,傲,奥,八,巴,扒, 吧,疤,拔,把,坝,爸,罢,霸,白,百,柏,摆,败,拜,班,般,斑,搬,板,版, 吧,疤,拔,把,坝,爸,罢,霸,白,百,柏,摆,败,拜,班,般,斑,搬,板,版, 办,半,伴,扮,拌,瓣,帮…

3500常用汉字书法体检测数据集

毛笔字数据集已收集 草书30044楷书12900行书29465隶书14001篆书9386 数据集有gif格式和jpg格式,白底黑字,支持向量机可训练 样例展示,一共4.5万张 关注微信公众号:酷尔编程,领取

整理的3500个常用汉字的调用字典

3500个常用汉字的调用字典 下载地址:https://download.csdn.net/download/hj960511/85034461 资源说明: 总数目: 目录截图 实际字典情况: 调用方法: 思路:通过读取文件并转换成数组即可进行调用和输出使用 pyt…

编程 常用3500汉字 常用字符

没有重复字符 最后三个字符是空格回车换行制表符 长度4374 1234567890-*/~!#$%^&&#xffe5;…():"{}[]|\?<>,.;abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ&#xff1a;。&#xff0c;、&#xff01;&#xff1f;&#xff1b;《》—&#xff08;…