目标定位(Object localization)

article/2025/10/12 16:51:41

来源:Coursera吴恩达深度学习课程

在构建目标检测之前,建议先了解一下目标定位(object localization)

在上图的这个例子中,图片分类(image classification)不仅要判断图片中是不是一辆汽车,还要在图片中标记出它的位置,用边框把汽车圈起来,这就是定位分类问题(classification with localization problem)。其中“定位”(localization)的意思是判断汽车在图片中的具体位置。比如,在自动驾驶程序(autonomous driving application)中,程序不但要检测其它车辆,还要检测其它对象,如行人(pedestrians)、摩托车(motorcycles)等。

这里研究的分类定位问题,通常只有一个较大的对象位于图片中间位置,对它进行识别和定位。在实际的目标检测问题中,图片可以含有多个对象(multiple objects),甚至单张图片中会有多个不同分类的对象。因此,图片分类(image classification)的思路可以帮助学习分类定位(classification with localization),而目标定位的思路又有助于学习目标检测(detection),现在先看分类和定位(classification with localization)。

如上图是一个图片分类问题,输入一张图片经过多层卷积神经网络,它会输出一个特征向量,并反馈给softmax单元来预测图片类型。在构建汽车自动驾驶系统时,识别的对象可能包括以下几类:行人(pedestrian)、汽车(car)、摩托车(motorcycle)和背景(background,这意味着图片中没有行人、汽车和摩托车),这四个分类就是softmax函数可能输出的结果。

这就是标准的分类过程(classification pipeline),如果你还想定位图片中汽车的位置,可以让让神经网络再多输出4个数字,标记为b_x,b_y,b_h和b_w,这四个数字是被检测对象的边界框的参数化表示(parameterize),输出一个边界框。

约定一下本周课程将使用的符号表示,输入的原始图片左上角的坐标为(0,0),右下角标记为(1,1)。指定红色方框的中心点(midpoint),坐标为(b_x,b_y)边界框的高度为b_h宽度为b_h。因此训练集(train set)不仅包含神经网络要预测的对象分类标签,还要包含表示边界框的这四个数字,接着采用监督学习算法,输出一个分类标签(class label),还有四个参数(four parameters),从而给出检测对象的边框位置。在这个例子中,b_x的理想值是0.5,因为它表示汽车位于图片水平方向的中间位置;b_y大约是0.7,表示汽车位于距离图片底部十分之三的位置;b_h约为0.3,因为红色方框的高度是图片高度的0.3倍;b_w约为0.4,红色方框的宽度是图片宽度的0.4倍。

下面具体看如何为监督学习任务定义目标标签y,如下图:

这有四个分类,神经网络输出的是这四个数字和一个分类标签,或分类标签出现的概率。目标标签y的定义如下

这是一个向量,第一个p_c表示是否含有对象,在这里如果对象属于前三类(行人(pedestrian)、汽车(car)、摩托车(motorcycle)),则p_c=1,如果是背景(background),则图片中没有要检测的对象,则p_c=0。我们可以认为它表示被检测对象属于某一类的概率,背景分类除外。如果检测到对象,输出被检测对象的边界框参数b_x,b_y,b_h和b_w,同时输出c_1、c_2和c_3,表示该对象属于1-3类中的哪一类(行人、汽车或者摩托车)

为简化分析,在这里假设图片中只有一个对象,在这个分类定位问题中,图片最多只会出现其中一个对象。

上图中给出了两个例子的标签y的表示:只有一辆车(紫色框)和背景图像(绿色框,当p_c=0时,y的其它参数变得毫无意义,这里都写成问号,表示“毫无意义”的参数(so this is a don’t care))。针对给定的被标记的训练样本,不论图片中是否含有定位对象,构建输入图片x和分类标签y的具体过程都是如此。这些数据最终定义了训练集(define your training set)。

最后看一下神经网络的损失函数(loss function),参数为网络输出y帽和类别y,采用平方误差策略(squared error),则损失值等于每个元素相应差值的平方和,公式如下:

分析一下,当y_1=1时,平方误差策略为这8个元素预测值和实际输出结果之间差值的平方。当y_1=0时,y中的后7个元素都不用考虑,只需要考虑神经网络评估yy_1(即p_c)的准确度。

注意,这里用平方误差简化了描述过程,实际应用中,通常做法是对边界框坐标应用平方差或类似方法,对p_c应用逻辑回归函数,甚至采用平方预测误差也是可以的。

以上就是利用神经网络解决对象分类和定位问题的详细过程。

说明:记录学习笔记,如果错误欢迎指正!转载请联系我。


http://chatgpt.dhexx.cn/article/vPCY74cC.shtml

相关文章

学习云计算从哪里入手

学习云计算从哪里入手 1、 学习思路 a) 学习前建议先了解 i. 什么是云计算 ii. 云计算对当前的商业模式有什么影响 iii. 云计算所涉及到的技术 iv. 云计算的现状 b) 云计算可以分为广义的和狭义的两类&…

云计算学习(1)

原文来自于HCIA-Cloud Computing 华为云计算工程师认证 --hsyl007学习笔记收集整理 ,个人博客地址 http://hsyl007.work/zblog/ 什么是云计算 云计算就在身边 将资源准备好,通过特定技术随时随地使用这些资源去执行特定任务的方式基本就属于云计算类…

大数据与云计算学习(2)

四、分布式数据库HABSE 1、请阐述HBase和传统关系数据库的区别 正确答案: 我的答案: (1)数据类型:关系数据库采用关系模型,具有丰富的数据类型和存储方式,HBase则采用了更加简单的数据模型&a…

云计算学习笔记(一):云计算基础

文章转载只能用于非商业性质,且不能带有虚拟货币、积分、注册等附加条件。转载须注明出处http://blog.csdn.net/flowingflying以及作者恺风Wei 本系列将对云计算进行学习,目前资料来自《云计算-概念、技术与架构》(第一作者:Tomas…

(一)云计算技术学习--基础概念

目录 Linux的用户管理 Yum 命令 Python SELinux vsftpd etcd Session、Cookie、Token LNMP VMware Docker Kubernetes(K8S) Centos CentOS(Community Enterprise Operating System,中文意思是社区企业操作系统)是Linux发行版之一…

云计算学习路线

文章目录 一、什么是云计算二、虚拟化2.1 云计算与虚拟机基础2.1.1 云计算底层就是虚拟化 or 物理机2.1.2【重点】企业级虚拟化架构 (VRM CNA 存储)(1)架构分析(2)心跳 cluster(3)…

云计算的学习(四)

四、云计算中的存储基础知识 1.云计算虚拟化中的存储架构 ①虚拟化存储 在虚拟化存储架构中,最底层为物理磁盘。 底层的硬件组成存储池,存储池分为NAS存储和SAN存储;NAS存储需要文件系统;SAN存储需要对存储池进行逻辑划分产生逻…

云计算的学习(三)

三、云计算中的网络基础知识 1.虚拟化中网络的架构 1.1虚拟化中网络的架构 二层交换机作为接入交换机使用,三层交换机可以作为汇聚交换机或核心交换机,在抛开网络安全设备时,路由器直接连接在互联网上。 1.2广播和单播 物理服务器内部主要…

云计算基础:云计算运用越来越广泛,我们应该如何去学习云计算

随着时代的发展,云计算越来越普及,越大众化,使用的人越来越多,我们应该如何去学习这门技术呢?这篇文章我们就来介绍如何学习我们的云计算。 学前介绍: 学前介绍 学习资料:HedEX Lite、产品文档、笔记、P…

云计算学习内容

2021.12.4 云技术 --- 云计算---分布式计算 云储存---百度网盘 计算机技术 抽象语---电信号 抽象语言---编码 应用层 编码---二进制 表示层 二进制---电信号 介质(硬件)访问控制层 处理电信号 物理层 通信技术 1946年2月14日 1876年---贝…

云计算的学习(五)

五、虚拟化特性介绍 1.集群特性 1.1HA HA(Hith Available,高可用特性),克服单台主机的局限性,当一台服务器损坏,运行在损坏服务器上的虚拟机会自动迁移到其他运行状态正常的服务器上,整个迁移过程用户无感…

云计算的学习(六)

六、云计算的发展趋势 1.云计算相关领域介绍 1.1物联网 物联网来源于互联网,是万物互联的结果,是人和物、物和物之间产生通信和交互。 物联网主要技术: RFID技术(射频识别技术)传感器技术嵌入式系统技术 1.2大数据…

大数据与云计算学习(1)

大数据学习 一、大数据概述: 1、大数据概念和特征。 正确答案: 大数据意指一个超大的、难以用现有常规的数据库管理技术和工具处理的数据集 数据量大(Volume):存储的数据量巨大,PB级别是常态,因…

云计算学习路线和经典资料推荐

hi,大家好,最近很多小伙伴叫我出一个云计算学习路线和推荐资料,那必须赶紧安排上。云计算可以说是当前的热门方向,各个大厂都在搞云计算(字节也加入云计算大家庭,以后跳槽有更多选择)&#xff0…

云计算:基础学习

云计算基础学习 一、云计算基础1.什么是云计算:2.云计算的商业模式: 二、网络的定义1.什么是网络:2.网络的类型:3.常见的网络设备: 三、OSI七层参考模型与TCP/IP五层模型:1.OSI七层参考模型:2.T…

云计算——让学习更轻松

​📋导读📋 💝博客主页:红目香薰_CSDN博客-大数据,计算机理论,MySQL领域博主💝 ✍本文由在下【红目香薰】原创,首发于CSDN✍ 🤗2022年最大愿望:【服务百万技术人】🤗 &am…

云计算基础之如何学习云计算?

文章目录 背景1. 学习思路1.1 了解基本概念与现状1.2 区分狭义与广义的云计算 2. 应用平台3. 不同职位的学习内容4. 云计算工程师的技能树 背景 随着云计算的普及,越来越多IDC上的网站与应用开始在云上。那么同时对于我们这些IT从业者来说,也面临着加快…

云计算应该怎么学,学习路线是什么?

云计算作为新的互联网热门技术,是很多年轻人喜爱的方向,不仅技术含量高,操作性强,易学性也高,对于零基础想转IT的小伙伴们来说是非常友好的。 那么本文就以零基础的角度来分享一些学习思路和学习方向,有需要…

如何学习云计算这一文就够了!

随着云计算的普及,越来越多IDC上的网站与应用开始向云上,那么同时对于我们这些IT从业者来说,也面临着加快学习云计算,不被新技术淘汰的挑战。那么我们就一起来聊聊,该怎样更快的学好云计算! 云计算可以分为…

云计算学习

1.典型的it系统 机房基础建设,包括机房选址、装修、供电、温湿度控制、监控、门禁等。组建计算机网络,包括大楼综合布线、机柜安装、网络设备购买安装和调试。安装存储磁盘柜。购买和配置服务器。注意,还可能是虚拟出来的服务器。安装操作系…