3-1 目标定位

article/2025/10/12 16:30:20

目标定位( Object localization)

图片分类任务就是算法遍历图片,判断其中的对象是不是某个指定的类别,这就是图片分类。

定位分类问题。意味着我们不仅要用算法判断图片中是不是一辆汽车,还要在图片中标记出它的位置,用边框或红色方框把汽车圈起来。“定位”的意思是判断汽车在图片中的具体位置。

对于图片分类问题,例如,输入一张图片到多层卷积神经网络。这就是卷积神经网络,它会输出一个特征向量,并反馈给 softmax 单元来预测图片类型。

如果你正在构建汽车自动驾驶系统,那么对象可能包括以下几类:行人、汽车、摩托车和背景,这意味着图片中不含有前三种对象,也就是说图片中没有行人、汽车和摩托车,输出结果会是背景对象,这四个分类就是 softmax 函数可能输出的结果。

这就是标准的分类过程,如果你还想定位图片中汽车的位置,该怎么做呢?我们可以让神经网络多输出几个单元,输出一个边界框。具体说就是让神经网络再多输出 4 个数字,标记${b_x}$,${b_y}$ , ${b_w}$ , ${b_h}$ 这四个数字是被检测对象的边界框的参数化表示。

图片左上角的坐标为(0,0),右下角标记为(1,1)。要确定边界框的具体位置,需要指定红色方框的中心点,这个点表示为$({b_x},{b_y})$,边界框的高度为${b_h}$,宽度为${b_w}$。因此训练集不仅包含神经网络要预测的对象分类标签,还要包含表示边界框的这四个数字,接着采用监督学习算法,输出一个分类标签,还有四个参数值,从而给出检测对象的边框位置。此例中, ${b_x}$的理想值是 0.5,${b_y}$大约是 0.7,${b_h}$约为 0.3,${b_w}$约为 0.4。

目标标签y的定义如下:

它是一个向量,第一个组件${p_c}$表示是否含有对象,如果对象属于前三类(行人、汽车、摩托车),则${p_c} = 1$,如果是背景,则图片中没有要检测的对象,则${p_c} = 0$,我们可以这样理解${p_c}$,它表示被检测对象属于某一分类的概率,背景分类除外。

如果检测到对象,就输出被检测对象的边界框参数${b_x}$,${b_y}$ , ${b_w}$ , ${b_h}$。最后,如果存在某个对象,那么${p_c} = 1$,同时输出${c_1}$,${c_2}$和${c_3}$,表示该对象属于 1-3 类中的哪一类,是行人,汽车还是摩托车。鉴于我们所要处理的问题,我们假设图片中只含有一个对象,所以针对这个分类定位问题,图片最多只会出现其中一个对象。

假如这是一张训练集图片,标记为x, 即上图的汽车图片。而在y当中,第一个元素${p_c} = 1$,因为图中有一辆车,${b_x}$,${b_y}$ , ${b_w}$ , ${b_h}$会指明边界框的位置,所以标签训练集需要标签的边界框。图片中是一辆车,所以结果属于分类 2,因为定位目标不是行人或摩托车,而是汽车,所以:${c_1} = 0$,${c_2} = 1$,${c_3} = 0$,如果图片中没有检测对象,这种情况下,${p_c} = 0$,y的其它参数将变得毫无意义。

神经网络的损失函数,其参数为类别y和网络输出${\hat y}$,如果采用平方误差策略,则: $L(\hat y,y) = {({{\hat y}_1} - {y_1})^2} + {({{\hat y}_2} - {y_2})^2} + ...{({{\hat y}_8} - {y_8})^2}$损失值等于每个元素相应差值的平方和。

当${y_1} = 1$时,平方误差策略可以减少这 8 个元素预测值和实际输出结果之间差值的平方。当${y_1} = 0$时,y矩阵中的后 7 个元素都不用考虑,只需要考虑神经网络评估${y_1}$(即${p_c}$)的准确度。

实际应用中,你可以对${c_1}$,${c_2}$,${c_3}$和 softmax 激活函数应用对数损失函数,并输出其中一个元素值,通常做法是对边界框坐标应用平方差或类似方法,对${p_c}$应用逻辑回归函数,甚至采用平方预测误差也是可以的。

转载于:https://www.cnblogs.com/xiaojianliu/articles/9925723.html


http://chatgpt.dhexx.cn/article/yNAWG0p2.shtml

相关文章

深度学习(十五):目标定位 Object Localization

这是一系列深度学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。 适用人群:深度学习初学者,转AI的开发人员。 编程语言:Python 参考资料:吴恩达老师的深度学习系列视频 吴恩达老师深度学习…

第二十五节,初步认识目标定位、特征点检测、目标检测

一 目标定位(单个物体) 对象检测,它是计算机视觉领域中一个新兴的应用方向,相比前两年,它的性能越来越好。在构建对象检测之前,我们先了解一下对象定位,首先我们看看它的定义。 图片分类任务我们已经熟悉了&#xff0c…

目标定位和特征点检测

1. 目标定位 目标检测是计算机视觉领域中的一个新兴的应用方向,在构建目标检测之前,我们首先了解一下object localization目标定位。 前面说过的图片分类任务就是算法遍历图片,判断其中的对象是不是汽车,主要是图片分类 这里所…

目标定位(Object localization)

来源:Coursera吴恩达深度学习课程 在构建目标检测之前,建议先了解一下目标定位(object localization)。 在上图的这个例子中,图片分类(image classification)不仅要判断图片中是不是一辆汽车&a…

学习云计算从哪里入手

学习云计算从哪里入手 1、 学习思路 a) 学习前建议先了解 i. 什么是云计算 ii. 云计算对当前的商业模式有什么影响 iii. 云计算所涉及到的技术 iv. 云计算的现状 b) 云计算可以分为广义的和狭义的两类&…

云计算学习(1)

原文来自于HCIA-Cloud Computing 华为云计算工程师认证 --hsyl007学习笔记收集整理 ,个人博客地址 http://hsyl007.work/zblog/ 什么是云计算 云计算就在身边 将资源准备好,通过特定技术随时随地使用这些资源去执行特定任务的方式基本就属于云计算类…

大数据与云计算学习(2)

四、分布式数据库HABSE 1、请阐述HBase和传统关系数据库的区别 正确答案: 我的答案: (1)数据类型:关系数据库采用关系模型,具有丰富的数据类型和存储方式,HBase则采用了更加简单的数据模型&a…

云计算学习笔记(一):云计算基础

文章转载只能用于非商业性质,且不能带有虚拟货币、积分、注册等附加条件。转载须注明出处http://blog.csdn.net/flowingflying以及作者恺风Wei 本系列将对云计算进行学习,目前资料来自《云计算-概念、技术与架构》(第一作者:Tomas…

(一)云计算技术学习--基础概念

目录 Linux的用户管理 Yum 命令 Python SELinux vsftpd etcd Session、Cookie、Token LNMP VMware Docker Kubernetes(K8S) Centos CentOS(Community Enterprise Operating System,中文意思是社区企业操作系统)是Linux发行版之一…

云计算学习路线

文章目录 一、什么是云计算二、虚拟化2.1 云计算与虚拟机基础2.1.1 云计算底层就是虚拟化 or 物理机2.1.2【重点】企业级虚拟化架构 (VRM CNA 存储)(1)架构分析(2)心跳 cluster(3)…

云计算的学习(四)

四、云计算中的存储基础知识 1.云计算虚拟化中的存储架构 ①虚拟化存储 在虚拟化存储架构中,最底层为物理磁盘。 底层的硬件组成存储池,存储池分为NAS存储和SAN存储;NAS存储需要文件系统;SAN存储需要对存储池进行逻辑划分产生逻…

云计算的学习(三)

三、云计算中的网络基础知识 1.虚拟化中网络的架构 1.1虚拟化中网络的架构 二层交换机作为接入交换机使用,三层交换机可以作为汇聚交换机或核心交换机,在抛开网络安全设备时,路由器直接连接在互联网上。 1.2广播和单播 物理服务器内部主要…

云计算基础:云计算运用越来越广泛,我们应该如何去学习云计算

随着时代的发展,云计算越来越普及,越大众化,使用的人越来越多,我们应该如何去学习这门技术呢?这篇文章我们就来介绍如何学习我们的云计算。 学前介绍: 学前介绍 学习资料:HedEX Lite、产品文档、笔记、P…

云计算学习内容

2021.12.4 云技术 --- 云计算---分布式计算 云储存---百度网盘 计算机技术 抽象语---电信号 抽象语言---编码 应用层 编码---二进制 表示层 二进制---电信号 介质(硬件)访问控制层 处理电信号 物理层 通信技术 1946年2月14日 1876年---贝…

云计算的学习(五)

五、虚拟化特性介绍 1.集群特性 1.1HA HA(Hith Available,高可用特性),克服单台主机的局限性,当一台服务器损坏,运行在损坏服务器上的虚拟机会自动迁移到其他运行状态正常的服务器上,整个迁移过程用户无感…

云计算的学习(六)

六、云计算的发展趋势 1.云计算相关领域介绍 1.1物联网 物联网来源于互联网,是万物互联的结果,是人和物、物和物之间产生通信和交互。 物联网主要技术: RFID技术(射频识别技术)传感器技术嵌入式系统技术 1.2大数据…

大数据与云计算学习(1)

大数据学习 一、大数据概述: 1、大数据概念和特征。 正确答案: 大数据意指一个超大的、难以用现有常规的数据库管理技术和工具处理的数据集 数据量大(Volume):存储的数据量巨大,PB级别是常态,因…

云计算学习路线和经典资料推荐

hi,大家好,最近很多小伙伴叫我出一个云计算学习路线和推荐资料,那必须赶紧安排上。云计算可以说是当前的热门方向,各个大厂都在搞云计算(字节也加入云计算大家庭,以后跳槽有更多选择)&#xff0…

云计算:基础学习

云计算基础学习 一、云计算基础1.什么是云计算:2.云计算的商业模式: 二、网络的定义1.什么是网络:2.网络的类型:3.常见的网络设备: 三、OSI七层参考模型与TCP/IP五层模型:1.OSI七层参考模型:2.T…

云计算——让学习更轻松

​📋导读📋 💝博客主页:红目香薰_CSDN博客-大数据,计算机理论,MySQL领域博主💝 ✍本文由在下【红目香薰】原创,首发于CSDN✍ 🤗2022年最大愿望:【服务百万技术人】🤗 &am…