物体识别

article/2025/9/11 20:02:06

一、物体识别

这里写图片描述

图像识别:很重要,是很多算法的基础

图像识别+定位:识别出来是猫,且定位出猫的位置

物体检测:每个图像中含有多物体,检测出有几个个体,并框出来位置

图像分割:不仅仅框出来位置,还有勾勒出来轮廓

很有意义,且能在工业落地。

这里写图片描述

如何识别+定位(单物体):

这里写图片描述

已经用多层的卷积神经网络做了分类的问题(右上角),得到了已经训练好的参数。现在要定位矩形框,四个值(x,y,w,h)分别为,(x,y)为左上的坐标,w为宽,h为高,四个数都是连续的值,就变为了一个回归问题。

这里写图片描述

分类问题是通过FC得到每类的概率,而此时需要得到连续的四个值,所以预测的是 x^,y^,w^,h^ x ^ , y ^ , w ^ , h ^ ,真实的是 x,y,w,h x , y , w , h

L2-loss: (xx^)2+(yy^)2+(ww^)2+(hh^)2 ( x − x ^ ) 2 + ( y − y ^ ) 2 + ( w − w ^ ) 2 + ( h − h ^ ) 2

利用BP+SGD进行训练,得到损失最小的参数。

这里写图片描述

去掉做分类的积木,在最后一个卷积层之后添加做回归的积木。

为了利用前面训练好的参数,有两种搭积木的方法:

  1. 对训练好的参数进行固定,也就是前面的参数不再训练,一路做回归,一路做分类
  2. 也许对参数也进行学习的话会有更好的回归的结果,也就是将训练好的参数作为初始值,对前面部分的学习率调低,后面新的部分的学习率调高,再进行训练,得到一个新的完整的结构,分类(交叉熵损失)和回归(L2-loss)是分开的。

思路二:

这里写图片描述

回归效果不太好,能不能提前给一些框来分类。

分别用黑色的框来遍历,左上->右上->左下->右下,分类后会获得在不同位置上判断出来是猫的概率:0.5->0.75->0.6->0.8

所以主体一定是靠近右边的,然后整合。

这里写图片描述

有四个红框,进行整合。

这里写图片描述

去掉全连接,改成1x1的卷积,计算共享,只有黄色的部分要计算,没有那么暴力。

二、多目标物体识别

如果图中有2个个体,框每滑到一个位置,判断是不是某个物体,

这里写图片描述

边缘策略,找到到底哪些位置可能是候选框,先用别的方法找到可能是一个物体的框。

这里写图片描述

选择性搜索:

自顶向下的搜索,先用像素KNN的方式对周边的点做扩散,得到很细的区域分布,可以再进行扩张,得到不同粒度的图像分割区域。

从上到下的过程:找到框把不同颜色的地方框出来。

这里写图片描述

对比:

这里写图片描述

R-CNN

这里写图片描述

R-CNN 思想:

有一张图,可以从图中选出可能感兴趣的区域(ROI),每个框都经过CNN,得到该框中的特征,取第5个池化层的特征,用SVM做分类,确定是哪一类,利用Bbox回归来对框进行调整。

Bbox regression:告诉你这个框怎么调整一下,可以更贴近物体的形状,也就是框可能太大,可以调小些,也是有参数的,需要训练,是一个独立的部分。

RCNN不是end-to-end的模型,这个ConvNet可以直接拿VGG来用,就是抽取特征。

改进:R-CNN太慢了

2000个图像候选框,每个框的数据都要进行卷积特征抽取,很耗时,所以简化为Fast-rcnn。

Fast-RCNN 思想:
这里写图片描述
① 将候选框缩减

对原图进行卷积神经网络特征抽取,得到了一个整图的特征图,在结果上抠出来和原来的框对应的位置,也就是将原图上的候选框映射到特征图上,抽取对应位置的特征。

② 将分类器变为神经网络,也就是接全连接层,完成分类和回归

这里写图片描述

实现:

这里写图片描述

原始图像3x800x600 -> 得到一个特征图,特征图上的某个点,是由原图的小块图像区域和卷积核卷积得到的,所以,特征图上的不同点,对应原图的不同小块儿。也就是原图的框应该是可以找到特征图对应的框。

问题:圈出来的框的大小是不同的,经过pooling之后也是不同大小的,但是FC的神经元的输入和输出大小是固定的,所以FAST 提出了ROI pooling

FAST RCNN中提出了ROI pooling:对所有的框下采样为相同的维度,之后再接神经元:

这里写图片描述

Faster-RCNN

找候选图框很麻烦,可以让神经网络自己找图框。

这里写图片描述

这里写图片描述

在大图上产出了一些特征图,在中心点找到不同大小的框,用候选框中的东西进行判别,得到n个得分,再进行判别。
这里写图片描述

NeuralStyle

原始图片+风格图片=>带风格的图

传统网络一直用Cross-entropy 或L2-loss,来评价两幅图在内容是的接近程度,所以作者思考有没有更好的损失函数,使得现在的问题性能有提升。

发现了一个style-loss能够定义两幅图像的风格的差异,所以将L2-loss和style-loss来综合起来来进行融合。

这里写图片描述

一般情况利用CNN来学习权重w,而图像是x,所以可以固定w去调x使得损失最小。

拿VGG网络,把网络固定住,调图像x,使得损失最小,让内容和猫最接近,让风格和下图更接近,所以定义两个loss,分别为内容的loss和风格的loss。

这里写图片描述

内容loss:原始图 Fij F i j ,生成图 Pij P i j

风格loss:评估了所有特征图(64x64x16)的depth(16)上,每两个特征图上进行了点乘,就有 A1616=16×16 A 16 16 = 16 × 16 个结果,即语法矩阵Gram matrix,对生成的语法矩阵和原始图像的语法矩阵做差值。

将两部分loss合起来, α α 为内容损失的权重, β β 为风格损失的权重, α α 越大,越偏内容,然后最小化损失即可。


http://chatgpt.dhexx.cn/article/7eW6vFKv.shtml

相关文章

【AI技术】物体识别概述1

【AI技术】物体识别概述1 1、背景2、物体识别3、应用 1、背景 主要针对客户以及初学者概述物体识别。 2、物体识别 物体识别又叫目标识别,物体分类,图像分类,习惯性称为图像分类,即对整张图片进行分类。 物体识别针对的是物体分…

目标检测和物体识别的方法有哪些?如何进行物体定位和分类?

目标检测和物体识别是计算机视觉领域中重要的任务,旨在从图像或视频中自动定位和识别出不同类别的物体。这些任务在许多应用领域中具有广泛的应用,如自动驾驶、视频监控、人机交互等。本文将介绍目标检测和物体识别的方法以及如何进行物体定位和分类。 一…

小程序 跳转 公众号 文章

1.通过组件 web-view https://developers.weixin.qq.com/miniprogram/dev/component/web-view.html <web-view src"https://mp.weixin.qq.com/s/Cz4x4QpvF_Pozn7xjYOVyw"></web-view>2.如果是关联好小程序的公众号 1.如果是 左图文章 都是 https://m…

微信小程序跳转公众号h5页面

小程序提供了web- view组件进行用来内嵌网页 根据限制说明准备域名即可&#xff0c;开发阶断可以使用http的域名&#xff0c;在开发者工具中勾选不验证https证书即可&#xff0c;发布上线时必须使用https的域名。 同时需要小程序后台配置业务域名。

微信小程序跳转微信公众号

1 webview 嵌套 微信公众号的页面 然后 文章里 添加 公众号二维码 然后引导用户长按识别公众号 2 公众号有关注的页面 路径 需要自己找 我记得是替换什么officeid啥的 百度即可 3 利用<official-account bindload"lookSuccess" binderror"lookFai…

微信小程序跳转公众号

长按识别跳转 步骤&#xff1a; 新建一个页面使用web-view组件的src链接到公众号编辑好的一篇带有公众号的二维码的文章 微信规则只有小程序关联的公众号里的文章可以长按识别二维码 <template><view><!--微信规则只有小程序关联的公众号里的文章可以长按识别…

小程序直接跳转公众号的必要条件记录

1、小程序必须关联公众号主体&#xff0c;可以从图1查看是否已被关联&#xff0c;如果没有被关联&#xff0c;则可以去图2进行关联 图1&#xff1a; 图2&#xff1a;登录微信公众平台&#xff0c;进入图片广告-小程序管理&#xff0c;进行关联 2.小程序不能直接打开公众号首…

小程序跳转公众号文章

这是首页的代码 <image class"seedingBannar" data-id"{{item.id}}" bindtap"goTweet" src"{{resourceUrlitem.iconPath}}"></image>// 跳转到推文页面goTweet: function (e) {console.log(e.currentTarget.dataset.id)wx…

uni-app微信小程序跳转公众号;微信小程序打开公众号;微信小程序识别二维码添加好友;微信小程序通过公众号添加好友;小程序里识别企业微信二维码点击联系人名片无反应?

需求&#xff1a; 在微信小程序页面中&#xff0c;长按识别图片二维码&#xff0c;识别出联系人后&#xff0c;点击添加好友&#xff1b; 问题&#xff1a;微信官方社区说是小程序添加不了好友&#xff1b; 解决方案&#xff1a; 目前只能通过微信小程序跳转至公众号&#xf…

uniapp写小程序跳转公众号H5链接

需求&#xff1a; 需求是小程序的首页banner图来自pc端配置生产。 在小程序点击轮播的banner图后&#xff0c;跳到对应的linkurl&#xff0c;但是我们和客户约定好&#xff0c;只能跳转公众号。 一开始看了小程序的文档&#xff0c;需要配置什么业务域名&#xff0c;下载校验…

微信小程序如何跳转微信公众号

目录 一、微信公众号配置二、微信小程序配置三、添加代码 一、微信公众号配置 登录微信公众号&#xff0c;点击【小程序管理】&#xff1a; 点击【添加】&#xff1a; 点击【关联小程序】&#xff1a; 输入小程序进行关联&#xff1a; 二、微信小程序配置 登录微信小程序…

小程序跳转公众号关注页面的两种方法

一、web-view方法 这个种方法有一个必须要达到的条件就是&#xff1a;小程序的公众号必须是认证的企业号&#xff0c;而且要在小程序公众号的后台添加“veb-view业务域名”&#xff01;不然会出现如下情况 <!--pages/webview666/webview.wxml--> <view class"ty…

小程序 小程序跳转公众号页面

web-view 基础库 1.6.4 开始支持&#xff0c;低版本需做兼容处理。 承载网页的容器。会自动铺满整个小程序页面&#xff0c;个人类型的小程序暂不支持使用。 客户端 6.7.2 版本开始&#xff0c;navigationStyle: custom 对 web-view 组件无效 小程序插件中不能使用。 属性类…

微信小程序跳转公众号推文

注&#xff1a;笔者是自学小程序&#xff0c;自身开发经验不足&#xff0c;代码肯定存在不规范和不足&#xff0c;该博客参考一下就好 完整项目代码&#xff1a;https://github.com/zim-keavin/wxapp-cloud-demo 实现在小程序中&#xff0c;点击某个组件后跳转到公众号的推文…

微信小程序跳转公众号链接

小程序跳转微信公众号文章&#xff0c;是通过web-view实现的。 1.web-view会默认自动打开所跳转的页面&#xff0c;但我们一般项目需求是点击某一按钮或下一步进行跳转&#xff0c;所以在小程序中我们需要新建一个页面来承载web-view 在页面点击按钮后跳转至承载页面&#xff0…

React + Taro 小程序跳转公众号

Taro小程序跳转公众号的文章 步骤&#xff1a;登录公众号后台-小程序-小程序管理-添加-关联小程序 关联后就可以在微信的公众平台查看(设置-关联设置-关联公众号) 如图所示&#xff1a; 然后使用web-view 我这个是使用广告轮播实现的代码如下 注意&#xff1a;一个页面使用…

【实战】前端必会 —— 微信小程序 跳转 微信公众号

文章目录 一、跳转方案二、获取biz三、小程序跳转公众号 web-view | 微信开放文档 一、跳转方案 跳转方案的选择关键在于目的性&#xff1a; 引流关注&#xff1a;直接跳转公众号页面内容查看&#xff1a;使用 web-view 直接查看 二、获取biz biz 相当于微信公众号的 唯一身…

小程序和公众号相互跳转

小程序跳转公众号 小程序跳转公众号目前只找到 微信暴露的 引导关注组件 official-account, 官方文档如下&#xff1a; https://developers.weixin.qq.com/miniprogram/dev/component/official-account.html 且这个组件展示是有限制的&#xff0c;只有在扫码进入小程序的情况下…

小程序直接跳转到公众号的方法

实现效果 小程序打开公众号的实现效果 小程序不能直接打开公众号首页&#xff0c;但是可以通过打开公众号的某一篇文章&#xff0c;然后进入到公众号内。 具体实现方法 在公众号后台创建一篇文章&#xff0c;最好以xx.weixin.qq.com为域名 &#xff0c;否则可能出现小程序不识…

JAVA调用百度OCR实现身份证识别

业务需求要实现身份证照片识别&#xff0c;还是比较简单的&#xff0c;百度的API开发文档也写的比较清楚&#xff1a;https://ai.baidu.com/ai-doc/OCR/rk3h7xzck 首先准备工作要先申请创建百度账号、创建相对应用&#xff0c;获取API Key 和 Secret Key&#xff08;创建成功后…