最新开源的图像识别算法来了!

article/2025/10/18 2:22:51

 Datawhale开源 

方向:图像识别开源项目

人脸、车辆、人体属性、卡证、交通标识等经典图像识别能力,在我们当前数字化工作及生活中发挥着极其重要的作用。业内也不乏顶尖公司提供的可直接调用的API、SDK,但这些往往面临着定制化场景泛化效果不好、价格昂贵、黑盒可控性低、技术壁垒难以形成多诸多痛点。

而今天小编要给大家推荐的是一个完全开源免费的覆盖人、车、OCR等9大经典识别场景、在CPU上可3毫秒实现急速识别、一行代码就可实现迭代训练的项目!

0019e17441d33aa1d14a914836a17e72.gif

图1 PaddleClas图像分类应用示意图

话不多说,赶紧送上传送门,识货的小伙伴赶紧尝试一下吧!

https://github.com/PaddlePaddle/PaddleClas

fa34025357fbc1b20620951af699a599.png

记得Star收藏防止走丢哦!

e0cdb0288b180e6431aeb049a4cfda76.gif

当然,小编不是只管吆喝的,下面小编就来详细拆解下这个项目的过人之处吧!

a9e55ba52b2526d9cdb0a269d47b9867.gif

图2 9大场景模型效果示意图

亮点一:完美平衡精度与速度

从大名鼎鼎的Resnet50到如今火热的Swin-Transformer,模型精度不断被刷新,但是预测效率并不高。即使是Swin-Transformer最小的模型,在CPU上的预测速度也超过100ms,远远无法满足产业实时预测的需求。

而使用MobileNet系列等轻量化模型可以保证较高的预测效率,在CPU上预测一张图像大约3ms,但是模型精度往往和大模型有很大差距。

而PaddleClas推出的超轻量图像分类方案(Practical Ultra Light Classification,简称PULC),就完美解决上述产业落地中算法精度和速度难以平衡的痛点。

29d425624f643bc6df71d953f6062a49.png

表1 不同模型精度速度结果对比

如图所示,它的精度与Swin-Transformer等大模型比肩,预测速度却可以快30倍以上,在CPU上的推理时长仅需2ms!

97bf0bfe76382aa573119c16b0704ce1.gif

亮点二:易用性极强

PULC方案不仅完美的平衡了精度与速度,还充分考虑了产业实践过程中需要定制化的对算法快速迭代的需求,只需一行命令,就可完成模型训练。

与此同时,PaddleClas 团队还发布了包括人、车、OCR在内的9大场景模型仅需2就能实现业务 POC 效果验证,训练、推理、部署一条龙,真正实现“开箱即用”。

96816d8416a8017443c2295f870c14bf.png

不仅如此,项目还匹配了详细的中文使用文档及产业实践范例教程。

243122cec20c5213db5b6f7980446ff3.png

图3 使用文档及范例示意图

ea5f3e60782e986e8ffc08b29cfff980.gif

亮点三:集成超多硬核技术

超轻量图像分类方案(PULC)集成了业界4大业界领先的优化策略:

1212e1b8ef467689f1b0e0f73f941eca.png

图4 超轻量图像分类方案(PULC)示意图

PP-LCNet轻量级骨干网络

PP-LCNet作为针对CPU量身打造的骨干网络模型,在速度、精度方面均远超如MobileNetV3等同体量算法,多个场景模型优化后,速度较SwinTransformer的模型快30倍以上,精度较MobileNetV3_small_0.35x高18个点。

SSLD预训练权重

SSLD半监督蒸馏算法可以使小模型学习到大模型的特征和ImageNet22k无标签大规模数据的知识。在训练小模型时,使用SSLD预训练权重作为模型的初始化参数,可以使不同场景的应用分类模型获得1-2.5个点的精度提升。

数据增强策略集成

该方案融合了图像变换、图像裁剪和图像混叠3种数据增强方法,并支持自定义调整触发概率,能使模型的泛化能力大大增强,提升模型在实际场景中的性能。模型可以在上一步的基础上,精度再提升1个点左右。

SKL-UGI知识蒸馏算法

SKL(symmetric-KL)在经典的KL知识蒸馏算法的基础上引入对称信息,提升了算法的鲁棒性。同时,该方案可以方便的在训练中加入无标签训练数据(Unlabeled General Image),可以进一步提升模型效果。该算法可以使模型精度继续提升1-2个点。

PaddleClas技术交流群

入群学习:

1.获取PaddleClas详解本次升级内容的直播课链接。

2.获取PaddleClas团队整理的10G重磅图像分类学习大礼包,包括:

b97537183ac61ed145f781bf2a8bf583.png

图5 PaddleClas入群学习内容

入群方式:

SETP1:微信扫描二维码,填写问卷

SETP2:加入交流群领取福利

56ba557b598db27a20f22b09068867f5.png

PaddleClas产业落地工具集

不仅如此,PaddleClas团队考虑到真实产业应用面对的各种软硬件环境和不同的场景需求,在提供PULC方案的同时,还提供了包括3种训练方式、5种训练环境、3种模型压缩策略和9种推理部署方式在内的20种产业算法落地方案:

b86498e9b727172bb98944e5061779bf.png

表3 图像分类产业落地工具集训练推理部署功能支持列表

集中值得高度关注的有:

01

分布式训练

飞桨分布式训练架构具备4D混合并行、端到端自适应分布式训练等多项特色技术。在PP-LCNet训练中,4机8卡相较于单机8卡加速比达到3.48倍,加速效率87%,精度无损。

02

模型压缩

飞桨模型压缩工具PaddleSlim功能完备,覆盖模型裁剪、量化、蒸馏和NAS。图像分类模型经过量化裁剪后,移动端平均预测耗时减少24%。

03

移动端/边缘端部署

飞桨轻量化推理引擎Paddle Lite适配了20+ AI 加速芯片,可以快速实现图像分类模型在移动设备、嵌入式设备和IOT设备等高效设备的部署。

以上所有模型、代码均在PaddleClas中开源提供,还有超详细文档教程和范例项目,赶紧查看全部开源代码并Star收藏吧~

链接指路:https://github.com/PaddlePaddle/PaddleClas

相关学习

为了让开发者们更深入的了解PaddleClas这次 发布的全新内容,解决落地应用难点,掌握产业实践的核心能力,6月15-6月17日晚20:30飞桨团队精心准备了为期三天的直播课程!

百度资深工程师将为我们详细介绍超轻量图像分类方案,对各场景模型优化原理及使用方式进行拆解,之后还有产业案例全流程实操,对各类痛难点解决方案进行手把手教学,加上直播现场互动答疑,还在等什么!抓紧扫码上车吧!

e73018613bf3ab79fc94dbcc9c73d2d1.png

更多阅读

官网地址:https://www.paddlepaddle.org.cn

PaddleClas项目地址:

GitHub: https://github.com/PaddlePaddle/PaddleClas

Gitee: https://gitee.com/paddlepaddle/PaddleClas


http://chatgpt.dhexx.cn/article/DGZv6MTZ.shtml

相关文章

神经网络的图像识别技术,神经网络图像识别算法

神经网络提取图像的概率分布特征 神经网络提取图像的概率分布特征:由于一个映射面上的神经元共享权值,因而减少了网络自由参数的个数,降低了网络参数选择的复杂度。 卷积神经网络中的每一个特征提取层(C-层)都紧跟着…

相似图像识别算法是什么,机器图像识别常用算法

计算图像相似度的算法有哪些 SIM Structural SIMilarity(结构相似性),这是一种用来评测图像质量的一种方法。 由于人类视觉很容易从图像中抽取出结构信息,因此计算两幅图像结构信息的相似性就可以用来作为一种检测图像质量的好坏.首先结构…

机器图像识别常用算法,图像对比识别技术

图像识别算法都有哪些 图像识别算法:1人脸识别类(Eigenface,Fisherface算法特别多),人脸检测类(j-v算法,mtcnn)2车牌识别类,车型识别类(cnn)3字符识别&#…

图像识别算法

图像特征包括颜色特征、纹理特征、形状特征以及局部特征点等。 局部特点具有很好的稳定性,不容易受外界环境的干扰。 1. 局部特征点 图像特征提取是图像分析与图像识别的前提,它是将高维的图像数据进行简化表达最有效的方式,从一幅图像的的…

图像识别最好的算法,图片相似度识别算法

现在人脸识别最有效的算法是什么? 最好的人脸识别系统在理想情况下比人类识别的表现要好的多。但是一旦环境情况变糟,系统的表现就差强人意了。而计算机科学家们当然是非常想要开发出一种算法,在各种情况下都能够表现优异。 现在&#xff0…

CNN图像识别_算法篇

CNN图像识别_算法篇 前言Keras1外层循环2中部循环3内部循环 Matlab CNN ToolBox总结 前言 CNN算法方面主要参考的的zh_JNU同学的工作和Deep-Learning-ToolBox-CNN-master的Matlab源码,然后也做了些修改和解读。 Keras 数据库是5钟分类的400张训练数据和100张测试…

人工智能图像识别四大算子

文章目录 背景引入图像识别发展简介边缘检测算法*Prewitt算子**Sobel算子**Laplace算子**Conny算子* * 文末寄语* 背景引入 图像识别是当今计算机科学最热门的研究方向之一。随着科学技术的发展和人类社会的不断进步,图像识别技术在很多行业得到了广泛的应用。本章…

图像识别算法(一)

目录 一、图像识别 二、最近邻分类器(Nearest Neighbor Classifier) 三、k-最近邻分类器(k - Nearest Neighbor Classifier) 四、超参数的设置(Hyperparameter) 五、分析 一、图像识别 对于人脑来说&a…

遗传算法(Genetic Algorithm)解析

00 目录 遗传算法定义生物学术语问题导入大体实现具体细节代码实现 01 什么是遗传算法? 1.1 遗传算法的科学定义 遗传算法(Genetic Algorithm, GA)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一…

遗传算法的手工模拟计算示例(通俗易懂)(包含遗传算法原理、遗传算法代码)

下面是关于“遗传算法”的几个不错的学习资源 遗传算法介绍及手工模拟计算示例(文字版) 遗传算法介绍及手工模拟计算示例(视频讲解版) 遗传算法原理介绍(包含二进制编码、解码原理,算法实现,视…

神经网络中的遗传算法

简 介: 人工神经网络是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。遗传算法是一种引入自然选择和进化思想的优化算法,具有优良的全局寻优性能。在神经网络中借助遗传算法进行网络优化,可以充分利用两者…

遗传算法(Genetic Algorithm)

1、遗传算法的基本思想 遗传算法(Genetic Algorithm, GA)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。 遗传算法(Genetic Algorithm, GA)起…

遗传算法基本原理

遗传算法基本原理 1.遗传算法 GA是基于“物竞天择、适者生存”原理的一种高度并行、随机和自适应优化算法,它将问题的求解表示成“染色体"(chromosome)适者生存的进化过程,通过种群(population)的一代代不断进化,通过选择(selection)、交叉(cross…

多目标遗传算法NSGA-II原理详解及算法实现

在接触学习多目标优化的问题上,经常会被提及到多目标遗传算法NSGA-II,网上也看到了很多人对该算法的总结,但真正讲解明白的以及配套用算法实现的文章很少,这里也对该算法进行一次详解与总结。会有侧重点的阐述,不会针对…

一文搞懂什么是遗传算法Genetic Algorithm【附应用举例】

代码链接放文末。 本文参考了很多张军老师《计算智能》的第四章内容。 本文来源:https://blog.csdn.net/qq_44186838/article/details/109181453 遗传算法 1.1 遗传算法简介 1.1.1 基本原理 重温高中生物哈哈! 遗传算法(Genetic Algor…

遗传算法的基本原理和matlab实现

2016年9月7日星期三 T.s.road 总结笔记 遗传算法解决全局优化(即为最值点如图中C,D),而局部最优解决的是极值点问题(如图中A,B) 1. 遗传算法流程; %遗传算法的伪代码描述&…

遗传算法(三)——基本遗传算法

目录 2.基本遗传算法 2.1基本遗传算法描述 2.1.1基本遗传算法的构成要素 2.1.2基本遗传算法描述 2.1.3基本遗传算法的形式化定义 2.2基本遗传算法的实现 2.2.1个体适应度评价 2.2.2比例选择算子 2.2.3单点交叉算子 2.2.4基本位变异算子 2.3基本遗传算法应用举例 2.3…

遗传算法原理以及matlab代码

目录 1,算法原理以及形象解释 2,参数编码 3,算法框架 4,代码 MATLAB 1,算法原理以及形象解释 遗传算法(Genetic Algorithm, GA)是仿生物智能优化算法,是模拟达尔文生物进化论中…

遗传算法的基本原理

1、简介 遗传算法是一种基于自然选择和群体遗传机理的搜索算法,它模拟了自然选择和自然遗传过程中的繁殖、杂交和突变现象.再利用遗传算法求解问题时,问题的每一个可能解都被编码成一个“染色体”,即个体,若干个个体构成了群体(所有可能解).在遗传算法开始时,总是随机的产生一些…

遗传算法原理介绍

前言 遗传算法( genetic algorithm,GA)是模拟自然界生物进化机制的一种算法,即遵循适者生存、优胜劣汰的法则,也就是寻优过程中有用的保留无用的则去除。在科学和生产实践中表现为在所有可能的解决方法中找出最符合该问题所要求的条件的解决方法,即找出一个最优解。…