MPEG VCM

article/2025/11/11 0:02:48

传统是视频编码是针对人眼视觉进行优化的,目的是在保持人的主观失真不增加的情况下降低码率。而现在越来越多的视频需要进行机器分析,而人只需要看机器分析的结果。因此MPEG成立VCM(Video Coding for Machines)工作组探索新的标准,在不降低机器处理性能的情况下降低码率。这里的机器处理任务包含多种计算机视觉任务,包括目标检测、目标跟踪、实例分割、姿态估计等。(公众号后台回复“VCM”获取相关资料)

简介

MPEG于2019年7月成立VCM工作组,专门研究针对机器处理的视频编码。VCM工作组的任务可以总结如下:(1)定义用例,指定机器视觉和人眼/机器混合视觉的需求;(2)收集带标签的数据集和评估方法;(3)征集特征压缩、面向人机的视频表征和压缩的提案;(4)开发一个框架用于检验和比较不同的技术方案;(5)开发面向机器处理的视频编码标准。

MPEG VCM

VCM致力于制定一种新的标准来规范化码流格式,这里的码流既可能是视频流也可能是提取的特征流。Fig.1是VCM可能的架构。

对于特征流,VCM的特征流编码包括特征提取、特征转换/封装、特征编码几步。其中特征提取和表示需要使用神经网络。

通过各模块协作,工作组创建了3种处理流水线来应对各种使用场景,用于研究和标准化的早期工作。

使用场景

MPEG VCM确立了6种使用场景,其中3种比较典型。

a)智慧交通

为了在边缘进行实时的物体检测、实例分割、车道检测、交通监控等任务并作出驾驶动作,不同基础设施上的传感器需要与交通工具,以及不同交通工具间需要进行特征的交流。在必要的时候这些视频也需要重建出来供人观看。此外,在一些场景中可能还存在一些非可见光图像如红外图像和激光雷达图像。

b)智慧城市

随着物联网IoT的发展,在不同设备间存在大量连接用于通信。典型的智慧城市应用包括交通监控、流量检测和预测、交通流预测和资源调度。视频监控系统是智慧城市的一部分,主要应用的机器视角任务包括目标检测、实例分割、关键点检测等。在必要的时候这些监控视频还需要重建出来供人观看。

c)智能内容检测

互联网上有大量的视频和图像内容,对于保护特定年龄(18岁以下)的用户免于接受不适宜的内容是个巨大挑战。传统的人工筛查费时费力,使用机器视觉技术能帮助解决这个问题。主要应用的机器视觉任务和监控系统类似。

需求

基于上面的使用场景,VCM工作组对于未来的VCM标准提出了关键需求。

a)高效的压缩性能

视频或特征的码流大小在效果不变的情况下要小于传统的视频编码方法。

b)能支持一种或多种认为

生成的码流要能用于不同的场景。

c)支持多种任务性能评价

对于不同的机器视觉任务,编码需要支持不同的性能评价。

此外,工作组还提出了以下可选的需求。1)码流既能支持机器处理也能支持人眼观看。2)编码要支持将部分机器视觉任务部署到前端设备,神经网络中间层输出可以压缩后传输到云端服务器。3)隐私保护,码流可以根据不同的隐私权限提供不同级别的重建视频。

处理流水线

VCM工作组提供了三种流水线形式,如Fig.2。

流水线1:在这种方式中视频在被传输和存储前首先被编码器压缩成码流,解码器获得码流后将其解码为视频送入机器视觉处理任务。在这种流水线中可以直接利用传统的视频编码框架。VVC的基于神经网络的视频编码就是使用这种方式。

流水线2:在这种方式中用于机器视觉任务的神经网络被分为两部分,第一部分在边缘设备中,第二部分在服务器上。有两种可选的方法,方法1是将网络1提取的特征封装后编码如Fig.2a所示。方法2是直接将网络1提取的特征编码,如Fig2.2b所示。

流水线3:这种方式用于人机共判场景,流水线上面部分是流水线2的简化版,下面部分用于编码视频输入包括原始视频和提取的特征。

除了上述三种流水线,其他可能的工作方式也可以向工作组提交。

评价方法

为了比较不同方法,VCM建立了一个评价框架包括机器视觉任务、数据集、指标和anchor生成方法。

机器视觉任务

基于前面的讨论,有以下几种典型的机器视觉任务,

数据集

VCM工作组指定了下面5个数据集,

1)OpenImageV6:该数据集用于目标检测和目标分割。含有20000幅图像,为了减少计算时间只选用其中5000幅。注意,用于目标检测和目标分割的5000幅并不相同。

2)FLIR:该数据集包括RGB图像和红外图像,可用于自动驾驶和辅助驾驶的目标检测。实验显示在低光线下红外图像检测效果优于RGB图像,所以VCM只选用其中的红外图像。

3)HiEve-10:HiEve数据集包含大量的姿态、复杂行为的标签和长时间轨迹,可用于轨迹跟踪、行为识别和字体估计任务。HiEve中只有10个序列可以商业使用称为HiEve-10,VCM选择其中的7个。

4)TVD:开源数据集。

5)SFU-HW-Object-v1:含有18类物体,可用于目标检测。

单任务评价指标

不同的机器视觉任务需要使用不同的评价指标,如下所示。

这些指标是评价机器视觉任务的性能,还需要评价码流的大小。VCM使用BPP评价码流大小,

根据BPP和表2指标,可以绘制RD曲线。

多务评价指标

对于支持多种任务的码流,例如人机共判场景,可以使用加权处理。

  是机器视觉任务的失真,  是人眼失真。

感兴趣的请关注微信公众号Video Coding


http://chatgpt.dhexx.cn/article/FK64kufF.shtml

相关文章

VCM基本原理和主要性能指标

VCM(Voice Coil Motor)音圈马达是一种将电能转化为机械能的装置,实现直线型及有限摆角的运动,实现运动的力来源于通电线圈在磁场中受到的作用力。VCM 的精确控制需要通过外部的驱动IC 来实现。按功能分为开环VCM,中置VCM,闭环VCM,光学防抖VCM。 VCM(Voice Coil Motor)音…

camera基础知识(1)

目录 camera module 镜头lens 光圈快门 音圈马达VCM 滤光片 image sensor: 摄像头工作原理大致如下 camera作为android系统中庞大的一个模块之一,camera框架包含的知识十分多,作为一名camera工程师,我们不仅要熟悉代码,也要…

VCM绕线机的功能参数

VCM的全称是Voice Coil Motor,我们也叫音圈马达和音圈电机,是手机中比较常用的配件,也广泛应用于电脑、网络摄像头、扫描仪等,因为原理和扬声器类似,所以叫做音圈电机。它与我们常见的电机不一样,具有结构简…

【camera】1. 相机硬件组成

相机—光照测量设备 图像—辐射能量测量 Lens:镜头 VCM:音圈马达 IR Filter:滤光片 Sensor:感光元件CCD\CMOS, Substrate PCB:基片电路 DSP(option):数字信号处理器 ISP(option):图像信号处理器 CCD 电耦合器件 CMOS 互补性金属氧化物半导体 无论是ccd还是cmos都是光…

VCM驱动IC--close loop

VCM驱动IC: 正从幕后走向台前 作为与VCM(音圈马达)匹配的driver IC一直被产业链当做一个小器件,故而默默无闻,较少为人所认知和谈论。其实小小的driver IC,是摄像模组实现自动对焦功能不可或缺的一部分…

vcm驱动芯片原理_技术科普 | 一文了解音圈马达的驱动原理

原标题:技术科普 | 一文了解音圈马达的驱动原理 第11期 庄子云: “鲲之大,不知其几千里也。化而为鸟,其名为鹏。鹏之背,不知其几千里也,怒而飞,其翼若垂天之云。”大鹏鸟展翅高飞借助的是风带来的动力。 可见,在一个运转的系统中,动力是多么的重要。我们的手机摄像头系…

手机相机接口介绍

原文来自公众号:工程师看海 相机是手机中非常重要的模组之一,已成为智能手机的标配,其按布局可以分为前摄和后摄,按功能可以分为自拍相机、主相机、超广角、长焦和微距等。 不同功能的相机有不同功能的结构和电气特性,…

音圈电机工作原理与直线电机的对比

图片来自:什么是音圈电机?如何工作的?如何应用于相机镜头调焦? - 知乎 目录 1. 什么是音圈? 2.音圈电机(VCM,Voice Coil Motor)结构及原理 2.1 音圈电机工作原理 2.2 音圈电机结构 2.3 音圈电机的特点 …

【转】VCM驱动IC--close loop

VCM驱动IC: 正从幕后走向台前 作为与VCM(音圈马达)匹配的driver IC一直被产业链当做一个小器件,故而默默无闻,较少为人所认知和谈论。其实小小的driver IC,是摄像模组实现自动对焦功能不可或缺的一部分…

Camera简介(一):摄像头模组CCM的结构和原理简述

我们常说的Sensor也就是图像传感器只是整个摄像头模组的一部分,主要负责将接收到的光信号转换成电信号,实际上整个摄像头模组(Camera Compact Module,CCM)由很多部分组成,除Sensor以外的其他模块会负责完成对焦、滤光、减震、数据…

【camera】【摄像头模组】摄像头模组简单介绍

摄像头模组 1. 摄像头介绍 摄像头模组的结构大致如下: camera模组工作原理:景物通过镜头lens生成光学图像信号投射到图像传感器image sensor表面上,由sensor感光像素点转换为电信号,经过图像传感器的A/D数模转换变为数字图像信号…

霍尔元件在VCM音圈马达中的应用

音圈马达(音圈电机)自动对焦装置又称为音圈马达自动对焦驱动器,此驱动器可分为移动部件与固定部件两大部分,移动部件包括镜头模组Lens、镜头座Holder以及两个永磁铁Magnets;而固定部件包括一个霍尔元件(型号推荐HG106C…

VCM音圈马达摄像头对焦

目录 VCM(Voice Coil Motor)是什么 主要功能是用作摄像头的快速对焦 音圈马达的构成 音圈马达控制原理 自动振幅控制系统 音圈马达的使用方式 总结 VCM(Voice Coil Motor)是什么 VCM是音圈马达有控制快、精度高的特点。 10ms左右可达目标位置,采用合适的定…

camera调试:VCM马达驱动调试(DW9763)

这篇文章介绍一下VCM马达驱动的调试,以RK3588,安卓平台,移植DW9763驱动为例。 目录 (一)概述 (1)VCM简介 (2)实现camera对焦方法 ①实现光学变焦采用变焦马达&#…

vcm驱动芯片原理_手机摄像头VCM音圈马达,原理、结构

一、VCM是什么 VCM(Voice Coil Motor),电子学里面的音圈电机,是马达的一种。因为原理和扬声器类似,所以叫音圈电机,具有高频响、高精度的特点。 其主要原理是在一个永久磁场内,通过改变马达内线圈的直流电流大小&#…

高频高精度圆柱形音圈电机 微型VCM 直线电机模组 音圈马达

➤01 音圈电机 在 高频高精度圆柱形音圈电机 微型VCM 直线电机模组 音圈马达-淘宝网 购买到音圈电机。这是在 P5压电陶瓷致动器,纵向极化,叠堆压电陶瓷,多层压电陶瓷促动器 推文之后,佟超给出的替换方案。 ▲ 高频高精度圆柱形音圈…

VCM(音圈)马达驱动IC

VCM(音圈)马达驱动IC 参考链接:https://jingyan.baidu.com/article/f3ad7d0f3e935409c2345b5b.html 1 2 3 4 5 6 分步阅读 VCM(Voice Coil Motor),电子学里面的音圈电机,是马达的一种。…

第八章:拆解VCM音圈马达,原理、结构

慧眼网 邓林供稿 第一章我们介绍了小孔成像的原理,实验中通过移动标尺即可在光屏上投影出清晰的蜡烛图像。在手机摄像头中,这个移动标尺的功能由VCM马达承担。 一、VCM是什么 VCM(Voice Coil Motor),电子学里面的音圈电…

拆解VCM音圈马达,原理、结构

转自http://www.52rd.com/S_TXT/2014_10/TXT62308.HTM 感谢作者! 一、VCM是什么 VCM(Voice Coil Motor),电子学里面的音圈电机,是马达的一种。因为原理和扬声器类似,所以叫音圈电机,具有高频响…

VCM 音圈电机 (马达)Voice Coil Motor

**VCM(Voice Coil Motor)**指电子学里面的音圈电机,是马达的一种。 因为原理和扬声器类似,所以叫音圈电机。具有高频响、高精度的特点。 原理是在一个永久磁场内,改变马达内线圈的直流电流大小,控制弹簧片的…