视频处理

article/2025/9/19 12:39:52

1.视频处理

  • 在视频压缩前后,对视频图像质量增强的操作
  • 视频编解码系统输出的图像主观质量不仅与压缩算法的性能有关,还受视频处理的影响
  • 压缩之前对视频的处理称作预处理(Pre-processing)
  • 压缩之后对视频的处理称作后处理(Post-processing)

2. 预处理

  • 预处理的目的
    • 为了减少原图像受到的损害,保持原图像的重要特征,使原图像能被高效的压缩
      • 噪声污染
      • 光照差
      • 抖动
    • 为了进行视频格式转换
      • 去隔行
      • 空间缩放
      • 帧率转换
  • 去噪声处理

  • 去隔行(Deinterlace)
    • 隔行扫描的视频图像在逐行扫描播放设备上播放会有隔行效应,降低了主观质量

3. 去隔行的方法

  • 在单场内去隔行
    • 用奇数(偶数)行插值出偶数(奇数)行

  • 两场间去隔行
    • 用两场的像素值(包括运动矢量信息)插值出一帧象素值

  • 运动补偿方法
    • 用前后向参考场的运动矢量信息,产生高质量的逐行帧

4. MPEG去隔行处理

  • MPEG-2后处理去隔行

5. 空间缩放

  • 上采样(Up sample)方法
    • 最近邻插值(Nearest-neighbor interpolation )
      • 用原图像上每一个象素点值作为上采样图像上对应四个相邻象素点的值
      • 会产生阶梯形状的效应
    • 线性,双线性插值

    P(x,y)=P(0,0)xy+P(1,0)(1-x)y+P(0,1)x(1-y)+P(1,1)(1-x)(1-y)

    • 双三次插值(Bicubic interpolation)
      • 用邻近的16个象素值插值当前象素
      • 有更平滑的插值效果

  • 下采样(Down sample)方法
    • 缩小原始图像

5. 超分辨率

  • 光流:象素的运动矢量

6. 帧率转换

  • 3:2下拉
    • 24帧/秒电影转换成60场/秒的电视视频
    • 24/30=4/5

  • 帧率下采样(跳帧)

  • 帧率上采样

7. 后处理

  • 后处理的目的是为了去除解码图像的各种效应,最大程度恢复损失的图像数据,提高解码图像的主观质量
    • 量化方法使变换系数信息损失导致解码图像产生失真和块边界的不连续性
      • 块效应(Block Artifact),振铃效应(Ringing Artifact)
      • 失真(Distortion)
    • 视频码流传输及解码导致的解码图像质量问题
      • 跳帧(Frame Skip)
      • 数据丢失(Data Loss)

8. 块效应

  • 块效应产生原因
    • 由于块被独立的处理

9. 去除块效应滤波

  • 去除块效应滤波
    • 环外滤波(Out loop filter):
      • 滤波器在解码环路外,对显示缓冲区的图像进行滤波
      • 非标准部分,只有解码器需要环外滤波
      • MPEG-2,MPEG-4 SP

    • 环路滤波(In loop filter):
      • 滤波器在解码环路内,滤波后的图像可以作为参考帧用于运动估计和补偿
      • 标准的一部分,编解码器都需要环路滤波
      • AVS,H.264/AVC

10. 振铃效应

  • 振铃效应产生原因
    • 由于高频系数的量化严重

11. 数据丢失

  • 数据丢失

12. H.264的环路滤波

  • 滤波边界

  • 适应性滤波

  • 滤波强度

  • 滤波决策阈值

  • 滤波强度
    • 滤波强度和量化参数QP有关
      • QP越高,量化程度越大,会产生更多的块效应,需要更强的滤波
      • QP越低,量化程度越小,会产生更少的块效应,用弱一些的滤波来防止边界变得模糊
    • 根据滤波强度(Bs)的不同有两种滤波器
      • 1≤ Bs≤3,基本滤波操作
      • Bs=4,强力滤波操作
    • 边界滤波计算

  • 截断操作参数C

  • Bs=4
  • 块效应更明显
  • 需要更剧烈的滤波,去除块效应
  • 当满足以下条件对边界进行强滤波

  • 强滤波时修改p0p1p2的像素值
  • 弱滤波时只修改p0的像素值

 

第11章 视频编码标准

1.国际标准组织

  • ITU (International Telecommunications Union):国际电信联盟
  • ISO (International Standardization Organization):国际标准化组织
  • IEC (International Electrotechnical Commission):国际电工委员会

2. ITU

  • ITU-T (Telecommunication):电信标准化部门
  • ITU-R (Radiocommunication):无线电通信部门
  • ITU-D (Development):电信发展部门
  • VCEG (Video Coding Experts Group):视频编码专家组,属于ITU-T的Study Group 16/Question 6 (ITU-T SG16/Q.6)

3. VCEG

  • VCEG制订标准:
    • H.261:第一个视频编码标准,用于ISDN(px64Kbps)传输的视频会议,主要采用了基于整象素的运动补偿
    • H.262 (MPE-2):与MPEG合作制定的标准
    • H.263 (H.263+, H.263++):用于低码率的视频编码,主要用于PSDN低于54Kbps的视频会议和视频电话,采用了1/2象素运动补偿,考虑了数据损失和错误鲁棒性的需要
    • H.26L: H.264的前身标准
    • H.264 (MPEG-4 AVC):目前编码效率最高的标准

4. ISO/IEC

  • JPEG:ISO/IEC JTC1/SC29/WG1
  • MPEG:ISO/IEC JTC1/SC29/WG11

5. MPEG

  • MPEG制订标准:
    • MPEG-1 : H.261+半象素运动补偿+双向预测+条带结构编码,用于VCD,LAN视频(最大1.5Mbps)
    • MPE-2: MPEG-1+隔行视频编码+缩放功能,用于HDTV(18Mbps) 、SDTV (2-5Mbps)数字信号传输和DVD(6-8Mbps)存储,兼容MPEG-1标准
    • MPEG-4 ASP (P-2) :从H.263标准发展而来,基于视频对象平面编码,能在解码端控制视频对象,合成场景,并有音视频交互功能
    • MPEG-4 AVC (P-10)(H.264/AVC):与VECG合作制定的标准

6. 视频编码标准

  • 国际标准组织及其制定的编码标准

7. 标准的应用

8. 其他标准组织

  • AVS (China Audio and Video Standard)
    • AVS1.0 :面向高清数字电视广播
    • AVS-M:面向移动视频
    • AVS-S:面向监控视频
  • SMPTE (The Society of Motion Picture and Television Engineers )
    • VC-1

9. 视频编码标准发展

10. MPEG-1

  • 标准文档:ISO/IEC 11172-2
  • 编码技术:基于H.261
    • B帧编码:B帧不能被其它帧参考
    • 16x16 ½精度运动补偿
    • 码率控制:宏块级的码率控制,调整宏块的量化参数控制码率
    • 支持视频随机访问,回放,码流编辑,音视频同步
  • 参考软件:Simulation Model 3(SM3)

11. MPEG-2

  • 标准文档:ISO/IEC 13818-2
  • 编码技术:基于MPEG-1
    • 帧和场运动补偿
    • 三种类型的缩放
      • 空间缩放
      • 时间缩放
      • SNR缩放
  • 参考软件:Test Model 5 (TM5)
  • Profile:工具集
  • Level:参数限制
  • 不同的应用使用不同的Profile和Level的组合

12. H.263系列

  • H.263编码技术:基于H.261
    • 半象素精度运动补偿
    • 可选的数据流层次结构
    • 四种高效编码模式
      • D选项—无限制的运动矢量模式
      • E选项—基于语法的算术编码
      • F选项—高级预测模式,OBMC
      • G选项—PB帧模式
    • 支持更多的视频图像分辨率
    • 参考软件TMN2.0(Test Model Near-term 2.0)
  • H.263+编码技术:基于H.263
    • 允许自定义视频图像格式
    • 增加了12个选项提高压缩效率
      • I选项—高级的帧内预测模式
      • J选项—去块效应滤波
      • K选项—条带结构模式
      • L选项—补充增强信息,用于解码器的显示相关的信息
      • M选项—增强的PB帧模式
      • N选项—参考帧选择
      • O选项—分级,时间分级,空间分级,SNR分级
      • P选项—参考帧重采样
      • Q选项—减少的分辨率更新
      • R选项—独立的片段解码
      • S选项—可替代的inter-VLC
      • T选项—改进的量化
  • H.263++编码技术:基于H.263+
    • 增加了三个选项,增强抗误码能力
      • U选项—增强型参考帧选择
      • V选项—数据分区条带,变换量化系数和运动矢量数据分离
      • W选项—增加的补充增强信息,包括定点IDCT的选项,图像信息,信息类型,重复的图像头,交替场指示,稀疏参考帧识别

13. MPEG-4

  • 标准文档:ISO/IEC 14496-2
  • 编码技术:基于H.263
    • 增加了基于对象的编码和操作
      • 形状分割编码
      • 缩放的静态纹理小波变换
      • 网格动画编码
      • 人脸动画编码
      • 内容合成,半合成编码
      • 10比特,12比特深度采样
      • 参考软件VM7(Verification Model 7
  • 基于对象编码
    • 场景被分成多个对象
    • 每个对象用形状,运动和纹理特征描述

  • Video Object Plane(VOP)

  • Sprite编码
    • 在序列开始编码整个视频背景和仿射映射,通过仿射映射将部分背景内容放到解码图像上显示

  • 网格(Mesh)动画编码
    • 对象可由初始的网格和节点的运动矢量描述

  • Profile

14. H.264/AVC

  • 标准文档:ISO/IEC 14496-10(ITU-T H.264)
  • 前身为:H.26L(Long Range),基于MPEG-2/4
  • 参考软件JM(Joint Model)

15. H.264编码结构

16. H.264-Intra编码

  • 4个亮度16x16的模式
  • 9个亮度4x4的模式
  • 4个色度8x8的模式
  • 编码复杂度高
  • 不利于错误恢复

17. H.264-运动补偿

  • 可变块运动补偿
  • ¼象素精度亮度运动补偿
    • ½像素滤波器(1, -5, 20, 20, -5, 1)
  • 1/8象素精度色度运动补偿
    • 色度采用双线性滤波
  • 图像外运动矢量
  • 多参考帧
    • 每个宏块的四个8x8子块都可以使用不同的参考帧

18. H.264多参考帧

  • P帧
    • 只参考一个list的参考帧,List0
  • B帧
    • 参考两个list的参考帧,List0和List1
  • 每个List最大可包含16个参考帧
    • List0:以前的参考帧缓冲
    • List1:将来的参考帧缓冲

19. H.274-加权预测

20. H.264-切换图像

  • SP/SI帧实现
    • 码流切换
    • 随机切入
    • 错误恢复
    • 也可以实现快进,快退
  • 特点
    • 对于不同的参考图像可以得到完全相同的重构图像
    • SP帧的编码效率低于P帧但高于I帧
    • SI帧的编码效率低于I帧

21. H.264-FMO

  • 灵活宏块顺序(Flexible MB Order,FMO)
    • 宏块有不同的组合构成条带
    • 七种不同的宏块组合方式
  • FMO增强了解码的错误恢复能力

22. H.264-数据分区

  • 上层的语法元素的丢失会严重影响压缩码流的解码
  • 将码流按照重要程度分成三部分
    • A:头信息:包括宏块类型,运动矢量等
    • B:Intra系数信息
    • C:Inter系数信息
  • 用不同的优先级传输不同重要程度的分区来实现错误恢复

23. H.264-ASO,RP

  • 任意条带顺序(Arbitrary Slice Order,ASO)
    • 条带之间独立解码
    • 条带可以按任意顺序传输
    • 丢失的条带可以被解码的条带恢复出来
  • 冗余图像(Redundant Picture)
    • 在码流里放入冗余的图像,如果图像数据丢失了,可以用冗余图像代替

24. H.264-视频编码层

  • 网络独立的编码层
  • VCL层包含:
    • 序列参数集:Sequence Parameter Set(SPS),存放序列头信息
    • 图像参数集:Picture Parameter Set(PPS),存放图像头信息
    • 条带以下数据
    • 额外的增强信息(Supplemental Enhancement Information,SEI)

25. H.264-网络提取层

  • 提取的VCL数据
  • 适合于传输层的数据传输和媒介的存储
  • NAL单元为数据包和码流系统定义了一种通用的传输格式

  • NAL单元连接在一起构成了NAL流
  • 面向码流传输的NAL单元

  • 面向数据包传输的NAL单元

26. H.264-Profiles

  • Profile:码流语法子集

  • Fidelity Range Extensions

27. H.264-Levels

  • Level:参数限制

28. AVS vs. H.264

29. 性能比较


http://chatgpt.dhexx.cn/article/4n0YJ9wV.shtml

相关文章

基于PythonOpenCv的视频图像处理

博主简介 博主是一名大二学生,主攻人工智能研究。感谢让我们在CSDN相遇,博主致力于在这里分享关于人工智能,c,Python,爬虫等方面知识的分享。 如果有需要的小伙伴可以关注博主,博主会继续更新的&#xff0c…

openpose如何处理视频

openpose提供了官方的bin文件,可以通过shell直接处理视频, 此外还提供了一系列的demo文件,用于处理图片文件。 那如何修改官方的demo用来处理视频呢? 找了不少别人的教程都是通过 cv2.dnn.readNetFromCaffe(protoFile, weight…

使用python的视频处理

本文探讨的是使用python对视频进行如下操作: 将待处理的视频分割成帧对每一帧进行处理对处理后的帧合并得到最终的视频 为了方便接下去的实验过程,读者必须具备如下的工具: 1、依赖包python-opencv 2、借助工具ffmpeg import cv2 import …

VideoProc v4.4 多功能视频处理工具

前言 VideoProc是WinX/MacX HD Video Converter Deluxe的进阶版本,在功能上更上一层。VideoProc全方位整合了影片转档、影片压缩、(YouTube)影片下载、影片剪辑的功能,使你在Windows上管理不同的多轨道、SD、HD、4K影片的绝佳方案…

视频分类Video-Swin-Transformer

视频分类Video-Swin-Transformer 视频分类Video-Swin-Transformer 视频分类Video-Swin-Transformer前言一、Video-Swin-Transformer二、环境安装三、数据预测四、对源码进行更改五、总结六、参考资料 前言 提示:这里可以添加本文要记录的大概内容: 星光…

Python - MoviePy 处理音视频

文章目录 一、关于 MoviePy相关教程安装工作原理 二、音频获取音频信息切割拼接音频叠加音频循环播放格式转换视频提取音频 三、视频获取视频信息预览视频视频/Gif 提取图片图片生成视频 / gif图片 音乐合成视频视频提取 gif视频添加文字视频拼接 concatenate_videoclips堆叠 …

音视频处理

问题背景:h265格式的视频转码之后ios存在兼容问题 原转码命令: /usr/local/bin/ffmpeg -y -i /data/tmp/1672385812000-tks3wa.mp4 -vf scale720:1281 -r 30 /data/tmp/1672385812000-tks3wa_720.mp4 -hide_banner解决办法: // 原视频格式为…

tune a video:one-shot tuning of image diffusion models for text-to-video generation

【Diffusion Models】新加坡国立大学、腾讯强强联手Tune-A-Video:One-Shot微调图像扩散模型用于文本到图像的生成!_哔哩哔哩_bilibili【Diffusion Models】新加坡国立大学、腾讯强强联手Tune-A-Video:One-Shot微调图像扩散模型用于文本到图像…

视频 处理

案例 Fu Xianjun. All Rights Reserved. 一.视频信号 视频信号(以下称为视频)是非常重要的视频信息来源,它是信息处理过程中经常要处理的一类信号。实际上,视频是由一系列图像构成的。这一系列图像被称为帧,帧是以固定…

用Python剪辑视频?太简单了

人生苦短,快学Python! 最近我在网上下载一个视频,结果下载到本地是近百个视频片段,为了方便观看只能将这些片段合并为一个视频整体。 不过我并没有搜到能够处理类似情况的小工具,只是发现剪映等软件可以实现视频合并功…

图片与视频的处理

1.首先需要在mac上安装ffmpeg(参考社区的安装教程) 需要先安装drew 然后再安装ffmpeg 2.使用dlib工具进行人脸识别,获取特征点,并输出人脸坐标 import cv2 import dlib import numpy as np import matplotlib.pyplot as pltpat…

基本全局阈值处理

基本全局阈值处理 1、全局阈值处理 (1)计算步骤 通常,在图像处理中首选的方法是使用一种能基于图像数据自动地选择阈值的算法,为了自动选阈值,下列迭代过程采用的就是这样的方法: (1) 针对全局阈值选择初…

基本的全局阈值处理Otsu方法进行最佳全局阈值处理

前言 图像阈值处理在图像分割中处于核心地位!本节将重点介绍一些常见的阈值处理方法。 一、基本的全局阈值处理 选取阈值往往是通过直方图来选择的,一方面我们可以人为的设置一个阈值进行一次二值化处理达到全局阈值处理的目的,但这样的阈值…

阈值调整

1.不平衡分类问题的阈值调整 如上图所示,正负例样本不平衡,负样本多,分类器就会更容易把图片分成负样本,因此要设置阈值, 如何选择阈值: 1.ROC曲线上的最优阈值 2.PR曲线上的最优阈值

神经网络阈值是什么意思,神经网络阈值如何确定

BP神经网络中初始权值和阈值的设定 1、首先需要了解BP神经网络是一种多层前馈网络。2、以看一下在matlab中BP神经网络的训练函数,有梯度下降法traingd,弹性梯度下降法trainrp,自适应lr梯度下降法traingda等。 3、在matlab中命令行窗口中定义输入P&…

图像的阈值处理

一般情况下,一张图片分为前景和背景,我们感兴趣的一般的是前景部分,所以我们一般使用阈值将前景和背景分割开来,使我们感兴趣的图像的像素值为1,不感兴趣的我0,有时一张图我们会有几个不同的感兴趣区域&…

神经网络阈值是什么意思,神经网络的权值和阈值

神经网络权值怎么确定? 神经网络的权值是通过对网络的训练得到的。如果使用MATLAB的话不要自己设定,newff之后会自动赋值。也可以手动:{};{}。一般来说输入归一化,那么w和b取0-1的随机数就行。 神经网络的权值确定的目的是为了让…

opencv c++ 二值图像、阈值计算方法、全局阈值、自适应阈值

1、图像定义: 彩色图像 :三通道,像素值一般为0~255; 灰度图像:单通道,像素值一般为0~255; 二值图像:单通道,像素值一般为0(黑色)、255&#xff08…

图像分割 - 阈值处理 - 全局阈值处理

目录 1. 介绍 2. 代码实现 3. 代码讲解 1. 介绍 当目标和背景像素的灰度分布非常不同的时候,可以对整个图像使用全局阈值 在大多数的应用中,图像之间通常存在足够的变化,全局阈值是一种合适的办法。所以,需要一种对图像做阈值…

硬阈值 软阈值

1 定义 1.1 硬阈值 硬阈值的定义如下: 相当于 1.2 软阈值 软阈值的定义如下: 相当于 1.3 二者对比(可视化解释) 这是一张很经典地表述软阈值和硬阈值区别的图,其中软阈值是蓝色的线,他没有突变&#xff1…