AVS2技术概述

article/2025/8/28 10:55:48

转自公众号“智媒之音”:https://mp.weixin.qq.com/s?__biz=MzI5Nzc4OTkxOQ==&mid=2247483715&idx=1&sn=bb28272fd9b2baad9d4cccbe7c8ddcea&chksm=ecaef1f3dbd978e56764beb9d8ac69c753f3635716e9c449362f34f3c9e738870b1ffa00df4e#rd

AVS2采用了传统的混合编码框架,整个编码过程包括帧内预测、帧间预测、变换量化、环路滤波和熵编码等模块。具有如下技术特征:


图1 AVS2编码框架

1.  编码结构划分

为了满足高清和超高清分辨率视频对压缩效率的要求,AVS2采用了更加灵活的基于四叉树的块划分结构,最大编码单元(Coding Unit,CU)为64×64,最小编码单元为8×8。同时, AVS2还采用了灵活的预测单元(Prediction Unit,PU)和变换单元(Transform Unit,TU)。待编码图像先被分割成固定大小的最大编码单元(Largest Coding Unit,LCU),然后按四叉树的方式迭代划分为一系列的CU。每个CU包含一个亮度编码块和两个对应的色度编码块(下文中块单元的大小指亮度编码块)。


图2原始图像、LCU和CU之间的关系以及四叉树的划分结构

 

预测单元PU是进行帧内预测和帧间预测的基本单元,它的尺寸不能超过当前所属CU。AVS2在上一代标准中的正方形帧内预测块的基础上,增加了非正方形的帧内预测块划分,同时,帧间预测也在对称预测块划分的基础上,增加了4种非对称的划分方式。


图3 帧内和帧间预测单元划分方式

 

除了CU和PU,AVS2还定义了用于预测残差变换和量化的变换单元TU。TU是变换和量化的基本单元,与PU一样,定义在CU之中。对于帧内模式,TU同PU绑定,大小相同。对于帧间模式,TU可以选择大块划分或小块划分。大块划分即将整个CU作为一个TU;小块划分时,CU块将被划分成4个小块TU,其尺寸的选择与对应的PU相关联,如果当前CU被划分为非方形PU,那么对应的TU将使用非方形的划分;否则,使用相应的方形划分类型。

 

2.  帧内预测编码

帧内预测可以消除待编码图像在空域上的冗余。AVS2支持33种帧内预测模式 ,包括DC预测模式、Plane预测模式、Bilinear预测模式和30种角度预测模式。相比于AVS1和H.264/AVC,AVS2提供了更丰富、更细致的帧内预测模式。同时,为了提高精度,AVS2采用了1/32精度的分像素插值技术,分像素的像素点由4触头的线性滤波器插值得到。在色度块上有5种模式:DC模式、水平预测模式、垂直预测模式、Bilinear预测模式以及新增的亮度导出(Derived mode, DM)模式。


图4 亮度块帧内预测模式

3.  帧间预测编码

与帧内预测不同,帧间预测用于消除时域上的冗余。和上一代AVS1和H.264/AVC编码标准相比,AVS2的帧间预测技术在预测模式上进行了加强和创新。

 

传统的帧间预测技术只有P帧和B帧,P帧是前向参考帧,预测单元只能向前参考一帧图像中的预测块,B帧是双向参考帧,预测单元可以向前和/或向后各参考一帧图像中的预测块。AVS2在此基础上,增加前向多假设预测F帧;针对视频监控、情景剧等特定的应用,设计了场景帧(G帧和GB帧)和参考场景帧S帧。

 

对于B帧,除了传统的前向、后向、双向和skip/direct模式,AVS2拥有独特的对称模式。在对称模式中,仅需对前向运动矢量进行编码,后向运动矢量通过前向运动矢量推导得到。

 

对于F帧,预测单元可以参考前向两个参考块,相当于P帧的多帧参考。AVS2将双假设预测分为两类,分别是时域双假设和空域双假设。时域双假设的当前预测块利用预测块加权平均作为当前块的预测值,但运动矢量差MVD和参考图像索引都只有一个,另外一个MVD和参考图像索引根据时域上的距离按线性缩放推导出来。而空域双假设预测也叫方向性多假设预测(Directional multi-hypothesis prediction,DMH),通过融合初始预测点周围的两个预测点得到,而且初始预测点位于这两个预测点的连线上。

图5 时域的双假设预测

图6 空域的双假设预测(DMH)

4.  运动矢量预测

运动矢量预测技术利用了相邻块的相关性,根据已编码相邻块的运动信息对当前待编码块的运动矢量进行预测,只对运动估计得到的运动矢量MV和预测运动矢量MVP的差值进行编码,从而降低用于编码运动矢量的比特数,节省码率。

 

在AVS2中,针对不同的帧间预测模式,采用了4种运动矢量预测方法:均值预测、空域预测、时域预测、空域和时域混合预测。为了进一步节省码率,当MVP和运动估计得到的MV大于某一阈值时,使用1/2精度的MV和MVD,否则仍然使用1/4精度。

5.  变换

变换的目的在于去除空间上的相关性,将空间信号的能量集中到频域的小部分低频系数上,然后对这些变换系数进行后续编码处理。AVS2中的变换编码主要使用整数DCT变换。对于4×4、8×8、16×16、32x32大小的变换块直接进行整数DCT变换。而对于64×64大小的变换块则采用一种逻辑变换,先进行小波变换,再进行整数DCT变换。在DCT变换完成后,AVS2对低频系数的4×4块再进行二次4×4变换,从而进一步降低系数之间的相关性,是能量更集中。

图7 4×4二次变换

 

6.  熵编码

AVS2的熵编码首先将变换系数分为4×4大小的系数组(Coefficient Group,CG),然后根据系数组进行zig-zag扫描和基于上下文的二元算术编码。系数编码先编码含有最后一个非零系数的CG位置,接着编码每一个CG,直到CG系数都编码完为止,这样可以使得0系数在编码过程中更集中。

 

7.  环路滤波

为了消除块效应、振铃效应、色度偏移和图像模糊等影响主观视觉的不良效果,AVS2的环路滤波包含三个部分:去块滤波、自适应样点偏移和样本补偿滤波。去块滤波的目的在于消除由于变换量化引起的块效应,基本的滤波单元为8×8的块,首先对垂直边界进行滤波,然后是水平边界。对每条边界根据滤波强度不同选择不同的滤波方式。

 

在去块滤波之后,采用自适应样本偏移补偿进一步减小失真。有两种补偿模式:边界补偿和边带补偿。边界补偿又分为垂直、水平、斜上和斜下四个滤波方向。边带补偿根据像素点重建值的振幅对每条边带加上不同的偏移值。

 

在去块滤波和样本偏移补偿之后,AVS2又添加了自适应滤波器,一种7×7十字加3×3方形中心对称的维纳滤波。利用原始无失真图像和编码重构图像计算最小二乘滤波器系数,并对重构图像进行滤波,降低重建图像中的压缩失真,提升参考图像质量。

 

8.  场景编码

对监控视频、情景剧等特殊场景来说,视频图像的冗余很大一部分来自于背景。因此,AVS2设计了一种基于背景模型的监控工具来提高这些特定场景的压缩效率。未打开监控工具时,I帧只给下个随机访问点之前的图像做参考。打开监控工具后,AVS2会用视频中的某一帧做场景图像G帧,G帧对于后面的图像可以作为长期参考。此外,为了防止编码背景帧导致码率陡增,在传输上产生较大的延迟,AVS2采用了一种基于块更新的背景参考帧技术,在每一帧编码图像中选择不超过一定比例的LCU作为背景刷新块,在编完一帧之后对背景帧参考图像进行刷新。


图8 基于背景模型的场景帧

 

总结

AVS2在传统的编码技术上进行了很多的改进和创新,例如帧间预测部分新增了F帧、背景帧等,因此才能将视频的压缩效率大幅提高。尤其是场景编码,基于背景模型的编码方法大大提高监控视频等场景的压缩效率,比国际同期标准超过了一倍。以上就是AVS2标准的技术概述,接下来的《标准解说》专栏将对AVS2中的技术按模块进行详细地介绍。

 



http://chatgpt.dhexx.cn/article/RWgpPKmw.shtml

相关文章

【金三银四】设计模式面试题(2021最新版)

目录 前言 1.什么是设计模式 2.为什么要学习设计模式 3.设计模式分类 4.设计模式的六大原则 5.单例模式 5.1 什么是单例 5.2 哪些地方用到了单例模式 5.3 单例优缺点 5.4 单例模式使用注意事项: 5.5 单例防止反射漏洞攻击 5.6 如何选择单例创建方式 5.…

【Java架构师面试题】设计模式面试专题(共35题含答案)

设计模式(DesignPattern)是前辈们对代码开发经验的总结,是解决特定问题的一系列套路。它不是语法规定,而是一套用来提高代码可复用性、可维护性、可读性、稳健性以及安全性的解决方案。 本篇为设计模式面试专题,总共收…

一文整理总结常见Java后端面试题系列——设计模式篇(2022最新版)

关于作者 🐶 程序猿周周 ⌨️ 短视频小厂BUG攻城狮 🤺 如果文章对你有帮助,记得关注、点赞、收藏,一键三连哦,你的支持将成为我最大的动力 本文是《后端面试小册子》系列的第 1️⃣2️⃣ 篇文章,该系列将整…

C++面试题之设计模式及设计原则

六大设计原则 1)单一职责原则 类的职责单一,对外提供一个功能,函数也支持; 2)里氏替换原则 任何抽象类的出现都可以用他的实现类进行替换。 3)依赖倒置原则 依赖于抽象,不要依赖具体实现&#…

23种设计模式(常见面试题)

23种设计模式(常见面试题) 1.什么是设计模式? 答: 设计模式(Design Pattern)是前辈们对代码开发经验的总结,是解决特定问题的一系列套路。是一套用来提高代码可复用性、可维护性、可读性、稳健…

设计模式面试题(总结最全面的面试题!!!)

文章目录 设计模式什么是设计模式为什么要学习设计模式设计模式分类设计模式的六大原则开放封闭原则(Open Close Principle)里氏代换原则(Liskov Substitution Principle)依赖倒转原则(Dependence Inversion Principle…

【2022最新Java面试宝典】—— 设计模式面试题(14道含答案)

目录 1.什么是设计模式2.为什么要学习设计模式3.设计模式分类4.设计模式的六大原则5.单例模式1.什么是单例2.那些地方用到了单例模式3.单例优缺点4.单例模式使用注意事项:5.单例防止反射漏洞攻击6.如何选择单例创建方式7.单例创建方式 6.工厂模式1.什么是工厂模式2.…

java高频面试题-设计模式

1 你所知道的设计模式有哪些? Java 中一般认为有 23 种设计模式,我们不需要所有的都会,但是其中常用的几种设计模式应该去掌握。下面列出了所有的设计模式。需要掌握的设计模式我单独列出来了,当然能掌握的越多越好。 总体来说设…

Java常见设计模式面试题及答案

文章目录 1.设计模式是什么?你是否在代码中使用过?2. JDK 中常用的设计模式有哪些?3.单例模式是什么?请用 Java 写出线程安全的单例模式4.在 Java 中,什么叫观察者模式(observer design pattern&#xff09…

JAVA常见设计模式面试题

一、单例模式 java中单例模式是一种常见的设计模式,单例模式的写法有好几种,这里主要介绍三种:懒汉式单例、饿汉式单例、双重检查锁定 1.单例模式有以下特点:   a、单例类只能有一个实例。   b、单例类必须自己创建自己的唯一…

设计模式面试题

设计模式 详解 设计模式 参考: https://www.jianshu.com/p/fc4b2e679a1e 单例模式 整个应用中保证只有一个类的实例存在 参考: https://mp.weixin.qq.com/s/dlVXW6aW4wLcLpey9NxPig 饿汉式单例类 懒汉式单例类 instance new SingletonClas…

设计模式面试题(设计模式速成版)

文章目录 说明名词解释UML基础面向对象编程中,都有哪些设计原则开闭原则里氏替换原则(Liskov Substitution Principle)依赖转置(依赖倒置)原则单一职责原则接口隔离原则迪米特法则合成复用原则 设计模式的分类创建型模…

【前端面试题】06—16道设计模式面试题(附答案)

设计模式不是针对某个框架的,而是针对某类问题或某类需求提出的,因此有广泛的适用性。 我们学习设计模式不仅要学习理论,还要学习如何解决实际工作中的问题,所以在面试中,设计模式通常是结合某类需求考察的。 1、什么是…

❤️设计模式肝完了,还挺全!腾讯和阿里的offer已拿!❤️

设计模式肝完了,还挺全!腾讯和阿里的offer已拿! 金九银十已经来了,挺近大厂最好的机会已经来了!如果你是要找工作的,一定要抓住这个机会! 前面已经整理了很多的面试资料: 1&#x…

「面试必背」设计模式面试题(收藏)

前言 设计模式在日常的工作中,是非常重要的一项技能,使用设计模式可以重构整体架构代码、提交代码复用性、扩展性、减少代码冗余问题。这是每个 Java 工程师必备的技能!今日小编主要讲的是设计模式之一的策略模式,小编会通过案例…

textRank杂谈

转自:这些文章 1. PageRank算法概述 PageRank,即网页排名,又称网页级别、Google左侧排名或佩奇排名。 是Google创始人拉里佩奇和谢尔盖布林于1997年构建早期的搜索系统原型时提出的链接分析算法,自从Google在商业上获得空前的成功后&#xff…

人工智能自然语言处理—PageRank算法和TextRank算法详解

人工智能自然语言处理—PageRank算法和TextRank算法详解 一、PageRank算法 PageRank算法最初被用作互联网页面重要性的计算方法。它由佩奇和布林于1996年提出,并被用于谷歌搜索引擎的页面排名。事实上,PageRank可以在任何有向图上定义,然后…

TextRank算法学习及使用

文章目录 一、算法思想二、python代码实现三、TextRank算法使用1、textrank4zh模块的安装2、实例介绍 总结 参考资料: 文本关键词抽取、文本摘要生成是自然语言处理(NLP)的应用之一,一定会对我们的生活产生巨大影响。随着数字媒体…

自然语言处理NLP--TextRank算法

文本摘要方法 早在20世纪50年代,自动文本摘要已经吸引了人们的关注。在20世纪50年代后期,Hans Peter Luhn发表了一篇名为《The automatic creation of literature abstract》的研究论文,它利用词频和词组频率等特征从文本中提取重要句子&…

【自然语言处理】基于TextRank算法的文本摘要

基于TextRank算法的文本摘要 文本摘要是自然语言处理(NLP)的应用之一,一定会对我们的生活产生巨大影响。随着数字媒体的发展和出版业的不断增长,谁还会有时间完整地浏览整篇文章、文档、书籍来决定它们是否有用呢? 利…