阿里巴巴优酷视频增强和超分辨率挑战的冠军方案:VESR-Net

article/2025/8/6 18:52:30

在这里插入图片描述
作者单位:中国科学技术大学、微软亚洲研究院
挑战赛链接:https://tianchi.aliyun.com/competition/entrance/231711/rankingList/1
论文链接:https://arxiv.org/pdf/2003.02115.pdf
译者:Wangsy

看点

视频增强与超分辨率(VESR)旨在从噪声和低分辨率视频帧中恢复高分辨率的细节。为了推动研究从受现实世界退化影响的低质量视频中恢复高质量视频,优酷举办了视频增强和超分辨率挑战赛,以探索在线视频应用程序中真实退化的数据集的VESR解决方案。
本文介绍了VESR-Net,它在优酷VESR挑战赛中获得第一名。具体的说:

  1. 设计了一个独立的非局部(Separate NL)模块来有效地探索视频帧之间的关系并对视频帧进行融合;
  2. 设计了一个通道注意残差块(CARB),用于在VESR网络中捕获视频帧重构的特征映射之间的关系。
    在这里插入图片描述

Youku-VESR挑战

挑战赛了收集1000个1080p视频片段,包括高分辨率和低分辨率视频对。该数据集包含了多种类型的内容,在在线视频观看应用中,低分辨率视频会受到不同噪声的影响。
挑战阶段:第一阶段,所有参与者得到200对LR和HR视频用于训练,50对LR视频用于评估。第二阶段,Youku发布650对LR和HR视频用于培训,100对LR视频用于验证。第二阶段的LR视频比第一阶段的视频退化更严重。在本文所提及的方法中,对于一共1000个视频片段,分割了50个视频用于评估,剩下的视频用于训练。
评估阶段:评估阶段定量指标是峰值信噪比(PSNR)和视频多方法评估融合(VMAF)。测试为前5个视频中的所有帧和剩下视频中的每隔5帧的下一帧。

方法

overview

VESR-Net由两部分组成:帧间融合的融合模块和帧内融合的重构模块。融合模块的目标是通过从相邻帧中提取有用信息,同时忽略时间冗余信息来融合相邻帧进行中间帧重建。因此,本文提出了一个独立的非局部模块来模拟视频特征之间的关系。在帧重建模块中,我们在残差块中引入了通道注意机制,以实现高效重建。
在这里插入图片描述
每个模块的具体网络架构如下表:
在这里插入图片描述

独立的非局部模块

在计算机视觉中的自注意机制称为非局部神经网络。然而,由于非局部神经网络中关系矩阵的高维性,非局部运算消耗了大量的参数,尤其是对于视频特征。因此,本文设计了一种新的称为独立非本地的模块,在较浅的网络中可以达到更好的性能。本文设计了三种类型的注意模块,以探索不同维度的全局上下文信息。首先,在三个分支中分别生成两个新的特征映射A1、A2、A3和B1、B2、B3。然后将它们reshape到C×T×(N×W)、T×H×W×C、C×H×W×T,通过矩阵乘法得到三个关系矩阵 M 1 ∈ R H W × H W 、 M 2 ∈ R C × C 、 M 3 ∈ R T × T M1∈\mathbb R^{HW×HW}、M2∈\mathbb R^{C×C}、M3∈\mathbb R^{T×T} M1RHW×HWM2RC×CM3RT×T。M1、M2和M3分别表示不同空间上下文、不同通道和不同时间步长之间的相似性。同时,我们将视频特征F输入到三个卷积层中,生成新的与B在同一空间中的特征映射D1、D2、D3。接下来,对D1,D2,D3的转置与M1,M2,M3进行矩阵乘法,得到结果E1,E2,E3。最后,我们在E1,E2,E3和F之间进行元素和运算,得到融合特征。
在这里插入图片描述

通道注意残差块

重建模块中残差块中的通道注意机制是VESR高效重构和良好性能的基础。在CARB中,首先执行全局平均池化获取通道描述W。然后通过两个线性层得到通道权值Z,并将通道权值Z与视频特征X相乘,最后将相乘的结果与视频特征进行concat,输入进1×1卷积层得到最终输出。
在这里插入图片描述

实验

消融实验

对提出的独立非局部模块和通道注意残差块进行消融实验,并与EDVR s m a l l _{small} small进行对比。(此处没有给两个模块都没有的实验数据,如果两个模块都没有就比EDVR性能好,该论文就没有很大的意义了,不如去讲讲没有这两个模块为什么还会比EDVR性能好)
在这里插入图片描述

量化评估

为了公平比较,EDVR s m a l l _{small} small作为baseline采用了20个残差块,其参数数量与VESR-Net s m a l l _{small} small相当。在设计的独立非局部模块和通道注意残差块的帮助下,VESR-Net比EDVR网提高了0.22dB,并且计算复杂度较低。
在这里插入图片描述


http://chatgpt.dhexx.cn/article/7akRXCqb.shtml

相关文章

优酷网架构分析

记得以前给大家介绍过视频网站龙头老大YouTube的技术架构,相信大家看了都会有不少的感触,互联网就是这么一个神奇的东西。今天我突然想到,优酷网在国内也算是视频网站的老大了,不知道他的架构相对于YouTube是怎么样的,…

将腾讯视频优酷视频引入到自己网站embed标签的(仅支持PC端)

2019独角兽企业重金招聘Python工程师标准>>> 腾讯视频&#xff1a; 视频原地址&#xff1a; 1&#xff1a;https://v.qq.com/x/cover/ipm2meuu857sw3e.html 2&#xff1a;https://v.qq.com/x/cover/1t9erwhksw1w712.html?vidw0022c2qlrm <embed src“https://im…

优酷、YouTube、Twitter及JustinTV视频网站架构设计笔记

本文是整理的关于优酷、YouTube、Twitter及JustinTV几个视频网站的架构或笔记&#xff0c;对于不管是视频网站、门户网站或者其它的网站&#xff0c;在架构上都有一定的参考意义&#xff0c;毕竟成功者的背后总有值得学习的地方&#xff0c;虽然有些文章的发表时间有点久了&…

go语言实战-----31-----流媒体架构设计之直播架构、音视频通话(常见 流媒体协议 解释)

一 直播架构 直播架构例如以某主播在某直播平台直播为例&#xff1a; 1&#xff09;首先向平台请求直播url。2&#xff09;主播得到url。3&#xff09;然后主播开始往该url推流&#xff0c;实际最终是推流至流媒体服务器。4&#xff09;此时&#xff0c;当有用户观看时&#…

优酷网架构

记得以前给大家介绍过视频网站龙头老大YouTube的技术架构&#xff0c;相信大家看了都会有不少的感触&#xff0c;互联网就是这么一个神奇的东西。今天我突然想到&#xff0c;优酷网在国内也算是视频网站的老大了&#xff0c;不知道他的架构相对于YouTube是怎么样的&#xff0c;…

视频综合平台系统架构分析-1

一. 视频综合平台意义 视频综合平台这类设备之前都称为数字视频矩阵。此类设备以其强大的性能&#xff0c;丰富的功能和极高的集成度成为监控中心核心设备。其架构支持视频综合平台同时接入和管理上千路的高清视频数据而不会卡顿崩溃&#xff0c;特别是内部设计了双高速总线成…

大数据环境下的优酷视频数据分析与推荐系统

优酷视频网是中国最具影响力的网络媒体和具有全球影响力的中文视频网站&#xff0c;研究优酷视频标题的网络抓取技术&#xff0c;研究标题语料库的数据库设计方法和用户接口设计实现方法&#xff0c;标题语料的字词处理方法&#xff0c;实现标题语料字词检索、增删改查、统计、…

优酷、YouTube、Twitter及JustinTV几个视频网站的架构

优酷视频网站架构 一、网站基本数据概览据2010年统计&#xff0c;优酷网日均独立访问人数&#xff08;uv)达到了8900万&#xff0c;日均访问量&#xff08;pv&#xff09;更是达到了17亿&#xff0c;优酷凭借这一数据成为google榜单中国内视频网站排名最高的厂商。硬件方面&am…

已开源 优酷动态模板研发体系为分发提效30%

概述 优酷是一个多屏、多端&#xff0c;以内容分发及内容消费为主体的文娱生态综合体。 在内容分发场景&#xff0c;存在大量的客户端开发需求&#xff0c;包括视觉升级、各场景的业务需求迭代、大小屏设备需求同步等&#xff0c;为了降低研发在跨端场景中组件重复开发的技术成…

优酷youku 1080P 视频下载方法

> PC端下载优酷视频方法,以下是优酷视频下载地址解析python脚本 import re, requests, time, subprocess, json, base64 from hashlib import md5class YouKu:def __init__(self, cookie):self.cookie cookiedef youku_sign(self, t, data, token):appKey 24679788 …

亿级短视频,如何架构?

说在前面 在尼恩的&#xff08;50&#xff09;读者社群中&#xff0c;经常指导大家面试架构&#xff0c;拿高端offer。 前几天&#xff0c;指导一个年薪100W小伙伴&#xff0c;拿到字节面试邀请。 遇到一个 非常、非常高频的一个面试题&#xff0c;但是很不好回答&#xff0…

优酷网视频存储架构

视频分享网站总会面对这样两个问题&#xff1a;视频资源能否吸引网民以及视频浏览是否顺畅&#xff1f;中国互联网协会互联网数据中心发布的《2008上半年视频网站数据》显 示&#xff0c;2008年上半年&#xff0c;优酷网月度总访问时长突破1.1亿小时&#xff0c;通过与全行业的…

Java实现简单在线播放器——支持优酷和土豆

今天本来是打算继续写“Java新浪微博客户端开发”的&#xff0c;也实现了“系统托盘”&#xff0c;“点击查看大图”的功能&#xff0c;写到一半&#xff0c;想起上篇博文中有CSDN有一网友提及客户端中播放微博的视频的功能&#xff0c;自己之前完成的客户端也没实现这功能&…

优酷弹幕穿人「渲染技术」揭秘

弹幕穿人功能&#xff0c;能使用户在弹幕刷屏的情况下&#xff0c;又不错过人物画面。因此&#xff0c;弹幕穿人功能一经推出就受到了广大用户的喜爱。 就技术方案而言&#xff0c;弹幕穿人方案可以分为以下两大类&#xff1a;“云端离线人体分割端侧渲染”和“端侧实时人体分割…

学习笔记:RTC时钟

学习笔记&#xff1a;RTC时钟 1.什么是RTC (1) RTC是个独立的定时器。RTC拥有一个连续计数的计数器。 &#xff08;2)注意&#xff1a;RTC模块和时钟配置系统&#xff08;RCC_BDCR寄存器&#xff09;工作在后备区域&#xff0c;系统断电或者复位不会影响RTC的设置和事件&…

STM32-RTC实时时钟

RTC实时时钟 RTC&#xff08;Real Time Clock&#xff09;是个独立的定时器。RTC模块拥有一个连续计数的计数器&#xff0c;在相应的软件配置下&#xff0c;可以提供时钟日历的功能。修改计数器的值可以重新设置当前时间和日期。 RTC模块和时钟配置系统&#xff08;RCC_BDCR寄…

STM32的RTC时钟的获取

STM32的RTC时钟的获取 硬件 1.STM32F103RCT6最小系统板&#xff08;mini&#xff09; 2.下载器&#xff08;我这里使用的ST-linkV2&#xff09; 3.纽扣电池 软件 1.keil5 &#xff08;MDK&#xff09; 2.STM32CuBe MX&#xff08;因为比较方便嘛&#xff0c;其实也可以拖库&…

STM32 RTC时钟掉电日期不更新 STM32 HAL库RTC时钟配置

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 STM32 RTC时钟掉电日期不更新 & STM32 HAL库RTC时钟配置 一、STM32CubeMX RTC配置二、RTC初始化三、RTC日期掉电不更新(F1...这里暂时只考虑F103&#xff0c;其他系列未测…

STM32CubeMX | 基于STM32使用HAL库驱动RTC时钟及闹钟功能

STM32CubeMX | 基于STM32使用HAL库驱动RTC时钟及闹钟功能 目录 STM32CubeMX | 基于STM32使用HAL库驱动RTC时钟及闹钟功能&#xff08;一&#xff09;工程配置&#xff08;二&#xff09;代码编写&#xff08;三&#xff09;运行效果 本章实现效果&#xff1a; RTC时钟获取周期…

STM32G4之RTC实时时钟

文章目录 前言一、RTC介绍二、STM32CubeMX配置三、部分源码总结 前言 一、RTC介绍 STM32 的 RTC 外设&#xff08;Real Time Clock&#xff09; &#xff0c;实质是一个掉电后还继续运行的定时器。STM32G4 的 RTC&#xff0c;是一个独立的 BCD 定时器/计数器。 RTC 提供一个日历…