视频理解论文综述

article/2025/8/19 18:04:39

A Comprehensive Study of Deep Video Action Recognition

TSN网络是一个很经典的网络,如果不知道的自己查...

基于TSN的改进论文分了三大类

 

 

其他资料:

Temporal  Segment  Network

 

TSN提出的背景是当时业界做动作识别都是用 Two-stream CNN 和 C3D 比较多,它们都有个通病,就是需要密集采样视频帧,比如 C3D 中使用的是连续采样间隔的16 frames,这样当输入是个Long视频,计算量很庞大~ 故文中就提出了 稀疏时间采样策略

Pros:

通过 Sparse temporal sampling 可以扔掉很多冗余帧,初步满足实际应用的real-time要求

Cons:

  1. 对于Temporal特征欠考虑,更多地是 focus 在 apperance feature
  2. 文中无对比超参K值(Default K=3)的选取对结果的影响 及 Segment内部采样小片策略

Temporal Relation Network

致力于探索时间维度上的关系推理

通过时间维度上 Multi-scale 特征融合,来提高video-level鲁棒性

Pros:

更鲁棒的 action/activity 时空特征表达方式,即 MLP fusion + Multi-scale。

Cons:

Spatial 和 temporal 的联系还是太少,只在最后 embedding feature时用MLP融合了一下~~另应对比不同的fusion方式,如LSTM/GRU与MLP的性能差异~

ECO

使用 TSN 稀疏采样来减少不必要的冗余帧的前提下,对采样帧的 mid/high-level 进行 spatio-temporal 特征fusion,故比 TRN 只在最后特征层来做 temporal fusion的时空表达能力更强~

时空建模新文解读:用于高效视频理解的TSM

文章 first 提出了 temporal shift 这个视角(感觉像是搞硬件底层或芯片的人来跨界融合搞算法一样~~),通过人为地调度 temporal channel 的顺序让网络学到其交互的时空特征,非常地高效实用。

视频理解 S3D,I3D-GCN,SlowFastNet, LFB 参考也是这篇

slowfast 是 slow提取空间信息,有些不变化的信息,fast 提取动作信息,即按照频率的不同来分别提取

lfb 是 使用了个bank来存储  短的video feature 聚合成 long video feature (用了non-local网络聚合效果好)

 

CoST 

构造了Collaborative SpatioTemporal (CoST) operation,仅仅用2D conv即可捕获时空信息。

preview

视频理解之CoST, STM, E3D-LSTM 参考

 

Shift思想在视频理解中的近期进展

ICCV(CVPR) 2019 video action classification

综述论文介绍:MIT写的 Video Action Understanding: A Tutorial

部分参考:

各个任务的不同点

AR问题:视频主流问题模型

视频proposal提出问题:侧面的视频问题模型

存在 context和action frame 分不清的问题,主要解决这个问题,以及怎么更快更好的得到 action边界,即proposal也很重要 

对应目标检测 image

行为检测问题:不仅需要 得到proposal 还需要知道 class 的模型

弱监督和强监督

对应 目标分类问题 image

 

时空object检测问题模型:

 


http://chatgpt.dhexx.cn/article/gVy1KAU6.shtml

相关文章

毕业论文第一步--如何快速写出让人眼前一亮的文献综述论文(citspace)

一、文献综述是什么? 文献综述简称综述,是对某一领域,某一专业或某一方面的课题、问题或研究专题搜集大量相关资料,然后通过阅读、分析、提炼、整理当前课题、问题或研究专题的最新进展、学术见解或建议,对其做出综合性…

论文综述是写什么?

各位客官,走过路过不要错过,现在的你可能是一名刚步入大学的论文新手,也可能是一名刚上大四的学生,正准备开始写毕业论文。那么这篇文章我来给大家讲讲论文的综述是究竟是要写什么,为什么说文献综述奠定了一篇论文的优…

Matlab初始化太慢及相应的设置方法

前几天装的MATLAB2017,但是初始化太慢的问题一直没解决,如下: 等4-5分钟才就绪,真的很浪费时间,然后百度别人的解决方案,看到网上很多是文字描述,实践的截图都没几个(本人喜欢图文解…

matlab四维插值程序,matlab练习程序(向量插值)

有两个向量,我们想从起始向量平滑的过度到终止向量,那么中间的向量就可以通过插值的方式得到。 这在图形学中图形旋转或者机器人中物体姿态旋转都可以用到。 有三种方法:Lerp,NLerp和SLerp。 Lerp为线性插值,公式如下: NLerp为线性插值后归一化,公式如下: SLerp为球面插…

MATLAB程序设计

文章目录 1 程序基础2 数据类型和运算2.1 常量和变量2.2 数值数据2.3 字符数据2.4 逻辑数据类型2.5 日期和时间2.6 单元数组和结构体 3 数组与矩阵3.1创建数组3.2 数组运算3.3 数组处理函数3.3.1 zero/ones函数3.3.2 size/length函数3.3.3 max/min函数3.3.4 isempty函数3.3.5 u…

matlab-m脚本调用simulink无法运行的原因(本身设置了初始化函数

matlab-m脚本调用simulink无法运行的原因(本身设置了初始化函数) 最近从MATLAB中调用simulink模块老是不成功一直提示如下错误: 该错误的意思是,在运行PosControl这个模块之前,它本身还会运行自己设置的初始化函数In…

Isight与MATLAB联合仿真时出现:无法定位或初始化类(unsupported major minor version 52.0)

文章目录 一、报错页面二、解决方法三、仿真示例四、运行注意事项 一、报错页面 Isight 调用MATLAB的时候,MATLAB页面报错,出现如下页面: 二、解决方法 解决方法如下: 双击malab组件 1.选择options 2.Drive Matlab with Jav…

VS2019调用Matlab2019b生成的dll时初始化异常

VS2019调用matlab动态链接库遇到的问题 在Visual Studio中使用C调用Matlab程序VS与MATLAB版本选择VS与MATLAB混编的环境配置初始化异常的解决0xc0000005处理Debug错误:xsd_binder::MalformedDocumentError 在Visual Studio中使用C调用Matlab程序 我目前在写一个用V…

MATLAB一直显示“正忙”或“初始化”

解决方案 1 MATLAB 在启动时,一直停留在“正在初始化”的状态,有可能是因为 MATLAB 一直在找着本机的许可证。 有可能是设置了 LM_LICENSE_FILE 的环境变量。这个变量告诉 MATLAB 或者其他应用程序去哪里查找许可证文件。如果您有一个网络许可证&#xf…

C++和MATLAB混合编程——初始化mwArray失败解决方法!

首先,按这样设置, [填坑]VS2017与MATLAB2016b混合编程(生成dll方式)_清凉简装的博客-CSDN博客_matlab生成dllMATLAB 生成 dll 前的工作1、配置MATLAB环境控制面板->所有控制面板项->系统->高级系统设置->高级->环…

MATLAB打开后一直在初始化,或者初始化很慢问题

问题描述:遇到MATLAB启动较慢,进入主界面后,一直停留在“正在初始化”的状态。浪费很多时间。这种问题大多是因为MATLAB软件在启动时寻找本机的许可证或者是设置了 LM_LICENSE_FILE 的环境变量。这个变量告诉 MATLAB 或者其他应用程序去哪里查…

解决MATLAB一直初始化,加速MATLAB

之前,在做课设时,遇到MATLAB启动较慢,进入主界面后,一直停留在“正在初始化”的状态。浪费很多时间。逛了逛MATLAB中文社区,发现这种问题大多是因为MATLAB软件在启动时寻找本机的许可证或者是设置了 LM_LICENSE_FILE 的…

QT和matlab混合编程以及maltab程序化初始化失败

一. 内容简介 需要用QT调用matlab代码完成计算,并获取计算结果。 二. 软件环境 2.1QT 5.14.1 新版QT6.4,,6.5在线安装经常失败,而5.9版本又无法编译64位程序,所以就采用5.14.1这个用的比较多也比较稳定的一个版本。 QT编译器…

Matlab R2018a初始化问题

前几天装的MATLAB2018(我装在C盘,用的是在线安装,自己下的License破解了),但是初始化问题一直没解决,下面显示我遇到的问题: 等4-5分钟才就绪,真的很浪费时间,然后百度别…

Matlab一直初始化进不去程序之一种解决办法

很多解决办法不行的时候你可以试试在设置里把区域改成中国 究其原因可能是因为破解版的是中国的,然后在联网使用matlab时IP认证不通过

matlab初始化界面卡住,Matlab初始化initializing极慢解决方法

Matlab初始化initializing极慢解决方法 Matlab升级以后,功能的确丰富了好多,有些函数也更加人性话了,好多bug也没有了。但是可恼的是,这个该死的家伙却一天比一天肥,MATLAB7.6a居然达到了3.76G,启动和打开…

12306购票辅助工具

前段时间在GitHub上看到一段刷票的脚步代码,下下来稍稍改了下加了个简陋的UI界面,另外把车站列表等信息弄成了csv文件,方便不改源码的情况下添加车站。 先上核心内容: try:if hasattr(print_func, __call__):print_func(开始刷票…

全网首发:12306抢票算法大曝光?(十张图搞定)

前言 相信大家都有过抢票、刷票的经验,每年年底,这都是一场盛宴。 然而,你有没有想过12306的抢票算法是怎么实现的呢? 没有吧,想过,还是没有头绪? 今天,我们就来曝光让人又爱又恨…

12306自动刷票下单-查票下单

前言 上篇写了12306登录,隔了快一个月了,才准备动手写下单篇,真的要非常感谢博客园的 Asimple朋友,如果不是看到你的留言,我几乎都忘了要写下篇了,这一点在简书上就不好,都没人看/(ㄒoㄒ)/~~&a…

python+selenium实现12306自动登录刷票抢票(自己做黄牛?!)

上一篇写了12306的自动登录破解验证图https://blog.csdn.net/weixin_38283159/article/details/86498159 这篇算是它的后续部分加上了简单的刷票和预订功能,毕竟登录一下没什么实际价值嘛 博主曾被黄牛挣过一百大洋至今还耿耿于怀,不清楚他们到达是如何抢…