Decoupled Sparial-Temporal Attention Network forSkeleton-Based Action Recognition

article/2025/10/10 13:32:08

Abstract

解决问题:以前的方法严重依赖于手工设计的遍历规则图像拓扑结构来对关节之间的依赖关系建模。

方法:提出了一种新的解耦时空注意网络(DSTA-Net),允许对关节之间的时空依赖关系建模,无需知道位置以及相互连接关系。

具体来说,提出了三种注意力相关的模块:时空注意力解耦、解耦位置编码和空间全局正则化。

在数据方面,引入了骨骼数据解耦技术,以强调空间/时间和不同运动尺度的特定特征。

Introduction

骨骼数据优点:在少量数据中包含高级语义信息;对动态环境有很强的适应性。

骨骼数据的组成:一系列帧,每个帧包含一组点,每个点以2D/3D坐标表示一个人的关节。

常见的处理方式:将骨架数据依据遍历规则和拓扑结构转化为有意义的形式:点序列、伪图像…但手工设计的规则无法保证对关节的全局相关性建模了。

使用自我注意力机制的好处

  1. 以计算复杂度小学习元素之间的全局相关性;
  2. 不需要知道元素之间的内在关系,都可以自己学;
  3. 人体关节数量小,自注意力机制额外成本也小。

将自注意力机制应用于骨骼数据的难点于解决方案

  1. 原始的自注意力机制的输入是顺序数据,而骨骼数据存在于空间和时间维度;简单地将时空数据转化为单一序列是不可取的,本文将注意力机制分解为空间注意力和时间注意力;
  2. 将骨骼送入网络时,没有预定义顺序或结构。因此,引入了位置编码,分为空间编码和时间编码;
  3. 在先验知识基础上加入适当正则化,可以避免拟合;基于骨架关节特定的物理意义,提出空间全局正则化方法,迫使模型学习更多注意力;由于正则化不适用于时间维度,所以没有这样的语义对齐属性。

处理数据的技巧

  1. 将每一个数据分为动作相关与动作无关部分。于是将数据分解为空间维度和时间维度。空间流至包含与运动无关的特征;时间流只包含与运动相关的特征。比如向上挥手和向下挥手,通过空间流数据确定手的形状,通过时间流数据确定挥动方向。
  2. 对于时间流,分为短期动作与长期动作,因此需要有区别的对模型的处理方式进行区分,因此根据采样率分为了快流和慢流。低帧速率流捕获全局信息,高帧速率流关注细节信息。两个流融合提高性能。

Expriment

  1. 证明了位置编码在该任务中的重要性以及位置编码解码为时间属性和空间属性的必要性;
  2. 证明了存在空间全局正则化的必要性以及不需要时间全局正则化;
  3. 证明了单帧建模性能次于帧间建模词次于折衷建模。

请添加图片描述
策略1:仅对考虑帧中关节的依赖关系;

策略2:计算所有帧之间的两个关节的关系,这意味着同时考虑了两个关节的帧内关系和帧间关系;会引起过度拟合问题。

策略3: 只考虑相同帧中的关节来计算,但获得的所有帧的注意力map是平均的和共享的。

在注意力图像中有两点结论:

  1. 较低层次,更关注指尖和手腕的关系,因为这些关节对识别人类手势更具有辨识能力;
  2. 在高层,信息高度聚合,每个关节之间的差异变得不明显。

http://chatgpt.dhexx.cn/article/59DxMCdX.shtml

相关文章

3、RDD-Single-Stage Rotation-Decoupled Detector for Oriented Object

3、RDD-Single-Stage Rotation-Decoupled Detector for Oriented Object code: https://github.com/Capino512/pytorch-rotation-decoupled-detector 1.Abstract 2.Introduction 贡献: 文章提出一种新的单阶段检测算法用于有效且准确的方向性目标检…

基于Yolov5的道路缺陷识别,加入CVPR2023 InceptionNeXt、华为诺亚2023 VanillaNet、ASFF、EVC、Decoupled_Detect、TSCODE、WIoU优化

目录 1.数据集介绍 1.1数据增强,扩充数据集 1.1.1 通过split_train_val.py得到trainval.txt、val.txt、test.txt 1.1.2 通过voc_label.py得到适合yolov5训练需要的 2.基于yolov5的道路缺陷识别 2.1配置 crack.yaml 2.2 修改yolov5s_crack.yaml 2.3训练道路缺…

【Decouple】《Improving Semantic Segmentation via Decoupled Body and Edge Supervision》

ECCV-2020 作者分享:https://www.techbeat.net/talk-info?id462 Code:https://github.com/lxtGH/DecoupleSegNets 文章目录 1 Background and Motivation2 Related Work3 Advantages / Contributions4 Method4.1 Decoupled segmentation framework4.2 …

【CVPR2021】Decoupled dynamic filter networks

论文:https://thefoxofsky.github.io/files/ddf.pdf 代码:https://github.com/thefoxofsky/ddfnet 主页:https://thefoxofsky.github.io/project_pages/ddf 先从论文首页的图说起。第一行为普通静态卷积,对于道路、车辆、建筑使用…

阅读Decoupled Spatial-Temporal Attention Network for Skeleton-Based Action Recognition

基于骨骼动作识别的解耦时空注意网络 paper:https://arxiv.org/abs/2007.03263 文章目录 AbstractIntroductionMethod3.1 Spatial-temporal attention module 3.2 Decoupled Position encoding3.3 Spatial global regularization3.4 Complete attention module3.5 O…

[论文评析]Decoupled Knowledge Distillation, CVPR2022

[论文评析]Decoupled Knowledge Distillation, CVPR2022 文章信息动机方法Basic notionsKL Loss重要发现伪码 思考References 文章信息 题目:Decoupled Knowledge Distillation 发表: CVPR ,2022 作者:Borui Zhao 11,…

Decoupled head(解耦合头)和Coupled head(耦合头)

👻解耦合头和耦合头是目标检测中常见的两种头部设计,用于从检测网络的特征图中提取目标位置和类别信息。 (先看概念,概念看不懂可以直接看图一定能懂😁) 文章目录 耦合头(Coupled head&#xf…

#Reading Paper# 【序列推荐】SIGIR 2022 Decoupled Side Information Fusion for Sequential Recommendation

#论文题目:【序列推荐】Decoupled Side Information Fusion for Sequential Recommendation(DIF-SR:用于序列推荐的辅助信息解耦) #论文地址:https://arxiv.org/pdf/2204.11046.pdf #论文源码开源地址:http…

yolox Head-Decoupled head源码解读

目录 前言 yolox网络结构 yolox head网络结构 head组件及对应源码 解码 前言 yolox backbone部分介绍 yolox neck部分介绍 yolox:https://github.com/Megvii-BaseDetection/YOLOX yolox详细解读可参考:https://jishuin.proginn.com/p/763bfbd628ce yolox网络…

Decoupled Knowledge Distillation——目标分布与非目标分布相解耦

通过传统知识蒸馏的解耦分析,DKD(Decoupled Knowledge Distillation)重新审视了暗知识的本质,并通过蒸馏损失函数的改进、获得DKD loss,显著改善了任务相关知识迁移的效果: Paper地址:https://a…

【GCN-CTR】DC-GNN: Decoupled GNN for Improving and Accelerating Large-Scale E-commerce Retrieval WWW22

《DC-GNN: Decoupled Graph Neural Networks for Improving and Accelerating Large-Scale E-commerce Retrieval》(WWW’22) 在工业场景中,数百亿节点和数千亿的边直接端到端的GNN-based CTR模型开销太大,文章把整个GNN框架解耦成三阶段:预…

(2019.01, iclr) Decoupled Weight Decay Regularization

code: https://github.com/loshchil/AdamW-and-SGDW 除了纯SGD, L2 ! weight_decay 背景知识: sgd with momentum和adam,详见《深度学习》: L2 regulization and weight decay: https://benihime91.github.io/blog/machinelearning/deeplearning/python3…

Decoupled Novel Object Captioner

Decoupled Novel Object Captioner AbstractIntroductionMethodsPreliminariesZero-Shot Novel Object Captioning.Sequence Model with the PlaceholderKey-Value Object MemoryFramework OverviewTraining Reference Reference[原文]: Joselynzhao.top & 夏木青 | Decoup…

Video Anomaly Detection by Solving Decoupled Spatio-Temp

Video Anomaly Detection by Solving Decoupled Spatio-Temp 什么是SSL? Self-Supervised Learning,又称为自监督学习什么是多标签分类问题: 一个数据有多个标签pretext 任务: 简单的来说,通过另一个任务简介完成主任务 比如,要训…

魔改YOLOv5/YOLOv7高阶版——改进之结合解耦头Decoupled_Detect

💖💖>>>加勒比海带,QQ2479200884<<<💖💖 🍀🍀>>>【YOLO魔法搭配&论文投稿咨询】<<<🍀 ✨✨>>>学习交流 | 温澜潮生 | 合作共赢 | 共同进步<<<✨✨

Distilling Object Detectors via Decoupled Features

Abstract 相比于图像分类而言&#xff0c;目标检测器更加复杂&#xff0c;具有多个损失函数。而目前的的检测中&#xff0c;其主要将注意力集中在对象的区域中&#xff0c;但本文指出&#xff0c;从背景中提取的特征信息对于学生模型的学习也是必不可少的。且由于目标区域和背…

Decoupled Attention Network for Text Recognition

摘要&#xff1a; 最流行的文字检测的方法是注意力机制&#xff0c;但是大多数的注意力机制方法由于循环的对齐操作会导致严重的对齐问题。因为对齐操作依赖于历史解码信息。 本文提出的DAN将对齐操作与历史解码信息解耦。 原理&#xff1a; Connectionist temporal classifi…

涨点技巧:Detect系列---Yolov5/Yolov7加入解耦头Decoupled_Detect,涨点明显

目录 1. Decoupled Head介绍 2.Yolov5加入Decoupled_Detect 2.1 DecoupledHead加入common.py中&#xff1a; 2.2 Decoupled_Detect加入yolo.py中&#xff1a; 2.3修改yolov5s_decoupled.yaml 3.数据集下验证性能 &#x1f3c6; &#x1f3c6;&#x1f3c6;&#x1f3c6;&…

Decoupled Contrastive Learning 论文解读和感想

本文首先提出了当前对比学习的三大痛点&#xff1a; 1、当前的sota方法结构都过于复杂 2、对比学习要想取得效果&#xff0c;必须要用大batch 3、超参敏感(个人认为这里说的超参是指数据增强方式) 然后本文以SimCLR为例&#xff0c;通过对对比损失的梯度进行分析&#xff0c;发…

DECOUPLED WEIGHT DECAY REGULARIZATION

引言 Adam作为一个常用的深度学习优化方法&#xff0c;提出来的时候论文里的数据表现都非常好&#xff0c;但实际在使用中发现了不少问题&#xff0c;在许多数据集上表现都不如SGDM这类方法。 后续有许多工作针对Adam做了研究&#xff0c;之前整理过关于优化算法的发展历程&am…