MS-TCN: Multi-Stage Temporal Convolutional Network for Action Segmentation

article/2025/11/5 6:19:52

论文题目:Multi-Stage Temporal Convolutional Network for Action Segmentation
原文地址:https://arxiv.org/abs/1903.01945

这篇文章涉及的是视频的行为分割问题(Action Segmentation),也就是对视频(video)中的每帧,推断其对应的行为类别,也就是说,该问题本质上是一个逐帧的图像分类问题。
该文章的主要核心内容如下:

1.使用TCN对时序邻域信息进行聚合

由于人的行为具有时间相关性,为了捕获行为的dynamics,在涉及视频序列处理的问题中,有必要对时序信息进行聚合。该论文使用时间卷积神经网络(Temporal Convolutional Networks, TCN)来进行时序信息的聚合。
TCN的输入不是原始的图像,而是按照时序进行排列的特征,为了扩大感受野,作者选择使用空洞卷积(dilated convolution),后接1x1卷积进行通道数量的调整。作者同样使用的残差连接(residual connection)来对梯度的反向传播进行优化。该残差结构可以公式化的表示为:
在这里插入图片描述
TCN残差块
随后,我们对残差块进行堆叠,以提取更高层的特征,为了获得更大的感受野(receptive field),下一层的空洞卷积的dilation rate增加为原来的2倍,因此,随着层数的增加,网络的感受野呈指数增加。
最后,如同其他的分类任务,网络经过全连接层后,输入后续的softmax层中,得到逐帧的分类结果(frame-wise classification)
在这里插入图片描述

2.使用multi-state TCN对分类结果进行更好的调整

在第一部分提到的TCN已经实现了对视频的frame-wise classification,为了进一步改进分类效果,作者使用多层TCN进行堆叠,以对分类结果进行进一步微调。
在这里插入图片描述

3.在Loss function中加入平滑项,减缓过分类(over-classification)问题

常规的分类问题可以直接使用交叉熵(Cross-Entropy)损失
在这里插入图片描述
然而,在动作分类问题中,由于人的行为一般具有连贯性,直接使用Cross-Entropy
可能引起过分类(over-classification),造成行人行为的分类结果在时间轴上“不连贯”,因此,作者引入额外损失项对分类结果进行平滑
在这里插入图片描述
直观上来看,若当前帧与上一帧的行为分类结果的差异性越大,该loss项会基于网络更大的惩罚,从而一定程度上避免行为的分类结果在时间轴上出现剧烈的突变,提高分类结果的连贯性。
在这里插入图片描述
在这里插入图片描述
最终的损失函数为不同时刻对应的分类loss的求和。


http://chatgpt.dhexx.cn/article/pcwuGapq.shtml

相关文章

TCN时间卷积网络介绍

绪论 TCN, Temporal Convolutional Network,时间卷积网络,是一种能够处理时间序列数据的网络结构,论文还评为 2018年10大论文。 1. 模型 输入: x 0 , x 1 , . . . , x t {x_0, x_1,..., x_t} x0​,x1​,...,xt​ 输出: y 0 , …

TCN: TEMPORAL CONVOLUTIONAL NETWORKS

搬运自:Raushan Roy-TEMPORAL CONVOLUTIONAL NETWORKS Learning sequences efficiently and effectively Until recently the default choice for sequence modeling task was RNNs because of their great ability to capture temporal dependencies in sequenti…

【深度学习论文阅读】TCN:An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence

2018年人工智能十佳论文之一:TCN 论文地址:An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling 项目地址:TCN的github链接 文章目录 1. ABSTRACT2. INTRODUCTION & BACKGROUND2.1 Temporal…

wavenet及TCN

一切皆卷积——包括时序相关任务 1.wavenet1.1 wavenet的pytorch实现1.1.1 wavenet类1.1.2 ResidualConv1dGLU 1.2 wavenet在纳米孔测序中的应用 2.Temporal Convolutional Network(TCN)2.1 TCN模型介绍2.3 TCN代码实现及可视化 3.wavenet/TCN的优点参考…

时序模型(一)—— TCN 时间卷积网络

一、 概述 TCN是18年提出的时序卷积神经网络模型。 时序问题建模,通常采用RNN循环神经网络及其相关变种,比如LSTM、GRU等,这里将卷积神经网络通过膨胀卷积达到抓取长时依赖信息的效果,TCN在一些任务上甚至能超过RNN相关模型。 …

【学习日志】【TCN】时间序列卷积神经网络(1)

1. ask bing(Temporal Convolutional Network) 问:“我对CNN、RNN、TCN等神经网络没有任何基础,你能直观地给我讲一下TCN的结构、输入输出和原理吗?” bing对TCN的解释如下: TCN是一种用于处理序列数据的神…

LSTM的备胎,用卷积处理时间序列——TCN与因果卷积(理论+Python实践)

什么是TCN TCN全称Temporal Convolutional Network,时序卷积网络,是在2018年提出的一个卷积模型,但是可以用来处理时间序列。 卷积如何处理时间序列 时间序列预测,最容易想到的就是那个马尔可夫模型: P ( y k ∣ x…

python深度学习之TCN实例

1.TCN的介绍 近些年,关于时间序列、自然语言处理等任务大家一般都会想到RNN、LSTM、GRU,一维CNN以及后面延伸出的Bi-Lstm、ConvLstm等等,这是因为RNN天生可以记住以前时段的信息,而传统的神经网络并不具有这个功能。卷积神经网络…

时间卷积网络TCN:时间序列处理的新模型

这篇文章回顾了基于TCN的解决方案的最新创新。我们首先介绍了一个运动检测的案例研究,并简要回顾了TCN架构及其相对于传统方法的优势,如卷积神经网络(CNN)和递归神经网络(RNN)。然后,我们介绍了一些使用TCN的应用,包括改进交通预测…

TCN论文及代码解读总结

前言:传统的时序处理,普遍采用RNN做为基础网络模型,如其变体LSTM、GRU、BPTT等。但是在处理使用LSTM时时序的卷积神经网络 目录 论文及代码链接一、论文解读1、 摘要2、引言(摘)3、时序卷积神经网络(Temporal Convolutional Networks)3.1 因果…

轨道交通中TCN、TRDP、TSN的理解

轨道交通中TCN、TSN、TRDP的理解 1 TCN2 TSN3 TRDP———————————————————————— 1 TCN TCN(Train Communication Network)是列车通信网络,是列车通信网络的总称。 在IEC 61375-1 以及GB/T 28029.1中都详细的介绍了列车…

深度学习 + 论文详解: TCN_时间卷积网络_原理与优势

论文链接 TCN: https://arxiv.org/pdf/1803.01271.pdf p.s. TCN stands for Temporal Convolutional Network. 它是除了 RNN architecture 之外的第二种可以分析时间性数据的架构 更多文章将在公众号:AI 算法辞典 首发! 前言 RNN 从最一开始发展以来…

【python量化】用时间卷积神经网络(TCN)进行股价预测

写在前面 下面这篇文章首先主要简单介绍了目前较为先进的时间序列预测方法——时间卷积神经网络(TCN)的基本原理,然后基于TCN的开源代码,手把手教你如何通过时间卷积神经网络来进行股价预测,感兴趣的读者也可以基于此模…

时域卷积网络(Temporal Convolutional Network,TCN)

TCN基本结构 时域卷积网络(Temporal Convolutional Network,TCN)由Shaojie Bai et al.在2018年提出的,可以用于时序数据处理,详细内容请看论文。 1.因果卷积(Causal Convolution) 因果卷积如上…

时域卷积网络TCN详解:使用卷积进行序列建模和预测

CNN经过一些简单的调整就可以成为序列建模和预测的强大工具 尽管卷积神经网络(CNNs)通常与图像分类任务相关,但经过适当的修改,它已被证明是进行序列建模和预测的有价值的工具。在本文中,我们将详细探讨时域卷积网络(TCN)所包含的基本构建块&…

TCN代码详解-Torch (误导纠正)

1. 绪论 TCN网络由Shaojie Bai, J. Zico Kolter, Vladlen Koltun 三人于2018提出。对于序列预测而言,通常考虑循环神经网络结构,例如RNN、LSTM、GRU等。他们三个人的研究建议我们,对于某些序列预测(音频合…

时序CNN基础——TCN

自用~~笔记~~ 知识补充: 空洞卷积(膨胀卷积)——Dilated Conv 在标准卷积的基础上注入空洞,以此来增加感受野(reception field)。因此增加一个超参:膨胀率,指kernel的间隔数量。 因…

时间卷积网络(TCN):结构+pytorch代码

文章目录 TCNTCN结构1-D FCN的结构因果卷积(Causal Convolutions)膨胀因果卷积(Dilated Causal Convolutions)膨胀非因果卷积(Dilated Non-Causal Convolutions)残差块结构 pytorch代码讲解 TCN TCN(Temporal Convolutional Network)是由Shaojie Bai et al.提出的,p…

时间序列预测——时序卷积网络(TCN)

本文展示了使用时序卷积网络(TCN)进行时间序列预测的全过程,包含详细的注释。整个过程主要包括:数据导入、数据清洗、结构转化、建立TCN模型、训练模型(包括动态调整学习率和earlystopping的设置)、预测、结…

TCN-时间卷积网络

目录 一、引言 二、时序卷积神经网络 2.1 因果卷积(Causal Convolution) 2.2 膨胀卷积(Dilated Convolution) 2.3 残差链接(Residual Connections) 三、讨论和总结 1. TCN的优点 2. TCN的缺点 参考…