最近在学习视频分类任务,想要跑通一个更换数据集用到自己的课题上。
看到了这篇文章及代码
论文链接:http://vlg.cs.dartmouth.edu/c3d/c3d_video.pdf
代码链接:https://github.com/jfzhang95/pytorch-video-recognition
贴一下学习这个代码的原博。
代码真的很适合新手入门pytorch 。
C3D模型pytorch源码逐句详析(一)_zzh1370894823的博客-CSDN博客
C3D模型pytorch源码逐句详析(二)_zzh1370894823的博客-CSDN博客
C3D模型pytorch源码逐句详析(三)_zzh1370894823的博客-CSDN博客
代码很友好,只需要修改mypath中的路径和train.py里面的
num_classes = 3
改变分类类别,以及添加新的label.txt
报错处理:路径错误,这个地方很奇怪,dateset.py需要../ultrsound
train.py需要把root_dir=./ultrasound
运行dateset.py会生成一个path文件夹,里面是处理好的数据。
dateset的处理逻辑是对于每一个视频,确定隔几帧取一帧,至少取16帧。
运行train会生成run文件夹,存放这一次训练的权重。
最后跑出来的效果还是不错的,但好像存在过拟合(存疑),留待日后解决。