1. 克隆或者下载项目
方法一:在github上直接下载项目:项目地址
方法二:使用git克隆(推荐),相关内容参考Git的安装及github远程仓库ssh连接
git clone https://github.com/Niki173/C3D.git
https://github.com/jfzhang95/pytorch-video-recognition.git
2. 配置环境
首先确定已经安装好pytorch的环境,接下来还需要安装以下几个依赖
conda install opencv
pip install tqdm scikit-learn tensorboardX
使用上边命令安装会比较慢,建议直接换源进行安装
conda install --channel https://conda.anaconda.org/menpo opencv
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tqdm
3. 下载数据集和与训练权重
UCF101:https://www.crcv.ucf.edu/data/UCF101/UCF101.rar
训练权重:https://pan.baidu.com/s/1iEkK5aV51UvG1Ul5kgUkHw,提取码:ch8y
- 在项目中创建data文件夹,将数据集放在data中,解压缩在这个位置
rar x UCF101.rar
- 在项目中创建models的文件夹,将与训练权重放在models中
- 检查mypath.py中相关路径
4. 预处理数据
预处理数据使将这两个地方改为True运行train.py。表示对要对视频进行预处理,比如将数据集划分,视频处理为帧图片等。
控制台出现数据处理完成之后可以停掉项目。此时数据已经处理完成,数据如下图所示。
5. 训练
- 先修改前边两处preprocess为False
- 运行train.py得到训练的权重
6. 预测
检查inference.py中权重路径和要预测的视频
然后就可以得到预测视频的结果了,这里放个截图
如有错误,感谢指出!
参考文章:
C3D源码解析:https://blog.csdn.net/better_boy/article/details/108801411
C3D代码总结(Pytorch):https://blog.csdn.net/weixin_47349091/article/details/113484959
行为识别C3D代码(pytorch)实现过程及常见错误:https://blog.csdn.net/yuanhaopeng123/article/details/113459528