Resnet50对PyTorch视频中的人类行为进行分类

2024-06-28 19:45:28 发布

您现在位置:Python中文网/ 问答频道 /正文

我尝试使用Resnet50来对thisrepo之后的人类行为进行分类。我实现了自己的数据加载器,从this数据集生成批处理。与回购不同,我使用的不是3D CNN,而是一个简单的PyTorch Resnet50。因此,我需要一个4D的张量输入来输入网络,而我有一个5D(批次大小、频道大小、堆叠图像、高度、宽度),其中堆叠的图像是视频中不同时间步长的帧。我应该停止叠加这些图像,而只是迭代4D张量的列表吗?在


Tags: 数据图像网络视频宽度高度分类pytorch