Deep-Feature-Flow文章及代码训练解析|电子爱好者

admin管理员组
文章数量:1650790

Deep Feature Flow for Video Recognition
CVPR2017
Github地址：https://github/msracver/Deep-Feature-Flow
paper地址：https://arxiv/abs/1611.07715

读书笔记

Deep feature flow 利用deep feature （appearance 信息）和光流（motion 信息）来对视频中的每一帧做建模，它的核心思想是利用指定的关键帧（key frame）和其他帧（current frame）到关键帧的光流信息，把关键帧送入到deep CNN中得到deep feature，而对于其他帧算出与关键帧的光流，再用光流把关键帧的deep feature propagate （相加，在做双线性差值）到当前帧，这时候就可大大减少计算量，因为对于非关键帧的话就不用再去过CNN了。对于新得到的特征，接下来就可对其进行不同任务处理，比如分割或者检测。

算法要点

1）在关键帧（Key Frame）进行特征图提取

这一步是比较耗时的，因此是间隔进行的，至于是使用Faster RCNN 还是RFCN，网络是ResNet-101 还是Inception，可以自行选择。

2）帧间传播

通过下面这幅图来看，作者将任务分成两个：特征提取 N（feat）和分类&分割 N（task）。
耗时的特征提取 N（feat）只在关键帧 Work，非关键帧的 Feature 通过传播（Propagation）得到。
F是通过两个 Raw Frame得到的 Flow信息，作用于前面的 Feature Map，得到当前帧特征图，并用于计算 N（task）。

3）特征图映射

特征图映射是本文的最关键部分，因为高层特征和底层特征的差别，流估计的误差会使得特征形变不准确，来看映射效果：

4）端到端训练

为了让算法达到比较好的效果，端到端（end-to-end）的训练必不可少，好处在于能够比较好的平衡误差，避免因为单独训练每一部分都挺好，结果却无法 Match 的情况，大多数 Deep Net 都会选择 end-to-end 的方法，也比较好理解。

算法流程

代码训练笔记

基于mxnet的Deep-Feature-Flow文件内容相信大家都可以看懂，作者基于imagenet比赛的数据集进行的训练，31类（包含背景）并不包含人，而我所作的需要对人员进行检测，所以重新训练数据集。
训练过程作者写的很详细了，在此不做介绍，主要记录一下我所进行的修改：

准备工作：

作者使用的是ILSVRC2015数据集，所以需要准备格式相同的数据集。

建议：先下载ILSVRC2015数据集，先能跑通该数据集，然后再用自己的数据集集跑，如果出问题，那么就是标注数据集的问题

data/ILSCRC2015/ImageSets VID_train_15frames.txt 解析

train/ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000 1 10 300
train/ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000 1 30 300
train/ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000 1 50 300
train/ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000 1 70 300
train/ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000 1 90 300

第一列表示对应的路径信息
第二列表示正负样本， 1为正 -1 为负
第三列表示第几帧图像
第四列表示该vid一共多少帧图像

注意：图片格式为JPEG

训练过程

修改cfgs下的文件：以resnet_v1_101_imagenet_vid_rfcn_end2end_ohem.yaml为例：

MXNET_VERSION: "mxnet"
output_path: "./output/rfcn/imagenet_vid" #选择要输出的路径
symbol: resnet_v1_101_rfcn
gpus: '0,1,2,3' #修改为你所使用的GPU
CLASS_AGNOSTIC: true

dataset: #根据标题，修改为自己的数据集的相关信息
  NUM_CLASSES: 31
  dataset: ImageNetVID
  dataset_path: "./data/ILSVRC2015"
  image_set: DET_train_30classes+VID_train_15frames
  root_path: "./data"
  test_image_set: VID_val_frames
  proposal: rpn

TRAIN: # 修改学习率已经epoch等
  lr: 0.00025
  lr_step: '1.333'
  warmup: false
  begin_epoch: 0
  end_epoch: 2
  ...

主要遇到的训练问题：

1：TypeError: init_params() got an unexpected keyword argument ‘allow_extra’

解决办法：进入mnxet/module/找到base_module.py文件中 allow_extra=allow_extra这一行删除掉。

2：TypeError: _update_params_on_kvstore() takes exactly 4 arguments (3 given)

解决办法：进入对应的module.py文件，相应修改

_update_params_on_kvstore(self._exec_group.param_arrays,
                                      self._exec_group.grad_arrays,
                                      self._kvstore,
                                      self._param_names)

本文标签：代码文章 Deep feature Flow

版权声明：本文标题：Deep-Feature-Flow文章及代码训练解析内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1729533639a1205130.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Deep-Feature-Flow文章及代码训练解析

读书笔记

算法要点

1）在关键帧（Key Frame）进行特征图提取

2）帧间传播

3）特征图映射

4）端到端训练

算法流程

代码训练笔记

准备工作：

建议：先下载ILSVRC2015数据集，先能跑通该数据集，然后再用自己的数据集集跑，如果出问题，那么就是标注数据集的问题

注意：图片格式为JPEG

训练过程

主要遇到的训练问题：

1：TypeError: init_params() got an unexpected keyword argument ‘allow_extra’

2：TypeError: _update_params_on_kvstore() takes exactly 4 arguments (3 given)

更多相关文章

RESA: Recurrent Feature-Shift Aggregator for Lane Detection (AAAI 2021)

Emulator: handleCpuAcceleration: feature check for hvf Emulator: added library vulkan-1.dll的一种解决办法

ArcGIS Engine从FeatureLayer中获取Feature的方法

自监督学习（六）Context Encoders: Feature Learning by Inpainting

Epic &amp; Feature &amp; Story &amp; Task

[享学Jackson] 七、Jackson使用bit位运算来开启禁用Feature的原理解析

FPN及其feature map特征融合（CVPR2016：Feature Pyramid Networks for Object Detection）

在Opendaylight中karaf启动的时候自动安装自己编写的feature

Feature hashing(特征哈希)

FFD：Fast Feature Detector运行失败解决

深入理解深度学习中的【卷积】和 feature map

git feature分支远落后于dev分支解决方案

论文笔记：Rich feature hierarchies for accurate object detection and semantic segmentation(R-CNN)

【论文笔记】视觉重定位 PixLoc || Back to the Feature: Learning Robust Camera Localization from Pixels to Pose

We recommend you use --use-feature=2020-resolver to test your packages with the new resolver before

Opendaylight将自己写的feature添加到控制器当中

vivado综合时出现：A valid license was not found for feature ‘Synthesis‘...

openlayer ol.feature

FeatureLayer，FeatureDataset，FeatureClass，Feature几个概念一点点总结

一个好的直播间如何搭建，看完此文章你就明白了丨国仁网络

发表评论

推荐文章

原生Android安装小米云服务,小米云服务在哪里打开 新版MIUI小米云服务打开路径介绍...

小米6系统 android版本是多少,MIUI全新升级Android P!小米6全新适配，快看看有没有你的手机...

[SEQREQZMB] 跑reset test出现的UVM_ERROR原因及解决方法

为什么计算机桌面下面没有显示不出来,电脑底下一排图标没了,桌面底部任务栏不见了...

python爬取酷狗付费音乐_python爬蟲教程：爬取酷狗音樂

热门文章

关闭windows安全警报_关闭 Windows 10 系统中自带 Defender 防病毒软件三种方法

java-proxool 异常

【软件工程与实践】（5）jdchain的区块账户模型Account以及ContractAccount和UserAccount的账户职能

the account is locked 问题的解决方法

如何在Windows 10桌面显示我的电脑和控制面板等系统图标

如何去除360浏览器“网页走丢了”页面广告

win10系统打不开原神游戏怎么办？打不开原神游戏的解决方法

Fastjson源码分析—反序列化—Feature的功能和实现

oracle的执行图标不见了,开始菜单oracle集成管理工具的图标没了怎么办

酷狗音乐模仿还在继续之UI界面源码下载

最新文章

彻底关闭win10更新自动更新 卸载win10自带杀毒软件 新增联想软件 lenovo quick fix

赛门铁克symantec的安装与卸载-附下载地址(本人亲测)

下载MSE的提示——微软正式提供免费杀毒软件下载 仅限7.5万份

linux卸载安天杀毒软件,安天杀毒软件Linux版使用说明

mcafee 8.5杀毒软件下载、安装、配置详解教程

centos系统安装nod32杀毒软件并通过xmanager进行远程管理

Linux 杀毒软件clamav的yum 安装

十二款世界顶级杀毒软件下载,有序列号全可免费升级

centos7 clamav 杀毒软件安装

windows11关闭自带杀毒软件

node-webkit（Windows系统） 打包成exe文件后，被360杀毒软件误报木马的解决方法

MSF图形化界面Viper(炫彩蛇)下载与使用

windows server 2008 杀毒软件和防火墙 免费 国外

linux主机如何安装杀毒软件,Linux 杀毒软件ClamAV安装部署

pdf转word的几个方案

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

Epic & Feature & Story & Task

原生Android安装小米云服务,小米云服务在哪里打开新版MIUI小米云服务打开路径介绍...

彻底关闭win10更新自动更新卸载win10自带杀毒软件新增联想软件 lenovo quick fix

下载MSE的提示——微软正式提供免费杀毒软件下载仅限7.5万份

node-webkit（Windows系统）打包成exe文件后，被360杀毒软件误报木马的解决方法

windows server 2008 杀毒软件和防火墙免费国外

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载