【光流】——GMA:Learning to Estimate Hidden Motions with Global Motion Aggregation论文浅读|电子爱好者

admin管理员组
文章数量:1660166

光流，GMA
code：https://gitcode/u011622208/GMA

解决的问题：

解决光流估计中被遮挡点的光流估计问题
在RAFT的基础上进行优化改进

解决方案

两帧之间的运动信息，可以通过计算cost volume的匹配信息进行估计
当没有匹配信息时，基于这样一个假设，单个物体（在前景或背景中）的运动通常是均匀的，运动信息必须从其他像素开始传播
同时，对于每个像素理解他属于那个对象。也就是说，非被遮挡的自相似点的运动信息可以传播到被遮挡的点。
CNN不适合做全局运动估计，因为CNN时局部的，transformer更适合做全局估计。

1. 网络结构

全局运动假设
为了解决由遮挡引起的模糊性，我们的核心思想是允许网络在更高的层次上进行推理，即全局聚合相似像素的运动特征，并隐含地推断出哪些像素在外观特征空间中是相似的。我们假设，通过在参考坐标系中寻找具有相似外观的点，该网络将能够找到具有相似运动的点。这是由于观察到单个物体上的点的运动通常是均匀的。例如，一个向右跑的人的运动向量偏向于右，即使我们没有看到这个人的大部分由于遮挡而在匹配帧中结束，这也成立。我们可以利用这种统计偏差，将具有高（隐式）置信度的非被遮挡像素的运动信息传播到具有低置信度的被遮挡像素

1.1 全局聚合模块

查询和关键特征是上下文特征图的投影，用于建模第1帧中的外观自相似性。值特征是对运动特征的投影，而运动特征本身是对四维相关体积的编码。利用从查询和关键特征中计算出的注意矩阵来聚合作为运动的隐藏表示的值特征。

以上就是全局聚合特征的计算。 y i y_{i} yi就是RAFT出来的运动特征， α \alpha α是可学习参数。 θ , ϕ , σ \theta, \phi, \sigma θ,ϕ,σ 分别是对查询，键，值的编码函数。 f f f 是相似性计算函数。

其次，以上的全局聚合特征的计算还可以考虑加上位置编码的信息。

或者

P j − i P_{j-i} Pj−i表示位置编码。

本文标签：论文 estimate Hidden GMA Learning

版权声明：本文标题：【光流】——GMA:Learning to Estimate Hidden Motions with Global Motion Aggregation论文浅读内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1729849741a1215253.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

【光流】——GMA:Learning to Estimate Hidden Motions with Global Motion Aggregation论文浅读

1. 网络结构

1.1 全局聚合模块

更多相关文章

estimate和estimation

【2024年5月备考新增】《软考高项论文专题 （10）进度管理（合集）》

机器学习-44-Transfer Learning(迁移学习)

【AI视野·今日Robot 机器人论文速览 第十期】Fri, 18 Jun 2021

ICML 2022 | 腾讯AI Lab入选论文解读

Double Q-learning

论文笔记之Double Q-learning

机器学习20：Transfer learning 迁移学习

2024 推荐系统论文汇总

关于cannot estimate gas； transaction may fail or may require manual gas limit错误的排查

ROS 2D Pose Estimate,2D Nav Goal

estimate, underestimate and overestimate

【光流】——GMA:Learning to Estimate Hidden Motions with Global Motion Aggregation论文浅读

openMVS深度图计算：DenseReconstruction Estimate之EVTEstimateDepthMap之深度图保存

《Learning to Estimate 3D Hand Pose from Single RGB Images》 论文笔记

No way to disable datapump estimate？

生信豆芽菜-ESTIMATE预测免疫评分

【人脸属性】Age-Gender-Estimate-TF复现步骤

How to Estimate a Web Site Project

How CBO estimate the row source for group operation

发表评论

推荐文章

渗透测试 | 信息收集详解

[ecshop调试]ecshop 数据库查询缓存详解 有三种缓存，query_cache（数据库查询缓存）、static_cache（静态缓存）和cache(普通的缓存)

selenium使用手机浏览模式打开chrome，进行浏览网页（java）

度盘视频视频网页倍速播放？一行代码就够了

车辆安装角标定

热门文章

为什么说刚上市的富途，是最“腾讯”的腾讯系公司？

数据科学竞赛经验分享：你从未见过的究极进化秘笈

计算机病毒与恶意代码期末总结

怎么提高计算机的桌面性能,电脑卡顿怎么办？4个小技巧帮你解决问题

mysql写保护_简易修改注册表!小白都会去掉u盘写保护

深入理解搜索引擎——搜索评价指标

Wallpaper Engine 占用GPU过高解决办法

WiFi的一些连接信息

Oracle VM VirtualBox 异常退出，如何解决？？

EXPDP预估导出空间estimate，estimate_only

最新文章

三星U盘格式化后数据不见了？3个方法帮您找回珍贵文件

格式化后数据恢复全解析

华恒2410常见问题

Windows Mobile平台智能系统存储器ROM和RAM解释

移动硬盘加密

联想e480一键恢复小孔_联想自带一键恢复没用了怎么处理

如何恢复U盘里格式化数据？别慌，有带图详细步骤！

ubuntu2

转载：基于AT91RM9200与LINUX2.6.26内核的嵌入式平台开发全过程

ArchLinux 2009.08 硬盘安装

开机直接进入键盘布局_开机怎么进入安全模式（windows10停留选择键盘布局）

u盘格式化后数据能恢复吗？这四款工具别错过！

u盘快速格式化后怎么恢复文件：深入解析与全面指南

授之以鱼不如授之以渔！五分钟教会您手工查杀***！

|--------硬件故障专题--------| 主板.CPU.硬盘.内存.显卡.声卡

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

【2024年5月备考新增】《软考高项论文专题（10）进度管理（合集）》

【AI视野·今日Robot 机器人论文速览第十期】Fri, 18 Jun 2021

《Learning to Estimate 3D Hand Pose from Single RGB Images》论文笔记

[ecshop调试]ecshop 数据库查询缓存详解有三种缓存，query_cache（数据库查询缓存）、static_cache（静态缓存）和cache(普通的缓存)

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载