《GRIP++: Enhanced Graph-based Interaction-aware TrajectoryPrediction for Autonomous Driving》论文精读|电子爱好者

admin管理员组
文章数量:1589951

车辆轨迹/行为预测方向硕士在读，以后会经常更新该方向的经典论文精读，感兴趣的朋友可以点个关注，有不准确的地方还请各位大佬批评指正！

摘要：

改进了之前提出的GRIP方案。（GRIP：使用图结构来表示接近对象的交互，应用多个图卷积块来提取特征，然后使用编码器解码器LSTM模型进行预测。）

1.引言：

不同traffic agents具有不同的运动模式，它们行为也会相互影响；

提出了GRIP++，利用固定图和动态图来捕捉不同类型traffic agents之间的复杂交互(并且编码器解码器改用了GRU)，以提高轨迹预测的准确性。

2.相关工作

传统的经典轨迹预测方法：（贝叶斯网络、蒙特卡洛模拟、隐马尔可夫模型）很少考虑对象之间的交互和环境上下文信息；

目前基于深度学习的预测模型：

LSTM-CNN：缺点：计算成本高

CNN：将鸟瞰 LiDAR 数据作为输入，并处理跨空间和时间的 3D 卷积；缺点：拥堵环境表现不佳

LSTM：输入为TV和SV的轨迹历史，输出为机动分类；缺点：机动类型分类错误时对模型性能影响较大。

3.问题表述

一句话描述就是：根据场景中所有对象的历史轨迹数据去预测场景中所有对象的未来位置

输入：X（场景中所有可观测对象的历史轨迹数据）过去的th个时间步

输出：Y所有可观测对象的未来位置从th+1到th+tf共tf个时间步

4.解决方案

GRIP++由三部分组成：(1) 输入预处理模型，(2) 图卷积模型，和 (3) 轨迹预测模型。

(1) 输入预处理模型

①输入表示：

在过去第 th 个时间步观察到交通场景中的 n 个对象，我们将这些信息表示在一个大小为 (n×th×c) 的 3D 数组 Finput 中。（其中c=2来指示对象的x，y坐标）。因预测物体的速度比预测其位置更容易，我们在将数据输入模型之前计算速度 (pt+1 −pt)；

②图构建

G={V,E}

节点集V是n个智能体在th个时间步上的状态集合：

边集E包含两部分：空间边集Es和帧间边集Ef

其中D是一个范围，只有traffic agents之间的距离小于Dclose时，才说它们属于D

使用邻接矩阵 A = {A0, A1} 表示该图，其中 A0 是表示时间空间中的自连接的单位矩阵 I，A1 是空间连接邻接矩阵（A0和A1均为nxn的方阵）。因此，在任何时间 t，

（2）图卷积模型

在该Graph Convolutional Model中的每个Graph Operation层的末尾添加一个Temporal Convolution层，以在空间和时间上交替处理输入数据；

首先第一个卷积层用来将二维输入数据（x，y 坐标）映射到更高维空间，这有助于模型学习轨迹预测任务的良好表示；

批量归一化层用于提高我们模型的训练稳定性；

跳跃连接（绿色折线）用于确保模型可以将更大的梯度传播到初始层。

①图操作层

用于考虑traffic agents之间的交互，包含两部分：

“固定图”（图 1 中的蓝色图形符号）

“可训练图”（图1中Graph Operation层后的红色图形）

将固定图A进行归一化：

之后进行如下运算：

其中Fgraph是图操作层的输出，fconv是上一卷积层的输出。

②时间卷积层

将时间卷积层的内核大小设置为 (1 × 3)，以强制它们沿时间维度（第二维度）处理数据。

（3）轨迹预测模型

输入：图卷积模型的输出（即图特征）；

输出：对象在未来所有预期时间步 (tf) 的位置。

使用序列到序列（Seq2Seq）的结构

每一个解码步骤，都会添加一个“Last History”作为输入，（即上一时间步对象的坐标）

在解码器 GRU 的每个单元格的输入和输出之间添加残差连接（图 1 中的蓝色虚线）来强制模型预测速度的变化。（因为很少有交通对象以恒定速度移动）

在每个时间步对结果（预测速度）进行平均（因为有多个编码器-解码器块，对这些块的结果进行平均）。在得到平均预测速度后，我们将它们 (Δx, Δy) 添加回上一个历史位置 (p(th))，将预测结果转换为 (x, y) 坐标。

GRIP++ 和 GRIP 之间的主要区别是

• GRIP++ 将速度 (Δ x, Δ y) 作为输入，而 GRIP 将 (x,y) 坐标作为输入

• GRIP++ 考虑固定图和可训练图，而 GRIP 仅考虑图卷积中的固定图子模块。

• GRIP++ 在图形卷积模型中使用 3 个块并添加批量归一化，而 GRIP 在图形卷积模型中使用 10 个块而没有批量归一化层。此外，GRIP++ 使用跳跃连接。

• GRIP++ 使用 GRU 网络，而 GRIP 使用 LSTM 网络。 GRIP++ 还使用三个编码器-解码器块进行轨迹预测并对结果进行平均，而 GRIP 仅使用单个编码器-解码器块进行轨迹预测。

（4）实现细节

使用python和pytorch库

处理的是EV附近±90英尺的交通场景（大概±27.5米）

Dclose=25英尺（7.6米）

在每次图操作后执行了dropout，概率是0.5

编码器和解码器都是双层GRU（门控循环单元）网络。我们将这两个 GRU 的隐藏单元数设置为输出维度的 r 倍（r×2×n，其中 r 用于提高表示能力，n 是对象的数量，2 是 x，y 坐标).选择 r = 30 以获得最佳性能

将模型训练视为回归任务，loss为：

Batchsize设为64

5.实验

Ubuntu 16.04、4.0GHz Intel Core i7 CPU、32GB 内存和 NVIDIA Titan Xp

在三个数据集上进行了训练和评估：NGSIM I-80、US-101、ApolloScape Trajectory

这部分太多，主要挑一些我认为的比较重要的点来说一说：

Dclose是之前设置的阈值，当对象之间小于这个阈值时我们认为它们可以相互影响。RMSE（均方误差）是模型准确性的评价指标，越小越好

从图中我们可以看出，当Dclose为0时（即不考虑对象之间的交互），误差会很大，当设为25或50英尺时，误差明显变小，但两者差距甚微，说明只有近距离的对象才会互相产生影响。

你可以把这张图理解为车道的俯瞰图，车道方向为左右方向，0的位置为EV（自车）的位置。可以发现对后方对象的预测误差要明显小于前方对象的误差，这说明对于模型来说，观察前方对象比后方对象更重要。

从上到下可以看作调优的过程，也是GRIP++的进化历史

计算时间相较于其他模型缩短了很多。

总结

使用历史轨迹数据作为输入并将原始数据抽象为图结构添加在网络的训练中，使模型既能够考虑对象之前的运动模式又能够考虑到对象之间的相互影响和交互，并且图结构的数据处理时间相较于BEV或原始图像数据可以大大缩短，使得预测时间大大缩短，并且能够预测场景内所有对象的轨迹，模型的性能也极为优秀。

论文源码：GitHub - xincoder/GRIP

本文标签：论文 Graph Based GRIP Enhanced

版权声明：本文标题：《GRIP++: Enhanced Graph-based Interaction-aware TrajectoryPrediction for Autonomous Driving》论文精读内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1728075959a1144475.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

《GRIP++: Enhanced Graph-based Interaction-aware TrajectoryPrediction for Autonomous Driving》论文精读

摘要：

1.引言：

2.相关工作

3.问题表述

4.解决方案

(1) 输入预处理模型

①输入表示：

②图构建

（2）图卷积模型

①图操作层

②时间卷积层

（3）轨迹预测模型

（4）实现细节

5.实验

总结

更多相关文章

对抗样本方向（Adversarial Examples）2018-2020年最新论文调研

【论文翻译】卷积神经网络研究综述

opentracing-02 dapper论文词汇摘要

Rethinking the Route Towards Weakly Supervised Object Localization论文阅读

区块链论文速读A会-ATC 2024 如何降低以太坊存档节点的存储要求？

Paper：《Graph Neural Networks: A Review of Methods and Applications—图神经网络:方法与应用综述》翻译与解读

论文翻译——Artificial Intellligence：miracle or mirage？

基于springboot的海滨体育馆管理系统的设计与实现论文

【论文通读】UFO：A UI-Focused Agent for Windows OS Interaction

【虚拟人综述论文】Human-Computer Interaction System: A Survey of Talking-Head Generation

人物交互（human object interaction）论文汇总-2020年

论文《AutoFIS: Automatic Feature Interaction Selection in Factorization Models for Click-Through R..》阅读

Cascaded Human-Object Interaction Recognition论文阅读笔记

论文阅读笔记2—《Document-level Event Extraction via Heterogeneous Graph-based Interaction...》

AN INTERACTION-AWARE ATTENTION NETWORK FOR SPEECH EMOTION RECOGNITION IN SPOKEN DIALOGS -情感识别论文学习

AI医药论文笔记--SSI–DDI: substructure–substructure interactions for drug–drug interaction prediction

TFNet: Multi-Semantic Feature Interaction for CTR Prediction 论文简读

AI医药论文笔记--MUFFIN: multi-scale feature fusion for drug–drug interaction prediction

读论文，第十三天：DualRing: Enabling Subtle and Expressive Hand Interaction with Dual IMU Rings

Video-based Evanescent, Anonymous, Asynchronous Social Interaction: Motivation and Adaption to Mediu

发表评论

推荐文章

在线二维码解码器：将二维码转换成网址链接

Linux命令 ——ipconfig与ifconfig命令用法及区别

计算机不显示用户组密码设置,手把手教你设置win10系统开机时跳过锁屏画面直接显示密码框登录界面-系统操作与应用-亦是美网络...

台式计算机启动时 每次按f1,台式机电脑每次开机都要按F1,华硕主板

java架构师进阶之路

热门文章

如何统计各个分发平台的下载数据

linux 命令--常用关机命令

win11锁定和解锁功能键(Fn)的方法

Ubuntu基本指令

maya2020卸载不干净安装不了_maya 2020安装失败，怎么完全彻底卸载删除清理干净maya 2020各种残留注册表和文件？...

千牛工作台linux版,深度商店应用千牛工作台、Discord、QQ(Linux)、新浪微博安卓版...

Win10自动开机设置方法

2024年最全最新pycharm专业版免费激活申请步骤_pycharm专业版学生激活，腾讯面试试题

things 3 mac 破解版永久激活方法

计算机点了睡眠怎么开机,进入睡眠模式的电脑怎样重新启动

最新文章

苹果5s参数_iphone12值得入手吗？iPhone12和12pro哪款性价比高？苹果手机推荐选购指南...

微型计算机的 I3 I5是,电脑i3和i5有什么区别

oppoa5系统服务器是什么,买OPPO A5还是OPPO A3？OPPO A3和OPPO A5区别对比

i7 7700k linux,i7 7700K和i7 7740X哪个好？i7-7740X与7700K的区别对比详细评测

电脑主机组装总结——自己动手，丰衣足食

游戏测试工具清单

鸿蒙OS麒麟659,华为和荣耀手机上的麒麟659到底处于什么水平？

小米mix2安兔兔html5跑分,小米MIX 2S跑分多少？高通骁龙845安兔兔跑分实测 (全文)...

华为nova3i 计算机在哪里,华为nova3i常见问题汇总，你想了解的都在这里

计算机专业大学世界排名2019,2019电脑销量排行榜_2019世界大学排名 计算机专业...

【整理】SIMD、MMX、SSE、AVX、3D Now！、neon

鸿蒙os骁龙845,小米MIX 2S跑分多少？高通骁龙845安兔兔跑分实测 (全文)

骁龙660是32位还是64位_高通骁龙632和660哪个好 骁龙660和632区别对比 (全文)

mt6765和骁龙665哪个好_联发科MT6750和骁龙450哪个好 高通骁龙450与联发科MT6750区别对比评测...

android系统 备份恢复,Android系统备份及系统还原方法介绍

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

台式计算机启动时每次按f1,台式机电脑每次开机都要按F1,华硕主板

计算机专业大学世界排名2019,2019电脑销量排行榜_2019世界大学排名计算机专业...

骁龙660是32位还是64位_高通骁龙632和660哪个好骁龙660和632区别对比 (全文)

mt6765和骁龙665哪个好_联发科MT6750和骁龙450哪个好高通骁龙450与联发科MT6750区别对比评测...

android系统备份恢复,Android系统备份及系统还原方法介绍

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载