admin管理员组

文章数量:1660166

《Learning to Estimate 3D Hand Pose from Single RGB Images》ICCV_2017.3

  • 摘要
    • 主要流程
    • 困难
    • 手姿势表示
    • HandSegNet
    • PoseNet
    • PosePrior network
    • 数据集
    • 完整系统的例子

摘要

本文介绍了从2D彩色图像进行3D hand pose estimation的一种方法,总体来说方法很直观。
project page

论文摘要主要讲了以下几点:

低成本的深度相机和深度学习使得能够从深度图像进行合理的3D手姿势估计;
本文提出了一种从常规RGB图像估计3D手部姿态的方法。由于缺少深度信息,该任务具有更多的模糊性;
为此,本文提出了一个深度网络,学习网络隐式3D关节的先验。与图像中检测到的关键点一起,该网络 产生良好的3D姿势估计;
引入了基于合成手模型的大规模3D手势数据集用于训练相关网络。在各种测试集上的实验,包括关于手语识别的测试,证明了对单一RGB图像3D手姿态估计的可行性。

主要流程

Figure 2: 我们的方法由三个构建块组成。首先,通过分割网络(HandSegNet)将手定位在图像中。根据手部掩模,将输入图像裁剪并作为PoseNet的输入。这将定位一组表示为score map

困难

为了训练网络,需要具有真实标注3D关键点的大型数据集。由于没有这样的数据集具有足够的多样性,我们创建了一个包含各种数据增强处理的合成数据集。

本文标签: 笔记论文handestimateLearning