笔记】Deep Multi"/>
【论文笔记】Deep Multi
DMVST论文心得
- 前言
- 本文贡献
- 模型架构
- 空间视图:Local CNN
- 时间视图:LSTM
- 语义视图:结构嵌入
- 模型综合
- 损失函数
- 实验
- 对比试验方法
- 数据集
- 评价标准
- 实验结果
- 参考文献
前言
在智慧城市的建设中,出租车需求预测是一个及其重要的问题。准确的预测需求能够帮助城市预分配交通资源,提前避免交通拥堵,从而缓解交通压力,同时降低出租车空载率,提高出租车司机收入。传统的出租车需求预测往往基于时序预测技术,无法对复杂的非线性时空关系进行建模。深度学习技术的突破为交通预测问题带来了曙光,但是现存的深度学习网络架构,往往只单一考虑了时间关系或者空间关系,没有把两者结合起来进行建模。
本文提出了 DMVST-Net,同时对时间关系和空间更新进行建模。更具体地,该模型同时从三个角度出发(分别是 temporal view, spatial view,semantic view),综合考虑了出租车需求在路网上分布的时空关系,并利用语义信息,对相似区域的时空模式进行了建模。
值得一提的是,本文运用图网络 和 Local CNN 的方法,对由数万路段组成的大型道路交通网,进行了特征提取,这一举措,将图网络的运用拓宽到一个新的层次,使得大型交通网的建模有了新的解决思路。
本文贡献
简单来说,本文综合了时间、空间、语义三个方面预测需求量。
空间:local CNN,强调了邻近空间相似,较远的位置参与训练之间会有负作用
时间:使用传统LSTM
语义:使用“区域图”的边来表达区域对之间需求模式的相似性,用图嵌入的方法作为环境特征参与训练
模型架构
这是DMVST-Net的架构图。 (a).空间组件使用一个局部CNN来捕获附近区域之间的空间依赖性。局部CNN包括几个卷积层。最后使用全连接层来得到低维表示。 (b).时间视图采用了一个LSTM模型,该模型从空间视图中获取表示形式,并在相应的时间将它们与上下文特征连接起来。 ©.语义视图首先构造一个加权的区域图(其权重表示功能相似度)。节点被编码到向量中。最后使用一个全连接的层来进行联合训练。最后,利用一个全连接的神经网络进行预测。
空间视图:Local CNN
Local CNN: 如要对 (a)提取特征,最常见的一种方式是把(a)这整张图像送入到CNN中,进行卷积运算;而另一种方式就是把(a)分块,把划分后的每一小块分别送入到CNN中,也就是每次只对(b)进行卷积运算,最后把每个部分的结果进行综合,这就是 Local CNN。提出该方法的动机是地理学第一定律——近邻比远邻重要。
作者在这里把待预测城市分成了20 x 20个区域,每个区域是0.7km x 0.7km,用7 x 7的二维图像来表示每一个区域,图像中每个像素点的灰度值代表出租车的需求量。每张图像可以用 Y t i ∈ R S × S × 1 Y_t^i\in\mathbb{R}^{S\times S\times 1} Yti∈RS×S×1表示,其中 S = 7 S=7 S=7。经过K层卷积层后得到 Y t i , k ∈ R S × S × 1 Y_t^{i,k}\in\mathbb{R}^{S\times S\times 1} Yti,k∈RS×S×1,经过flatten操作后得到 s t i ∈ R S 2 λ s_t^i\in\mathbb{R}^{S^2 \lambda} sti∈RS2λ,最后进行降维得到 s t i ^ ∈ R d \widehat{s_t^i} \in \mathbb{R}^d sti ∈Rd,具体公示为:
Y t i , k = f ( Y t i , k − 1 ∗ W t k + b t k ) Y_t^{i,k} = f(Y_t^{i,k-1}*W_t^k+b_t^k)
更多推荐
【论文笔记】Deep Multi
发布评论