图神经网络与分子表征：2. SchNet|电子爱好者

admin管理员组
文章数量:1565813

SchNet 在2018年的面世彻底引爆了神经网络势函数(NNP, Neural Network Potential)领域，虽然说NNP的开山鼻祖还要更早，但均未像 SchNet 这样真正被物理化学家接受，引发变革。

这篇博客浅浅记录下自己阅读SchNet代码的心得。2023年的今天，网上有关SchNet的解读已经出现了很多，也有很多论文从更高的维度审视这一框架，有很多优秀的代码框架对SchNet代码进行了重构。
本文就按照自己的思路去解析这篇文献。主要参考：

DIG框架中的代码：选择DIG的二创，是因为DIG代码写得清晰，套用了SphereNet的架构，更容易理解。

GNN Expressive：这篇论文和论文附带的幻灯片对理解SchNet有很大帮助。

SchNet JCP原文：看看作者是怎么讲故事的。

GNN 语境下的 SchNet

SchNet 是图神经网络，势函数和力场中的哪一种？这个目前框架很混乱。
在那篇著名的 4 generation of Neural Network Potential 论文里，SchNet 是高维势函数（HDNNP）
在近期的 Forces are not enough 里，SchNet 被叫做机器学习力场（MLFF）
在 GNN Expressive 这篇论文里，SchNet 又变成了 GNN。

按笔者个人理解，力场一般指：相对传统的分子动力学模拟。力场二字源于传统的二体，三体力场函数的拟合。常见于分子体系，溶液体系的分子动力学模拟（MD）。体系中原子坐标给定，求解原子的受力，是一个动力学方程。

势函数脱胎于材料，金属，半导体领域的密度泛函理论计算，源头可以追溯到均匀电子气，体系中各原子坐标给定，求解整个体系的基态能量，是一个能量方程。

读者不必纠结具体的名词，我们暂且将 SchNet 当做一个 GNN，那么 GNN 的核心流程，前文已经讲过了，这里再放一下 GNN 的整体流程：

输入分子图在经过多次的信息聚合和迭代之后（message passing），变成了一张新的图，最后再使用这张图上的信息去对目标性质做预测。

在 DIG 框架中，SchNet 被改写成了一个典型的 GNN 框架，其流程与上图大致对应：

即，SchNet 是一个以点集为核心的框架：

先根据每个原子的元素种类去对该原子做一个映射，这一映射可以被看做是点的初始特征向量。
随后经过巧妙设计的 message passing layers，该特征向量聚合了周围节点的诸多信息，整张图获得了迭代更新。如何去设计 message passing layers 是整个 SchNet 模型的重中之重。
基于更新后的图对目标性质做预测，这一操作在 AI 领域叫 Pooling ，在SchNetPack 中叫 Output layer，就是一个简单的前向传递。

下面结合代码看一下各个步骤。

DIG 框架下的代码

DIG 改写后的 SchNet 代码仅有168行，非常适合入门阅读！
我们直接跳到主类的 forward 阶段：

可以看到，经过改写后的框架还是清晰易懂的，能够跟原文献的几个模块一一对应。
值得注意的是，此处的 update_e 在原文里是 interaction 的意思，在传统的 GNN 框架中就是 message passing.
此外，对元素的 embedding 也是参照了 NLP 的做法，初始化了一个 look up table ，这样可以保证，同样元素的原子初始化向量是一致的。
最后，整张图去进行预测时，也仅仅是保留的点的 feature （这套代码里的edge可以说是聊胜于无，就当成 message 看就行）

OK，下面我们重点看一下 message passing 是如何实现的。

从 forward 主程序中可以看到，message passing 是由一个 for 循环构成的。在这个 for 循环下面，第一句话是构建 message ，第二句话是节点feature的迭代。
其实与本专栏第一篇文章中提到的点集上的消息传递框架类似，某一节点根据其邻居节点的 feature 进行更新。这种方式是最简单的消息传递模型。
在 GNN expressive 这篇论文里，SchNet 框架如下所示：

每个原子（i）有 Ni 个邻居（邻居指在截断半径内），每个邻居在迭代时会创造一个 message ，节点的 feature 在融合诸多 message 后进行下一次的迭代。
SchNet 模型被认为是一个二体的不变模型，其原因在于，其每次迭代只涉及 1-hop 的邻居，而且使用不变的距离信息（标量）。

我们继续看原文中提到的 interaction 模块，其中的 filter generator 在代码中的 update_e 模块。
该模块的物理意义是，邻居原子对目标原子的影响力会随着距离的增大而衰减（C矩阵）。同时，邻居原子对目标原子的影响是一个距离的函数，而且该函数是可学的一个MLP模块（self.mlp(dist_emb)）

在理解了过滤矩阵后，我们再回头看 interaction 模块。其实这里 DIG 的代码和图中所示不太匹配，这里我们需要将 update_e 和 update_v 两个模块的 forward 连起来看。

两句话连起来对应一个 interaction 模块这一点应该很好理解。整个 interaction 的输入是 vertex embedding + distance embedding。
我们从下往上看，首先，比较明显的是 vertex update 含有一个短接，这一短接在 update_v 的 return 中是可以对上的。那这个 out 再往上过了一个线性层+激活层+线性层，这也分别可以和 56,57,58对应，55 行则对应message的聚合，所以我前面一直强调 message 就是DIG框架中的e。

总体来看，迭代后的节点向量如下：

V i ′ = V i + l i n 1 _ s s p _ l i n 2 ( ∑ j ∈ N m s g j ) V_i'=V_i+lin_1\_ssp\_lin_2(\sum_{j\in \mathcal{N} }^{} msg_j) Vi′=Vi+lin1_ssp_lin2(∑j∈Nmsgj)

message用公式表示如下：
（来自邻居 j 的 message ）
m s g j = l i n ( V j ) ∗ f i l t e r _ g e n ( d i s , d i s _ e m b ) msg_j=lin(V_j)*filter\_gen(dis, dis\_emb) msgj=lin(Vj)∗filter_gen(dis,dis_emb)

最后就剩下最开始的一块了。filter generator 是一个相对独立的小块儿，只与距离有关，对应31，32行，前文以提过。
有了 filter 以后，我们看 33 行。33行的线性层显然是 cfconv 层上面的 atom-wise 64
cfconv 层则对应 34 行，即，卷积核与邻居embedding的乘积。

至此，SchNet 模型中的核心代码已经全部能跟文献对应了。

一些感悟

下面我说一下自己的感悟。

我们深入学习一个模型，在读文献、看代码时，首先要看到整个模型大的模块。本例中，我首先将 SchNet 套到了一个 GNN 的框架里，然后用消息传递去近似原文中晦涩难懂的 interaction 模块。其次，我们要将文献中重点提及的模块跟代码进行一个映射，希望大家不要害怕扒代码。本例中，比较核心的代码加起来不到20句，在多读多思考的情况下，还是可以慢慢理解的（本人看了一天啊啊啊啊！！）。最后是一些 technical 的感悟，我们可以先把代码跑起来，然后在小batch size，debug 模式下进行观察，这将有利于从数据结构的角度理解算法模型！

希望大家看完这篇文章有所收获！！

本文标签：神经网络表征分子 SchNet

版权声明：本文标题：图神经网络与分子表征：2. SchNet 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1725280359a1016416.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

图神经网络与分子表征：2. SchNet

GNN 语境下的 SchNet

DIG 框架下的代码

一些感悟

更多相关文章

神经网络中的深度学习算法研究与应用

神经网络的卷积算法优化

神经网络与传统算法的比较研究

MATLAB中的神经网络算法详解

神经网络的优化算法研究

神经网络训练电脑配置,cpu可以训练神经网络吗

ps2021神经网络AI滤镜下载,ps神经网络滤镜安装包

大创项目推荐 深度学习卷积神经网络垃圾分类系统 - 深度学习 神经网络 图像识别 垃圾分类 算法 小程序

跑神经网络的笔记本推荐,笔记本能跑神经网络么

学习神经网络（深度学习）电脑的配置要求

训练好的神经网络怎么用,神经网络训练电脑配置

大数据深度学习：基于Tensorflow深度学习卷积神经网络CNN算法垃圾分类识别系统

神经网络应用_我们为应用选择了神经变态，这就是我们的做法

**探索生物分子的视觉艺术：Illustrate项目深度剖析**

B站UP搭建世界首个纯红石神经网络、基于深度学习动作识别的色情检测、陈天奇《机器学编译MLC》课程进展、AI前沿论文 | ShowMeAI资讯日报

毕设项目 深度学习卷积神经网络垃圾分类系统

腾讯多媒体实验室：基于三维卷积神经网络的全参考视频质量评估算法

2023春 - 神经网络与深度学习 - 笔记1

计算分子动力学模拟轨迹contact-map概率，并绘制热图

基于BP神经网络的人脸朝向识别

发表评论

推荐文章

检查您的手机浏览器是否支持WebRTC技术

手机浏览器上也能无成本使用Chat GPT，无需魔法和注册

谷歌浏览器Chrome书签同步方法(新方法)

应用程序无法正常启动 0xc000000d

安全模式启动电脑和正常启动有什么区别

热门文章

浏览器g.xxx333xxx.com 跳转2345问题解决方法

认知心理学论文精选Cognitive Psychology

解决“错误代码0x80070035”的几种方法，一键修复错误代码问题

手机浏览器跳转微信指定页面及跳转微信公众号一键关注

手机浏览器window.close()无效（黑科技）

win10蓝牙鼠标不稳定解决办法

win10 安装dig工具与使用dig命令

kickstart 配置文件说明

谷歌浏览器插件安装教程，简单易懂（图文讲述）

WiFi万能钥匙破解显密码版。

最新文章

微信：禁用小程序跳转 App

Docker安装Harbor

黑科技——通过docker+xware在群辉DSM 6.0系统实现迅雷远程下载

VS2019 C#开发手机App环境配置和开发

这些免费看电视的直播软件，还能免费追剧的app，需要的收藏！

neo4j安装遇到的坑

Arduino IDE傻瓜式离线安装ESP8266ESP32stm32固件支持包

完整恢复玩客云官方固件，恢复迅雷下载和备份

Google Chrome 下载链接，直接复制到QQ旋风或迅雷即可下载

iOS迅雷7月19日更新，终于可以稳定下载了！

linux 命令行 迅雷替代,MacLinux下迅雷替代方案

迅雷精简版依托迅雷强大的P2P资源网络和独特的下载技术

app应用内升级方案选型与优化

OpenWrt路由器通过Aria2开启迅雷离线下载[图文教程]

pytorch手动安装开发包

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

大创项目推荐深度学习卷积神经网络垃圾分类系统 - 深度学习神经网络图像识别垃圾分类算法小程序

探索生物分子的视觉艺术：Illustrate项目深度剖析

毕设项目深度学习卷积神经网络垃圾分类系统

linux 命令行迅雷替代,MacLinux下迅雷替代方案

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载