Effective gene expression prediction from sequence by integrating long-range interactions|电子爱好者

admin管理员组
文章数量:1565276

摘要

为了解决非编码DNA如何确定不同细胞类型中的基因表达问题，文章提出了一种称为Enformer的深度学习框架。该框架能够整合基因组中远程交互的信息，提高了从DNA序列中进行基因表达预测的准确性。
论文地址：Effective gene expression prediction from sequence by integrating long-range interactions

方法

Transformer

因为卷积操作的局部性，以往的模型只能考虑转录起始位点 (TSS) 最多 20 kb 的序列元素，但增强子、抑制子和绝缘子等，可以影响远大于 20 kb 的基因表达。因此文章引入了基于自注意力的Transformer结构来解决这个问题。Transformer由注意力层组成，通过计算序列中所有其他位置的表示的加权和来转换输入序列中的每个位置。任意两个位置之间的注意力权重取决于它们当前表示向量的嵌入以及它们之间的距离。因此使用Transformer大大的增加了网络的感受野。

网络结构

具体网络结构如图1a左1。

图1

网络的架构由三部分组成：

7 个带池化的卷积块
11 个Transformer块
1 个裁剪层

最后加上进行逐点卷积、有2个分别用于人和鼠的分支的网络头。
Enformer 将一个热编码的 DNA 序列作为输入 (A = [1,0,0,0], C = [0,1,0,0], G = [0,0,1,0], T = [0,0,0,1], N = [0,0,0,0]) ，长度为 196,608 bp，用于预测人类基因组的 5,313 个基因组轨迹和小鼠基因组的 1,643 个轨迹。每个896 长度 896 对应于 114,688 bp ，聚合到 128 bp 的 bin 中。带池化的卷积块首先将空间维度从 196,608 bp 减少到 1,536，因此每个序列位置向量代表 128 bp。然后，transformer 模块会捕获整个序列中的远程交互。裁剪层在每侧修剪 320 个位置以避免计算远端的损失最后，两个输出头预测生物体特定的轨迹。
多头注意（MHA）层用于共享整个序列的信息并模拟远程交互。每个头部有一组单独的权重： w q ∈ R C × K , w k ∈ R C × K 和 w v ∈ R C × V w^q \in R^{C \times K},w^k \in R^{C \times K}和w^v \in R^{C \times V} wq∈RC×K,wk∈RC×K和wv∈RC×V，将输入序列 x ∈ R L × C x\in R^{L\times C} x∈RL×C转化为查询 q i = x i w q q_i=x_iw^q qi=xiwq，key键 k j = x j w k k_j=x_jw^k kj=xjwk，值 v j = x j w v v_j=x_jw^v vj=xjwv。查询表示每个位置的当前信息，键表示每个位置将要关注的信息。它们的点积加上相对位置编码 R i j R_{ij} Rij形成了注意力矩阵。

实验

该模型在关注细胞类型特异性增强子、对 eQTL 数据的变异效应预测和MPRA 突变效果预测的问题上，与现有的模型进行对比，均取得了较好的结果。

本文标签： Expression prediction Effective gene sequence

版权声明：本文标题：Effective gene expression prediction from sequence by integrating long-range interactions 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1726481003a1072565.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Effective gene expression prediction from sequence by integrating long-range interactions

摘要

方法

Transformer

网络结构

实验

更多相关文章

Comprehensive anticancer drug response prediction based on a simple cell line drug complex network m

oracle创建sequence序列语法

ERROR: permission denied for sequence seq_m_qunar_train_id

Critical dependency: the request of a dependency is an expression

Critical Expression

如何解决 Critical dependency: the request of a dependency is an expression ？

require图片报错Critical dependency: the request of a dependency is an expression

探索Effective Go: 提升Go编程效率的新指南

C++ | 【04 效率】More Effective C++

Effective Java 经典学习（一）

Effective C++中文版第三版 高清完整版PDF

Are Transformers Effective for Time Series Forecasting?|填坑

Effective C++ 55个改善编程与设计的有效方法

《Effective Modern C++》- 极精简版 1-4条

Effective Objective-C 52个有效方法个人笔记

Effective Java 总结

Unity 协程插件More Effective Coroutines Pro 学习笔记

Effective Modern C++笔记汇总

[论文阅读]:PP-YOLO: An Effective and Efficient Implementation of Object Detector

10 个Team Leader应该具备的特质（The 10 Effective Qualities of a Team Leader）

发表评论

推荐文章

禁用windows 2008R2的恢复模式，防止服务器意外关机而进行恢复模式

什么是java,java在linux和windows下的安装方法以及变量配置

android浏览器获取设备id,H5能获取到手机设备ID或者手机浏览器唯一识别码吗

局域网共享打印机教程

cad2018致命错误unhandled_CAD打不开出现致命错误的四种解决办法

热门文章

Spectrum Sensing Based on Deep Learning Classification for Cognitive Radios阅读 2019

手机浏览器onclick事件不能跳转页面

ubuntu 输入法安装流程

win10下Groovy安装及开发环境配置

u盘 安装 centOS 7

x86机器PC机改造成云终端瘦终端教程

只需一款软件就能让电视秒变成电脑

电脑通过 wifi 连接小米手机

定时任务莫名停止，Spring 定时任务存在 Bug？？

Auto CAD：CAD软件之上菜单栏(CAD选项设置、常用工具(样条曲线多段线倒角移动镜像偏移修剪工具延伸阵列)、修改工具(拉长编辑多段线对齐命令、注释标注)简介之详细攻略

最新文章

Linux软件安装部署（jdk、mysql、nginx、nacos、redis、rocketmq）

单招十类（计算机基础）知识点整理【备考版本】

软件即服务（saas）_什么是SaaS？ 定义软件即服务

软件工程学科的诞生

三维激光扫描后处理软件_三维激光扫描在建筑、地质、采矿及科研解决方案

AutoCAD常见问题及解决

免费好用的图纸管理系统(带手机cad看图功能)

信誉软件测试工资,软件测试脱产学习价格信誉保证_尚脑教育经得起考验

【第一CAD】“布局”的使用@外挂技术部

【总结】编程语言的分类

Transformer应用到建筑行业，CAD设计起飞了

软件开发相关名词解释

2024年图纸加密软件最新版排行榜出炉！10款图纸加密软件大比拼

高性能计算专业应用软件大观

苹果电脑steam和epic哪个用的人多 steam里的mac游戏比epic多吗 Mac游戏推荐 Steam官网 Epic和Steam有什么区别 Mac电脑玩Windows游戏 crossover软件

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

Effective C++中文版第三版高清完整版PDF

u盘安装 centOS 7

软件即服务（saas）_什么是SaaS？定义软件即服务

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载