转录因子的数据库"/>
关于各种转录因子的数据库
1 、 TRANSFAC ( .html#transfac)德国生物工程研究所开发的 TRANSFAC 数据库是关于转录因子、它们在基因组上的结合位点和与 DNA 结合的 profiles 的数据库。由 SITE 、 GENE 、 FACTOR 、 CLASS 、 MATRIX 、 CELLS 、 METHOD 和 REFERENCE 等数据表构成。此外,还有几个与 TRANSFAC 密切相关 的扩展库: PATHODB 库收集了可能导致病态的突变的转录因子和结合位点; S/MART DB 收 集了与染色体结构变化相关的蛋白因子和位点的信息; TRANSPATH 库用于描述与转录因子 调控相关的信号传递的网络; CYTOMER 库表现了人类转录因子在各个器官、细胞类型、生 理系统和发育时期的表达状况。 TRANSFAC 及其相关数据库可以免费下载,也可以通过 Web 进行检索和查询。 TRANSFAC 数据库始建于 1988 年,采用关系数据库模式,用表格存放数 据。 1997 年起,基于 Web 的版本开始上网,目前,该数据库正在进一步开发,如构建各种转 录因子在不同细胞组织中的表达特异性数据库等。()
2 、 EPD (/)
是真核基因启动子数据库,提供从 EMBL 中得到的真核基因的启动子序列,目标是帮助实验研究人员、生物信息学研究人员分析真核 基因的转录信号。现有 1500 多个启动子序列数据,按照层次式方式组织数据。关于启动子 的描述信息直接摘自科学文献,因而相对独立于 EMBL 。 该数据库所有的启动子均经过一系列的实验证实:如是否为真核 RNA 聚合酶 Ⅱ 启动 子、是否在高等真核生物中有生物学活性、是否与数据库中的其他启动子有同源性等等。 EPD 与其他的相关数据库也建立了相关链接,如 EMBL 、 SWISS-PROT 、 TRANSFAC 等。 在最新版本第 76 版本中, EPD 将收集的启动子分为六大类:植物启动子、线虫启动子、 拟南芥启动子、软体动物启动子、棘皮类动物启动子和脊椎动物启动子。共 2997 个条目, 其中脊椎动物中的人类启动子有 1871 个,约占总数的 62% 。 EPD 是目前唯一的一个实验证实启动子数据库,所以是各种预测软件的评论手段之一。
3 、 SCPD (/)酵母启动子数据库(The Promoter Database of Saccharomyces cerevisiae )
提供 6000 余 条酵母基因和 ORF 以及相关的调控元件和转录因子数据。在 SCPD 中列有酵母菌的 256 个转 录因子,目前已经可以借助基因表达分析来搜寻基因的调控位置。 Roth 等人及 Hughes 等人针 对有类似基因表现图谱的基因启动子位置,寻找统计上经常出现的 DNA 序列,发现 3311 个 DNA motif ,经归类后有近 400 个 DNA motif 。由于一个基因的启动子区域经常含有一个以上 的不同的 DNAmotif ,并且无法知道哪些 DNAmotif 必须同时与转录因子结合进而促进基因表 达。 Pilpel 等人设计了一种称作基因表达一致性分数( Expression Coherence Score )的度量, 做法是先收集酵母菌全部在启动子区域上拥有某种特殊 DNA motif 组合的基因,接下来计算 酵母菌在不同生理状况下基因表现的相关性(即 Expression Coherence Score ),如果相关系数 高,则可以推测出此种 DNAmotif 的特殊组合对基因表达进行调控。
4 、 TRRD (/)
转录调控区数据库( Transcription RegulatoryRegions Database ) 是在不断积累的真核生物基因调控区结构-功能特性信息基础上构建的。每一个 TRRD 的条目里包含特定基因各 种结构-功能特性:转录因子结合位点、启动子、增强子、静默子、以及基因表达调控模式等。 TRRD 包括五个相关的数据表: TRRDGENES( 包含所有 TRRD 库基因的基本信息和调控 单元信息 ) ; TRRDSITES( 包括调控因子结合位点的具体信息 ) ; TRRDFACTORS( 包括 TRRD 中与各个位点结合的调控因子的具体信息 ) ; TRRDEXP( 包括对基因表达模式的具体描述 ) ; TRRDBIB( 包括所有注释涉及的参考文献 ) 。 TRRD 主页提供了对这几个数据表的检索服务。
5.JASPAR /
JASPAR 是收集有关转录因子与 DNA 结合位点模体 (motif) 的最全面的公开的数据库 , 该数据库是由哥本哈根大学 (University of Copenhagen) 负责日常数据更新维护工作。 JASPAR 数据库中所包含的数据 , 都经过严格筛选 , 有确切的实验依据 , 通过计算机辅助软件进行整合识别匹配并用生物学手段进行注释。 JASPAR 中的数据是完全公开的 , 用户可以通过主页对数据库进行直接访问。网站在最新一次更新中对 JASPAR_CORE 根据物种分成 5 类 , 即脊椎动物门 (Vertebrata) 、线虫纲 (Nematoda) 、昆虫纲 (Insecta) 、植物界 (Plantae) 和真菌界 (Fungi), 以及根据结构归类 , 用户可以清晰地在主页上找到相应链接。网站还提供了根据序列号 (ID) 、物种等特性进行的搜索 , 还可以直接浏览 数据库的内容。同时 , 用户通过主页可以下载 JASPAR 中的数据到自己的电脑上。与同领域相似数据库相比 , JASPAR 是一个非冗余的数据 库 , 数据来源经过严格筛选 , 并且对所有数据提供免费下载 , 并有相应软件配套使用。但是相对于 TRANSFAC 等其他数据库 , JASPAR 所包 含的数据量比较小 , 用户可以根据需要选择相应的数据库 .
更多推荐
关于各种转录因子的数据库
发布评论