admin管理员组文章数量:1567286
2024年7月4日发(作者:)
ncbi中查找基因序列的方法和三个号码
一.例子:查找酿酒酵母(Saccharomyces cerevisiae)里的海藻糖合成酶基因(tps1)
即可出现很多条目,找到Saccharomyces cerevisiae的就是NC_001134了,点击后就进入该
基因所在染色体的界面了,再在“编辑”中“查找” tps1就可以看该基因所在的位置,再
点击CDS或者GeneID:852423都可以出现相关链接!
当然,如果你在文献查到目的蛋白的序列号如NP_009684.1或者GeneID:852423,那分
别在Search后选择Protein或者Gene也可以出现相关链接!
二.基因CDS区界面的3个号码
/entrez/?val=50593115&from=488899&to=490386&
view=gbwithparts
找到后,我发现该界面有3个标记,一个是NC_001134 ,其次是gi:50593115,最后是
FEATURES中的gene中的 /db_xref= “GeneID:852423”,他们分别是什么号码,用在什么
地方呢?尝试中,终于发现,
在Search“Nucleotide”或者“Core Nucleotide”时,for后面是NC_001134,最终go
到该基因所在染色体全长序列的信息,所以NC_001134应该是该染色体的登录号吧?
在Search“Nucleotide”或者“Core Nucleotide”时,for后面是50593115,最终go到
该基因所在染色体全长序列的信息,所以50593115应该是该染色体的号吧?
在Search“Gene”时,for后面是852423,最终go到该基因的信息,所以852423应该
是该基因的登录号吧?所以我们如果要记住目的基因在ncbi中的位置就记住这个GeneID!
其他像NP_009684当然是基因编码的蛋白质的登录号啦,不说了。
我们在文献中查到的基因往往给的是Gene ID
三.引物设计第一步--找编码序列的方法
在Search“Gene”时,for后面是852423,最终go到目的基因的信息
点击中的FASTA,获得的就是mRNA的非模
板链(其实就是mRNA里的U换成了T),也可以说是CDNA的互补片段,因为与编码的
蛋白质一一对应,所以也就是引物设计真正的模板!引物设计后面的PCR要克隆的就是这
段序列!所以千万不要搞错了!点击GENBANK,获得的是CDS区的序列和相关信息,这
个CDS区包括CDNA,也包括其他不编码的序列,所以PCR没必要把CDS区全部克隆出
来!其实在CDS界面(或者说点击GENBANK后出现的界面里),把Display里的GENBANK
(full)改成FASTA也可以!
其实在该界面中我们还可以了解到其他信息
1. 点击reference sequence details,可以看到NP_009684.1,点击他,可以看到目的蛋白质
的信息
2. 点击
获得的是目的基因的图谱,然后点击
TPS1后面的sv,也可以看到编码序列了,当然这里的DNA序列和蛋白质一一对应,更说
明是设计引物的模板(这个图谱界面也可以在2的点击GENBANK后获得的CDS区中点击
852423链接获得,或者说条条链接通罗马!)
四.关于CDS和CDNA的关系
ncbi中的CDS就是编码序列,包括CDNA全部,也含有其他序列,毕竟CDNA是人为
根据mRNA反转录得到的,而CDS区生物本身的,有些不编码的序列,好像CDNA是纯
净物,CDS有点渣子,呵呵。CDNA的互补序列既然是与编码的蛋白质一一对应的,当然
是ATG起始的,TAA TAG TGA终止的。
版权声明:本文标题:ncbi中查找基因序列的方法和三个登录号 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://www.elefans.com/shuma/1720025464a817754.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论