admin管理员组文章数量:1564172
2024年7月21日发(作者:)
字符集合
只是一些非控制型字符,象空格和结束符,出现在PDB文件记录中。也就是:
abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
1234567890
` - = [ ] ; ' , . / ~ ! @ # $ % ^ & * ( ) _ + { } | : " < > ?
空格和结束符。结束符根据系统而定,Unix用一行字符,而其他的系统可能就用一个回车来表示。
特殊字符
希腊字母就详细的拼写出来。比如:α, β, γ
原子用DOT表示。
右箭头用-->表示。
左箭头用<--表示。
上标用两个等号表示开始和结束。比如:S==2+==
下标用一个等号来表示开始和结束。比如:F=c=
如果等号两边至少有一边有一个空格,那么这个字符就是表示等号。比如:2 + 4 = 6
逗号,冒号和括号用来表示文档中的分界苻,也就是下面几种中的一种:
List
SList
Specification List
Specification
如果逗号,冒号或者括号在任何一片文档中使用不是作为分界苻的话,那么肯定有字符被漏掉了。比如下边例子中第四行的"":
COMPND MOL_ID: 1;
COMPND 2 MOLECULE: GLUTATHIONE SYNTHETASE;
COMPND 3 CHAIN: NULL;
COMPND 4 SYNONYM: GAMMA-L-GLUTAMYL-L-CYSTEINE:GLYCINE LIGASE
COMPND 5 (ADP-FORMING);
COMPND 6 EC: 6.3.2.3;
COMPND 7 ENGINEERED: YES
COMPND MOL_ID: 1;
COMPND 2 MOLECULE: S-ADENOSYLMETHIONINE SYNTHETASE;
COMPND 3 CHAIN: A, B;
COMPND 4 SYNONYM: MAT, ATP:L-METHIONINE S-ADENOSYLTRANSFERASE;
COMPND 5 EC: 2.5.1.6;
COMPND 6 ENGINEERED: YES;
COMPND 7 BIOLOGICAL_UNIT: TETRAMER;
COMPND 8 OTHER_DETAILS: TETRAGONAL MODIFICATION
数据类型-------------------------------------
该部分该部分主要用来描述试验和记录中该大分子的一些基本信息,有
以下几种记录:
HEADER,OBSLTE,TITTITLE,CAVEAT,COMPND,SOURCE,KEYWDS,EXPDTA,
AUTHOR,REVDAT,SPRSDE,JRNL和REMARK部分。以下来具体说明一下各个记录。
记录类型--------------------------------------
按照在记录中出现的频率区分:
SINGLE
一个文件中只出现一次.按字母顺序列出如下:
记录类型 说明
CRYST1 晶胞参数
END 结束
HEADER 分子类,公布日期,ID号
MASTER 版权拥有者
ORIGXn 直角-PDB坐标
SCALEn 直角部分结晶学坐标
如果这些记录在一个记录中重复出现是错误的。
SINGLE CONTINUED
在记录中概念性的只出现一次,但信息内容可能超过了可利用列的数目.因次这些记录在后来的排列中会继续.按字母顺序列出如下:
记录类型 说明
AUTHOR 结构测定者
CAVEAT 可能的错误提示
COMPND 化合物名称
EXPDTA 测定结构所用的试验方法
KEYWDS 关键词
OBSLTE 注明该id号已改为新号
SOURCE 化合物来源
SPRSDE 已撤消或更改的相关记录
TITLE 说明试验方法类型
MULTIPLE
大部分记录类型多次出现,经常出现在这些组中,组中的信息理论上并没有连接,但已呈现为列表的组成部分.这种记录类型中的许多习惯连载可能不
仅仅制定记录还和其他记录相联.按字母顺序列出如下:
记录类型 说明
ANISOU 温度因子
ATOM 标准基因的原子坐标
CISPEP 顺势残基
CONECT 有关记录
DBREF 其他序列库的有关记录
HELIX 螺旋
HET 非标准残基
HETSYM 非标准残基的同义字
HYDBND 氢键
LINK 残基间化学键
MODRES 对标准残基的修饰
MTRIXn 显示非晶相对称
REVDAT 修订日期及相关内容
SEQADV PDB和其它记录的出入
SEQRES 残基序列
SHEET 片层
SIGATM 标准差
SIGUIJ 温度因子
SITE 特性位点
SLTBRG 盐桥
SSBOND 二硫键
TURN 转折
TVECT 转换因子
Multiple Continued
在记录中概念性的出现多次,但信息内容可能超过了可利用列的数目.因次这些记录在后来的排列中会继续.按字母顺序列出如下:
记录类型 说明
FORMUL 非标准残基化学式
HETATM 非标准集团原子坐标
HETNAM 非标准残基的化学名称
Grouping
有三种记录类型用来聚合其他记录. 按字母顺序列出如下:
记录类型 说明
ENDMDL 亚基结束
MODEL 多亚基时,示亚基号
TER 链末端
MODEL/ENDMDL 记录包围着 ATOM, HETATM, SIGATM, ANISOU, SIGUIJ,和 TER 记录. TER 记录预示链的末端.
Other
其他记录类型有详细的内部结构.按字母顺序列出如下:
记录类型 说明
JRNL 发表坐标集的文献
REMARK 注解
记录的表示
PDB数据库中的数据都应按照一定的规定来出现,强制记录类型必须出现在所有的记录中,当强制数据没有提供,记录名必须出现在记录中并以
NULL表示当此条件存在时选择项表就变成强制记录类型。以下表格是对这两种类型的具体划分和描述:
记录类型
HEADER
OBSLTE
TITLE
CAVEAT
COMPND
SOURCE
KEYWDS
EXPDA
AUTHOR
REVDAT
SPRSDE
JRNL
REMARK 1
REMARK 2
说明
强制
可选
强制
可选
强制
强制
强制
强制
强制
强制
可选
可选
可选
强制
变为强制的条件
个别记录中强制
该记录中有错误
在被替代的记录中
出版物描述了该试验
出版物描述了该试验
REMARK 3
REMARK N
DBREF
SEQADV
SEQRES
MODRES
HET
HETNAM
HETSYN
FORMUL
HELIX
SHEET
TURN
SSBOND
LINK
HYDBND
SLTBRG
CISPEP
SITE
CRYST1
ORIGX1 ORIGX2 ORIGX3
SCALE1 SCALE2 SCALE3
MTRIX1 MTRIX2 MTRIX3
TVECT
MODEL
ATOM
SIGATM
ANISOU
SIGUIJ
TER
ENDMDL
CONNECT
MASTER
END
记录部分的划分
强制
可选
可选
可选
可选
可选
可选
可选
可选
可选
可选
可选
可选
可选
可选
可选
可选
可选
可选
强制
强制
强制
可选
可选
可选
可选
可选
可选
可选
可选
可选
可选
强制
强制
一定条件下强制,如记录在备注描述
每个缩氨酸链的长度大于十个残基并
且核酸记录存在于核算蛋白库中(NDB)
有序列冲突
ATOM记录存在
有修饰存在
有不标准的残基除了水分子
有不标准的残基除了水分子
有不标准的残基或水
有二硫键存在
完全不对称单元
非晶相对称
记录中多于一个MODEL
有标准的残基存在
有ATOM记录存在
有MODEL存在
不标准的团存在
Title
Remark
大概描述
参考书目,最大分辨率,注解等
一级结构 氨基酸或核苷酸序列和PDB序列和
其他序列库的有关记录
不标准组的描述
二级结构
化学元素连接
大分子的特征
晶体细胞描述
坐标描述
原子坐标数据
HEADER, OBSLTE, TITLE,CAVEAT, COMPND,
SOURCE,KEYWDS, EXPDTA, AUTHOR,REVDAT,
SPRSDE, JRNL
REMARKs 1, 2, 3 and others
Primary structure DBREF, SEQADV, SEQRES,MODRES
Heterogen
Secondary structure
Connectivity annotation
Miscellaneous feature
Crystallographic
Coordinate transformation
Coordinate
HET, HETNAM, HETSYN, FORMUL
HELIX, SHEET, TURN
SSBOND, LINK, HYDBND, SLTBRG,CISPEP
SITE
CRYST1
ORIGXn, SCALEn, MTRIXn, TVECT
MODEL, ATOM, SIGATM,ANISOU, SIGUIJ, TER,
HETATM, ENDMDL
Connectivity
Bookkeeping
化学键连接
概要信息和结束标志
CONECT
MASTER, END
对数据类型的说明
数据类型
Achar
Atom
Character
Continuation
Date
IDcode
Integer
Token
List
Lstring
LString(n)
Real(n,m)
Record name
Residue name
Slist
Specification
Specification list
String
String(n)
SymOP
残基名字
在PDB格式中出现的标准残基的名字:
残基类型
氨基酸
核酸
其他
残基名字
ALA, ARG, ASN, ASP, CYS, GLN, GLU, GLY, HIS, ILE, LEU, LYS
A, C, G, T, U, I, +A, +C, +G, +T, +U, +I
UNK(unknown)
描述
一个英文字母(A-Z,a-z)
原子名
ASCII码和空格
如果一行描述不完用此表示序列号,占两个字符右对齐,第一个用空格
占九个字符dd-mmm-yy, DD表日期,右对齐不足左补零;MMM表月份用常用的三个英文字母表示;YY表20世纪的一
年,他们都必须是有效日期
占四个字符,第一个是阿拉伯数字(0-9),余下的三个由希腊数字组成,字母必须是大写的。若第一个是阿拉伯数
字零则对此蛋白质的描述中没有坐标数据
右对齐,不足的用空格填充的整型数据
由一组没有空格的字符组成,结尾部分紧跟着冒号和空格
一个由逗号分开的字符串
字符串,任何空格都有意义必须保存
有N个字符的Lstring
实型
记录的名字,由六个字符组成,左对齐,不足的用空格补充
右对齐格式标准氨基酸或核苷酸中的一个,后有列表.不标准组分在HET中详细说明
由一些内容组成的字符串,有分号分开
由一些token记录组成的字符串,由冒号分开
由Specifications组成的序列,由分号分开
由字符组成的序列,可能有些空格,但应该详细说明
由N个字符组成String
由4-6个数字组成的整数,右对齐格式.详细资料在Appendix 1
Appendix 4中有更多关于标准残基名和缩写的信息, Appendix 5中有他们的化学式和分子量.
标题部分
HEADER(分子类,公布日期、ID号)
综述
该记录包含三个方面的内容:蛋白质的种类,被该数据库接收的日期和唯一区分该蛋白质的id CODE.
记录格式
列 数据类型 字段名称 定义描述
1 – 6
11 – 50
51 – 59
63 – 66
细节
改分类表示是左对齐的,并且由于分给字符位的限制,有时分类名太长,要用简写表示。在KEYWDS记录中存着改分类的全称。
示例
1 2 3 4 5 6 7
345678934567890
HEADER MUSCLE PROTEIN 02-JUN-93 1MYS
HEADER HYDROLASE (CARBOXYLIC ESTER) 08-APR-93 2PHI
HEADER COMPLEX (LECTIN/TRANSFERRIN) 07-JAN-94 1LGB
OBSLTE (注明此ID号已改为新号)
综述
该记录出现在已经被收回的蛋白质的描述中,可以作为一个标志。任何新的记录都能代替别回收的记录.这个版本允许多个新纪录代替现有记录.
记录格式
列
1 – 6
9 – 10
12 – 20
22 – 25
32 – 35
37 – 40
42 – 45
47 - 50
52 - 55
57 – 60
62 – 65
67 – 70
细节
只有第一个提交记录的人才有权利收回改蛋白质,所有回收的记录都有研究用途.
示例
1 2 3 4 5 6 7
345678934567890
OBSLTE 31-JAN-94 1MBP 2MBP
TITLE(说明实验方法类型)
综述
该记录描述试验的题目或者对它的一些分析。该记录唯一区分一个蛋白质。
记录格式
列
1 - 6
9 - 10
11 - 70
细节
数据类型
Record name
Continuation
String
字段名称
"TITLE "
顺序
标题
定义描述
允许多重记录串联表示不同行的顺序号
试验题目
数据类型
Record name
Continuation
Date
IDcode
IDcode
IDcode
IDcode
IDcode
IDcode
IDcode
IDcode
IDcode
字段名称
"OBSLTE"
continuation
repDate
idCode
rIdCode
rIdCode
rIdCode
rIdCode
rIdCode
rIdCode
rIdCode
rIdCode
定义描述
允许多重记录串联表示不同行的顺序号
被替代的日期
该记录的id code
替换的id code
替换的id code
替换的id code
替换的id code
替换的id code
替换的id code
替换的id code
替换的id code
Record name
String(40)
Date
IDcode
"HEADER"
classification
depDate
idCode
该蛋白质的分类
被数据库接收的日期
唯一标识某个蛋白
1. 描述记录内容和区别相似记录得程序或条件,使录入者有机会着重强调做这些特殊试验得根本目的.
2. TITLE可能包括得一些项目: -实验类型
-对突变的描述
-记录中只给出α-碳原子.
示例
1 2 3 4 5 6 7
345678934567890
TITLE RHIZOPUSPEPSIN COMPLEXED WITH REDUCED PEPTIDE INHIBITOR
TITLE BETA-GLUCOSYLTRANSFERASE, ALPHA CARBON COORDINATES ONLY
CAVEAT(可能的错误提示)
综述
警告在蛋白质记录中中出现的错误。
记录格式
列 数据类型 字段名称 定义描述
1 - 6 Record name "CAVEAT"
9 - 10 Continuation continuation 允许多重记录串联表示不同行的顺序号
12 - 15 IDcode idCode 蛋白质的ID code
20 - 70 String comment 警告的原因
细节
1. PDB在还未回收的错误记录中加此记录,用的比较保守只在外部评论后用.
2. PDB不能核实转化回晶胞时注意此记录,此时分子结构依然正确.
示例
1 2 3 4 5 6
345678934567890
CAVEAT 1ABC THE CRYSTAL TRANSFORMATION IS IN ERROR BUT IS
CAVEAT 2 1ABC UNCORRECTABLE AT THIS TIME
COMPND(化合物分子组成)
综述
描述蛋白质的组成
记录格式
列 数据类型 字段名称 定义描述
1 - 6 Record name "COMPND"
9 - 10 Continuation continuation 允许多重记录串联表示不同行的顺序号
11 - 70 Specification list compound 对分子成分的描述
细节
对蛋白质组成的描述又细分为如下:
记号 确切涵义描述
MOL_ID 每一成分的数目
MOLECULE 分子名
CHAIN 逗号分开链标识符,若空白用"NULL"表示
FRAGMENT 对结构域或具体部分的详细描述
SYNONYM MOLECULE同义部分,逗号分开
EC 酶学委员会相关号码,不止一个时用逗号分开
ENGINEERED 分子通过重组产生或纯化学合成
MUTATION 自野生型突变的描述
BIOLOGICAL_UNIT 完整功能单元描述
7
OTHER_DETAILS 增加的注释
对MUTATION以下举例说明惯用的几种突变类型:
突变类型 描述 形式
简单替代
Asn替代His 57 H57N
只在C链中Asn替代His 57 Chain C, H57[A]N
插入突变 His and Pro 插入Lys 48前 INS(HP-K48)
A链和C链的Arg 141缺失,B链
缺失突变
中的不缺失 Chain A, C, DEL(R141)
His 23到ARG 26缺失 DEL(23-26) DEL(23-26)
只B链的His 23C和Arg 26缺失 Chain B, DEL(H23[C],R26)
如有多于十种突变: - 所有突变在SEQADV记录中列出
- 一些突变可能在COMPND的MUTATION中列出来强调录入者认为最重要的部分.
示例
1 2 3 4 5 6
345678934567890
COMPND MOL_ID: 1;
COMPND 2 MOLECULE: HEMOGLOBIN;
COMPND 3 CHAIN: A, B, C, D;
COMPND 4 ENGINEERED: YES;
COMPND 5 MUTATION: CHAIN B, D, V1A;
COMPND 6 BIOLOGICAL_UNIT: HEMOGLOBIN EXISTS AS AN A1B1/A2B2
COMPND 7 TETRAMER;
COMPND 8 OTHER_DETAILS: DEOXY FORM
COMPND MOL_ID: 1;
COMPND 2 MOLECULE: COWPEA CHLOROTIC MOTTLE VIRUS;
COMPND 3 CHAIN: A, B, C;
COMPND 4 SYNONYM: CCMV;
COMPND 5 MOL_ID: 2;
COMPND 6 MOLECULE: RNA (5'-(*AP*UP*AP*U)-3');
COMPND 7 CHAIN: D, F;
COMPND 8 ENGINEERED: YES;
COMPND 9 MOL_ID: 3;
COMPND 10 MOLECULE: RNA (5'-(*AP*U)-3');
COMPND 11 CHAIN: E;
COMPND 12 ENGINEERED: YES
COMPND MOL_ID: 1;
COMPND 2 MOLECULE: HEVAMINE A;
COMPND 3 CHAIN: NULL;
COMPND 4 EC: 3.2.1.14, 3.2.1.17;
COMPND 5 OTHER_DETAILS: PLANT ENDOCHITINASE/LYSOZYME
SOURCE(化合物来源)
综述
用来详细描述记录中每个生物大分子的生物或化学来源。用习惯命名和系统命名共同描述.
记录格式
列 数据类型 字段名称 定义描述
1 - 6 Record name "SOURCE"
9 - 10 Continuation continuation 允许多重记录串联表示不同行的顺序号
11 - 70 Specification list srcName 分子来源名
细节
同COMPND一样,对SOURCE描述也细分为如下:
记号 确切涵义描述
7
MOL_ID
SYNTHETIC
FRAGMENT
ORGANISM_SCIENTIFIC
ORGANISM_COMMON
STRAIN
VARIANT
CELL_LINE
ATCC
ORGAN
TISSUE
CELL
ORGANELLE
SECRETION
CELLULAR_LOCATION
PLASMID
GENE
EXPRESSION_SYSTEM
EXPRESSION_SYSTEM_STRAIN
EXPRESSION_SYSTEM_VARIANT
EXPRESSION_SYSTEM_CELL_LINE
EXPRESSION_SYSTEM_ATCC_NUMBER
EXPRESSION_SYSTEM_ORGAN
EXPRESSION_SYSTEM_TISSUE
EXPRESSION_SYSTEM_CELL
EXPRESSION_SYSTEM_ORGANELLE
EXPRESSION_SYSTEM_CELLULAR_LOCATION
EXPRESSION_SYSTEM_VECTOR_TYPE
EXPRESSION_SYSTEM_VECTOR
EXPRESSION_SYSTEM_PLASMID
EXPRESSION_SYSTEM_GENE
OTHER_DETAILS
示例
1 2 3
345678934567890
SOURCE MOL_ID: 1;
SOURCE 2 ORGANISM_SCIENTIFIC: AVIAN SARCOMA VIRUS;
SOURCE 3 STRAIN: SCHMIDT-RUPPIN B;
SOURCE 4 EXPRESSION_SYSTEM: ESCHERICHIA COLI;
SOURCE 5 EXPRESSION_SYSTEM_PLASMID: PRC23IN
SOURCE MOL_ID: 1;
SOURCE 2 ORGANISM_SCIENTIFIC: GALLUS GALLUS;
SOURCE 3 ORGANISM_COMMON: CHICKEN;
SOURCE 4 ORGAN: HEART;
SOURCE 5 TISSUE: MUSCLE
KEYWDS(关键词)
综述
该部分主要用来描述关于该蛋白质的一些关键字,用逗号分开。
记录格式
列 数据类型 字段名称
1 - 6 Record name "KEYWDS"
9 - 10 Continuation Continuation
11 – 70 List keywds
分子数目
化学合成来源
分子结构域或片段的详细描述
生物体的系统命名
生物体的习惯命名
标识链
标识参数
实验细胞链
American Type Culture Collection 号码
有特殊功能的组织
一般功能和结构的组织细胞
标识特殊的细胞类型
细胞组织结构
标识分泌物如唾液,尿液,毒液等
标识细胞位置
识别包含基因的质体
标识基因
重组大分子表达系统
生物体的张力
生物体的参数
细胞排列
标识ATCC numbe
标识表达分子的特殊器官
标识表达分子的特殊组织
表示细胞类型
标识细胞器官
标识位置
标识载体类型如质粒,病毒,粘粒等
标识常用载体
在重组试验中常用质粒
重组试验中常用的基因的名
表示别处给出的信息来源
4 5
定义描述
允许多重记录串联表示不同行的顺序号
各个不同的关键字用逗号分开
6 7
细节
在该记录中描述的关键字的内容可以是:功能分类,代谢角色,在生物或化学上的活性,结构分类等。
示例
1 2 3 4 5 6 7
345678934567890
KEYWDS LYASE, TRICARBOXYLIC ACID CYCLE, MITOCHONDRION, OXIDATIVE
KEYWDS 2 METABOLISM
EXPDTA(测定结构所用的实验方法)
综述
该记录用来描述关于试验的一些信息,主要是做试验时用的方法:电子衍射,光纤衍射,荧光传递,中子衍射,NMR(核磁共振),理论模型,X光
衍射等。
记录格式
列
1 - 6
9 - 10
11 – 70
细节
该记录是必须出现的;如果有多于一种的方法被使用,用分号分开。对某一方法的评论出现在分号前面。
示例
1 2 3 4 5 6 7
345678934567890
EXPDTA X-RAY DIFFRACTION
EXPDTA NEUTRON DIFFRACTION; X-RAY DIFFRACTION
EXPDTA NMR, 32 STRUCTURES
AUTHOR(结构测定者)
综述
该记录存储有关科学家的名字信息。多个名字用逗号分开。
记录格式
列
1 - 6
9 - 10
11 - 70
细节
个人姓名的表示: -First names和middle names在姓之前大写于词首,后跟一句点.
-只有作者的姓完整给出.
-若为作者名字的一部分可用连字号.
-姓可用省略符号表示
- Junior不是简略.
-变音或其他字符修改都未给出
个人姓名的结构: -词首大写字母和其后的句点后么没有空格.
-空格只用在姓中或姓和Junior, II,或 III之间
-缩写作为姓的一部分如St.或 Ste.和其后的姓的下一部分之间有一句点和空格.
集体名字的表示: -所有作者的团体名字应该完整拼写.
-大团体的名称应在其细分名称之前,如某所大学的化学系.
特殊情况: -名字若有英文译本就用英文表示,否则就用不本土语言,必要时可音译.
数据类型
Record name
Continuation
List
字段名称
"AUTHOR"
Continuation
authorList
定义描述
允许多重记录串联表示不同行的顺序号
作者的名字,用逗号分开
数据类型
Record name
Continuation
SList
字段名称
"EXPDTA"
Continuation
technique
定义描述
允许多重记录串联表示不同行的顺序号
试验用的方法
示例
1 2 3 4 5 6 7
345678934567890
AUTHOR ,,BACK,,,
AUTHOR 2 PS JUNIOR,. STEVENS
AUTHOR C.-N,T-CLEWS, DI SANSAVERINO
REVDAT(修订日期及相关内容)
综述
该记录用来描述曾经修改过的历史记录。
记录格式
列 数据类型 字段名称 定义描述
1 - 6 Record name "REVDAT"
8 – 10 Integer modNum 修改的号码
11 - 12 Continuation continuation 允许多重记录串联表示不同行的顺序号
14 - 22 Date modDate 更改的日期,不再重复
24 - 28 String(5) modId 标识这个特殊修改
32 Integer modType 用一个整数来表示更改的类型
40 - 45 LString(6) record 更改的记录的名字
47 - 52 LString(6) record 更改的记录的名字
54 - 59 LString(6) record 更改的记录的名字
61 - 66 LString(6) record 更改的记录的名字
细节
对蛋白质的每一次修改,标识其修改的号码就增一;该记录出现的次序是递减的,最近的修改先出现。修改类型用数字表示如下:
0 最初发布的记录
1 混杂的
2 修改CONECT记录.
3 修饰坐标或构型
4 - 9 没有定义
示例
1 2 3 4 5 6
345678934567890
REVDAT 3 15-OCT-89 1PRCB 1 REMARK
REVDAT 2 19-APR-89 1PRCA 2 CONECT
REVDAT 1 09-JAN-89 1PRC 0
SPRSDE(已撤销或更改的相关记录)
综述
存储已经作废了的ID code及替换的ID code.一条记录可能代替很多,只有结构的主要调查人才有权收回它.
记录格式
列 数据类型 字段名称 定义描述
1 - 6 Record name "SPRSDE"
9 – 10 Continuation continuation 允许多重记录串联表示不同行的顺序号
12 - 20 Date sprsdeDate 替换日期,不重复
22 - 25 IDcode idCode 原来的ID code,不重复
32 - 35 IDcode sIdCode 替换的ID code
37 - 40 IDcode sIdCode 替换的ID code
42 - 45 IDcode sIdCode 替换的ID code
47 - 50 IDcode sIdCode 替换的ID code
52 - 55 IDcode sIdCode 替换的ID code
57 - 60 IDcode sIdCode 替换的ID code
7
62 - 65
67 - 70
细节
ID code列表在第一个空白的sIDcode区域结束
示例
1 2 3 4 5 6 7
IDcode
IDcode
sIdCode
sIdCode
替换的ID code
替换的ID code
345678934567890
SPRSDE 17-JUL-84 4HHB 1HHB
SPRSDE 27-FEB-95 1GDJ 1LH4 2LH4
JRNL(发表坐标集的文献)
JRNL(发表坐标集的文献)
综述
存储用来描述试验的文献引用。
记录格式
列 数据类型 字段名称
1 - 6 Record name "JRNL "
13 - 70 LString text
细节
如下表格用来描述该记录的亚记录,细分为:
1. AUTHOR(作者)
包含引用的著明出版刊物上的论文或投稿的作者的列表.
列 数据类型 字段名称
1 - 6 Record name "JRNL "
13 - 16 LString(4) "AUTH"
17 - 18 Continuation continuation
20 - 70 List authorList
2. TITL(参考书的标题)
详细说明参考书目的标题.
列 数据类型 字段名称
1 - 6 Record name "JRNL "
13 - 16 LString(4) "TITL"
17 - 18 Continuation continuation
20 - 70 LString title
3. EDIT(编辑)
编辑非定期刊物上的相关参考.
列 数据类型 字段名称
1 - 6 Record name "JRNL "
13 - 16 LString(4) "EDIT"
17 - 18 Continuation continuation
20 - 70 List editorList
定义描述
看下面的详细描述
定义描述
出现在所有连续记录中
允许多重记录串联表示不同行的顺序号
作者名单
定义描述
允许多重记录串联表示不同行的顺序号
文章的标题
定义描述
允许多重记录串联表示不同行的顺序号
编者的名单
4. REF(参考)
分两种情况:
4a. 如果参考书目还没有被出版,亚记录类型有如下格式:
列
1 - 6
13 - 16
17 - 18
数据类型
Record name
LString(3)
LString(15)
字段名称
"JRNL "
"REF"
"TO BE PUBLISHED"
定义描述
4b. 参考书目已经出版了,REF亚记录类型包括适当领域关于出版物名称,附录,报告,卷,页,年等的信息.
列 数据类型
1 - 6 Record name
13 - 16 LString(3)
17 - 18 Continuation
20 - 47 LString
50 - 51 LString(2)
52 - 55 String
57 - 61 String
63 - 66 Integer
5. PUBL(出版者的名字或出版的地方)
列 数据类型
1 - 6 Record name
13 - 16 LString(4)
17 - 18 Continuation
20 - 70 LString
6. REFN(对引用参考书目的编码)
分两种情况:
4a. 引用没有被出版REFN亚记录类型的格式:
列 数据类型
1 - 6 Record name
13 - 16 LString(4)
67 - 70 LString(4)
4b. 引用被出版REFN亚记录类型的格式:
列 数据类型
1 - 6 Record name
13 - 16 LString(4)
20 - 23 LString(4)
25 - 30 LString(6)
33 - 34 LString(2)
36 - 39 LString(4)
41 - 65 Lstring
67 - 70 LString(4)
示例
1 2
7
字段名称
"JRNL "
"REF"
continuation
pubName
"V."
volume
page
year
字段名称
"JRNL "
"PUBL"
continuation
pub
字段名称
"JRNL "
"REFN"
"0353"
字段名称
"JRNL "
"REFN"
"ASTM"
astm
country
"ISBN" or "ISSN"
isbn
coden
3
定义描述
允许多重记录串联表示不同行的顺序号
N出版物的名字
只出现在第一个亚记录中
右对齐空格补足
说明: 只出现在第一个亚记录中
文章的第一页, 出现在第一个亚记录中
出版的时间, 出现在第一个亚记录中
定义描述
允许多重记录串联表示不同行的顺序号
出版的城市和出版者的名字
定义描述
未出版著作的CCDC/PDB分类编号
定义描述
ASTM 设计分类编号
在OCLC/MARC目录形式中详细说明的出版国家(可选随
意)
国际标准书名号或"ISSN"国际标准序号
ISSN or ISBN号码(最后一个数字可能是字母并包含一
个或多个破折号).
CCDC/PDB分类编号列表代码.
5 6 4
345678934567890
JRNL AUTH ,,ING,,
JRNL AUTH 2 ELLI,KSON,IVONGS,
JRNL AUTH 3 ER
JRNL TITL CRYSTAL STRUCTURE OF A COMPLEX OF HIV-1 PROTEASE
JRNL TITL 2 WITH A DIHYDROETHYLENE-CONTAINING INHIBITOR:
JRNL TITL 3 COMPARISONS WITH MOLECULAR MODELING
JRNL REF TO BE PUBLISHED
JRNL REFN
0353
JRNL AUTH ,,N,
JRNL TITL THE CRYSTAL STRUCTURE OF HUMAN DEOXYHAEMOGLOBIN AT
JRNL TITL 2 1.74 A RESOLUTION
JRNL REF . V. 175 159 1984
JRNL REFN ASTM JMOBAK UK ISSN 0022-2836 0070
REMARK
综述
该记录用来描述试验细节,注解,评论和别的记录上没有的信息。
列
1 - 6
8 - 10
12 - 70
数据类型
Record name
Integer
LString
字段名称
"REMARK"
REMARK码
空
定义描述
REMARK 号码
左边是一个空格
REMARK 1(有关文献)
该记录用来列举重要出版物有关的信息。每个REMARK记录的首行用作空格有助阅读.具体又细分为如下:
1. REFERENCE
表示记录中的参考号
列
1 - 6
10
12 - 20
22 - 70
2. AUTH
表示参考书目的作者的名字
列
1 - 6
10
13 - 16
17 – 18
20 - 70
3. TITL
表示参考书目的标题
列
1 - 6
10
数据类型
Record name
LString(1)
字段名称
"REMARK"
"1"
定义描述
数据类型
Record name
LString(1)
LString(4)
Continuation
List
字段名称
"REMARK"
"1"
"AUTH"
Continuation
authorList
定义描述
出现在所有连续记录中
允许一个长的作者名单
作者名单.
数据类型
Record name
LString(1)
LString(9)
Integer
字段名称
"REMARK"
"1"
"REFERENCE"
refNum
定义描述
参考书目序号从一开始并逐一增加
13 - 16 LString(4)
17 – 18 Continuation
20 - 70 LString
4. EDIT
表示非定期刊物相关参考编者的有关信息
列 数据类型
1 - 6 Record name
10 LString(1)
13 - 16 LString(4)
17 – 18 Continuation
20 - 70 LString
5. REF
记录出版物的名字,分两种情况:
5a. 还没有被发表
列 数据类型
1 - 6 Record name
10 LString(1)
13 - 16 LString(3)
20 - 34 LString(15)
5b. 已经出版了
列 数据类型
1 - 6 Record name
10 LString(1)
13 - 16 LString(3)
17 - 18 Continuation
20 - 47 Lstring
50 - 51 LString(2)
52 - 55 String
57 - 61 String
63 - 66 Integer
6. PUBL
出版者的名字或出版的地方
列 数据类型
1 - 6 Record name
10 LString(1)
13 - 16 LString(4)
17 - 18 Continuation
20 - 70 LString
7. REFN
对参考书目的编码,分两种情况如下:
7a. 引用没有被出版
列 数据类型
1 - 6 Record name
10 LString(1)
13 - 16 LString(4)
67 - 70 LString(4)
"TITL"
Continuation
title
字段名称
"REMARK"
"1"
"EDIT"
Continuation
editorList
字段名称
"REMARK"
"1"
"REF"
"TO BE PUBLISHED"
字段名称
"REMARK"
"1"
"REF"
Continuation
pubName
"V."
volume
page
year
字段名称
"REMARK"
"1"
"PUBL"
Continuation
pub
字段名称
"REMARK"
"1"
"REFN"
"0353"
出现在所有连续记录中
允许多重记录串联表示不同行的顺序号
文章的标题.
定义描述
出现在所有连续记录中
允许多重记录串联表示不同行的顺序号
编者名单
定义描述
定义描述
准许长的出版物名称
出版物的名字
仅在55列被占据时只出现在第一个记录中
右对齐空格补足
说明: 只出现在第一的亚记录中
文章的第一页, 只出现在第一的亚记录中
出版的日期
定义描述
出现在所有连续记录中
允许多重记录串联表示不同行的顺序号
出版者的名字和出版的城市
定义描述
为出版著作的PDB分类编码.
7b. 引用没有被出版
列
1 - 6
10
13 - 16
20 - 23
25 - 30
33 - 34
36 - 39
41 - 65
68 - 70
数据类型
Record name
LString(1)
LString(4)
LString(4)
LString
LString
LString(4)
LString
LString(4)
字段名称
"REMARK"
"1"
"REFN"
"ASTM"
astm
country
"ISBN" or"ISSN"
isbn
coden
定义描述
如果没有用空格表示
ASTM 文件编码.
由两个阿拉伯数字缩写表示出版的国家
ISSN 或ISBN 号.
剑桥结晶学数据中心分类编号列表号码
示例
1 2 3 4
345678934567890
REMARK 1
REMARK 1 REFERENCE 1
REMARK 1 AUTH ,NN,CHS,S,
REMARK 1 AUTH 2 N
REMARK 1 TITL "ENSEMBLE" ITERATIVE RELAXATION MATRIX APPROACH:
REMARK 1 TITL 2 A NEW NMR REFINEMENT PROTOCOL APPLIED TO THE
REMARK 1 TITL 3 SOLUTION STRUCTURE OF CRAMBIN
REMARK 1 REF PROTEINS: STRUCT.,FUNCT., V. 15 385 1993
REMARK 1 REF 2 GENET.
REMARK 1 REFN ASTM PSFGEY US ISSN 0887-3585
REMARK 1 REFERENCE 2
REMARK 1 AUTH NN,,S,N
REMARK 1 TITL STRUCTURE DETERMINATION BY NMR - APPLICATION TO
REMARK 1 TITL 2 CRAMBIN
REMARK 1 EDIT SIS,
REMARK 1 REF COMPUTATION OF BIOMOLECULAR 1 1992
REMARK 1 REF 2 STRUCTURES; ACHIEVEMENTS,
REMARK 1 REF 3 PROBLEMS, AND PERSPECTIVES
REMARK 1 PUBL BERLIN : SPRINGER-VERLAG
REMARK 1 REFN GW ISBN 3540559515
REMARK 1 REFERENCE 3
REMARK 1 AUTH CHS
REMARK 1 REF 2D NMR STUDIES OF
REMARK 1 REF 2 BIOMOLECULES: PROTEIN
REMARK 1 REF 3 STRUCTURE AND PROTEIN-DNA
REMARK 1 REF 4 INTERACTIONS
REMARK 1 PUBL UTRECHT : UNIVERSITY OF UTRECHT (THESIS)
REMARK 1 REFN NE
REMARK 2(最大分辨率)
该记录用来描述分辨率,用埃构筑模型.
对衍射试验:
列 数据类型 字段名称 定义描述
1 - 6 Record name "REMARK"
10 LString(1) "2"
12 - 22 LString(11) "RESOLUTION."
23 - 27 Real(5.2) resolution 决定
29 - 38 LString(10) "ANGSTROMS."
不是衍射试验:
列 数据类型 字段名称
1 - 6 Record name "REMARK"
10 LString(1) "2"
12 - 38 LString(28) "RESOLUTION. NOT APPLICABLE."
5
0867
2010
1989
定义描述
2011
6 7
41 - 70
一些说明:
列
1 - 6
10
12 - 22
24 - 70
示例
1 2 3 4 5 6 7
345678934567890
REMARK 2
REMARK 2 RESOLUTION. 1.74 ANGSTROMS.
REMARK 2
REMARK 2 RESOLUTION. NOT APPLICABLE.
REMARK 2
REMARK 2 RESOLUTION. NOT APPLICABLE.
REMARK 2 THIS EXPERIMENT WAS CARRIED OUT USING FLUORESCENCE TRANSFER
REMARK 2 AND THEREFORE NO RESOLUTION CAN BE CALCULATED.
REMARK 3(用到的程序和统计方法)
该记录用来描述提纯用的方法和相关统计数据。
下面介绍用不同提纯的方法时的模板:
用X-PLOR方法:
REMARK 3
REMARK 3 REFINEMENT.
REMARK 3 PROGRAM : X-PLOR
REMARK 3 AUTHORS : BRUNGER
REMARK 3
REMARK 3 DATA USED IN REFINEMENT.
REMARK 3 RESOLUTION RANGE HIGH (ANGSTROMS) :
REMARK 3 RESOLUTION RANGE LOW (ANGSTROMS) :
REMARK 3 DATA CUTOFF (SIGMA(F)) :
REMARK 3 DATA CUTOFF HIGH (ABS(F)) :
REMARK 3 DATA CUTOFF LOW (ABS(F)) :
REMARK 3 COMPLETENESS (WORKING+TEST) (%) :
REMARK 3 NUMBER OF REFLECTIONS :
REMARK 3
REMARK 3 FIT TO DATA USED IN REFINEMENT.
REMARK 3 CROSS-VALIDATION METHOD :
REMARK 3 FREE R VALUE TEST SET SELECTION :
REMARK 3 R VALUE (WORKING SET) :
REMARK 3 FREE R VALUE :
REMARK 3 FREE R VALUE TEST SET SIZE (%) :
REMARK 3 FREE R VALUE TEST SET COUNT :
REMARK 3 ESTIMATED ERROR OF FREE R VALUE :
REMARK 3
REMARK 3 FIT IN THE HIGHEST RESOLUTION BIN.
REMARK 3 TOTAL NUMBER OF BINS USED :
REMARK 3 BIN RESOLUTION RANGE HIGH (A) :
REMARK 3 BIN RESOLUTION RANGE LOW (A) :
REMARK 3 BIN COMPLETENESS (WORKING+TEST) (%) :
REMARK 3 REFLECTIONS IN BIN (WORKING SET) :
REMARK 3 BIN R VALUE (WORKING SET) :
REMARK 3 BIN FREE R VALUE :
REMARK 3 BIN FREE R VALUE TEST SET SIZE (%) :
REMARK 3 BIN FREE R VALUE TEST SET COUNT :
REMARK 3 ESTIMATED ERROR OF BIN FREE R VALUE :
数据类型
Record name
LString(1)
LString(11)
String
字段名称
"REMARK"
"2"
"RESOLUTION."
comment
定义描述
注释
String comment 注释
REMARK 3
REMARK 3 NUMBER OF NON-HYDROGEN ATOMS USED IN REFINEMENT.
REMARK 3 PROTEIN ATOMS :
REMARK 3 NUCLEIC ACID ATOMS :
REMARK 3 HETEROGEN ATOMS :
REMARK 3 SOLVENT ATOMS :
REMARK 3
REMARK 3 B VALUES.
REMARK 3 FROM WILSON PLOT (A**2) :
REMARK 3 MEAN B VALUE (OVERALL, A**2) :
REMARK 3 OVERALL ANISOTROPIC B VALUE.
REMARK 3 B11 (A**2) :
REMARK 3 B22 (A**2) :
REMARK 3 B33 (A**2) :
REMARK 3 B12 (A**2) :
REMARK 3 B13 (A**2) :
REMARK 3 B23 (A**2) :
REMARK 3
REMARK 3 ESTIMATED COORDINATE ERROR.
REMARK 3 ESD FROM LUZZATI PLOT (A) :
REMARK 3 ESD FROM SIGMAA (A) :
REMARK 3 LOW RESOLUTION CUTOFF (A) :
REMARK 3
REMARK 3 CROSS-VALIDATED ESTIMATED COORDINATE ERROR.
REMARK 3 ESD FROM C-V LUZZATI PLOT (A) :
REMARK 3 ESD FROM C-V SIGMAA (A) :
REMARK 3
REMARK 3 RMS DEVIATIONS FROM IDEAL VALUES.
REMARK 3 BOND LENGTHS (A) :
REMARK 3 BOND ANGLES (DEGREES) :
REMARK 3 DIHEDRAL ANGLES (DEGREES) :
REMARK 3 IMPROPER ANGLES (DEGREES) :
REMARK 3
REMARK 3 ISOTROPIC THERMAL MODEL :
REMARK 3
REMARK 3 ISOTROPIC THERMAL FACTOR RESTRAINTS. RMS SIGMA
REMARK 3 MAIN-CHAIN BOND (A**2) : ;
REMARK 3 MAIN-CHAIN ANGLE (A**2) : ;
REMARK 3 SIDE-CHAIN BOND (A**2) : ;
REMARK 3 SIDE-CHAIN ANGLE (A**2) : ;
REMARK 3
REMARK 3 NCS MODEL :
REMARK 3
REMARK 3 NCS RESTRAINTS. RMS SIGMA/WEIGHT
REMARK 3 GROUP 1 POSITIONAL (A) : ;
REMARK 3 GROUP 1 B-FACTOR (A**2) : ;
REMARK 3 GROUP 2 POSITIONAL (A) : ;
REMARK 3 GROUP 2 B-FACTOR (A**2) : ;
REMARK 3 GROUP 3 POSITIONAL (A) : ;
REMARK 3 GROUP 3 B-FACTOR (A**2) : ;
REMARK 3 GROUP 4 POSITIONAL (A) : ;
REMARK 3 GROUP 4 B-FACTOR (A**2) : ;
REMARK 3
REMARK 3 PARAMETER FILE 1 :
REMARK 3 PARAMETER FILE 2 :
REMARK 3 PARAMETER FILE 3 :
REMARK 3 PARAMETER FILE 4 :
REMARK 3 PARAMETER FILE 5 :
REMARK 3 PARAMETER FILE 6 :
REMARK 3 TOPOLOGY FILE 1 :
REMARK 3 TOPOLOGY FILE 2 :
REMARK 3 TOPOLOGY FILE 3 :
REMARK 3 TOPOLOGY FILE 4 :
REMARK 3 TOPOLOGY FILE 5 :
REMARK 3 TOPOLOGY FILE 6 :
REMARK 3
REMARK 3 OTHER REFINEMENT REMARKS:
用NUCLSQ方法:
REMARK 3
REMARK 3 REFINEMENT.
REMARK 3 PROGRAM : X-PLOR
REMARK 3 AUTHORS : BRUNGER
REMARK 3
REMARK 3 DATA USED IN REFINEMENT.
REMARK 3 RESOLUTION RANGE HIGH (ANGSTROMS) :
REMARK 3 RESOLUTION RANGE LOW (ANGSTROMS) :
REMARK 3 DATA CUTOFF (SIGMA(F)) :
REMARK 3 DATA CUTOFF HIGH (ABS(F)) :
REMARK 3 DATA CUTOFF LOW (ABS(F)) :
REMARK 3 COMPLETENESS (WORKING+TEST) (%) :
REMARK 3 NUMBER OF REFLECTIONS :
REMARK 3
REMARK 3 FIT TO DATA USED IN REFINEMENT.
REMARK 3 CROSS-VALIDATION METHOD :
REMARK 3 FREE R VALUE TEST SET SELECTION :
REMARK 3 R VALUE (WORKING SET) :
REMARK 3 FREE R VALUE :
REMARK 3 FREE R VALUE TEST SET SIZE (%) :
REMARK 3 FREE R VALUE TEST SET COUNT :
REMARK 3 ESTIMATED ERROR OF FREE R VALUE :
REMARK 3
REMARK 3 FIT IN THE HIGHEST RESOLUTION BIN.
REMARK 3 TOTAL NUMBER OF BINS USED :
REMARK 3 BIN RESOLUTION RANGE HIGH (A) :
REMARK 3 BIN RESOLUTION RANGE LOW (A) :
REMARK 3 BIN COMPLETENESS (WORKING+TEST) (%) :
REMARK 3 REFLECTIONS IN BIN (WORKING SET) :
REMARK 3 BIN R VALUE (WORKING SET) :
REMARK 3 BIN FREE R VALUE :
REMARK 3 BIN FREE R VALUE TEST SET SIZE (%) :
REMARK 3 BIN FREE R VALUE TEST SET COUNT :
REMARK 3 ESTIMATED ERROR OF BIN FREE R VALUE :
REMARK 3
REMARK 3 NUMBER OF NON-HYDROGEN ATOMS USED IN REFINEMENT.
REMARK 3 PROTEIN ATOMS :
REMARK 3 NUCLEIC ACID ATOMS :
REMARK 3 HETEROGEN ATOMS :
REMARK 3 SOLVENT ATOMS :
REMARK 3
REMARK 3 B VALUES.
REMARK 3 FROM WILSON PLOT (A**2) :
REMARK 3 MEAN B VALUE (OVERALL, A**2) :
REMARK 3 OVERALL ANISOTROPIC B VALUE.
REMARK 3 B11 (A**2) :
REMARK 3 B22 (A**2) :
REMARK 3 B33 (A**2) :
REMARK 3 B12 (A**2) :
REMARK 3 B13 (A**2) :
REMARK 3 B23 (A**2) :
REMARK 3
REMARK 3 ESTIMATED COORDINATE ERROR.
REMARK 3 ESD FROM LUZZATI PLOT (A) :
REMARK 3 ESD FROM SIGMAA (A) :
REMARK 3 LOW RESOLUTION CUTOFF (A) :
REMARK 3
REMARK 3 CROSS-VALIDATED ESTIMATED COORDINATE ERROR.
REMARK 3 ESD FROM C-V LUZZATI PLOT (A) :
REMARK 3 ESD FROM C-V SIGMAA (A) :
REMARK 3
REMARK 3 RMS DEVIATIONS FROM IDEAL VALUES.
REMARK 3 BOND LENGTHS (A) :
REMARK 3 BOND ANGLES (DEGREES) :
REMARK 3 DIHEDRAL ANGLES (DEGREES) :
REMARK 3 IMPROPER ANGLES (DEGREES) :
REMARK 3
REMARK 3 ISOTROPIC THERMAL MODEL :
REMARK 3
REMARK 3 ISOTROPIC THERMAL FACTOR RESTRAINTS. RMS SIGMA
REMARK 3 MAIN-CHAIN BOND (A**2) : ;
REMARK 3 MAIN-CHAIN ANGLE (A**2) : ;
REMARK 3 SIDE-CHAIN BOND (A**2) : ;
REMARK 3 SIDE-CHAIN ANGLE (A**2) : ;
REMARK 3
REMARK 3 NCS MODEL :
REMARK 3
REMARK 3 NCS RESTRAINTS. RMS SIGMA/WEIGHT
REMARK 3 GROUP 1 POSITIONAL (A) : ;
REMARK 3 GROUP 1 B-FACTOR (A**2) : ;
REMARK 3 GROUP 2 POSITIONAL (A) : ;
REMARK 3 GROUP 2 B-FACTOR (A**2) : ;
REMARK 3 GROUP 3 POSITIONAL (A) : ;
REMARK 3 GROUP 3 B-FACTOR (A**2) : ;
REMARK 3 GROUP 4 POSITIONAL (A) : ;
REMARK 3 GROUP 4 B-FACTOR (A**2) : ;
REMARK 3
REMARK 3 PARAMETER FILE 1 :
REMARK 3 PARAMETER FILE 2 :
REMARK 3 PARAMETER FILE 3 :
REMARK 3 PARAMETER FILE 4 :
REMARK 3 PARAMETER FILE 5 :
REMARK 3 PARAMETER FILE 6 :
REMARK 3 TOPOLOGY FILE 1 :
REMARK 3 TOPOLOGY FILE 2 :
REMARK 3 TOPOLOGY FILE 3 :
REMARK 3 TOPOLOGY FILE 4 :
REMARK 3 TOPOLOGY FILE 5 :
REMARK 3 TOPOLOGY FILE 6 :
REMARK 3
REMARK 3 OTHER REFINEMENT REMARKS:
用NUCLSQ方法:
REMARK 3
REMARK 3 REFINEMENT.
REMARK 3 PROGRAM : NUCLSQ
REMARK 3 AUTHORS : WESTHOF,DUMAS,MORAS
REMARK 3
REMARK 3 DATA USED IN REFINEMENT.
REMARK 3 RESOLUTION RANGE HIGH (ANGSTROMS) :
REMARK 3 RESOLUTION RANGE LOW (ANGSTROMS) :
REMARK 3 DATA CUTOFF (SIGMA(F)) :
REMARK 3 COMPLETENESS FOR RANGE (%) :
REMARK 3 NUMBER OF REFLECTIONS :
REMARK 3
REMARK 3 FIT TO DATA USED IN REFINEMENT.
REMARK 3 CROSS-VALIDATION METHOD :
REMARK 3 FREE R VALUE TEST SET SELECTION :
REMARK 3 R VALUE (WORKING + TEST SET) :
REMARK 3 R VALUE (WORKING SET) :
REMARK 3 FREE R VALUE :
REMARK 3 FREE R VALUE TEST SET SIZE (%) :
REMARK 3 FREE R VALUE TEST SET COUNT :
REMARK 3
REMARK 3 FIT/AGREEMENT OF MODEL WITH ALL DATA.
REMARK 3 R VALUE (WORKING + TEST SET, NO CUTOFF) :
REMARK 3 R VALUE (WORKING SET, NO CUTOFF) :
REMARK 3 FREE R VALUE (NO CUTOFF) :
REMARK 3 FREE R VALUE TEST SET SIZE (%, NO CUTOFF) :
REMARK 3 FREE R VALUE TEST SET COUNT (NO CUTOFF) :
REMARK 3 TOTAL NUMBER OF REFLECTIONS (NO CUTOFF) :
REMARK 3
REMARK 3 NUMBER OF NON-HYDROGEN ATOMS USED IN REFINEMENT.
REMARK 3 PROTEIN ATOMS :
REMARK 3 NUCLEIC ACID ATOMS :
REMARK 3 HETEROGEN ATOMS :
REMARK 3 SOLVENT ATOMS :
REMARK 3
REMARK 3 B VALUES.
REMARK 3 FROM WILSON PLOT (A**2) :
REMARK 3 MEAN B VALUE (OVERALL, A**2) :
REMARK 3 OVERALL ANISOTROPIC B VALUE.
REMARK 3 B11 (A**2) :
REMARK 3 B22 (A**2) :
REMARK 3 B33 (A**2) :
REMARK 3 B12 (A**2) :
REMARK 3 B13 (A**2) :
REMARK 3 B23 (A**2) :
REMARK 3
REMARK 3 ESTIMATED COORDINATE ERROR.
REMARK 3 ESD FROM LUZZATI PLOT (A) :
REMARK 3 ESD FROM SIGMAA (A) :
REMARK 3 LOW RESOLUTION CUTOFF (A) :
REMARK 3
REMARK 3 RMS DEVIATIONS FROM IDEAL VALUES.
REMARK 3 DISTANCE RESTRAINTS. RMS SIGMA
REMARK 3 SUGAR-BASE BOND DISTANCE (A) : ;
REMARK 3 SUGAR-BASE BOND ANGLE DISTANCE (A) : ;
REMARK 3 PHOSPHATE BONDS DISTANCE (A) : ;
REMARK 3 PHOSPHATE BOND ANGLE, H-BOND (A) : ;
REMARK 3
REMARK 3 PLANE RESTRAINT (A) : ;
REMARK 3 CHIRAL-CENTER RESTRAINT (A**3) : ;
REMARK 3
REMARK 3 NON-BONDED CONTACT RESTRAINTS.
REMARK 3 SINGLE TORSION CONTACT (A) : ;
REMARK 3 MULTIPLE TORSION CONTACT (A) : ;
REMARK 3
REMARK 3 ISOTROPIC THERMAL FACTOR RESTRAINTS. RMS SIGMA
REMARK 3 SUGAR-BASE BONDS (A**2) : ;
REMARK 3 SUGAR-BASE ANGLES (A**2) : ;
REMARK 3 PHOSPHATE BONDS (A**2) : ;
REMARK 3 PHOSPHATE BOND ANGLE, H-BOND (A**2) : ;
REMARK 3
REMARK 3 OTHER REFINEMENT REMARKS:
用PROLSQ, CCP4, PROFFT, GPRLSA,和其他方法:
REMARK 3
REMARK 3 REFINEMENT.
REMARK 3 PROGRAM :
REMARK 3 AUTHORS :
REMARK 3
REMARK 3 DATA USED IN REFINEMENT.
REMARK 3 RESOLUTION RANGE HIGH (ANGSTROMS) :
REMARK 3 RESOLUTION RANGE LOW (ANGSTROMS) :
REMARK 3 DATA CUTOFF (SIGMA(F)) :
REMARK 3 COMPLETENESS FOR RANGE (%) :
REMARK 3 NUMBER OF REFLECTIONS :
REMARK 3
REMARK 3 FIT TO DATA USED IN REFINEMENT.
REMARK 3 CROSS-VALIDATION METHOD :
REMARK 3 FREE R VALUE TEST SET SELECTION :
REMARK 3 R VALUE (WORKING + TEST SET) :
REMARK 3 R VALUE (WORKING SET) :
REMARK 3 FREE R VALUE :
REMARK 3 FREE R VALUE TEST SET SIZE (%) :
REMARK 3 FREE R VALUE TEST SET COUNT :
REMARK 3
REMARK 3 FIT/AGREEMENT OF MODEL WITH ALL DATA.
REMARK 3 R VALUE (WORKING + TEST SET, NO CUTOFF) :
REMARK 3 R VALUE (WORKING SET, NO CUTOFF) :
REMARK 3 FREE R VALUE (NO CUTOFF) :
REMARK 3 FREE R VALUE TEST SET SIZE (%, NO CUTOFF) :
REMARK 3 FREE R VALUE TEST SET COUNT (NO CUTOFF) :
REMARK 3 TOTAL NUMBER OF REFLECTIONS (NO CUTOFF) :
REMARK 3
REMARK 3 NUMBER OF NON-HYDROGEN ATOMS USED IN REFINEMENT.
REMARK 3 PROTEIN ATOMS :
REMARK 3 NUCLEIC ACID ATOMS :
REMARK 3 HETEROGEN ATOMS :
REMARK 3 SOLVENT ATOMS :
REMARK 3
REMARK 3 B VALUES.
REMARK 3 FROM WILSON PLOT (A**2) :
REMARK 3 MEAN B VALUE (OVERALL, A**2) :
REMARK 3 OVERALL ANISOTROPIC B VALUE.
REMARK 3 B11 (A**2) :
REMARK 3 B22 (A**2) :
REMARK 3 B33 (A**2) :
REMARK 3 B12 (A**2) :
REMARK 3 B13 (A**2) :
REMARK 3 B23 (A**2) :
REMARK 3
REMARK 3 ESTIMATED COORDINATE ERROR.
REMARK 3 ESD FROM LUZZATI PLOT (A) :
REMARK 3 ESD FROM SIGMAA (A) :
REMARK 3 LOW RESOLUTION CUTOFF (A) :
REMARK 3
REMARK 3 RMS DEVIATIONS FROM IDEAL VALUES.
REMARK 3 DISTANCE RESTRAINTS. RMS SIGMA
REMARK 3 BOND LENGTH (A) : ;
REMARK 3 ANGLE DISTANCE (A) : ;
REMARK 3 INTRAPLANAR 1-4 DISTANCE (A) : ;
REMARK 3 H-BOND OR METAL COORDINATION (A) : ;
REMARK 3
REMARK 3 PLANE RESTRAINT (A) : ;
REMARK 3 CHIRAL-CENTER RESTRAINT (A**3) : ;
REMARK 3
REMARK 3 NON-BONDED CONTACT RESTRAINTS.
REMARK 3 SINGLE TORSION (A) : ;
REMARK 3 MULTIPLE TORSION (A) : ;
REMARK 3 H-BOND (X...Y) (A) : ;
REMARK 3 H-BOND (Y) (A) : ;
REMARK 3
REMARK 3 CONFORMATIONAL TORSION ANGLE RESTRAINTS.
REMARK 3 SPECIFIED (DEGREES) : ;
REMARK 3 PLANAR (DEGREES) : ;
REMARK 3 STAGGERED (DEGREES) : ;
REMARK 3 TRANSVERSE (DEGREES) : ;
REMARK 3
REMARK 3 ISOTROPIC THERMAL FACTOR RESTRAINTS. RMS SIGMA
REMARK 3 MAIN-CHAIN BOND (A**2) : ;
REMARK 3 MAIN-CHAIN ANGLE (A**2) : ;
REMARK 3 SIDE-CHAIN BOND (A**2) : ;
REMARK 3 SIDE-CHAIN ANGLE (A**2) : ;
REMARK 3
REMARK 3 OTHER REFINEMENT REMARKS:
用SHELXL方法:
REMARK 3
REMARK 3 REFINEMENT.
REMARK 3 PROGRAM : SHELXL
REMARK 3 AUTHORS : ICK
REMARK 3
REMARK 3 DATA USED IN REFINEMENT.
REMARK 3 RESOLUTION RANGE HIGH (ANGSTROMS) :
REMARK 3 RESOLUTION RANGE LOW (ANGSTROMS) :
REMARK 3 DATA CUTOFF (SIGMA(F)) :
REMARK 3 COMPLETENESS FOR RANGE (%) :
REMARK 3 CROSS-VALIDATION METHOD :
REMARK 3 FREE R VALUE TEST SET SELECTION :
REMARK 3
REMARK 3 FIT TO DATA USED IN REFINEMENT (NO CUTOFF).
REMARK 3 R VALUE (WORKING + TEST SET, NO CUTOFF) :
REMARK 3 R VALUE (WORKING SET, NO CUTOFF) :
REMARK 3 FREE R VALUE (NO CUTOFF) :
REMARK 3 FREE R VALUE TEST SET SIZE (%, NO CUTOFF) :
REMARK 3 FREE R VALUE TEST SET COUNT (NO CUTOFF) :
REMARK 3 TOTAL NUMBER OF REFLECTIONS (NO CUTOFF) :
REMARK 3
REMARK 3 FIT/AGREEMENT OF MODEL FOR DATA WITH F>4SIG(F).
REMARK 3 R VALUE (WORKING + TEST SET, F>4SIG(F)) :
REMARK 3 R VALUE (WORKING SET, F>4SIG(F)) :
REMARK 3 FREE R VALUE (F>4SIG(F)) :
REMARK 3 FREE R VALUE TEST SET SIZE (%, F>4SIG(F)) :
REMARK 3 FREE R VALUE TEST SET COUNT (F>4SIG(F)) :
REMARK 3 TOTAL NUMBER OF REFLECTIONS (F>4SIG(F)) :
REMARK 3
REMARK 3 NUMBER OF NON-HYDROGEN ATOMS USED IN REFINEMENT.
REMARK 3 PROTEIN ATOMS :
REMARK 3 NUCLEIC ACID ATOMS :
REMARK 3 HETEROGEN ATOMS :
REMARK 3 SOLVENT ATOMS :
REMARK 3
REMARK 3 MODEL REFINEMENT.
REMARK 3 OCCUPANCY SUM OF NON-HYDROGEN ATOMS :
REMARK 3 OCCUPANCY SUM OF HYDROGEN ATOMS :
REMARK 3 NUMBER OF DISCRETELY DISORDERED RESIDUES :
REMARK 3 NUMBER OF LEAST-SQUARES PARAMETERS :
REMARK 3 NUMBER OF RESTRAINTS :
REMARK 3
REMARK 3 RMS DEVIATIONS FROM RESTRAINT TARGET VALUES.
REMARK 3 BOND LENGTHS (A) :
REMARK 3 ANGLE DISTANCES (A) :
REMARK 3 SIMILAR DISTANCES (NO TARGET VALUES) (A) :
REMARK 3 DISTANCES FROM RESTRAINT PLANES (A) :
REMARK 3 ZERO CHIRAL VOLUMES (A**3) :
REMARK 3 NON-ZERO CHIRAL VOLUMES (A**3) :
REMARK 3 ANTI-BUMPING DISTANCE RESTRAINTS (A) :
REMARK 3 RIGID-BOND ADP COMPONENTS (A**2) :
REMARK 3 SIMILAR ADP COMPONENTS (A**2) :
REMARK 3 APPROXIMATELY ISOTROPIC ADPS (A**2) :
REMARK 3
REMARK 3 BULK SOLVENT MODELING.
REMARK 3 METHOD USED:
REMARK 3
REMARK 3 STEREOCHEMISTRY TARGET VALUES :
REMARK 3 SPECIAL CASE:
REMARK 3
REMARK 3 OTHER REFINEMENT REMARKS:
用TNT方法:
REMARK 3
REMARK 3 REFINEMENT.
REMARK 3 PROGRAM : TNT
REMARK 3 AUTHORS : TRONRUD,TEN EYCK,MATTHEWS
REMARK 3
REMARK 3 DATA USED IN REFINEMENT.
REMARK 3 RESOLUTION RANGE HIGH (ANGSTROMS) :
REMARK 3 RESOLUTION RANGE LOW (ANGSTROMS) :
REMARK 3 DATA CUTOFF (SIGMA(F)) :
REMARK 3 COMPLETENESS FOR RANGE (%) :
REMARK 3 NUMBER OF REFLECTIONS :
REMARK 3
REMARK 3 USING DATA ABOVE SIGMA CUTOFF.
REMARK 3 CROSS-VALIDATION METHOD :
REMARK 3 FREE R VALUE TEST SET SELECTION :
REMARK 3 R VALUE (WORKING + TEST SET) :
REMARK 3 R VALUE (WORKING SET) :
REMARK 3 FREE R VALUE :
REMARK 3 FREE R VALUE TEST SET SIZE (%) :
REMARK 3 FREE R VALUE TEST SET COUNT :
REMARK 3
REMARK 3 USING ALL DATA, NO SIGMA CUTOFF.
REMARK 3 R VALUE (WORKING + TEST SET, NO CUTOFF) :
REMARK 3 R VALUE (WORKING SET, NO CUTOFF) :
REMARK 3 FREE R VALUE (NO CUTOFF) :
REMARK 3 FREE R VALUE TEST SET SIZE (%, NO CUTOFF) :
REMARK 3 FREE R VALUE TEST SET COUNT (NO CUTOFF) :
REMARK 3 TOTAL NUMBER OF REFLECTIONS (NO CUTOFF) :
REMARK 3
REMARK 3 NUMBER OF NON-HYDROGEN ATOMS USED IN REFINEMENT.
REMARK 3 PROTEIN ATOMS :
REMARK 3 NUCLEIC ACID ATOMS :
REMARK 3 OTHER ATOMS :
REMARK 3
REMARK 3 WILSON B VALUE (FROM FCALC, A**2) :
REMARK 3
REMARK 3 RMS DEVIATIONS FROM IDEAL VALUES. RMS WEIGHT COUNT
REMARK 3 BOND LENGTHS (A) : ; ;
REMARK 3 BOND ANGLES (DEGREES) : ; ;
REMARK 3 TORSION ANGLES (DEGREES) : ; ;
REMARK 3 PSEUDOROTATION ANGLES (DEGREES) : ; ;
REMARK 3 TRIGONAL CARBON PLANES (A) : ; ;
REMARK 3 GENERAL PLANES (A) : ; ;
REMARK 3 ISOTROPIC THERMAL FACTORS (A**2) : ; ;
REMARK 3 NON-BONDED CONTACTS (A) : ; ;
REMARK 3
REMARK 3 INCORRECT CHIRAL-CENTERS (COUNT) :
REMARK 3
REMARK 3 BULK SOLVENT MODELING.
REMARK 3 METHOD USED :
REMARK 3 KSOL :
REMARK 3 BSOL :
REMARK 3
REMARK 3 RESTRAINT LIBRARIES.
REMARK 3 STEREOCHEMISTRY :
REMARK 3 ISOTROPIC THERMAL FACTOR RESTRAINTS :
REMARK 3
REMARK 3 OTHER REFINEMENT REMARKS:
非衍射的研究方法:
1 2 3
345678934567890
REMARK 3
REMARK 3 REFINEMENT.
REMARK 3 PROGRAM :
REMARK 3 AUTHORS :
REMARK 3
REMARK 3 FREE TEXT
示例
1 2 3
345678934567890
REMARK 3
REMARK 3 REFINEMENT.
4
4
5 6 7
5 6 7
REMARK
REMARK
REMARK
REMARK
REMARK
REMARK
REMARK
REMARK
REMARK
REMARK
REMARK
REMARK
REMARK
REMARK
REMARK
3 PROGRAM : X-PLOR 3.1
3 AUTHORS : BRUNGER
3
3 STRUCTURAL STATISTICS:
3 25 SA
3 STRUCTURES SAAVEMIN
3 RMS DEVIATIONS FROM EXP. RESTRAINTS[A]
3 NOE DISTANCE RESTRAINTS (1430) 0.0451 A 0.044 A
3 DIHEDRAL ANGLE RESTRAINTS (130) 0.551 DEG 0.660 DEG
3 DEVIATIONS FROM IDEAL GEOMETRY
3 BONDS 0.004 A 0.004 A
3 ANGLES 0.661 DEG 0.650 DEG
3 IMPROPERS 0.371 DEG 0.380 DEG
3 X-PLOR ENERGIES (IN KCAL MOL-1)[B]
3 ENOE 167 158
REMARK 3 ECDIH 2.6
REMARK 3 ENCS 0.01
REMARK 3 EREPEL 54
REMARK 3 EBOND 36
REMARK 3 EANGLE 263
REMARK 3 EIMPROPER 22
REMARK 3 ETOTAL 545
REMARK 3 ATOMIC RMS DIFFERENCES[C]
REMARK 3 BACKBONE(N, CA, C') + LIGAND ATOMS 0.53+/-0.09 A
REMARK 3 ALL HEAVY ATOMS 0.91+/-0.08 A
REMARK 4-999(其他注解)
REMARK 4:格式
该记录用来描述内容向导2.2版本的格式。
模板
REMARK 4
REMARK 4 XXXX COMPLIES WITH FORMAT V. 2.2, 16-DEC-1996
XXX表示记录的ID idcode
N.M表示版本号
DD-MMM-YYYY表示格式译本的发布日期.分别表实日,月,年.
示例
1 2 3 4
345678934567890
REMARK 4
REMARK 4 1ABC COMPLIES WITH FORMAT V. 2.1, 25-OCT-1996
REMARK 5:警告
该记录用来描述警告信息,和CAVEAT记录的内容一样,并且还有接收者的评论。
模板
1 2 3 4
345678934567890
REMARK 5
REMARK 5 WARNING
REMARK 5 XXXX: FREE TEXT GOES HERE.
XXX来表示记录的ID code
示例
1 2 3 4
345678934567890
REMARK 5
REMARK 5 WARNING
3.4
0.01
50
33
256
23
523
6
6
6
5 7
5 7
5 7
REMARK 5 1ABC: THE CRYSTAL TRANSFORMATION IS IN ERROR BUT IS
REMARK 5 UNCORRECTABLE AT THIS TIME.
REMARK 6 - 99:未赋值
该记录用来表示不标准的注释,不清楚的说明。
REMARK 100 - 199:核酸
该记录用来表示核酸结构。
REMARK 200-250:试验细节
该记录用来表示试验细节。
REMARK 200:表示X光衍射试验的细节。
Remark 205:光纤衍射和光纤标本衍射。
Remarks 210 and 215: 核磁共振试验细节。
Remarks 220 and 225: 理论模型试验细节。
Remark 230:种子衍射试验细节
Remark 240:电子衍射试验细节。
Remark 250:别的类型的试验细节。
REMARK 280:晶体。
REMARK 285: 描述CRYST1记录.
REMARK 290: 对称结晶体。
REMARK 295:不对称结晶体。
REMARK 300:生物分子。
REMARK 350:生物分子的产生。
REMARK 375:特殊位置。
REMARK 400:成分。
REMARK 450:来源。
REMARK 460:Non-IUPAC Names。
REMARK 470:缺少的原子。
REMARK 500:几何学和立体化学。
REMARK 525:溶剂。
REMARK 550:SEGID,描述片段标识符.
REMARK 600:杂原子。
REMARK 650:螺旋。
REMARK 700:折叠。
REMARK 750:转角。
REMARK 800:位置
REMARK 850:发布前对坐标的修正
REMARK 860:在发表以后的改正。
REMARK 900:有关系的记录。
REMARK 999:序列。
3.一级结构
PDB文件里的一级结构包括蛋白大分子每条链上的残基序列。记录了链的标识符和序列号以便和其他记录相链接。一共分DBREF,SEQADV,SEQRES
和MODRES四部分来进行描述。
DBREF (其他序列库的有关记录)
综述
提供了PDB序列和相应的数据库记录的链接。数据库的对照参考需要不少于10个残基的肽链。当相应记录在NDB中时,对核酸来说DBREF记录就
会被强制指向核酸数据库Nucleic Acid Database (NDB)中。
记录格式
列
1 - 6
8 – 11
13
15 - 18
19
数据类型
Record name
Idcode
Character
Integer
AChar
字段名称
"DBREF "
idCode
chainID
seqBegin
insertBegin
定义描述
记录的ID号
链的标识符
PDB序列片段的起始序列号
PDB序列片段的起始插入代码
21 - 24
25
27 - 32
34 - 41
43 - 54
56 - 60
61
63 – 67
68
细节
1. PDB记录包括多联分子,其序列可能是不定类型,变量或人造的。序列也可能经点突变实验修饰。大量PDB记录报告了拆自大分子的结构
域结构。
2. 它通过提供出PDB ATOM 记录所给出的邻近片段和数据库序列记录之间的清晰关系说明体现出其间的区别差异。有些情况下只是简单通过
DBREF中数据库中的指示表现出来。PDB记录包含杂原子聚合体,链接到不同的序列数据库记录中。一些情况下象PDB记录中包含的免疫
球蛋白Fab片段每条链都链接到两个不同的SWISS-PROT, PIR, and/or GenBank记录中。这种便利的需要是因为这些数据库用各式各样的
免疫球蛋白结构域作为单独的记录表现序列。PDB也可以表现经点突变改变基因(融合基因,改变序列,诱变基因或循环序列改变)的分
子。这种设计诱额外的优势,那就是它可能构建指示器和相关联的数据库相连,如Nucleic Acid Database核酸数据库,BioMagResBank,
和 描述基序序列的数据库 (如 PROSITE, BLOCKS).
3. 数据库名称和它们在DBREF records相应的缩写:
数据库名称
BioMagResBank
BLOCKS
European Molecular Biology Laboratory
GenBank
Genome Data Base
Nucleic Acid Database
PROSITE
Protein Data Bank
Protein Identification Resource
SWISS-PROT
TREMBL
4.
5.
6.
7.
数据库缩写(27 - 32列)
BMRB
BLOCKS
EMBL
GB
GDB
NDB
PROSIT
PDB
PIR
SWS
TREMBL
Integer
AChar
LString
LString
LString
Integer
AChar
Integer
AChar
seqEnd
insertEnd
Database
dbAccession
dbIdCode
dbseqBegin
idbnsBeg
dbseqEnd
dbinsEnd
PDB序列片段的终止序列号
PDB序列片段的终止插入代码
序列数据库名称如PDB,SWS,当一个相应的序列数据库记录还未识
别时即存放PDB
序列数据库的访问号码,如对于GenBank来说即是NCBI gi
序列数据库的识别密码,对GB来说即是访问号码
数据库片段的起始序列号
涉及到PDB的话,存放片段起始残基的插入代码
数据库片段的终止序列号
涉及到PDB的话,存放片段终止残基的插入代码。
DBREF记录呈现PDB ATOM记录和相应的PIR, GenBank,或SWISS-PROT等序列相关性.
PDB并不能保证列出的数据库能提供所有可能的参考.多数情况下,只能提供一种数据数据库的一种相关参考.
当序列数据库中没有参考,PDB自身就会给出相关参考.
对连接到PDB记录的适当序列数据库登陆是的选择是以序列和其生物学来源为基础的.可能出现在记录分配上的疑问可通过咨询数据库职
员来解决.
示例
1 2 3 4 5 6 7
345678934567890
DBREF 1ABC B 1B 36 PDB 1ABC 1ABC 1B 36
DBREF 3AKY 3 220 SWS P07170 KAD1_YEAST 5 222
DBREF 1HAN 2 288 GB 397884 X66122 1 287
DBREF 3HSV A 1 92 SWS P22121 HSF_KLULA 193 284
DBREF 3HSV B 1 92 SWS P22121 HSF_KLULA 193 284
DBREF 1ARL 1 307 SWS P00730 CBPA_BOVIN 111 417
DBREF 249D A 1 12 NDB BDL070 BDL070 1 12
DBREF 249D B 13 24 NDB BDL070 BDL070 13 24
DBREF 249D C 26 36 NDB BDL070 BDL070 26 36
DBREF 249D D 37 48 NDB BDL070 BDL070 37 48
1-5列存放记录名即DBREF;8-11列存放记录的ID号如1ABC;13列存放链的标识符如A链B链C链D链;18列存放PDB序列片段的起始序列
号如1;19列存放PDB序列片段的起始插入代码如B;23-24列存放PDB序列片段的终止序列号如36;25列存放PDB序列片段的终止插入代码;
27-29列存放序列数据库名称如PDB,SWS,当一个相应的序列数据库记录还未识别时即存放PDB;34-37列存放序列数据库的访问号码如1ABC;
如对于GenBank来说即是NCBI gi;43-46列存放序列数据库的识别密码如1ABC,对GB来说即是访问号码;60列存放数据库片段的起始序列号
1;涉及到PDB的话,61列存放片段起始残基的插入代码B;66-67列存放数据库片段的终止序列号36;涉及到PDB的话,68列存放片段终止残
基的插入代码。
SEQADV ( PDB和其他记录的出入)
综述
提供识别PDB记录ATOM记录中的序列信息和DBREF提供的序列数据库记录之间的出入。需要注意的是这些记录是用来识别不同而并非错误。很多
情况下记录了PDB记录和PIR或SWS记录间的出入。有很多的可能原因如自然突变,序列多态性或实验结果的模糊或出入。PDB可能包括REMARK
记录记录中反映录入者关于哪个数据库存有正确序列的观点。
记录格式
列
1 - 6
8 - 11
13 - 15
17
19 - 22
23
25 - 28
30 - 38
40 - 42
50 - 70
示例
1 2 3 4 5 6 7
345678934567890
SEQADV 1ABC ASN A 100A SWS P10725 ASP 100 1994-300-1200-0070
SEQADV 2ABC ASN A 100A SWS P10725 ASP 100 PDB: 1ABC
SEQADV 3ABC MET A -1 SWS P10725 CLONING ARTIFACT
SEQADV 3ABC GLY A 50 SWS P10725 VAL 50 ENGINEERED
就第一行来说,1-6列存放记录名即SEQADV;8-11列存放记录的ID号1ABC;13-15列存放出入的PDB残基名ASN;17列存放PDB链的标识符A;
20-22列存放PDB中的序号100;23列存放PDB插入代码A;25-28列存放序列数据库名称SWS;30-35列存放序列数据库的访问号码P10725;
40-42列存放序列数据库SWS中的残基名ASP;46-48列存放SWS中的的序号;就是说A链上第100个氨基酸残基在PDB中是天冬酰胺ASN而在 SWS
中是天冬胺酸ASP。最后是对出入的注释。
SEQRES (残基序列)
综述
包括所研究的大分子每条链的氨基酸或核酸残基序列。
记录格式
列
1 - 6
9 - 10
12
14 - 17
20 - 22
24 - 26
28 - 30
32 - 34
36 - 38
40 - 42
44 - 46
数据类型
Record name
Integer
Character
Integer
Residue name
Residue name
Residue name
Residue name
Residue name
Residue name
Residue name
字段名称
"SEQRES"
serNum
chainID
numRes
resName
resName
resName
resName
resName
resName
resName
定义描述
SEQRES记录中当前链的序号,从1开始逐一增加,另一条链从1重新
安排
链的标识符,这可能是任何一个专一合法的特征。如只有一条链可空
缺。
链上的残基号,每行都重复
残基名称
残基名称
残基名称
残基名称
残基名称
残基名称
残基名称
数据类型
Record name
IDcode
Residue name
Character
Integer
AChar
LString
LString
Residue name
LString
字段名称
"SEQADV"
idCode
resName
chainID
seqNum
iCode
Database
dbIdCode
dbRes
Conflict
定义描述
记录的ID号
出入的PDB残基名
PDB链的标识符
PDB序号
PDB 插入代码
序列数据库名称
序列数据库的访问号码
序列数据库的残基名称
出入的注释
48 - 50
52 - 54
56 - 58
60 - 62
64 - 66
68 - 70
细节
PDB条目用3个字母的缩写来作为氨基酸名称,用一个字母代码表示核酸且核糖和脱氧核糖没有区别。所有出现的标准氨基酸或核酸残基都列在
SEQRES中,且都在分子研究水平上。整合到链骨架上的杂原子也作为链的一部分包括在SEQRES中。在不标准的情况下,一个hetID等于三个文
字数字的特征。一般普通HET名称都出现在HET 字典中.每套SEQRES记录和HET group都分配到一个组成号,这个组成号从1开始作为第一套SEQRES
记录连续增加.这个号码在FORMUL记录清晰的给出,而在SEQRES记录中只是隐含的。
示例
1 2 3 4 5 6 7
345678934567890
SEQRES 1 A 21 GLY ILE VAL GLU GLN CYS CYS THR SER ILE CYS SER LEU
SEQRES 2 A 21 TYR GLN LEU GLU ASN TYR CYS ASN
SEQRES 1 B 30 PHE VAL ASN GLN HIS LEU CYS GLY SER HIS LEU VAL GLU
SEQRES 2 B 30 ALA LEU TYR LEU VAL CYS GLY GLU ARG GLY PHE PHE TYR
SEQRES 3 B 30 THR PRO LYS ALA
SEQRES 1 C 21 GLY ILE VAL GLU GLN CYS CYS THR SER ILE CYS SER LEU
SEQRES 2 C 21 TYR GLN LEU GLU ASN TYR CYS ASN
SEQRES 1 D 30 PHE VAL ASN GLN HIS LEU CYS GLY SER HIS LEU VAL GLU
SEQRES 2 D 30 ALA LEU TYR LEU VAL CYS GLY GLU ARG GLY PHE PHE TYR
SEQRES 3 D 30 THR PRO LYS ALA
前两行存放了一条链A链的氨基酸序列。1-6列存放SEQRES;10列存放的1,2表示A链用两行存放,16-17列存放的数字21表示A链共有21
个氨基酸残基,从第20列开始存放氨基酸序列。
MODRES (对标准残基的修饰)
综述
提供了对蛋白质和核酸残基修饰的描述,比如化学修饰或等等。包括PDB记录中的残基名和标准残基之间的映射。
记录格式
列
1 - 6
8 – 11
13 - 15
17
19 - 22
23
25 - 27
30 - 70
细节
1. 在MODRES记录中对残基的修饰包括翻译后修饰,酶解修饰或特意修饰等。在这种情况下,在PDB要选择用不标准残基名的地方MODRES
提供出相应于原始标准残基名的映射。
2. MODERS是用来托管记录中存在的标准残基的修饰。但当同等记录并没供给修饰残基时它并不是必需的。以下是几个修饰描述的例子:
糖基化位点;翻译后修饰;专一化学修饰;磷酸化作用;N-末端的钝化;C-末端的氨化;右旋构型;肽链的剪切等。
3. D-氨基酸有他们自己的残基名resName 如用DAL表示D-alanine。这个resName出现在SEQRES记录中, 还和 SEQADV, MODRES, HET和
FORMUL记录相关联.相关内容在有ATOM记录的 HETATMs中给出并出现在链的正确顺序中,这种顺序是规定的记录顺序的例外情况。
4. 当用一个标准残基名描述修饰位点时,resName (13-15列) 和stdRES ( 25-27列) 包含同样的内容。
5. MODRES 和其他记录类型的联系是它连接了 ATOMan和 HETATM记录中对标准残基名的记录SEQADV, HET和FORMUL可能也出现其中。
示例
1 2 3 4 5 6 7
345678934567890
MODRES 1ABC ASN A 22A ASN GLYCOSYLATION SITE
数据类型
Record name
IDcode
Residue name
Character
Integer
Achar
Residue name
String
字段名称
"MODRES"
idCode
resName
chainID
seqNum
iCode
stdRes
comment
定义描述
记录的ID号
这个记录所用的残基名
链的标识符
序号
插入代码
标准残基名
对残基修饰的描述
Residue name
Residue name
Residue name
Residue name
Residue name
Residue name
resName
resName
resName
resName
resName
resName
残基名称
残基名称
残基名称
残基名称
残基名称
残基名称
MODRES 2ABC TTQ A 50A TRP POST-TRANSLATIONAL MODIFICATION
MODRES 3ABC DAL A 32 ALA POST-TRANSLATIONAL MODIFICATION,D-ALANINE
MODRES 3ABC DAL B 32 ALA POST-TRANSLATIONAL MODIFICATION,D-ALANINE
就第一行来说,表示ID号为1ABC的A链第22位氨基酸ASN有糖基化位点;第三四行表示ID号为3ABC的A链和B链第32位ALA经翻译后修饰
为右旋的ALA。
4.杂因子
对记录中非标准残基的完整描述.
HET(非标准残基)
综述
HET记录用来描述非标准残基,如抑制剂,溶解分子和已给出坐标的离子.
以下包含在HET中:-不是标准氨基酸中的一员;
-不是核酸(C, G, A, T, U, and I)中的一员;
-不是修饰了的核酸(+C, +G, +A, +T, +U, and +I)中的一员;
-不是UNK中还未说明残基名的不知道的氨基酸或核酸。
Het记录还描述了对其化学特性还不太了解的杂因子,这种情况就被分配到hetID UNK。
记录格式
列
1 - 6
8 - 10
13
14 - 17
18
21 - 25
31 - 70
细节
1. 每个HET分配到一个含至多三个文字数字字符的 hetID 。记录中出现的每个HET group都给出了序号,链标识符,插入代码和同等的记
录号码。HET group中的化学名称 由HETNAM记录给出,化学名称的同意字在 HETSYN记录中。
2. 记录中所出现的每个 HET group都有单独的HET记录。
3. 一个特殊的HET group用一个唯一的hetID描绘在PDB档案中。
4. 但PDB记录中没有水分子的HET记录。
5. 正文部分描述材料。PART_OF用来指出HET group是已用个别成分表现出来的一大组的一部分。(如:放线菌素的一部分)片段标识符,
73 - 76列的 ATOM/HETATM 记录也用来记述一巨大的HET group中的个别成分。
6. 不知道的原子或离子将用化学式X1表现UNX。
7. 如果可使用的话,对记录中出现的每个het group,PDB都核实相应的HET, HETNAM, HETSYN, FORMUL, HETATM,和CONECT记录。HET记录
由PDB用 het group dictionary和 HETATM记录中的信息自动产生。
8. 每个唯一的hetID代表一个唯一的分子。
示例
1 2 3 4 5 6 7
345678934567890
HET TRS 975 8
HET STA I 4 25 PART_OF: HIV INHIBITOR;
HET FUC Y 1 10 PART_OF: NONOATE COMPLEX; L-FUCOSE
HET GAL Y 2 11 PART_OF: NONOATE COMPLEX
HET NAG Y 3 15 PART_OF: NONOATE COMPLEX
HET FUC Y 4 10 PART_OF: NONOATE COMPLEX
HET NON Y 5 12 PART_OF: NONOATE COMPLEX
HET UNX A 161 1 PSEUDO CARBON ATOM OF UNKNOWN LIGAND
HET UNX A 162 1 PSEUDO CARBON ATOM OF UNKNOWN LIGAND
HET UNX A 163 1 PSEUDO CARBON ATOM OF UNKNOWN LIGAND
数据类型
Record name
LString(3)
Character
Integer
AChar
Integer
String
字段名称
"HET "
hetID
ChainID
seqNum
iCode
numHetAtoms
text
定义描述
Het 标识符, 右对齐
链标识符
序号
插入代码
HATATM记录对当前记录的记录号
Het group描述的正文.
就第二行来说,1-3列存放HET;8-10列存放HET标识符STA(而在后面对还不清楚的假碳原子就存UNX);I链第四位在HATATM记录中记为
25,是艾滋病病毒抑制剂的一部分。
HETNAM(非标准残基的名称)
综述
给出有hetID的化合物的化学名称。
记录格式
列
1 - 6
9 - 10
12 - 14
16 - 70
细节
1.
2.
3.
4.
5.
示例
1 2 3 4 5 6 7
345678934567890
HETNAM GLC GLUCOSE
HETNAM SAD BETA-METHYLENE SELENAZOLE-4-CARBOXAMIDE ADENINE
HETNAM 2 SAD DINUCLEOTIDE
HETNAM UNX UNKNOWN ATOM OR ION
如第一行1-6列存放HETNAM,Het标识符为SAD,只包括一个化学名称葡萄糖。
HETSNY (非标准残基的同义字)
综述
这部分对相应的HETNAM记录中的化合物提供所有的同意字,这使搜寻HET groups有更大的机动性。
记录格式
列
1 - 6
9 - 10
12 - 14
16 - 70
细节
1. 这并不能保证是对所有可能同义字的完整列表,但通过PDB统一起来。新的同义字可以加入。这个列表可继续附加在HETSYN记录。即使
相同的hetID出现在不止一个HET记录中。
2. 对于一个给出的hetID只能包括一个HETSYN记录。
3. 对记录中的每个HETSYN记录,相应的 HET, HETNAM, FORMUL, HETATM和CONECT 记录一定出现。LINK记录也可能出现。
示例
1 2 3 4 5 6 7
345678934567890
HETSYN NAD NICOTINAMIDE ADENINE DINUCLEOTIDE
HETSYN COA COA
HETSYN CMP CYCLIC AMP; CYCLIC ADENOSINE MONOPHOSPHATE
数据类型
Record name
Continuation
LString(3)
SList
字段名称
"HETSYN"
Continuation
hetID
hetSynonyms
定义描述
允许多条记录串连表示不同行的顺序号.
Het 标识符,右对齐
同义字
在HETNAM记录中每个hetID赋一个唯一的化学名称。
其他名字在HETSYN记录中。
PDB 依据IUPAC/IUB(国际理论和使用化学联合会)命名惯例对这组进行系统描述。
允许在原来基础上附加化学名称。
对于一个给出的hetID只能包括一个HETNAM记录,即使相同的hetID出现在不止一个HET记录中。
数据类型
Record name
Continuation
LString(3)
String
字段名称
"HETNAM"
Continuation
hetID
text
定义描述
允许多条记录串连表示不同行的顺序号.
Het 标识符,右对齐
化学名称
HETSYN TRS TRIS BUFFER; TRISAMINE;
HETSYN 2 TRS TRIS(HYDROXYMETHYL)AMINOMETHANE; TRIMETHYLOL
HETSYN 3 TRS AMINOMETHANE
1-6列存放HETSYN,如NAD同义名称为NICOTINAMIDE ADENINE DINUCLEOTIDE(烟酰腺嘌呤二核苷酸)。还允许多条记录串连,如第五行TRS就
有TRIS(HYDROXYMETHYL)AMINOMETHANE核和TRIMETHYLOL两条记录。
FORMOL(非标准残基的化学式)
综述
介绍化学式和非标准部分。(标准残基的化学式在Appendix 5中)
记录格式
列
1 - 6
9 - 10
13 - 15
17 - 18
19
20 - 70
细节
1. 化学式中的元素按C,H,N的顺序给出,其他元素接着按字母顺序排列,之间用空格分开。
2. 每个原子的数目紧跟着化学符号无空格。
3. 每套SEQRES记录和每个T group在记录中都分到一个成分号,这些号码是续分配的,从1开始作为第一套SEQRES记录。另外,
-如果一个HET group出现在一个SEQRES记录中,它的FORMUL分配给它所出现链的成分号。
-如果HET group 出现不止一个且不出现在SEQRES记录中,第一个出现的成分号即为所用。
4. ET group一条链所有内容用系数聚合在一起,剩余的也是如此。这个系数的总数数目相当于记录中所出现的HET group的次数。
5. 如果HET group是水和UNX,19列就用“*”表示,象征应排除分子量计算。
6. 附加区域需要更多的空间来放化学式。17-18列用来保持现有格式的连续性。
7. 对记录中所出的het group相应的 HET, HETNAM, FORMUL, HETATM和CONECT记录一定出现。FORMUL记录由PDB处理程序用het group
模板文件和来自HETATM 记录的信息自动产生。
示例
1 2 3 4 5 6 7
345678934567890
FORMUL 2 SO4 2(O4 S1 2-)
FORMUL 3 GLC C6 H12 O6
FORMUL 3 FOL 2(C19 H17 N7 O6 2-)
FORMUL 4 CL 2(CL1 1-)
FORMUL 5 CA CA1 2+
FORMUL 6 HOH *429(H2 O1)
FORMUL 3 UNX *3(X1)
FORMUL 4 HOH *256(H2 O1)
FORMUL 1 ACE C2 H3 O1
FORMUL 2 ACE C2 H3 O1
就第二行来说1-6列存放FORMUL,有两个葡萄糖分子,化学式为C6H12O6。
5.二级结构
PDB文件二级结构部分描述了蛋白质和多肽中的螺旋(HELIX)、折叠片(SHEET)和转角(TURN)结构。下面分别介绍PDB文件中对这三类结构
的说明。
HELIX(螺旋)
综述
数据类型
Record name
Integer
LString(3)
Integer
Character
String
字段名称
"FORMUL"
compNum
hetID
continuation
asterisk
text
定义描述
成分数目
Het 标识符
延长数目
"*" 代表水分子
化学式
HELIX记录是用来标识蛋白质分子中螺旋结构的部分,并且在这部分对分子中的螺旋结构都进行了编号和命名,也注释出各个螺旋的起始和终止
氨基酸残基以及螺旋的长度。以下是PDB的HELIX部分的记录格式,
记录格式
列
1 - 6
8 - 10
12 - 14
16 - 18
20
22 - 25
26
28 - 30
32
34 - 37
38
39 - 40
41 - 70
72 - 76
细节
1. 如果螺旋中出现多于一个螺旋,那么HELIX记录中要用不同的系列编号和标识符。
2. 螺旋的起始残基是氮末端残基。
3. 螺旋分类号:
螺旋类型
右手α-螺旋(默认)
右手ω-螺旋
右手π-螺旋
右手γ-螺旋
右手310螺旋
左手α-螺旋
左手ω-螺旋
左手γ-螺旋
27 RIBBON/螺旋
多聚脯氨酸
和其他记录类型的关系可以在REMARK中找到。
示例
1 2 3 4 5 6 7
345678934567890123456
HELIX 1 HA GLY A 86 GLY A 94 1 9
HELIX 2 HB GLY B 86 GLY B 94 1 9
如此例,1-5列是记录名HELIX,10列是HELIX编号,HA是代表A链中的HELIX,16-18列是起始残基,这里GLY是甘氨酸,后面20列是链代码,
这里是A链,即此螺旋起始残基所在是A链,24-25列是残基所在位点编号,这里的起始残基GLY所在为A链第86位。同样道理,后面数列描述
的是此螺旋的末端残基,为甘氨酸,所在链为A链94位。第40列数字是螺旋类型代码,这里数字1是代表α-螺旋。第76位数字意义为螺旋长
度,这里是9个残基长。
SHEET(折叠片)
综述
折叠片记录项标识了折叠片在分子中的位置,以及起始和终止残基,并对每个折叠片进行了命名和编号。
记录格式
列
1 - 6
数据类型
Record name
字段名称
"SHEET "
定义描述
分类编号(39-40)列
1
2
3
4
5
6
7
8
9
10
数据类型
Record name
Integer
LString(3)
Residue name
Character
Integer
AChar
Residue name
Character
Integer
AChar
Integer
String
Integer
字段名称
"HELIX "
serNum
helixID
initResName
initChainID
initSeqNum
initICode
endResName
endChainID
endSeqNum
endICode
helixClass
comment
length
定义描述
螺旋的次序号。从1开始顺次增加编号。
螺旋标识。用来补充说明螺旋的次序号,每个螺旋用一个单字母来
做为其标识。
起始残基的名称。
用来标识此螺旋所在的链。
描述起始残基在序列中的排号。
起始残基的插入代码。
螺旋中的末端残基名称。
用来标识此螺旋所在的链。
描述末端残基在序列中的排号。
末端残基的插入代码。
螺旋的分类号。
有关此螺旋的评论。
螺旋的长度。
8 - 10
12 - 14
15 - 16
18 - 20
22
23 - 26
27
29 - 31
33
34 - 37
38
39 - 40
42 - 45
46 - 48
50
51 - 54
55
57 - 60
61 - 63
65
66 - 69
70
细节
1. 分支链的起始残基为氮末端残基,39-70描述的是分支链的标识信息。列出的分支链从折叠片的一边开始,后续为和其空间上相临近的其
他分支链。
2. 39-40列阐述了分支链相对顺反的意义,分支链n相对和n-1如果是顺式,则赋值为1,反之,分支链n相对分支链n-1如果是反式,则
赋值为-1,而此折叠片的第一分支链就赋值为0。
3. 42-70列详细说明了n和n-1的每对分支链间的一个氢键,这在当前链和前导链间均给出。主链的第一前导链没有此标识信息。
4. 对于一个闭合的折叠片(β桶)结构,第一条分支链就是最后一条分支链,可以在REMARK部分看到解释性的说明。
5. 分离的分支链或者是有两个或多个氨基酸序列不连续部分残基的趋向的分支链也被列出,并且在REMARK部分有关于它的描述。
示例
示例1:
1 2
345678934567890
SHEET 1 A 5 THR A 107 ARG A 110 0
SHEET 2 A 5 ILE A 96 THR A 99 -1
SHEET 3 A 5 ARG A 87 SER A 91 -1
SHEET 4 A 5 TRP A 71 ASP A 75 -1
SHEET 5 A 5 GLY A 52 PHE A 56 -1
SHEET 1 B 5 THR B 107 ARG B 110 0
SHEET 2 B 5 ILE B 96 THR B 99 -1
SHEET 3 B 5 ARG B 87 SER B 91 -1
SHEET 4 B 5 TRP B 71 ASP B 75 -1
SHEET 5 B 5 GLY B 52 ILE B 55 -1
Integer
LString(3)
Integer
Residue name
Character
Integer
AChar
Residue name
Character
Integer
AChar
Integer
Atom
Residue name
Character
Integer
AChar
Atom
Residue name
Character
Integer
AChar
strand
sheetID
numStrands
initResName
initChainID
initSeqNum
initICode
endResName
endChainID
endSeqNum
endICode
sense
curAtom
curResName
curChainId
curResSeq
curICode
prevAtom
prevResName
prevChainId
prevResSeq
prevICode
折叠片的分支链(strand)的编号,从1开始逐次增加。
折叠片的标识符。
折叠片中分支链的数目。
起始残基的名称。
分支链中起始残基的主链标识符。
分支起始残基在主链中的排序号。
分支链起始残基的插入代码。
末端终止残基名称。
终止残基的主链标识符。
终止残基的主链排序号。
终止残基的插入代码。
相对于前导链的意义。数字0代表第一前导链,1代表相对为顺式,
-1代表相对为反式。详细解释见后细节部分。
分支链标识信息:前分支链中原子的名称。
分支链标识信息:前分支链中的残基名称。
分支链标识信息:分支链的主链标识符。
分支链标识信息:前分支链残基的主链序列排号。
分支链标识信息:前分支链的插入代码。
分支链标识信息:导分支链的原子名称。
分支链标识信息:导分支链的残基名称。
分支链标识信息:导分支链的主链标识符。
分支链标识信息:导分支链残基的主链序列排号。
支链标识信息:导分支链的插入代码。
3 4 5 6 7
N
N
N
N
N
N
N
N
LYS A
LEU A
ALA A
PHE A
LYS B
LEU B
ALA B
ASP B
98
89
74
56
98
89
74
54
O
O
O
O
O
O
O
O
THR A 107
TYR A 97
ILE A 88
TRP A 71
THR B 107
TYR B 97
ILE B 88
GLU B 73
从这个示例可以看出SHEET A共有5条分支链,列14为SHEET标识符,列10为分支链标号,列16表示SHEET中的分支链总数。分支链1是从主
链A107位的苏氨酸(THR)到主链A110位的精氨酸(ARG),后面40列数字0代表了此链是首链。第二行是分支链2,从1到37列意义是主链
A96位的赖氨酸(LYS)到主链A99位的苏氨酸(THR),后面的-1代表其和它的前导链关系是反式。后面表示A链98位赖氨酸上的氮和前导链
A107位的苏氨酸(THR)上的氧之间形成氢键。后面其他SHEET意义都可以参考上面的注解。
示例2:
下面列出的BS1折叠片是一个8条分支链的β折叠桶。这个例子表现了闭和折叠片的首分支链和最后一条分支链是同一条链。其他含义可以参考
示例1的注释。
SHEET
SHEET
SHEET
SHEET
1 BS1 9 VAL
2 BS1 9 ALA
3 BS1 9 LYS
4 BS1 9 GLY
13 ILE 17 0
70 ILE 73 1 O TRP 72 N ILE 17
127 PHE 132 1 O ILE 129 N ILE 73
221 ASP 225 1 O GLY 221 N ILE 130
SHEET
SHEET
SHEET
SHEET
SHEET
5 BS1 9 VAL
6 BS1 9 LEU
7 BS1 9 TYR
8 BS1 9 VAL
9 BS1 9 VAL
248 GLU 253 1 O PHE
276 ASP 278 1 N LEU
310 THR 318 1 O VAL
351 TYR 356 1 O VAL
13 ILE 17 1 N VAL
249 N ILE 222
277 O GLY 252
317 N ASP 278
351 N THR 318
14 O PRO 352
示例3:
下面是个折叠片结构被分为两部分的实例,为了表现这一特征,定义了两个折叠片,分支链BS7的2链和分支链BS8的3链是同一条链。
SHEET
SHEET
SHEET
SHEET
SHEET
SHEET
1 BS7 3 HIS
2 BS7 3 LYS
3 BS7 3 ASN
1 BS8 3 ASN
2 BS8 3 LYS
3 BS8 3 ASN
662
639
596
653
639
596
THR
LYS
VAL
TRP
LYS
VAL
665 0
648 -1 N
600 -1 N
656 0
648 -1 N
600 -1 N
PHE 643 O HIS 662
TYR 598 O ILE 646
LYS 647 O THR 655
TYR 598 O ILE 646
TURN(转角)
综述
转角记录项是来确认转角和其他通常连接其他二级结构片段的短环转角(short loop turns)。
记录格式
列
1 - 6
8 - 10
12 - 14
16 - 18
20
21 - 24
25
27 - 29
31
32 - 35
36
41 - 70
细节
1. 转角包括那些来自β转角的残基都有一对(C-O)i到(N-H)I+3的氢键。连接I到I+2(γ弯曲)残基的转角也应该被包括。其他的也
有可能包括在转角的分类中。
2. 起始残基是氮末端残基。
3. 和其他数据类型的关系:可以在REMARK项中找到相关信息。
示例
1 2
345678934567890
TURN 1 S1A GLY A 16 GLN A 18
TURN 2 FLA ILE A 50 GLY A 52
TURN 3 S2A ILE A 66 HIS A 69
TURN 4 S1B GLY B 16 GLN B 18
TURN 5 FLB ILE B 50 GLY B 52
TURN 6 S2B ILE B 66 HIS B 69
3 4 5 6 7
SURFACE
FLAP
SURFACE
SURFACE
FLAP
SURFACE
数据类型
Record name
Integer
LString(3)
Residue name
Character
Integer
AChar
Residue name
Character
Integer
AChar
String
字段名称
"TURN "
seq
turnId
initResName
initChainID
initSeqNum
initICode
endResName
endChainID
endSeqNum
endICode
comment
定义描述
转角的编号,从1开始逐个增加。
转角标识符。
转角中的起始残基名称。
包含此转角的主链的标识符。
转角起始残基主链中的序列排号。
转角起始残基的插入码。
转角终止残基名称。
包含此转角的主链的标识符。
转角终止残基在主链中的序列排号。
转角终止残基的插入码。
相关注释。
参照以上转角的数据描述,此示例有如下含义:10列为转角标号,从一开是逐一递增,12-14是转角标识符,后面分别说明了转角的起始和终止
残基,以TURN 1 来说明,其标识为S1A,起始残基为主链A 16位的甘氨酸,终止残基为主链A18位的谷氨酰氨(GLN),后面是对此转角的说明。
6.连接注释
连接注释部分详细说明二硫化物的存在和位置,还有其他连接:共价键,盐桥。它包括以下几个部分。
SSBOND(二硫键)
综述
这一部分通过识别二硫键连接的两个残基识别蛋白中的每个二硫键和多肽键结构。
记录格式
列
1 - 6
8 - 10
12 - 14
16
18 - 21
22
26 - 28
30
32 - 35
36
60 - 65
67 - 72
示例
1 2 3 4 5 6
7
34567893456789012
SSBOND 1 CYS E 48 CYS E 51 2555
SSBOND 2 CYS E 252 CYS E 285
如上边所示:SSBOND 1 CYS E 48 CYS E 51
记录名为:SSBOND,序列号为1,E链上第48位和第51位结合形成二硫键。
LINK(残基间化学键)
综述
LINK详细说明在一级结构中残基间没有指出的结构,残基之间的连接依据原子名来表示,即残基间的化学键。该记录补充了CONECT记录的信息,
方便了查询。
记录格式
列
1 - 6
13 - 16
17
18 - 20
22
23 - 26
27
43 - 46
47
48 - 50
52
53 - 56
57
60 - 65
67 - 72
示例
1 2 3 4 5 6 7
34567893456789012
LINK O1 DDA 1 C3 DDL 2
LINK MN MN 391 OE2 GLU 217 2565
数据类型
Record name
Atom
Character
Residue name
Character
Integer
AChar
Atom
Character
Residue name
Character
Integer
AChar
SymOP
SymOP
字段名称
"LINK "
name1
altLoc1
resName1
chainID1
resSeq1
icode1
name2
altLoc2
resName2
chainID2
resSeq2
icode2
sym1
sym2
定义描述
原子名
交替位点标识
残基名
链标识符
残基序列号
插入代码
原子名
交替位点标识
残基名
链标识符
残基序列号
插入代码
第一个原子的对称算子
第二个原子的对称算子
数据类型
Record name
Integer
LString(3)
Character
Integer
AChar
LString(3)
Character
Integer
AChar
SymOP
SymOP
字段名称
"SSBOND"
serNum
"CYS"
chainID1
seqNum1
icode1
"CYS"
chainID2
seqNum2
icode2
sym1
sym2
定义描述
序列号
残基名
链标识符
残基序列号
插入代码
残基名
链标识符
残基序列号
插入代码
第一个残基对称算子
第二个残基对称算子
如:LINK O1 DDA 1 C3 DDL 2
解释为:LINK记录,第一个残基DDA中的原子O1和第2个残基DDL中的原子C3相互作用形成特殊键。
HYDBND(氢键)
综述
详细说明记录中的氢键.
记录格式
列 数据类型 字段名称 定义描述
1 - 6 Record name "HYDBND"
13 - 16 Atom name1 原子名
17 Character altLoc1 交替位点标识
18 - 20 Residue name resName1 残基名
22 Character chainID1 链标识符
23 - 27 Integer resSeq1 残基序列号
28 AChar icode1 插入代码
30 - 33 Atom nameH 氢原子名
34 Character altLocH 交替位点标识
36 Character ChainH 链标识符
37 - 41 Integer resSeqH 残基序列号
42 AChar iCodeH 插入代码
44 - 47 Atom name2 原子名
48 Character altLoc2 交替位点标识
49 - 51 Residue name resName2 残基名
53 Character chainID2 链标识符
54 - 58 Integer resSeq2 残基序列号
59 AChar icode2 插入代码
60 - 65 SymOP sym1 第一个非氢原子的对称算子
67 - 72 SymOP sym2 第二个非氢原子的对称算子
示例
1 2 3 4 5
34567893456789012
HYDBND N LEU 10 AO3* NDP 501
HYDBND NH2 ARG 111 OD1 ASP 149 1555
如:HYDBND N LEU 10 AO3* NDP 501
解释为: 第10个氨基酸LEU上的N原子和第501个氨基酸NDP上的第三位氧的一个氢原子相互作用形成的特殊键。
SLTBRG(盐桥)
综述
SLTBRG详细记录了盐桥,盐桥是两个原子通过电子之间的相互作用所形成的一种特殊键。
记录格式
列 数据类型 字段名称 定义描述
1 - 6 Record name "SLTBRG"
13 - 16 Atom atom1 第一个原子名
17 Character altLoc1 交替位点标识
18 - 20 Residue name resName1 残基名
22 Character chainID1 链标识符
23 - 26 Integer resSeq1 残基序列号
27 AChar icode1 插入代码
43 - 46 Atom name2 第二个原子名
47 Character altLoc2 交替位点标识
48 - 50 Residue name resName2 残基名
52 Character chainID2 链标识符
6 7
53 - 56
57
60 - 65
67 - 72
示例
1 2 3 4 5 6 7
34567893456789012
SLTBRG O GLU 10 NZ LYS 115
SLTBRG O GLU 10 NZ LYS 115 3654
如:SLTBRG O GLU 10 NZ LYS 115
第10个GLU上的氧和第115个LYS上NZ上的氢相结合形成盐桥。
CISPEP(顺式残基)
综述
CISPEP详细记录了在顺式结构中的脯氨酸和其他缩氨酸,即顺式残基。这些记录可以取代脚本注释来显示顺式残基。
记录格式
列
1 - 6
8 - 10
12 - 14
16
18 - 21
22
26 - 28
30
32 - 35
36
44 - 46
54 - 59
示例
1 2 3 4 5 6 7
345678934567890
CISPEP 1 GLY A 116 GLY A 117 0 18.50
CISPEP 2 THR D 92 PRO D 93 0 359.80
如:CISPEP 1 GLY A 116 GLY A 117 0 18.50
解释为:记录序列号为1的CISPEP中,A型链第116位残基GLY和A型链第117位残基GLY相互作用形成的键角为18.5度。
7.晶胞特征及坐标变换
这部分共包括五种记录参数:CRYST1,ORIGXn,SCALEn,MTRIXn,TVECT。在这五种记录参数中有三种是必须的:CRYST1,ORIGXn,SCALEn。
CRYST1(晶胞参数)
综述
CRYST1用来描述晶胞特征,其包含了晶胞结构参数。其中,a,b,c表示晶胞三条棱的长度,α,β,γ表示三条棱之间的夹角,如此晶胞空间结构
被描述成菱形六面体。Space group用来描述空间聚合的程度,用完整的Hermann- Mauguin 符号表示。Z 值表示一个单位结构中聚合链的个数。
记录格式
列
1 - 6
7 - 15
16 - 24
25 - 33
数据类型
Record name
Real(9.3)
Real(9.3)
Real(9.3)
字段名称
"CRYST1"
a
b
c
定义描述
a(埃)
b(埃)
c(埃)
数据类型
Record name
Integer
LString(3)
Character
Integer
AChar
LString(3)
Character
Integer
AChar
Integer
Real(6.2)
字段名称
"CISPEP"
serNum
pep1
chainID1
seqNum1
icode1
pep2
chainID2
seqNum2
icode2
modNum
measure
定义描述
记录序列号
残基名
链标识符
残基序列号
插入代码
残基名
链标识符
残基序列号
插入代码
识别特殊模型
测量角的度数
Integer
AChar
SymOP
SymOP
resSeq2
icode2
sym1
sym2
残基序列号
插入代码
第一个原子的对称算子
第二个原子的对称算子
34 - 40
41 - 47
48 - 54
56 - 66
67 - 70
细节
1.
2.
3.
4.
5.
CRYST1使用了国际 Hermann- Mauguin 符号,例如使用P 1 21 1 代替 P 21。
Z值表示一个单位晶胞的聚合链数。
在处理正确和内在一致性时,要检查被给定的空间组和Z值。
在 polycrystalline纤维衍射研究,CRYST1和SCALEn中包含常态单位结构数据。
单位晶胞参数用来计算SCALE。如果 EXPDTA 记录是 NMR ,理论模型,或纤维衍射,纤维,那末CRYST1 记录会被预先定义,如a = b= c=1.0 ,
α=β=γ=90 度,space group = P 1 和 Z=1. 在这些情况,一个说明性的REMARK一定在进入中出现。一些纤维衍射结构这样将会被这样
Real(7.2)
Real(7.2)
Real(7.2)
LString
Integer
alpha
beta
gamma
sGroup
z
α(度)
β(度)
γ(度)
空间基团
Z 值
做,和此同时其它纤维衍射有一个包含测量值的CRYST1 记录。
6. 存在的问题是,没有给出标准的偏离 。
示例
1 2 3 4 5 6
345678934567890
CRYST1 52.000 58.600 61.900 90.00 90.00 90.00 P 21 21 21 8
CRYST1 1.000 1.000 1.000 90.00 90.00 90.00 P 1 1
CRYST1 42.544 69.085 50.950 90.00 95.55 90.00 P 1 21 1 2
ORIGXn(直角-PDB坐标)
综述
ORIGXn (n = 1, 2, or 3) 记录介绍记录中直角坐标向递交坐标的转换.
列 数据类型 字段名称 定义描述
1 - 6 Record name "ORIGXn" n=1, 2, or 3
11 - 20 Real(10.6) o[n][1] On1
21 - 30 Real(10.6) o[n][2] On2
31 - 40 Real(10.6) o[n][3] On3
46 - 55 Real(10.5) t[n] Tn
细节
1. 即使当转换是恒等交换(矩阵单元,无效向量)时PDB也给出这些信息.可参看SCALE部分关于定义默认的直角埃系统的文献.
2. 如果初始递交坐标是 Xsub , Ysub, Zsub 和被包含在数据输入的直角埃坐标是 X , Y , Z,然后: Xsub= O11X+ O12Y+ O13Z+ T1
Ysub= O21X+ O22Y+ O23Z+ T2
Zsub= O31X+ O32Y+ O33Z+ T3
3. Appendix 2详细记录ORIGX坐标转换的出处.
4. ORIGXn联系ATOM和 HETATM 记录中的坐标和初始坐标。
示例
1 2 3 4 5 6
345678934567890
ORIGX1 0.963457 0.136613 0.230424 16.61000
ORIGX2 -0.158977 0.983924 0.081383 13.72000
ORIGX3 -0.215598 -0.115048 0.969683 37.65000
SCALEn(直角-部分结晶学坐标)
综述
SCALEn记录介绍记录中直角坐标向部分结晶学坐标的转换。也应解释非标准坐标.
列 数据类型 字段名称 定义描述
1 - 6 Record name "SCALEn" n=1, 2, or 3
11 - 20 Real(10.6) s[n][1] sn1
7
7
21 - 30
31 - 40
46 - 55
细节
PDB使用的标准直角坐标系统和单位晶胞轴系统相关。单位晶胞轴系统相关由下列定义提供:
•
•
Real(10.6)
Real(10.6)
Real(10.5)
s[n][2]
s[n][3]
u[n]
sn2
sn3
Un
•
如果矢量a,矢量b,矢量c描述晶胞边缘,且矢量A,矢量B,矢量C是单位内定的直角埃系统晶胞矢量,那末矢 量a,矢量b,矢量c和矢量
A,矢量B,矢量C同源:矢量A平行和矢量a,矢量B平行于矢量c倍的矢量a,矢量C平行和矢量a倍的矢量b。
如果直角的埃坐标是 X , Y , Z 和部分晶胞坐标是x frac , yfrac, zfrac,然后:
xfrac= S11X+ S12Y+ S13Z+ U1
yfrac= S21X+ S22Y+ S23Z+ U2
zfrac= S31X+ S32Y+ S33Z+ U3
SCALEn的变换和 CRYST1 记录相关联,如SCALE点阵式的决定因素的反相等于晶胞体积。
以上三个记录是每个PDB文件中必须的三项记录。
示例
1 2 3 4 5 6 7
345678934567890
SCALE1 0.019231 0.000000 0.000000 0.00000
SCALE2 0.000000 0.017065 0.000000 0.00000
SCALE3 0.000000 0.000000 0.016155 0.00000
MTRIXn(非晶相对称)
综述
SCALEn记录介绍记录中直角坐标向部分结晶学坐标的转换。也应解释非标准坐标.
列
1 - 6
8 - 10
11 - 20
21 - 30
31 - 40
46 - 55
60
数据类型
Record name
Integer
Real(10.6)
Real(10.6)
Real(10.6)
Real(10.5)
Integer
字段名称
"MTRIXn"
serial
m[n][1]
m[n][2]
m[n][3]
v[n]
iGiven
定义描述
n=1, 2, or 3
序列号
Mn1
Mn2
Mn3
Un
如果和分子转换近似相关的坐标表示法包含在记录中就用1表
示,否则空白.
细节
1. 用一个固定序号的MTRIX记录三个一组来定义描述一个非晶胞对称操作。如果和给定变换相联系坐标表示在文件中,那么iGiven的值为
1,否则为空。
2. 一个相应的REMARK记录一定出现在描述变化的地方。
3. 如果iGiven的值为1,PDB通过使用给定的变换和计算提供坐标决定RMSD来查证所有的MTRIX记录。如果iGiven的值为空,PDB通过检
查产生分子的封装来查证MTRIX记录。
示例
1 2 3 4 5 6 7
345678934567890
MTRIX1 1 -1.000000 0.000000 -0.000000 0.00001 1
MTRIX2 1 -0.000000 1.000000 0.000000 0.00002 1
MTRIX3 1 0.000000 -0.000000 -1.000000 0.00002 1
TVECT(转换因子)
综述
TVECT记录介绍无限共价键连接结构的转换因子。
列
1 - 6
数据类型
Record name
字段名称
"TVECT "
定义描述
8 - 10
11 - 20
21 - 30
31 - 40
41 - 70
细节
1. 由于结构不是由不连续的分子组成的,这种进入包含一个通过TVECT记录的简单转化因子能加入完整结构的碎片。
2. 有一个描述结构的相关REMARK记录出现。
3. PDB使用这种转化并检查产生的分子。
示例
1 2 3 4 5 6 7
345678934567890
TVECT 1 0.00000 0.00000 28.30000
MTRIX,TVECT这两项不是必须有的两项。
8.坐标部分
坐标部分主要包括原子坐标的收集,正如MODEL/ ENDMDL记录。
MODLE用来标志一个模块的开始,ENDMDL则标志着一个模块的结束。一个模块主要有MODEL,ATOM,HETATM,SIGATM SIGUIJ,ANISOU,TER和 ENDMDL
记录等几部分组成。
MODEL(多亚基时示亚基号)
综述
MODEL部分主要记录了模块的序列号。
记录格式
列
1 - 6
11 - 14
细节
需要注意的是,这种记录只用于当一个记录中有多个MODEL出现时,并且它主要用于NMR结构中。MODEL的序列号是从1开始的,并且是连续的。
示例
1 2 3 4 5 6 7
8
34567893456789
MODEL 1
ATOM 1 N ALA 1 11.104 6.134 -6.504 1.00 0.00 N
ATOM 2 CA ALA 1 11.639 6.071 -5.147 1.00 0.00 C
...
ATOM 294 2HG GLU 18 -13.518 -3.769 0.084 1.00 0.00 H
TER 295 GLU 18
ENDMDL
MODEL 2
ATOM 296 N ALA 1 10.883 6.779 -6.464 1.00 0.00 N
ATOM 297 CA ALA 1 11.451 6.531 -5.142 1.00 0.00 C
...
ATOM 589 2HG GLU 18 -12.634 -3.023 -3.475 1.00 0.00 H
TER 590 GLU 18
ENDMDL
ATOM(标准基团的原子坐标)
综述
MODEL部分主要记录了模块的序列号。
数据类型
Record name
Integer
字段名称
"MODEL "
serial
定义描述
Model序列号
Integer
Real(10.5)
Real(10.5)
Real(10.5)
Integer
serial
t[n][1]
t[n][2]
t[n][3]
text
序列号
转化矢量成分
转化矢量成分
转化矢量成分
注释
记录格式
列
1 - 6
7 - 11
13 - 16
17
18 - 20
22
23 - 26
27
31 - 38
39 - 46
47 - 54
55 - 60
61 - 66
73 - 76
77 - 78
79 - 80
细节
1.
2.
3.
4.
一般来说,蛋白质的这些原子记录是从氨基到羧基来排列的。
但对多聚糖而言是无序的。
核酸的残基是从5' 端到 3'端排列的。
由于第7—11位存储原子的序列号,即一个MODEL/ENDMD模块中能够存储的最大原子数为99999,所以当一个记录中有多于99999个原子
时,就需要多个MODEL/ENDMD模块,而这些模块中的原子序列号是连续的,并且关键字MODEL和ENDMDL必须显示,但一般情况下可以不
写。
数据类型
Record name
Integer
Atom
Character
Residue name
Character
Integer
AChar
Real(8.3)
Real(8.3)
Real(8.3)
Real(6.2)
Real(6.2)
LString(4)
LString(2)
LString(2)
字段名称
"ATOM "
serial
name
altLoc
resName
chainID
resSeq
iCode
x
y
z
occupancy
tempFactor
segID
element
charge
定义描述
原子序列号
原子名
交替位点标识
残基名
链标识符
残基序列号
残基的插入代码
X坐标
Y坐标
Z坐标
空间大小
温度因数
段标识符,左对齐
元素符号,右对齐
原子的价位
示例
1 2 3 4 5 6 7
8
34567893456789
ATOM 145 N VAL A 25 32.433 16.336 57.540 1.00 11.92 A1 N
ATOM 146 CA VAL A 25 31.132 16.439 58.160 1.00 11.85 A1 C
ATOM 147 C VAL A 25 30.447 15.105 58.363 1.00 12.34 A1 C
ATOM 148 O VAL A 25 29.520 15.059 59.174 1.00 15.65 A1
SIGATM(标准差)
综述
这部分主要记录了在ATOM和HETATM 中出现的原子参数的标准差。
记录格式
列
1 - 6
7 - 11
13 - 16
17
18 - 20
22
23 - 26
27
31 - 38
39 - 46
47 - 54
55 - 60
61 - 66
73 - 76
77 - 78
数据类型
Record name
Integer
Atom
Character
Residue name
Character
Integer
AChar
Real(8.3)
Real(8.3)
Real(8.3)
Real(6.2)
Real(6.2)
LString(4)
LString(2)
字段名称
"SIGATM"
serial
name
altLoc
resName
chainID
resSeq
iCode
sigX
sigY
sigZ
sigOcc
sigTemp
segID
element
定义描述
原子序列号
原子名
交替位点标识
残基名
链标识符
残基序列号
插入代码
坐标的标准差
坐标的标准差
坐标的标准差
占有标准差背离
温度因数的标准差
段标识符,左对齐
元素符号,右对齐
79 - 80
细节
其中7 - 27位 和 73 - 80位所记录的内容和ATOM/HETATM中的相同,并且每个SIGATM总是紧跟着一个ATOM/HETATM记录后面。但不是每个
ATOM/HETATM记录都有一个SIGATM,只有当研究人员提供这些数值并且这些数值不为零时才会出现SIGATM记录。
示例
1 2 3 4 5 6 7
8
34567893456789
ATOM 230 N PRO 15 20.860 29.640 13.460 1.00 12.20 N
SIGATM 230 N PRO 15 0.040 0.030 0.030 0.00 0.00 N
ATOM 231 CA PRO 15 22.180 29.010 12.960 1.00 14.70 C
SIGATM 231 CA PRO 15 0.060 0.040 0.050 0.00 0.00 C
ATOM 237 HA PRO 15 22.630 28.400 13.620 1.00 14.70 H
ATOM 238 1HB PRO 15 22.240 28.540 10.860 1.00 17.70 H
ATOM 239 2HB PRO 15 21.670 27.240 11.840 1.00 17.70
ANISOU(温度因子)
综述
这部分主要记录了各种温度因子。
记录格式
列
1 - 6
7 - 11
13 - 16
17
18 - 20
22
23 - 26
27
29 - 35
36 - 42
43 - 49
50 - 56
57 - 63
64 - 70
73 - 76
77 - 78
79 - 80
细节
其中7 - 27位 和 73 - 80位所记录的内容和ATOM/HETATM中的相同。在这里,这些温度因数都是整数,并且是以10**4 (埃**2)为单位来度量
的,它们存储在和原子记录相同的坐标结构中。和SIGATM部分一样,只有当研究人员提供这些数据值时才会出现ANISOU记录。
示例
1 2 3 4 5 6 7
8
34567893456789
ATOM 107 N GLY 13 12.681 37.302 -25.211 1.000 15.56 N
ANISOU 107 N GLY 13 2406 1892 1614 198 519 -328 N
ATOM 108 CA GLY 13 11.982 37.996 -26.241 1.000 16.92 C
ANISOU 108 CA GLY 13 2748 2004 1679 -21 55 -419 C
ATOM 109 C GLY 13 11.678 39.447 -26.008 1.000 15.73
SIGUIJ(各种温度因素导致的标准差)
数据类型
Record name
Integer
Atom
Character
Residue name
Character
Integer
AChar
Integer
Integer
Integer
Integer
Integer
Integer
LString(4)
LString(2)
LString(2)
字段名称
"ANISOU"
serial
name
altLoc
resName
chainID
resSeq
iCode
u[0][0]
u[1][1]
u[2][2]
u[0][1]
u[0][2]
u[1][2]
segID
element
charge
定义描述
原子序列号
原子名
交替位点标识
残基名
链标识符
残基序列号
插入代码
U(1,1)
U(2,2)
U(3,3)
U(1,2)
U(1,3)
U(2,3)
段标识符,左对齐
元素符号,右对齐
原子的价位
LString(2) charge 原子的价位
综述
这部分主要记录了各种温度因子。
记录格式
列
1 - 6
7 - 11
13 - 16
17
18 - 20
22
23 - 26
27
29 - 35
36 - 42
43 - 49
50 - 56
57 - 63
64 - 70
73 - 76
77 - 78
79 - 80
细节
其中7 - 27位 和 73 - 80位所记录的内容和ATOM/HETATM中的相同,而且只有当研究人员提供这些数值并且这些数值不为零时才会出现SIGATM
记录。
示例
1 2 3 4 5 6 7
8
34567893456789
ATOM 107 N GLY 13 12.681 37.302 -25.211 1.000 15.56 N
ANISOU 107 N GLY 13 2406 1892 1614 198 519 -328 N
SIGUIJ 107 N GLY 13 10 10 10 10 10 10 N
ATOM 108 CA GLY 13 11.982 37.996 -26.241 1.000 16.92 C
ANISOU 108 CA GLY 13 2748 2004 1679 -21 155 -419 C
SIGUIJ 108 CA GLY 13 10 10 10 10 10 10
TER(链末端)
综述
TER记录表示了在一个链中一个ATOM/HETATM记录的结束。
记录格式
列
1 - 6
7 - 11
18 - 20
22
23 - 26
27
细节
1. 在SEQRES 记录中描述的每个ATOM/HETATM 链都是以一个TER记录来标志结束的。
2. 这种TER记录出现在每个记录的坐标部分,并且指示出每个多肽或者是核酸链的最后一个残基。对于蛋白质来说,这个残基是C-端残基;
但对于核酸来说它是一个3'端残基。
3. 对于环状分子来说,这个末端分子的选择是随意的。
数据类型
Record name
Integer
Residue name
Character
Integer
AChar
字段名称
"TER "
serial
resName
chainID
resSeq
iCode
定义描述
原子序列号
残基名
链标识符
残基序列号
插入代码
数据类型
Record name
Integer
Atom
Character
Residue name
Character
Integer
AChar
Integer
Integer
Integer
Integer
Integer
Integer
LString(4)
LString(2)
LString(2)
字段名称
"SIGUIJ"
serial
name
altLoc
resName
chainID
resSeq
iCode
sig[1][1]
sig[2][2]
sig[3][3]
sig[1][2]
sig[1][3]
sig[2][3]
segID
element
charge
定义描述
原子序列号
原子名
交替位点标识
残基名
链标识符
残基序列号
插入代码
Sigma U(1,1)
Sigma U(2,2)
Sigma U(3,3)
Sigma U(1,2)
Sigma U(1,3)
Sigma U(2,3)
段标识符,左对齐
元素符号,右对齐
原子的价位
4. 蛋白质中末端的氧原子是以OXT的形式描述的,而核酸中末端的氧原子是以O5T 或 O3T 的形式描述的。
5. 这种TER记录描述了残基的残基名,链标识符,序列号以及插入代码。并且它的序列号比前面ATOM/HETATM记录中描述的残基的序列号都
大。
6. 对于由于无序而造成的具有空位的链,人们习惯用C-端原子来表示O and OXT,并且用一个REMARK记录来解释其中不明确的地方。
示例
1 2 3 4 5 6 7
8
34567893456789
ATOM 4150 H ALA A 431 8.674 16.036 12.858 1.00 0.00 H
TER 4151 ALA A 431
ATOM 1403 O PRO P 22 12.701 33.564 15.827 1.09 18.03 O
ATOM 1404 CB PRO P 22 13.512 32.617 18.642 1.09 9.32 C
ATOM 1405 CG PRO P 22 12.828 33.382 19.740 1.09 12.23
ATOM 1406 CD PRO P 22 12.324 34.603 18.985 1.09 11.47
HETATM 1407 CA BLE P 1 14.625 32.240 14.151 1.09 16.76
HETATM 1408 CB BLE P 1 15.610 33.091 13.297 1.09 16.56
HETATM 1409 CG BLE P 1 15.558 34.629 13.373 1.09 14.27
HETATM 1410 CD1 BLE P 1 16.601 35.208 12.440 1.09 14.75
HETATM 1411 CD2 BLE P 1 14.209 35.160 12.930 1.09 15.60
HETATM 1412 N BLE P 1 14.777 32.703 15.531 1.09 14.79
HETATM 1413 B BLE P 1 14.921 30.655 14.194 1.09 15.56
HETATM 1414 O1 BLE P 1 14.852 30.178 12.832 1.09 16.10
HETATM 1415 O2 BLE P 1 13.775 30.147 14.862 1.09 20.95
TER 1416 BLE P 1
HETATM(非标准基团原子坐标)
综述
这部分主要记录了非标准集团原子的坐标,这些记录主要用于水分子和HET集团原子.
记录格式
列 数据类型 字段名称 定义描述
1 - 6 Record name "HETATM"
7 - 11 Integer serial 原子序列号
13 - 16 Atom name 原子名
17 Character altLoc 交替位点标识
18 - 20 Residue name resName 残基名
22 Character chainID 链标识符
23 - 26 Integer resSeq 残基序列号
27 AChar iCode 残基的插入代码
31 - 38 Real(8.3) x X坐标
39 - 46 Real(8.3) y Y坐标
47 - 54 Real(8.3) z Z坐标
55 - 60 Real(6.2) occupancy 空间大小
61 - 66 Real(6.2) tempFactor 温度因数
73 - 76 LString(4) segID 段标识符,左对齐
77 - 78 LString(2) element 元素符号,右对齐
79 - 80 LString(2) charge 原子的价位
细节
1. 这里的 x, y, z 坐标是以埃为单位的。
2. 在一些条目中,空间大小和温度因素区域部分经常用来说明原子的其它参数。如果是这
种情况,在注释部分将会有一个详细的解释。
3. 插入代码,段标识符和元素名称在ATOM部分已经作了详细的描述。
4. 除了水以外,每个HETATM记录都必须有一个相应的HET, HETNAM, FORMUL 和 CONECT
记录。
C
C
C
C
C
N
B
O
O
C
C
示例
1 2 3 4
5 6 7 8
34567893456789
HETATM 1357
MG MG 168 4.669 34.118 19.123 1.00 3.16
MG2+
HETATM 3835 FE HEM 1 17.140 3.115 15.066 1.00
14.14 FE3+
ENDMDL(亚基结束)
综述
ENDMDL记录和MODEL记录是成对出现的,用来组成一个坐标条目中的单结构。
记录格式
列
1 - 6
细节
1. 要注意的是,这种记录只用于当一个记录中有多个MODEL出现时,并且它主要用于NMR
结构中。
2. 在一个具有多模块的条目中所有的模块必须描述的是相同的结构。
3. 每个MODEL记录都有一个相应的ENDMDL记录。
示例
1 2 3 4
5 6 7 8
34567893456789
...
...
ATOM 14550 1HG GLU 122 -14.364 14.787
-14.258 1.00 0.00 H
ATOM 14551 2HG GLU 122 -13.794 13.738
-12.961 1.00 0.00 H
TER 14552 GLU 122
ENDMDL
MODEL 9
ATOM 14553 N SER 1 -28.280 1.567 12.004 1.00 0.0
0 N
ATOM 14554 CA SER 1 -27.749 0.392 11.256 1.00 0.00
C
...
...
ATOM 16369
1HG GLU 122 -3.757 18.546 -8.439 1.00 0.00
H
ATOM 16370
2HG GLU 122 -3.066 17.166 -7.584 1.00 0.00
H
TER 16371 GLU 122
ENDMDL
MODEL 10
数据类型
Record name
字段名称
"ENDMDL"
定义描述
ATOM 16372 N SER 1 -22.285 7.041 10.003 1.00 0.0
0 N
ATOM 16373 CA SER 1 -23.026 6.872 8.720 1.00 0.0
0 C
...
...
ATOM 18188 1HG GLU 122 -1.467 18.282
-17.144 1.00 0.00 H
ATOM 18189 2HG GLU 122 -2.711 18.067
-15.913 1.00 0.00 H
TER 18190 GLU 122
ENDMDL
10.连通性部分
要是提供该pdb在化学连通性方面的信息。LINK(联系),HYDBND(氢键), SLTBRG(盐桥)和CISPEP
(顺势肽)则出现在连通性注释部分.
CONECT(原子间的连通性有关记录)
综述
CONECT详细的描述了已给出坐标的原子间的连通性。而这种连通性是以该记录的原子序列号的形式
表现的。(参照后面的例子)
CONECT记录是用来描述那些非标准残基(包括水)和那些在标准连同性表中没有被详细列出的键。
(参照第四部分标准残基列表)
记录格式
列
1 - 6
7 - 11
12 - 16
17 - 21
22 - 26
27 - 31
32 - 36
37 - 41
42 - 46
47 - 51
52 - 56
57 - 61
细节
1.
2.
3.
4.
5.
6.
7.
8.
在非标准残基(包括水)中的内部残基连通性在CONECT中有所表现。
非标准残基组和标准残基组或和非标准残基组之间的交叉性隐含在CONECT中。
在SSBOND记录中二硫键在CONECT中有相应的记录。
氢键和盐桥在CONECT中有相应的记录。
连接氢键的两个原子没有区别。
带多余正负电荷的原子之间没有区别。
原子的连通性是通过原子序列号表现出来的。
如果原子的共价键大于4个,那么需要再建立一个新的和这个原子的序列号相同的CONECT
记录。
9. 如果一个键的两端的一个原子出现在7-11字节中,那么另一个就没有必要再标示出来。
10. 对于核酸,氢键列出和否是可以选择的。
11. 对于氢键来说,当一个氢原子出现的时候,pdb会建立一个CONECT用来记录氢原子和它连接
的原子。
12. 对于核磁共振来说,CONECT用来记录异型杂种的连通性。
数据类型
Record name
Integer
Integer
Integer
Integer
Integer
Integer
Integer
Integer
Integer
Integer
Integer
字段名称
“CONECT”
serial
serial
serial
serial
serial
serial
serial
serial
serial
serial
serial
定义描述
原子序列号
共价键连接的原子序列号
共价键连接的原子序列号
共价键连接的原子序列号
共价键连接的原子序列号
氢键连接的原子序列号
氢键连接的原子序列号
盐桥连接的原子序列号
氢键连接的原子序列号
氢键连接的原子序列号
盐桥连接的原子序列号
13. 和其他记录的联系:如果某条出现了非标准组或是二硫键,CONECT必须出现 。
示例
1 2 3 4
5 6 7
345678934567890
CONECT 1179 746 1184 1195 1203
CONECT 1180 1211 1222
CONECT 1021 544 1017 1020 1022 1211 1222 1311
10.簿记
该部分主要是用提供文件自身最后其他一些补充的内容.
MASTER (版权拥有者)
综述
MASTER记录是簿记部分的控制记录,在这部分列出了相应记录或所选数据类型文件的数目。
记录格式
列
1 - 6
16 - 20
21 - 25
26 - 30
31 - 35
36 - 40
41 - 45
46 - 50
51 - 55
56 - 60
61 - 65
66 - 70
细节
对于已经选用的记录类型,MASTER项给出了这一条目所有记录数目行数的验证数字。
示例
1 2 3 4
5 6 7
345678934567890
MASTER 40 0 0 0 0 0 0 6
2930 2 0 29
如上示例,14列表示REMARK记录项一共有40行,20列被定义为0,25列为0表示没有HET记录,
30列为0表示没有HELIX记录,35列为0表示没有SHEET记录,35列表示TURN记录为0,40列表
示没有SITE记录,50列为数字6表示坐标变换记录有6行,22-25行表示ATOM和HETATM项共2930
行,60表示TER记录有2行,65列表示CONECT记录为0,69-70列表示SEQRES项共29行。
1 2 3 4
5 6 7
345678934567890
END
数据类型
Record name
Integer
Integer
Integer
Integer
Integer
Integer
Integer
Integer
Integer
Integer
Integer
字段名称
"MASTER"
numRemark
"0"
numHet
numHelix
numSheet
numTurn
numSite
numXform
numCoord
numTer
numConect
numSeq
定义描述
REMARK记录项的行数
HET记录项的行数
HELIX记录项的行数
SHEET记录项的行数
TURN记录项的行数
SITE记录项的行数
坐标变换记录项的行数
(ORIGX+SCALE+MTRIX)
原子坐标记录项的行数(ATOM+HETATM)
TER记录项的行数
CONECT记录项的行数
SEQRES记录项的行数
11 - 15 Integer
关于蛋白质数据库 | 蛋白质数据库文件格式 | 蛋白质结
修改日期: 2008年5月3日
版权声明:本文标题:蛋白质PDB文件说明 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://www.elefans.com/xitong/1721550610a884516.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论