GenBank 中字符的意思
Nucleotide 数据库分为三个子数据库:
·EST :表达序列标记数据库
·GSS :基因组测序序列数据库
·CoreNucleotide :包含所有未被以上两个子数据库收录的核苷酸序列
MeSH: 查询缩写基因的全称
3RefSeqReference Sequence)序列接受号
1mRNA 记录(NM_*):
    e。g。:NM_000492
2)基因组的DNA重叠(NT_*:
    e.g。:NT_000347
3)完整的基因组或染体(NC_*:include啥意思
    e。g。:NC_000907
(4)基因组的局部区域(NG_*:
    e。g。:NG_000019
5)从人类基因组注释、加工得到的序列模型(XMXPor XR_*):
    e。g。:XM_000483
GenBank记录中特性表中的主要关键词:
关键词
 
关键词
 
misc_feature
生物学特性无法用特性表关键词描述的序列
promoter
转录起始区
misc_difference
序列特性无法用特性表关键词描述的序列
CAAT_signal
真核启动子上游的CAATRNA结合相关
conflict
同一序列在不同的研究中在位点或区域上有差异
TATA_signal
真核启动子的TATA
unsure
序列不能确定的区域
—35_signal
原核启动子中的—35
old_sequence
该序列对以前的版本做过修订
—10_signal
原核启动子的Pribow
variation
包含稳定突变的序列
GC_signal
真核启动子的GC
modified_base
修饰过的核苷酸
RBS
核糖体结合位点
gene
已识别为基因或已命名的序列区域
polyA_signal
RNA转录本的剪切识别位点
misc_signal
无法用信号特性关键词描述的信号序列
enhancer
增强子
关键词
 
关键词
 
attenuator
与转录终止有关的序列
CDS
蛋白质编码序列
terminator
转录终止序列
sig_peptide
编码信号肽的序列
rep_origin
双链DNA复制起始区
transit_peptide
转运蛋白编码序列
misc_RNA
无法用RNA关键词描述的转录物或RNA产物
mat_peptide
编码成熟肽的序列
prim_transcript
初始转录本
intron
内含子
precursor_RNA
前体RNA
polyA_site
RNA转录本的多聚腺苷酸化位点
mRNA
信使RNA
rRNA
核糖体RNA
5’clip
前体转录本中被剪切掉的5’端序列
tRNA
转运RNA
3’ clip
前体转录本中被剪切掉的3'端序列
scRNA
小细胞质RNA
5’UTR
5’非翻译区
snRNA
小核RNA
3’UTR
exon
3'非翻译区
外显子
snoRNA
加工和修饰rRNA的小核RNA
关键词
 
关键词
 
immunoglobulin_related
 
repeat_unit
单个的重复元件
C_region
免疫相关蛋白上的不变区
LTR
长末端重复序列
D_segment
免疫球蛋白重链的可变区,
T细胞受体β链
Satellite
卫星重复序列
J_ segment
免疫球蛋白重链、轻链以及T细胞α、β、γ的结合链
misc_binding
无法描述的核酸序列结合位点
N_ region
插入重排免疫球蛋白片段间的核苷酸
primer_bind
复制、转录的引物结合位点
S_ region
免疫球蛋白重链的开关区
protein_bind
蛋白质结合区
V_ region
编码免疫球蛋白的可变区N末端的序列
STS
测序标签位点
V_ segment
编码免疫球蛋白的可变区的序列
misc_recomb
无法用重组特性关键词描述的重组事件
repeat_region
基因组中所包含的重复序列
iDNA
通过重组所消除的DNA
misc_structure
无法用结构关键词描述的核酸序列高级结构或构型
stem_loop
发夹结构
D_loop
线粒体中DNA中的取代环
GenBank记录中特性表中的限定词
限定词
 
限定词
 
/allele=
给定基因的等位基因
/codon_start=
相对于序列第一个碱基,编码序列密码子的偏移量
/bound_moiety=
嵌合范围
/country=
DNA样本的来源国
/cell_type=
获得序列的细胞类型
/db_xref=
其他数据库信息的交叉索引号
/citation=
已被引用的参考文献数
/direction=
DNA复制方向
/clone_lib=
获得序列的克隆文库
/environmental_sample=
序列直接从环境材料中获得而没有指明来源物种
限定词
 
限定词
 
/exception=
指明DNA序列未按通常的生物学规律翻译,如RNA编辑
/PCR_conditi—ons=
描述PCR的反应条件
/frequency=
在种中发生变异的频率
/pop_variant=
获得序列的体变异种名称
/germline
如果序列是DNA并来源于免疫球蛋白家族,则表示该序列来源于未重排DNA
/product=
序列编码产物的名称
/insertion_seq=
序列来源于某种插入元件
/anticodon=
tRNA反义密码子的位置及它所编码的氨基酸
/isolate=
序列来源的生物个体
/cell_line=
获得序列的细胞系
/lab_host=
为扩增序列来源物种所用的实验室宿主
/chromosome=
获得序列的染体
/macronuclear
指明DNA来源于染体分化的大核期
/clone=
获得序列的克隆子
/note=
评论及附加信息
/codon=
指出与参考密码子不同的密码子
/organelle=
获得序列的细胞器
/EC_number=
序列产物的酶学编号
/sub_strain=
获得序列的来源微生物亚种
/transl_table=
描述在翻译中与通用密码表不同的密码表
/tissue_type=
获得序列组织类型
/usedin=
表明该特性在其他检索中也被使用
/translation=
按通用或指定的密码子表翻译的氨基酸序列
/virion
病毒颗粒