名解
编辑 editing改变原有mRNA碱基序列组成的修饰。有两种编辑方式,将mRNA分子中某些碱基进行代换,如将C转为A,从而使原有的mRNA密码子的含义发生改变;在mRNA分子内部插入某些核苷酸,使mRNA原有的读框发生大范围的改变。因此mRNA的编码产物与原有基因编码的序列是不同的,编辑后的mRNA含有的遗传信息发生了改变。
表达序列标签 expressed sequence tag EST基因转录产物的一段cDNA序列,是一种重要的基因组图分子标记
表观遗传 epigenetic染体区域的一种适应性结构,可使改变的活性状态注册、传导或持续
CpGCpG island:基因组中富含双碱基CpG的序列,主要在脊椎动物中发现,其他种属基因组中也有CpG岛,但特征不明显。CpG岛长度约1kb,其比例显著高于基因组平均水平。约56%的人类基因与上游CpG岛相连。含有许多限制酶HpaII识别位点,曾被称为HTF岛。
重叠基因 overlap gene:编码序列彼此重叠的基因,含有不同蛋白质的编码序列,已在结构
紧凑的病毒基因组、某些高等生物线粒体基因组和核基因组中发现。重叠基因主要有两个特征,单个的mRNA可编码2中或多种蛋白质;不同的启动子转录的彼此重叠的mRNA,各自编码不同的蛋白质。
单核苷酸多态性 single nucleotide polymorphisms:基因组中单个核苷酸突变称为点突变,理论上每个单核苷酸位置最多只有4中形式,即A、T、C和G。
蛋白质组/蛋白质组学 proteome/proteomics:细胞蛋白质全部内容称之为蛋白质组,研究蛋白质组结构与功能的领域称为蛋白质组学。
功能基因组学 functional genomics:又称后基因组学,是指基于基因组序列信息,利用各种组学技术,在系统水平上将基因组序列与基因功能(包括基因网络)以及表型有机联系起来,最终揭示自然界中生物系统不同水平功能的科学。
管家基因 house-keeping gene:所有细胞中均要稳定表达的一类基因,其产物是对维持细胞基本生命活动所必需的始终保持着低水平的甲基化并且一直处于活性转录状态的基因。
宏基因组/宏基因组学metagenome/metagenomics:研究一类在特殊或极端的环境下共栖
生长微生物的混合基因组。
基因本体 gene ontology GO一个具代表性的规范化的基因和基因产物特性的术语描绘或词义解释的工作平台。使生物信息学研究者对基因和基因产物的数据能够进行统一的归纳、处理、解释和共享。
基因组作图 genomic mapping:确定界标或基因在构成基因组的各条染体上的位置,以及染体上各个界标或基因之间的染体多态性相对距离,绘制遗传连锁图或物理图。
假基因 pseudogene:来源于功能基因但已失去活性DNA序列。
绝缘子 insulator:可以阻断邻近位置激活或失活效应的序列。
开放阅读框 open reading frame:在DNA链上,由蛋白质合成的起始密码子开始,到终止密码子为止的一个连续编码序列
miRNA micro-interfering RNA原miRNA连续加工产生长度约22nt的成熟miRNA。主要生物学功能是促使靶mRNA降解,或阻止和干扰靶mRNA的翻译
逆转录(转座)子 retrotransposon:具有类似内源逆转录病毒(ERV的序列,但只分布在非脊椎动物基因组中,脊椎动物少见。逆转录转座子在某些基因组中有很高的拷贝,有许多不同的类型。
全基因组鸟法测序 whole genome shotgun sequencing:将整个基因组DNA打断成小片段后将其克隆到质粒载体中,然后随机挑取克隆对插入片段进行测序,并获得测序序列构建重叠。在此基础上进一步搭建序列支架,最后以分子标记为向导将序列支架锚定到基因组整合图上
snoRAN编码小分子核仁RNA。这些类RNA分子的作用场所主要位于核仁区,其功能是修饰rRNA,如指定特定位置的碱基甲基化或将某些碱基转变为假尿嘧啶。
snRNA :编码小分子细胞核RNA。所有真核生物都含有大量的位于细胞核内的小分子RNA,它们始终与蛋白质结合形成核蛋白复合物,即snRNP,参与mRNA前体的剪切加工
生命之树 tree of life:生物依据分类学中的等级分类,起始于界,然后依次为门、纲、目、科、属直到种。
顺式元件 cis-element:某些能影响基因表达不编码蛋白质和RNA的DNA序列,按照功能分为启动子、增强子、负调控元件(沉默子)
TATA box:转录起始位点及其上游-25~30bp处的富含TA典型元件。其核心序列为TATAAAA,其功能为确定转录起始位点并产生基础水平的转录
同源基因 homologous:起源于共同祖先的基因,包括直向同源基因和共生同源基因,涉及同一基因家族的所有成员。
物理图 physical map 采用分子生物学技术直接将DNA分子标记、基因或克隆标定在基因组的实际位置所构建的位置图
遗传图 genetic mapping:采用遗传学分析方法将基因或其他DNA分子标记标定在染体上构建连锁图
小干扰RNA siRAN:产生于双链RNA,主要来源于内源转座子,反向重复DNA,病毒mRNA和转基因表达产物等。
增强子 enhancer位于启动子上游或下游并通过启动子增强邻近基因转录效率的DNA顺序,但增强子本身不具备启动子活性。
转录组/转录组学 transcriptome/transcriptomics:某一特定条件下单个或一组细胞所具有的mRNA总和。转录组的内容依实验设计的不同而随之变化。
转座(位)因子 transposable element:能够在一个DNA分子内部或两个DNA分子之间移动的DNA片段。可以促使染体区段的重组与交换,提供转录调控元件,增加前体mRNA的剪接信号和加尾信号,还可提供新的蛋白质的编码序列。
细菌人工染体 bacterial artificial chromosome:一种以F质粒(F-plasmid)为基础建构而成的细菌染体克隆载体,常用来克隆150kb左右大小的DNA片段,最多可保存300kb碱基对。
问答
1.为什么RNA不能成为主要的遗传信息载体?
1) 2’—OH赋予了RNA许多不同与DNA 的特性, 极易断裂与分解,不能形成稳定的双螺旋;
2) 单链RNA分子的链内配对可形成高级结构, 赋RNA分子在生命活动中担负许多重要的结构和催化功能;
3) RNA的核苷酸组成中由尿嘧啶取代了DNA中胞嘧啶, 使其不能成为遗传信息的载体.
2.假基因能否表达?为什么?
1) 相对于原来的功能基因而言,假基因已失去正常功能.
2) 假基因可能产生了新的功能.
3.有哪些异常结构基因:
重叠基因,基因内基因,反义基因
4.什么是蛋白质结构域?什么是蛋白质模体?两者有何差别?
蛋白质的三级结构中有一些在结构上和功能上相对独立的组成区域,如球形或纤维状结构,称为域(domain),它们介于二级结构与三级结构之间。
在许多蛋白质中都可发现由2个或3个二级结构如α-螺旋,β-折叠和转环构成的组合,它们有特征性的序列,具有定的功能,称为基序或模体 motif)。
结构域常常由多个基序组成。
5.小分子RNA的功能
snRNA: 小分子细胞核RNA 涉及前体mRNA剪接
snoRNA: 小分子核仁RNArRNA剪接和修饰有关
scRNA: 小分子细胞质RNA 7S RNA, 与核糖体转移到内质网上有关
6.DNA标记的种类及特点
第一代分子标记---RFLP
1) 处于染体上的位置相对固定;2) 同一亲本及其子代相同位点上的多态性片段特征不变;3) 同一凝胶电泳可显示等位区段不同多态性片段, 表现为共显性.4) 需要用Southern杂交检测显示.
第二代分子标记---SSR
1) 可变排列的简单重复顺序, 即重复次数不一,在染体的同一座位重复顺序拷贝数不同;
2) SSR的类型:小卫星序列(minisatellite), 重复单位较长;微卫星序列(micrisatellite), 重复单位较短
第三代分子标记---SNP