研究植物基因功能的策略和方法
研究植物基因功能主要有两种策略:正向遗传学(forward genetics)和反向遗传学(reverse genetics)策略。正向遗传学即通过生物个体或细胞基因组的自发突变或人工诱变,寻相关表型或性状改变,然后通过图位克隆并结合一些基因差异表达筛选技术(如差减杂交、差异显示PCR、差异显示分析等)从这些特定性状变化的个体或细胞中到对应的突变基因,并揭示其功能,例如遗传病基因的克隆。反向遗传学的原理正好相反,人们首先是改变某个特定的基因或蛋白质,然后再去寻与之有关的表型变化,例如基因剔除技术或转基因研究。简单地说,正向遗传学是从表型变化研究基因变化,而反向遗传学则是从基因变化研究表型变化。
研究植物体内基因功能的方法主要有以下几种:(1)基因功能丧失或减少,即筛选目的基因功能部分丧失或全部丧失的突变体,比较其与野生型的表型差异来确定该基因功能;(2)基因功能增加或获得,即筛选目的基因高水平表达的植株,比较其与相应对照植株(野生型植株,功能丧失突变体或模式植物植株)差异,观察其表型性状变化来鉴定基因功能;(3)基因异位表达(Ectopic expression),通过定向调控靶基因的时空表达模式来研究基因功能;(4)微阵列(Microarray)是一种在全基因组水平对基因表达进行高通量检测的技术;(5)酵母双杂交技术(Yeast two-hybrid system)用于分析基因产物即蛋白质之间的互作。
1 基因功能丧失或减少
以前,通常通过筛选自然突变体来获得基因功能部分或全部丧失的突变体,但概率较低;现在一般通过各种人工方法来获得合适突变体。人工产生基因功能丧失的方法有插入突变、反义抑制(antisense suppression)、共抑制(cosuppression)、双链RNA干扰(double-stranded RNA interference, dsRNAi)。
(1) 插入突变
创建突变体一般可以通过各种理化诱变、转座子标签、T-DNA插入等突变方法来产生(吴昌银,博士学位论文,2003[3][4][5][6][7][8])。通过以上方法已在拟南芥、水稻、玉米、矮牵牛构建了大型的突变体库(Jeon et al. 2000; Walbot 2000; Greco et al. 2001; Hirochika 2001; Wu et al. 2003)。
理化诱变往往造成植物基因组多位点突变,因此覆盖全基因组需要构建的突变体库较小,且不涉及植物组织培养、遗传转化;但是理化诱变造成基因组的多位点突变使突变体遗传背景很复杂,给突变体鉴定和筛选带来了一定困难。由于理化诱变处理的是植物种子,因此由种子发育而成的突变体会有大量嵌合体存在。转座子标签是利用转座子作为插入突变源或分子标记来分离和克隆插入位点基因的方法。其优点是通过转座子切离靶位点能够产生突变性状的回复体,从而快速建立突变表型与转座子插入位置之间对应关系。但转座子插入突变体中有些为体细胞转座,导致突变性状不能稳定遗传;转座子转座后往往会留下“脚印”,这些“脚印”亦会造成基因突变,在分析这些突变性状位点时难以到转座子标签。T-DNA
插入突变能直接在基因组DNA中产生稳定的插入突变,且拷贝数较低,不需要额外步骤来稳定T-DNA 插入序列。此方法也存在一定缺点:其只适合易被T-DNA转化的植物,且T-DNA边界的质粒序列可随着T-DNA整合到基因组DNA中,同时常常出现由T-DNA整合引起的各种染体重排现象,以致突变表型与T-DNA插入无关,因此在突变体鉴定中必须进行突变性状和T-DNA共分离检测,以确定突变性状是否真正是由于T-DNA插入所造成。
以上各种插入突变都可以创造功能丧失的突变体,但是这些方法也存在一定局限性。首先这些方法创造突变体被认为是一个随机过程,若要饱和整个基因组需构建一个比较大的突变体,耗时耗力;其次,这些突变方法并非是针对某个基因创造突变,筛选某个基因的突变体
必须借助于相关的技术手段,大规模地筛选整个突变体库,并且把不同基因和它的突变表型联系起来并非易事,有些基因是多拷贝,有的甚至紧密串联,使得到目标基因的纯合突变体受到局限,并且基因家族的存在对表型差异明显的突变体获得造成影响。基于此,近年来一些新技术(如反义抑制、共抑制、RNA干涉等)已被广泛应用于鉴定基因功能。
(2) 反义抑制和共抑制
反义抑制,是指将反向的全长或部分基因与高活性的组成型启动子或组织特异性启动子融合,通过转化获得转基因植株,转基因植株中该序列所表达的RNA与体内的靶mRNA相互作用,从而抑制相应内源基
因表达。反义RNA导致内源基因失活一般认为是转录后水平的基因沉默(Hamilton and Baulcombe 1999)。不仅反义基因转化体能导致内源基因失活,而且转化正义基因也可以抑制内源基因表达,这种现象首先在植物上发现,被称之为“共抑制”(Jorgensen 1990; Napoli et al. 1990)上一页[3][4][5][6][7][8]。目前这种现象的机理尚不明确,一般认为是在转录后水平导致基因的沉默,可能是导致了内源转录本降解;也有可能是DNA甲基化影响了基因转录(Matzke et al. 2001)。
反义抑制和共抑制已成功地鉴定了一些基因的功能,然而这两种方法都可导致转基因植株的致死效应或强烈的多重效应,很难从表型上鉴定出所需转基因植株,抑制作用也只发生在某些转基因植株中,导致研究一个基因需培养大量的转基因植株,并且很难产生只抑制目的基因的突变植株,在应用于大量的基因研究时,这两种方法都具有一定局限性。
(3 )RNA干扰(RNAi)
不仅反义RNA、正义RNA能抑制内源基因的表达,双链RNA(Double-stranded RNA)也能抑制内源基因的表达(Matzke et al. 2001; Sharp 2001),而且双链RNA介导的抑制效果更优于反义单链RNA(Fire et al. 1998; Waterhouse et al. 1998)。双链RNA干扰是指同时表达的同一基因的sense RNA和antisense RNA序列,通过形成双链RNA强有力地抑制内源基因表达。这种双链RNA抑制首先在动物上建立起来,这种现象被称为双链RNA干涉(Double-stranded RNA interference, RNAi),后来在植物上也发现了这
种现象,被称之为转录后抑制(post transcriptional gene silencing, PTGS),不久也采用了这种说法(Chuang and Meyerowitz 2000)。近来普遍认为RNAi的抑制机理为(图4):天然存在的病毒RNA上一页[3][4][5][6][7][8](在复制过程中可产生dsRNA),单链互补形成的茎环RNA (hpRNA)或直接将dsRNA注入植物,可以被体内dsRNA endonuclease (e. g., Dicer, CAF)特异识别,降解成只具有21-25 bp的RNA片断,称为siRNA (small interfering RNA),这些siRNA与RISC (RNA-induced silencing complex)复合体结合后可以降解与siRNA单链特异性互补的内源mRNA,从而导致外源和内源的特异靶mRNA沉默表达。植物中dsRNA不仅能引起细胞质中同源RNA的降解,还能导致细胞核中同源基因组DNA的甲基化(RNA-directed DNA methylation, RdDM),使目标基因沉默(Matzke et al. 2001)。
为了更有效地利用RNAi技术抑制基因表达,构建一个高效率、高通量的抑制表达载体系统显得十分重要。近几年发展起来的“pHELLSGATE”载体可以满足这一要求(Wesley et al. 2001)。这个载体采用了重组交换位点attP1和attP2,它们反向排列并被一个intron隔开(图5),在目标基因的PCR产物两端分别加上attB1和attB2接头,通过重组酶的作用可以将ccdB 基因(对大肠杆菌DH5α和DH10B具有致死效应)置换掉并将目的基因反向重复克隆到“pHELLSGATE”载体上,从而快速、高效地获得不同基因的双链RNA载体,满足高通量地构建抑制表达载体。
2 基因功能增加或获得
上一页[3][4][5][6][7][8]利用基因功能缺失突变体来研究基因功能已有很多成功的例子,但也有一些不足:如有些基因是隐性基因、必需基因或冗余基因,它们失活后引起的突变表型难以观察。为此,需要从另一方面即提高基因表达的角度来研究基因功能。现有的功能增
加方法有超量表达和诱导表达(胡红红,博士学位论文,2006)。
(1) 超量表达(Over-expression)
超量表达是指将靶基因置于高活性的组成型启动子或组织特异性启动子调控之下,通过转化获得该基因产物大量积累的植株,从而扩大该基因在生理生化过程中的效应,这部分扩大的效应将有助于帮助理解基因功能。通过一些重要逆境调控基因的微小表达变化就可以引起下游基因的积累效应,有可能使生物体表型发生可评估的变化,使其功能凸现。通过此方法,已成功研究了一系列基因的功能。但其与反义抑制和共抑制一样,均会导致转基因植株的致死效应或强烈的多重效应。
(2) 诱导表达(Inducible expression)
多态性的作用在转基因突变体、异源受体植株或组织中,基因诱导表达可以实现基因表达的空间、时间和量的控制,从而避免超量表达带来的麻烦。在非诱导下,该转基因不表达、本底表达或表达产物没有活性,不会干扰植物正常发育,也不会导致多重效应。一旦诱导,该基因迅速大量表达或基因产物被激活,并在一定
时间内保持稳定。在植物体内,诱导信号易于察觉、接受。通过此方法,已成功研究了一系列植物基因的功能,如前面提到过的利用逆境诱导型启动子驱动抗逆相关基因的表达,从而提高转基因植株的抗逆性。
3 基因的异位表达(Ectopic expression)
通过基因异位表达系统可以定向调控基因的时空表达,异位表达常采用双因子系统。双因子系统的基本原理是在植物上分别构建两种不同的转化株系,一种称为激活系(activator line),一种称为感应系(responder line)。它主要采用了转录因子反式激活基因表达的原理,现以植物中常用的GAL4/VP16-UAS系统(图6)为例说明基因异位表达系统的原理(Springer 2000; Wu et al. 2003)。
GAL4/VP16是由来自于酵母的转录激活蛋白GAL4的DNA结合域和来自单纯疱疹病毒蛋白VP16的转录激活域相融合改造而成,使其具有更强的反式激活能力(Sadowski et al. 1988; Schwechheimer et al. 1998)。显然改造后的GAL4/VP16含有两个结构域:DNA结合域和功能激活域。GAL4/VP16上一页[3][4][5][6][7][8]能够专一性地与上游活化序列(upstream activate sequence, UAS)结合,进而激活下游报告基因的表达。激活系中的GAL4/VP16在Enhancer trap系统中受附近宿主基因组中的增强子等调控序列的调控,进而激活下游报告基因mGFP表达,这样报告基因就能反映出增强子附近内源基因的表达模式。感应系中的靶基因(Gene X)受控于一个剪切过的小启动子和上游活化序列UAS之下,在正常情况
下感应系中的靶基因不表达;当选择不同的激活系与感应系杂交后,转录激活蛋白GAL4/VP16通过反式作用结合到它的结合位点UAS上,从而激活下游靶基因的表达,这样靶基因就具有与激活系中转录激活蛋白、报告基因相同的时空表达模式,从而达到人为调控不同靶基因的时空表达。
4 微阵列(Microarray)
微阵列(Microarray)技术是一种高通量鉴定基因功能的方法,该技术突出特点在于高度并行性、多样性、微型性和自动化(Schena et al. 1995; White et al. 1999; Seki et al. 2001)。由于这些优点,其已成为后基因组时代基因功能分析的最重要技术之一。微阵列包括cDNA 微阵列(cDNA microarray)和DNA芯片(DNA chip),现主要以DNA芯片为主。DNA芯片技术是将大量核苷酸片段(基因片段、cDNA、寡核苷酸等)以预先设计的方式固定于载玻片、尼龙膜等载体上组成高密度的分子阵列,然后将不同条件或不同处理的生物体样品(如总RNA 或mRNA)经反转录并连上不同的荧光标记作为探针与基因芯片杂交,通过检测杂交信号的强弱进而判断样品中靶分子丰度(Schena et al. 1995)。这样就可以得到每个基因在不同条件或处理(病虫害、干旱、冷害、盐碱等)下的表达谱,建立起全基因表达信息数据库,有助于综合分析植物生理代谢、胁迫应答、生长发育等调控途径(Harmer et al. 2000; Seki et al.
2001; Ma et al. 2002)。近年来,微阵列技术在植物生物学上的应用取得了长足的进步,并已应用于植物
DNA测序、病理学、毒理学、检测基因突变及多态性位点、植物与害虫直接的相互作用、转基因植物等研究领域。
5 酵母双杂交系统(Yeast two-hybrid system)上一页[3][4][5][6][7][8]酵母双杂交系统是基于转录因子的结构模型而建立,即当转录因子的DNA结合域和激活域紧密结合以后,将驱动下游一系列基因表达。该技术已成为研究蛋白相互作用、蛋白结构与功能的重要手段(Fields and Song 1989)。该系统将转录因子GAL4的DNA结合结构域(DNA-binding domain, GAL4-BD)与激活结构域(transcription-activating domain, GAL4-AD)构建于两个不同的载体上,载体分别与不同的基因ORF融合后一起转化酵母细胞,在酵母内表达的这两种蛋白若发生相互作用时,就会将GAL4-BD和GAL4-AD结合在一起形成完整的转录因子GAL4,进而与其结合位点(DNA-binding site上一页[3][4][5][6][7][8])即上游激活序列(upstream activating sequence, UAS)结合,激活相应报告基因(reporter gene)的表达。
此系统最主要的应用是快速直接分析已知蛋白质之间的相互作用、分离与已知蛋白质作用的新蛋白及基因、确定有已知生理作用的蛋白质间作用位点或结构域,这对大规模筛选分析蛋白质间的互作来说是一项简便易行的方法。同时,酵母双杂交系统也存在一些局限性:许多蛋白质间的相互作用依赖于翻译后加工(如糖基化、二硫键形成等),使得互作反应在核内无法进行;较高的假阳性使蛋白质互作的鉴定增加困难(Bartel et al. 1993; Allen et al. 1995)。基于此,许多研究者采用假阳性显示分析法和双筛选系统等方法对双杂交系统进行了改进和发展(Vidal et al. 1996; Walhout et al. 2000)。