doi
doi:10.3969/j.issn.1002-2481.2022.03.02
山西农业科学2022,50(3):289-295Journal of Shanxi Agricultural Sciences
谷子CAD基因家族的鉴定及分析
任晓庆1,王波2,欧阳春平1,丁鑫炎1,樊洁晶1,高建华1
(1.山西农业大学生命科学学院,山西太谷030801;2.山西农业大学农学院/
杂粮种质创新与分子育种山西省重点实验室,山西太谷030801)
摘要:木质素类型、含量等与谷子茎秆的强度具有密切关系,肉桂醇脱氢酶(Cinnamyl Alcohol Dehydrogenase,CAD)是木质素生物合成过程中的一个关键酶。为探究谷子木质素合成过程中CAD基因家族的结构和功能,为CAD基因家族的进一步研究提供一定的参考,通过同源序列比对,在已知全基因组序列的xiaomi中共鉴定到13个SiCAD,分布于谷子1、2、4、6、7、9号染体上。利用生物信息学方法对SiCAD基因家族成员进行亲缘关系、理化性质分析以及结构预测和表达谱分析。结果显示,SiCAD与狗尾草CAD的亲缘关系最近,且与豫谷1号CAD 基因家族的同源性极高。13个SiCAD分属3个亚类,依次含有2
、8、3个基因;结构预测结果显示,13个基因均为断裂基因,包含外显子数目为3~8个。表达谱分析结果表明,第1亚类基因SiCAD1具有时空表达差异性,在晋谷21号和xiaomi的茎中高表达,推测该基因编码谷子木质素生物合成的主要酶;第2亚类的SiCAD5和Si⁃CAD8在晋谷21号和xiaomi的茎中也高表达,该基因可能也是谷子重要的CAD基因;其余SiCAD的表达量相对较低或不表达。
关键词:谷子;xiaomi;木质素;肉桂醇脱氢酶;基因家族;生物信息学
中图分类号:S515文献标识码:A文章编号:1002-2481(2022)03-0289-07
Identification and Analysis of CAD Gene Family in Foxtail Millet REN Xiaoqing1,WANG Bo2,OUYANG Chunping1,DING Xinyan1,FAN Jiejing1,GAO Jianhua1bootstrap 软件
(1.College of Life Sciences,Shanxi Agricultural University,Taigu030801,Shanxi;2.College of Agricultural,Shanxi Agricultural University,Key Laboratory of Coarse Grain Germplasm Innovation and
Molecular Breeding in Shanxi,Taigu030801,Shanxi)
Abstract:The type,content of lignin and other characteristics were closely related to the stems strength of foxtail millet. Cinnamyl Alcohol Dehydrogenase(CAD)is a key enzyme in lignin biosynthesis.
To explore the structure and function of CAD genes family in foxtail millet and provide a certain reference for the further study on CAD genes family,in this study,by homologous sequence alignment,a total of13SiCAD genes were identified in xiaomi whose genome has been known,which were distributed on chromosome1,2,4,6,7and9.The genetic relationship,physicochemical properties,structure prediction and expression profile of SiCAD gene family were analyzed using bioinformatics methods.The results showed that SiCAD gene family had the closest genetic relationship with the counterparts in Setaria viridis and had high homology with Yugu1CAD genes family.Thirteen SiCADs were divided into3subclasses in which included2,8and3genes in turn.Structural prediction showed that all13genes were broken genes,including3~8exons.The analysis of expression pattern showed that SiCAD1in subclass1had spatiotemporal expression differences,especially highly expressed in the stems of JG21and xiaomi,inferring that SiCAD1was one of the important gene to encode the key enzyme of lignin biosynthesis in foxtail millet.SiCAD5and SiCAD8in subclass2were also highly expressed in the stems of JG21and xiaomi,predicting that these genes might also be important CAD genes in foxtail millet.The other SiCADs had relatively low-expression or not detected.
Key words:foxtail millet;xiaomi;lignin;CAD;gene family;bioinformatics
木质素是一种复杂且具有芳香特性的三维高分子酚类聚合物,在自然界中分布广泛,约占生物圈有机碳
的30%[1-2]。木质素主要存在于所有维管植物的次生细胞壁中,有着诸多功能,比如,与细胞壁的组成物质交联,可以形成有效的对抗病原体的物理屏障[3];木质素填充于纤维素构架中还可以增
收稿日期:2021-08-12
基金项目:杂粮种质创新与分子育种国家实验室(筹)(202105D121010)
作者简介:任晓庆(1996-),女,山西大同人,在读硕士,研究方向:谷子功能基因的挖掘。
通信作者:高建华(1983-),男,山西洪洞人,副教授,博士,主要从事谷子功能基因的挖掘研究工作。
山西农业科学2022年第50卷第3期
强植物细胞壁强度和茎秆抗弯折力,从而提高植物体的机械强度和抗倒伏能力[4-5]。因此,木质素含量也是评价抗倒伏性的有效指标[6]。
木质素合成通常从苯丙氨酸开始,多种酶参与反应,形成香豆醇(p-coumaryl alcohol)、芥子醇(Sinapyl alcohol)和松柏醇(Coniferyl alcohol)3种单体[7],然后在过氧化物酶或漆酶等的帮助下发生复杂的聚合反应[8-13]。其中,香豆醇聚合形成对-羟基苯基木质素(Hydroxy-phenyl lignin,H-木质
素),芥子醇聚合形成紫丁香基木质素(Syringyl lignin,S-木质素),松柏醇聚合形成愈创木基木质素(Guajacyl lignin,G-木质素)[9]。肉桂醇脱氢酶(Cinnamyl Alcohol Dehydrogenase,CAD)是整个合成途径的限速酶之一[14-15],通过催化香豆醛、芥子醛或松柏醛等加氢,相应地生成木质素单体。此外,CAD还具有调节木质素单体组成形式的作用,比如,平衡G-木质素和S-木质素的含量,若S-木质素缺乏,松柏醛可经由阿魏酸-5-羟化酶(Ferulic acid-5-hydroxylase,F5H)和CAD的作用生成5-羟基松柏醇(5-hydroxy-coniferyl alcohol),进而在咖啡酸-O-甲基转移酶(Caffeic acid O-methyl transferase,COMT)的作用下转化为芥子醇,最后生成S-木质素[5]。
目前,在水稻(Oryza sativa L.)、拟南芥(Arabidopsis thaliana)和烟草(Nicotiana tabacum L.)等植物中的CAD基因家族研究较为详细[16],而C4模式作物谷子(Setaria italica(L.)Beauv.)中的研究相对较少。谷子属禾本科狗尾草属,具有抗旱、耐贫瘠、耐盐碱等多种优良特性[17]。其籽粒小米营养丰富,脂肪、粗纤维和维生素B1含量明显高于大米和小麦[18],消费总量位居我国杂粮类食物第2。
本研究基于拟南芥、水稻已知的CAD基因,以已经公布全基因组数据的山西省名优谷子品种晋谷21号的超早熟突变体xiaomi为研究对象[19-20],采用生物信息学的方法筛选和鉴定谷子CAD基因(SiCAD),并进行了初步预测和分析,旨在为谷子木质素代谢的研究奠定基础。
1材料和方法
1.1谷子CAD基因家族成员的鉴定
本研究利用拟南芥、水稻以及狗尾草的CAD 基因家族成员,在Pfam(/)数据库的Sequence Search功能中下载符合CAD基因家族的隐马尔可夫模型(Hidden Markov Model,HMM)[21]。从Phytozome V13数据库( phytozome.v/pz/portal.html)[22]获取水稻(Osativa_323_v7.0.protein.fa)、谷子(豫谷1号,Sitalica_312_v2.2.protein.fa)、拟南芥(Athaliana_ 167_TAIR10.protein.fa)和狗尾草(Sviridis_500_ v2.1.protein.fa)的蛋白质数据。从山西农业大学MDSi谷子多组学数据库(sky.sxau.edu/ MDSi.htm)获取晋谷21号突变体xiaomi的蛋白质数据(Peptids.fa)。在Tbtools软件中利用上述CAD蛋白的HMM模型筛选2种谷子材料相关蛋白质数据;利用MEGA7软件对4个不同物种中CAD蛋白进行多序列比对(Clustal W法),并构建系统发育树(Neighbour Joining Tree,Bootstrap= 1000,其他参数设为默认)。利用MDSi数据库提取xiaomi CAD基因的位置信息,利用在线工具MapGene2Chromosome V2(mg2c.iask.in/ mg2c_v2.1/)对基因定位的结果进行分析并绘制染体定位图。
1.2谷子CAD蛋白质理化性质和亚细胞定位预测分析
本研究利用ExPASy(/ protparam/)分析CAD蛋白的相对分子质量、氨基酸数目、等电点、平均亲水性、不稳定指数等指标;利用Softberry(linux1.softberry/)在线网站对谷子CAD蛋白进行亚细胞定位预测。
1.3谷子CAD基因家族启动子顺式作用元件分析
利用TBtools中Gtf/gff3Sequences Extractor 选项,将Up Stream Bases设置为2000,进而获取CAD基因上游2000bp的序列,将所获取的序列提交至PlantCARE(http://bioinformatics.psb.ugent. be/webtools/plantcare/html/)进行启动子顺式作用元件分析,最后通过TBtools对常见的功能元件进行可视化展示。
1.4谷子CAD基因家族motif及基因结构分析
通过MEME(/meme/)预测谷子CAD基因家族成员的保守基序(基序数目设置为10),同时从MDSi数据库获取xiaomi基因组注释文件。
利用TBtools绘制谷子CAD基因家族成员的基因结构和保守基序示意图。
1.5谷子CAD基因表达谱分析
从MDSi谷子多组学数据库获取CAD基因在不同时期不同组织中的表达量数据,通过Tbtools 绘制热图进行可视化展示。
任晓庆等:谷子CAD基因家族的鉴定及分析
2结果与分析
2.1谷子CAD基因家族成员的鉴定及命名
本研究基于HMM模型的筛选,在xiaomi和豫谷1号(Yugu1)中均鉴定到13个CAD基因。依据染体位置命名为SiCAD1~SiCAD13,其中SiCAD2、SiCAD3、SiCAD4、SiCAD5紧密串联形成基因簇(图1)。
与狗尾草(11个)、拟南芥(9个)、水稻(12个)CAD蛋白的进化关系分析显示(图2),谷子CAD 蛋白与狗尾草的亲缘关系最近,且2种谷子中的CAD蛋白同源性极高(多数>99%),仅SiCAD8、SiCAD12和SiCAD13与Yugu1蛋白同源性较低,分别为66%、66.30%和73.20%。值得注意的是,谷子CAD基因被分为3个亚类,第1亚类包括SiCAD1、SiCAD6这2个基因;第2亚类包括8个基因:SiCAD2、SiCAD3、SiCAD4、SiCAD5、SiCAD7、SiCAD8、SiCAD11、SiCAD12;第3亚类包括3个基因:SiCAD9、SiCAD10、SiCAD13(图2)
山西农业科学2022年第50卷第3期
2.2谷子CAD蛋白质理化性质及亚细胞定位分析
对xiaomi CAD蛋白进行理化性质及亚细胞定位预测,结果显示,13个基因所编码蛋白氨基酸数目均在300个左右,相对分子质量接近,亚细胞定位在细胞质中。通过预测可知,13个蛋白的等电点为4.91~8.99,包含4个碱性蛋白和9个酸性蛋白;平均亲水性为-0.245~0.159,其中,SiCAD1、SiCAD2、SiCAD3、SiCAD4、SiCAD5、SiCAD6、SiCAD7、SiCAD8、SiCAD10为正值,属亲水蛋白;其余基因为负值,表明为疏水蛋白。此外,SiCAD13编码蛋白的不稳定系数为41.98,暗示其稳定性较差(表1)。
2.3谷子CAD基因家族启动子顺式作用元件分析
通过对xiaomi CAD家族基因CDS上游2000bp 的序列进行分析,预测到12种涉及低温响应、激素响应(茉莉酸甲酯、脱落酸、水杨酸和赤霉素)、光响应以及防御和应激响应的顺式作用元件。预测结果还发现,启动子序列中含有参与干旱诱导和光响应的MYB结合位点;13个基因上游启动序列所包含的顺式作用元件个数、种类及排列顺序没有明显规律(图3)。
2.4谷子CAD基因家族Motif及基因结构分析
对xiaomi CAD基因家族的保守基序(motif)以及基因结构进行了分析,结果如图4-A所示,13个SiCAD蛋白共有10个保守基序,均包含Motif1、
表1xiaomi CAD蛋白理化性质及亚细胞定位
Tab.1Physicochemical properties and subcellular localization of CAD protein in xiaomi
基因Gene ID
SiCAD1 SiCAD2 SiCAD3 SiCAD4 SiCAD5 SiCAD6 SiCAD7 SiCAD8 SiCAD9 SiCAD10 SiCAD11 SiCAD12 SiCAD13
染体
Chromosome
1
2
2
2
2
4
6
6
7
7
7
9
9
位置
Location
5768227—5772969
29925504—29927570
29929893—29931947
30017015—30024564
30028525—30030803
30282290—30284385
2106907—2111199
2129727—2133014
8367245—8369441
14224468—14226397
29817165—29820388
10528749—10533495
33058756—33062238
相对分子
质量
Relative mo‑
lecular
weight
39131.93
37061.38
37482.78
37212.39
43110.51
37948.55
39128.95
30275.84
38827.75
38437.24
38674.47
32983.23
40667.49
氨基酸
数目/个
Amino
acid num‑
ber
367
357
357
356
410
358
370
289
357
356
360
319
369
等电点
Isoelectric
point
6.11
5.55
5.03
4.91
8.08
6.11
6.42
7.06
6.75
6.06
5.95
7.92
8.99
平均亲水性
Mean hydrophi‑
licity
0.060
0.159
0.149
0.136
0.053
0.065
0.022
0.139
-0.018
0.036
-0.001
-0.022
-0.184
不稳定系数
Coefficient of
instability
29.92
19.35
19.77
28.12
32.25
25.68
29.45
33.52
28.81
29.19
31.37
27.97
41.98
亚细胞定位
Subcellular
localization
细胞质
细胞质
细胞质
细胞质
细胞质
细胞质
细胞质
细胞质
细胞质
细胞质
细胞质
细胞质
细胞质
任晓庆等:谷子CAD基因家族的鉴定及分析
Motif2、Motif4、Motif7和Motif9。SiCAD12缺少Motif2和Motif5;SiCAD13缺少Motif3、Motif5、Motif6、Motif8;SiCAD8缺少Motif3、Motif8;相比之下,Motif10仅出现在SiCAD13中。在基因结构方面,13个基因均为断裂基因,包含外显子数目为3~8个。SiCAD9和SiCAD10这2个基因最为相似(图4-B)。
2.5谷子CAD基因表达谱分析
利用MDSi数据库中的转录组信息,对晋谷21号和xiaomi的13个SiCAD基因在不同时期的组织表达谱进行分析,结果如图5所示,图中从左往右依次为晋谷21号(JG21)发芽3d的种子、两叶一心期植株、抽穗后2d顶端2、3片叶、灌浆期颈穗茎节、灌浆期旗叶、灌浆期旗叶鞘、灌浆期顶端第2节茎、灌浆期顶端第4片叶、灌浆期顶端第4个叶鞘、灌浆期根、幼穗初次分化时期的穗、幼穗再次分化时期的穗、S2时期未成熟的穗码、S4时期未成熟的穗码、S1时期未成熟的种子、S2时期未成熟的种子、S3时期未成熟的种子、S4时期未成熟的种子、S5时期未成熟的种子、成熟后30d种子、成熟后60d 种子、S3时期叶脉、S3时期叶肉;之后为xiaomi3周叶、孕穗期顶端第2片叶、抽穗后2d穗、授粉期穗、灌浆期穗、灌浆期茎。第1亚类中,SiCAD6的表达量均低;而SiCAD1存在时空表达特异性,在晋谷21号灌浆期颈穗茎节和灌浆期顶端第2节茎均有可观表达,在xiaomi灌浆期茎部的表达量也相对较高。第2亚类中,SiCAD
5在xiaomi的6个部位均有表达,尤其在灌浆期茎中表达最高,在晋谷21号的灌浆期顶端第2节茎中也有较高表达;SiCAD2、SiCAD3、SiCAD4、SiCAD12在29个部位中大部分表达量较低甚至不表达;SiCAD7、SiCAD8、SiCAD11表达量较高,其中SiCAD8在晋谷21号灌浆期顶端第2节茎的表达量最高。第3亚类中,SiCAD13在xiaomi中均不表达,在晋谷21号个别部位有少量表达;SiCAD9、SiCAD10在29个部位
的表达量均相对较低。