热带作物学报2021, 42(5): 1216 1222
Chinese Journal of Tropical Crops
生防菌株Bacillus velezensis Z全基因组测序分析
高圣风1,2,徐毕爽3,陆大倩3,刘爱勤1,2*,苟亚峰1,2,孙世伟1,2,王政1,2,孟倩倩1,2
1. 中国热带农业科学院香料饮料研究所,海南万宁  571533;
2. 海南省热带香辛饮料作物遗传改良与品质调控重点实验室,海南万宁  571533;
3. 云南农业大学热带作物学院,云南普洱  665000
摘要:生防菌株Bacillus velezensis Z对胡椒瘟病等多种植物病害具有良好的生防效果;全基因组测序能够为其分子机理研究和开发应用提供信息基础。本研究开展该菌株全基因组测序,并进行比较基因组学和抑菌次生代谢产物合成基因簇预测研究。结果表明:B. velezensis Z菌株的基因组中含有1条4 054 780 bp大小的环形染体DNA和1个17 122 bp大小的环形质粒,总基因组的GC含量为46.24%,共编码基因4173个;包含27个rRNA,86个tRNA基因,34个sRNA;含有串联重复序列179个,其中13个微卫星DNA,138个小卫星DNA;通过比较基因组学分析,结果发现该菌株与贝莱斯芽孢杆菌模式菌株FZB42同源性极高,
与枯草芽孢杆菌模式菌株168之间具有一定的遗传距离;同时发现B. velezensis Z基因组中共编码次生代谢产物合成基因簇13个,其中8个与表面活性素(surfactin)、泛革素(fengycin)、溶杆菌素(bacilysin)、macrolactin H、bacillaene、difficidin、plantazolicin、amylocyclicin等已知基因簇完全相似或高度相似,其他5个基因簇皆功能未知。总之,本研究揭示了B. velezensis Z的全基因组遗传信息,明确其与贝莱斯芽孢杆菌和枯草芽孢杆菌的比较基因组学关系,预测了抑菌产物合成编码基因簇,为该生防菌株及其抑菌产物的机理研究和开发应用奠定基础。
关键词:贝莱斯芽孢杆菌;全基因组测序;比较基因组学;次生代谢产物;抑菌
中图分类号:S435.73 文献标识码:A
Whole Genome Sequencing and Analysis of the Bio-control Strain Bacillus velezensis Z
GAO Shengfeng1,2, XU Bishuang3, LU Daqian3, LIU Aiqin1,2*, GOU Yafeng1,2, SUN Shiwei1,2, WANG Zheng1,2, MENG Qianqian1,2
1. Spice and Beverage Research Institute, Chinese Academy of Tropical Agricultural Sciences, Wanning, Hainan 571533, China;
2. Hainan Key Laboratory of Genetic Improvement and Quality Regulation for Tropical Spice and Beve
rage Crops, Wanning, Hainan 571533, China;
3. College of Tropical Crops, Yunnan Agricultural University, Pu’er, Yunnan 665000, China
Abstract: Bio-control strain Bacillus velezensis Z shows good effects on the control of various diseases, especially good for the black pepper Phytophtor a foot rot disease. The whole genome sequencing is an important basis to further study the molecular mechanism. In this study, the whole genome of the strain was completely sequenced using both Illumina HiSeq 4000 and PacBio RS II, and the gene function annotation, analyses of comparative genomics and secondary me-tabolite biosynthetic gene clusters were performed using blast alignment tools. The complete genome sequence of B. velezensis Z was consisted of a circular 4 054 780 bp chromosome and a 17 122 bp plasmid with GC content of 46.24%, 4173 identified genes, 27 rRNA, 86 tRNA, 34 sRNA, 179 tandem repeat regions including 138 minisatellite DNA and 13 microsatellite DNA. The genome showed highly homologous with the model strain B. velezensis Z FZB42 by the analyses of core/pan gene and gene family. B. velezensis Z harbored 13 secondary metabolite biosynthetic gene clusters, including 8
收稿日期  2020-06-22;修回日期  2020-09-08
基金项目  国家自然科学基金面上项目(No. 31972329);中国热带农业科学院基本科研业务费专项资
金项目(No. 1630142018015)。作者简介  高圣风(1982—),男,博士,助理研究员,研究方向:香料饮料作物主要病害生物防控。*通信作者(Corresponding author):刘爱勤(LIU Aiqin),E-mail:***************。
第5期高圣风等: 生防菌株Bacillus velezensis Z全基因组测序分析 1217
clusters involved in the synthesis of surfactin, plantazolicin, macrolactin H, bacilysin, fengycin, difficidin, amylocyclicin,
bacillaene, and others functionally unknown. In conclusion, the genetic information, comparative genomics and antibiotics
synthesis gene clusters of the B. velezensis Z were revealed in this study, and it would be useful for further research and
utilization of the strain.
Keywords: Bacillus velezensis; whole genome sequencing; comparative genomics; secondary metabolite; antibiotic
DOI: 10.3969/j.issn.1000-2561.2021.05.003
根际促生细菌(plant growth-promoting rhizobacteria,PGPR)天然生存于植物根际,具有拮抗病原菌、促进植株生长、诱导植株抗病、修复根际环境等多种功效,是当前实施“减肥、减药”的有效支撑手段[1-2]。芽孢杆菌(Bacillus spp.)具有广普高效、容易培养、耐逆境、耐储藏等特点,是国内外研究和应用最多的生防菌类。次生代谢产物是芽孢杆菌发挥生防功效的重要手段。目前已发现芽孢杆菌能够产生多种对植物有益的次生代谢产物,包括非核糖体途径(non-ribosomal peptide synthesis,NRPS)合成的脂肽类化合物[3-4]、聚酮合酶合成途径(polyketide synthase,PKS)合成的聚酮类化合物[5-7],以及核糖体途径(ribosomal peptide synthesis,RPS)合成的含噻唑(啉)线性肽类物质(linear azol(In)E-containing peptides,LAP)[8]、细菌素(bacteriocin)[9]、硫肽类物质(thiopeptide)[10]、萜烯类物质(terpene)[11]等。芽孢杆菌分泌的有益次生代谢产物种类繁多,全基因组测序是认识和利用生防菌株的重要基础。
生防菌株B. velezensis Z由本研究室从胡椒叶片中分离获得,在盆栽试验中对胡椒瘟病的防效达83%[12],具有良好的生防应用前景。该菌株曾被认为是枯草芽孢杆菌[13]。本研究对  B. velezensis Z进行全基因组测序和精准鉴定,并基于全基因组序列开展比较基因组学分析及抑菌产物合成基因簇研究,为该生防菌株的后续研究和利用提供基础。
1材料与方法
1.1材料
生防菌株B. velezensis Z由本研究室从感染胡椒瘟病的胡椒叶片组织中分离获得,保存于中国微生物保藏管理委员会普通微生物中心(China General Microbiological Culture Col-lection Center, CGMCC),菌株保藏编号为No. 4844。1.2方法
1.2.1  全基因组测序生防菌株  B. velezensis Z 在LB培养基中于37 ℃ 200 r/min条件下培养12 h 后,1000 g离心收集菌体,提取基因组总DNA,DNA纯度检测合格后,委托深圳华大基因股份有限公司进行de novo测序分析。测序采用第三代PacBio平台与第二代Illumina平台相结合的测序技术,测序结果与COG(cluster of ortho-logous groups of proteins)、GO(gene ontology)等12个数据库比对进行基因功能注释[14]。
1.2.2  比较基因组学分析从NCBI Genome上下载  B.velezensis FZB42、B. subtilis W23、B. subtilis168等模式菌株的全基因组序列,与  B. velezensis Z全基因组序列(包含质粒)一起进行以下比较基因组学分析。
(1)共有基因(Core Gene)和特有基因(Specific Gene)分析:参照Fu等[15]的方法,将生防菌B. velezensis Z的蛋白基因集与其他3个模式菌株的蛋白基因集一起采用CD-HIT 4.6.6软件进行聚类分析,将聚类获得的所有非冗余的基因集定为Pan Gene,提取聚类结果中4个菌株共有的基因集为Core Gene,单个菌株中特有的基因集为Specific Gene,Pan Gene中去除Core Gene为非共有基因集(Disp
ensable Gene)。根据各基因集在4个菌株基因组中的分布情况,绘制Dispensable Gene热图和Pan Gene文氏图以展现菌株间的聚类情况。参照Tannistha等[16]的方法,将Core/Pan分析结果用TreeBeST 1.9.2软件采用最大似然法(PHYML)计算,bootstraps参数设置为1 000次,构建系统进化树。
(2)基因家族(Gene Family)分析:基于4个菌株的全部基因,对蛋白序列进行BLAST比对分析去除冗余,然后将非冗余结果进行TreeFam聚类处理,再将聚类的基因家族进行多序列比对后转化成CDS区域的氨基酸多序列比对数据,最后用TreeBeST 1.9.2软件采用NJ法构建系统发育树[16-18]。
1218 热带作物学报第42卷
1.2.3  次生代谢产物合成基因簇分析生防菌株
bootstrap 软件
B. velezensis Z的抑菌次生代谢产物合成基因簇分析方法与前人[14]报道相同,采用antiSMASH软件(/#!/ start)[19]在线预测。并结合NCBI BLAST比对分析结果,对预测的次级代谢产物合成基因簇进行分析。
2结果与分析
2.1全基因组测序结果
测序结果分析发现,生防菌株B. velezensis Z 含有1条4 054 780 bp大小的染体和1个17 122 bp 大小的质粒,总基因组的GC含量为46.24%,共编码4173个基因,基因注释率为98.39%;其中染体的GC含量为46.27%,编码基因4155个,含有27个rRNA、86个tRNA基因、34个sRNA;含有串联重复序列177个,其中13个微卫星DNA,138个小卫星DNA。另外,质粒DNA的GC含量为39.84%,编码基因18个,含有sRNA 和串联重复序列各2个。
基于COG数据库注释结果构建基因组圈图(图1)。在预测的4173个基因中,(1)遗传信息类别:染质结构与动力相关基因1个,RNA 加工与修饰相关基因1个,核糖体结构、翻译和生物合成相关基因231个,转录相关基因286个,复制、重组和修复相关基因128个;(2)细胞相关类别:细胞周期控制、染体分离和细胞分裂相关基因61个,细胞膜、细胞外膜和细胞壁的合成相关基因209个,细胞骨架相关基因2个,细胞外结构相关基因2个,细胞内转运、胞外分泌和小泡运输相关基因36个,细胞运动相关基因64个,防御机制相关基因94个,信号转导机制相关基因183个;(3)新陈代谢类别:翻译后修饰、分子伴侣和蛋白转运相关基因122个,可移动基因组序列(转座子、原噬菌体)相关基因25个,能量产生与转换相关基因177个,氨基酸转运与代谢相关基因305个,碳水化合物转运与代谢相关基因265个,脂类转运与代谢相关基因151个,核苷酸转运与代谢相关基因94个,辅酶转运与代谢相关基因192个,无机离子转运与代谢相关基因180个,次级代谢产物合成、转运与代谢相关基因115个;未知(Poorly)类别:仅常规功能预测的基因335个,功能未知基因206个。
从外向内依次为:1. 基因组的刻度(大小为Mb);2. 正链基因;3. 负链基因;4. 正链长链非编码RNA;
5. 负链长链非编码RNA;
6. 重复序列;
7. GC百分含量;
8. GC偏好。
From outer to inner: 1. Genome size (Mb); 2. Forward strand gene; 3. Reverse strand gene; 4. Forward strand ncRNA;
5. Reverse strand ncRNA;
6. Repeat;
7. GC;
8. GC-SKEW.
图1  贝莱斯芽孢杆菌Z基因组圈图
Fig. 1 Circle diagram of B. velezensis Z genome
第5期 高圣风等: 生防菌株Bacillus velezensis Z 全基因组测序分析 1219
2.2  比较基因组学分析
2.2.1  基于4个菌株全基因组序列的Core/Pan 分析  通过Core/Pan 分析,发现B. velezensis Z 与3个模式菌株的所有非冗余的Pan Gene 数量为5651个,长度为1 578 662 bp ;其中共有的Core Gene 数量为2702个,长度为823 203 bp ;非共有的Dispensable Gene 数量为1347个,长度为45967 bp ;各菌株特有Specific Gene 数量分别为628个、436个、341个和197个。4个菌株中,以B. velezensis Z 的
Specific Gene 数目最多,散布于基因组中,部分基因功能预测与外排转运、核糖体、脂类转运代谢、膜蛋白、DNA 修饰、次生代谢产物等相关,大部分基因功能未知(图2)。通过Dispensable Gene 同源关系热图(图2A )、Pan Gene 同源关系文氏图(图2B )和Core Gene 系统发育树(图2C )可看出,B. velezensis Z 的基因组与贝莱斯芽孢杆菌模式菌株FZB42最为相似,与另外2株枯草芽孢杆菌模式菌株168具有明显的遗传距离。
A :Dispensable Gene 同源关系热图;
B :Pan Gene 同源关系文氏图;
C :基于Core Gene 同缘关系的系统发育树。
A: Heat map based on Dispensable Gene homology; B: Venn diagram based on Pan Genes homology;
C: Phylogenetic tree based on Core Gene homology.
图2  4个菌株之间基因组Core/Pan 分析结果 Fig. 2  Core/Pan genome analysis of four bacteria strains
2.2.2  基于4个菌株全基因组序列的Gene Family 分析  通过Gene Family 分析,发现B. velezensis Z 、B. velezensis  FZB42、B. subtilis  168、B. subtilis  W23等4个菌株能够聚类到Gene Family 的基因数量分别为3685个、3907个、3706个和3565个,Gene Family 数量分别为2710个、2816个、2715个和2601个;其中共有的Gene Family 数量为2777个,各菌株特有的Gene Family 数量分别为6个、11个、7个和3个(图3A 、图3B )。通过Gene Family 系统发育树可看出,B. velezensis Z 菌株与  B. velezensis  FZB42菌株聚类到同一分支,与另外2株枯草芽孢杆菌之间的遗传距离约为0.20(图3C )。
2.3  基于全基因组序列的次生代谢产物预测分析
通过antiSMASH 在线预测和NCBI BLAST 比对分析,结果发现B. velezensis Z 菌株共编码13个次生代谢产物合成基因簇,其中8个基因簇
能够到完全相似或相似度极高的已鉴定基因簇,另有5个基因簇未能到已鉴定基因簇(表1)。由表1可看出,B. velezensis Z 菌株编码的次生代谢产物有非核糖体途径的表面活性素(surfactin )、溶杆菌素(bacilysin )和泛革素(fengycin );聚酮合酶合成途径的bacillaene 、macrolactin 和difficidin ;以及核糖体途径中Linear azol(in)e-containing peptides (LAP )类的plantazolicin 和Bacteriocin 类的amylocyclicin 。在与已知基因簇比对结果中,表面活性素和Plantazolicin 编码基因簇的相似度分别为82%和91%,其他基因簇的相似度均为100%。此外,B. velezensis Z 菌株还可能编码5种未知的次生代谢产物,初步预测为2种聚酮类物质、2种萜烯类物质和1种硫肽类物质。在与其他菌株基因组比对结果中,仅有1个基因簇的相似度高达97%,其他基因簇均不高于70%。
1220 热带作物学报 第42卷
A :同源基因聚类情况;
B :Gene Family 同源关系文氏图;
C :基于Gene Family 同缘关系的系统发育树。
A: Clusters of homologous genes; B: Venn diagram based on Gene Family homology; C: Phylogenetic tree based on Gene Family homology.
图3  4个菌株之间基因组Gene Family 分析结果 Fig. 3  Gene Family analysis of four bacteria strains
表1  次生代谢产物合成区域鉴定结果 Tab. 1  Identified secondary metabolite regions
基因组中区域Region of genome 最相似(已知)基因簇Most similar (known) cluster 起始位点From
结束位点To 产物Products 途径Pathways 相似度Similarity/%
来源Resources
304 772 369 582 surfactin NRPS  82 Bacillus velezensis  FZB42[3] 681 312 703 494 plantazolicin LAP  91    B. velezensis  FZB42[8] 1 399 525    1 487 630 macrolactin PKS2 100    B. velezensi s FZB42[5] 1 706 839    1 816 558 bacillaene PKS1 100    B. velezensis  FZB42[6] 1 874 211    2 010 127 fengycin NRPS 100    B. velezensis  FZB42[3] 2 418 981    2 525 159 difficidin PKS3 100    B. velezensis  FZB42[7] 3 154 694    3 206 486 amylocyclicin Bacteriocin 100    B. velezensis  FZB42[9] 3 717 182    3 758 600 bacilysin
NRPS
100
B. velezensis  FZB42[7]
568 029 596 913 ‒ Thiopeptide  57 Bacillus velezensis  JJD34[20] 914 499 955 743 ‒ PKS2  97 B. velezensis  JJD34[20] 1 040 636    1 057 969 ‒ Terpene  56 B. amyloliquefaciens  L-S60[21] 2 033 712    2 055 595 ‒ Terpene  46 B. subtilis  916[22] 2 124 225
2 165 331
‒ PKS3
70 B. velezensis  NAU-B3[23]
注:“‒”代表该基因簇尚未被鉴定。
Note: “‒” in the table means the gene cluster has not been identified.
3  讨论
细菌de novo 测序是其分子机理研究的重要工具,广泛用于遗传进化关系研究、功能相关基因鉴定、工
程菌改造等领域,能够为生防菌的分子机理研究及开发利用提供信息基础。本研究对生防菌株B. velezensis Z 进行de novo 全基因组测序,虽然该菌株的基因组(包括质粒)大小仅有3.88 Mb ,但其各种功能元件非常丰富,编码基因
长度占总基因组的88.71%。此外,B. velezensis Z 中还携带一个大小为16.72 kb 的质粒,共有22个ORF 阅读框,其中ORF2~ORF9等8个ORF 阅读框与ORF12~ORF19等阅读框的同源性高达100%,每组ORF 阅读框中均编码Rap (ORF5/ ORF15)和Rep 蛋白(ORF7/ORF17),表明该质粒的功能可能与细菌体感应的Rap–Phr 双组分调控系统相关[24],为研究和利用生防菌株的体