进化树作图专题:盘点绘树的14款本地软件(转载)
⼤家好!很⾼兴再次见⾯。本期,让我们进⼊最重要的主题:让数据说话,看看⾼⽔平专业期刊上发表的论⽂更青睐哪些软件进⾏进化树绘图。
请注意,本期关注的内容全部是——本地软件!很多朋友也会选⽤在线⼯具作图,⽐如⽣信⼈往期栏⽬中介绍过的iTOL,以及evolview等⼯具作图,关于它们的情况我们将在以后的推送⾥进⾏介绍。
这⾥,⼩编选取了12种专业进化树作图软件进⾏⽐拼。另外,MEGA和Mesquite两⼤“万能”软件,虽然其开发初衷并⾮为了作图,但由于其包罗万象的功能和巨⼤的影响⼒,作为外卡持有者特邀参赛。加在⼀起,共计14种软件,按照英⽂字母顺序排列如下:
Archaeopteryx,Dendroscope,DensiTree,FigTree,HyperTree,MEGA,Mesquite,NJplot,PHYLIP,PhyloDraw,TreeDyn,T reeGraph,TreeView,Treevolution。
我们的⽬的很简单,就是为了⼀窥哪些软件更受到⾼⽔平的领域内杂志的欢迎。⽅法很简单,就是统计这14种软件在⾼⽔平分⼦进化和系统发育学(phylogenetics)期刊出现的频数。为了确保全⾯,⼩编挑选了以下四本期刊:Molecular Biology and Evolution,Genome Biology and Evolution,Molecular Phylogenetics and Evolution,BMC Evolutionary Biology(⼩编窃认为这⼏本期刊基本上涵盖了分⼦进
化和系统发育学的各个重要⽅向),在这⾥我们姑且将这四本杂志称为“四⼤”。为防⽌杂志选择上的偏差,⼩编⼜增加了两本杂志,分别是侧重于系统分类学(systematics)的Systematic Biology和基因组学领域的⾼产杂志BMC Genomics,同上述四⼤杂志组成“六⼤”,以更加全⾯地了解软件的使⽤情况。
BTW:这⾥⾯,Molecular Biology and Evolution(业内⼀般简称MBE)和Systematic Biology凭借近年来⼏乎年年上双的IF当仁不让占据了领域内的头两把交椅。剩下四个的IF加起来还没前两个多,每个在4.0上下浮动。所以,各位⽣化、分⼦、结构的实验⼤侠还求轻虐。
进⾏统计的时间是在18年的1⽉5号、6号两天,⼯具是⾕歌学术。
这14种软件在⼤家⼼⽬中的位次是怎样的呢?
让我们来揭晓答案:
image
*实际上指的是Phylip整个package⾥⾯的DRADIAGRAM 和DRAWTREE
请注意,为确保时间上的相对公平,这⾥名次是按照2015-2018在“四⼤”(BIG4)的引⽤频数进⾏排列的。此外,引⽤MEGA和Mesquite的⽂献很多是对软件其他功能的引⽤。
⼩编根据结果,把这14种软件分为三个梯队。
第⼀集团:(Figtree,MEGA,Meqsuite)
Figtree,MEGA,Mesquite,这三⼤软件毫⽆争议地位列三甲,引⽤次数也是较为接近。不过考虑到MEGA和Mesquite并⾮是进化树作图的专业软件,引⽤它们的⽂章很多并⾮是单纯拿来做图,⼩编认为Figtree作为最受欢迎的作图软件是令⼈信服的。
BTW:同很多⽣物学软件⼀样,这三款软件的名字都巧妙地运⽤到了英语中的双关语。Figtree:⽆花果树,MEGA:巨⼤,Mesquite:⼀种⾖类。
Figtree:此处⽆花胜有花
image
⼩编作图,tree provided by Figtree 1.4.3
image
Adapted from [1]
image
Adapted from [2]
Figtree对进化树的tip和branch的阴影绘制功能(如上图所⽰)是⼗分出⾊的。当然,类似的⼯作也可以通过MEGA加ps完成。其更多细节⽣信⼈将在以后的⽂章中进⾏介绍。
MEGA:弄潮⼉向潮头⽴
MEGA(Molecular Evolutionary Genetics Analysis)的⿍⿍⼤名,想必不需⼩编多费⼝⾆了。其神通⼴⼤的功能包括序列编辑、进化树构建、祖先序列重构(reconstruction of ancestral sequence)、进化模型选择(model selection)、选择压检验(selection test)等等。不过回到我们的主题进化树作图上来,MEGA对于进化树的展⽰⼗分⽅便⽽且选项较多,⼜⽅便和其神通⼴⼤的功能相结合,是很多专业⼈⼠的⾸选。不过其也有美观度有所不⾜的缺陷,从外对于“⼤树”的应对能⼒也显得有些单薄。
BTW:包括MEGA建树在内的系统发育树构建的⼀系列经典操作在⽣信⼈最新出炉的24课时视频教程《Hello!树先⽣》中有详尽介绍。
BTW:MEGA以⼀⼰之⼒撑起了分⼦进化领域顶级期刊Molecular Biology and Evolution影响因⼦的半壁江⼭。MEGA现已更新到第七版,从第四版开始全部发表于Molecular Biology and Evolution。论⽂
的通讯作者,来⾃美国天普⼤学(Temple University)的Sudhir Kumar(第七版中为第⼀作者,通讯为Koichiro Tamura),恰是该杂志的现任主编,可谓真正做到了肥⽔不流外⼈⽥。由于影响因⼦的计算是以两年为期限,所以该杂志的IF受MEGA影响呈潮汐式规律浮动:涨潮时(新版MEGA发表两年内)可以飙升到14,退潮时(旧版MEGA发表过了超过两年⽽新版尚未发表的空歇期)⼜能跌到7.0以下。17年恰逢退潮,IF只有6.2。借⽤巴菲特的⼀句名⾔就是:退潮了才知道谁在裸泳。不过不必担⼼,该杂志今年⼜将迎来天⽂⼤潮,因为新时代的弄潮⼉MEGA7(发表于16年)即将兴风作浪,卷起巨澜⾄上九霄。像MEGA这样⼀篇⽂章对杂志IF的起落到决定性作⽤的现象,被来⾃瑞⼠洛桑⼤学(Université de Lausanne)的进化⽣物学家Marc Robinson-Rechavi形象地称为:MEGA Effect [3]。
Mesquite:从来打虎亲兄弟
第⼀集团⾥的最后⼀位就是Mesquite。其作者是我们第⼀期提到的Maddison兄弟。同MEGA⼀样,Mesquite功能繁多,⽽且MEGA能做的基本上它都能做,还包含很多复杂的体遗传学检验、性状分析和模拟。但这也可能成为其最⼤缺点,很多功能⼤家平时是很难⽤到的,这就难免造成整个软件显得有些凝重。不过说回作图,⼩编认为其作图还是⽐较精美的:
image
Mesquite Project Team, CC-BY-3.0
image
2010年摄于厄⽠多尔热带⾬林,
Wayne Maddison Lab,CC3.0
第⼆集团:(Dendroscope, TreeGraph, DensiTree, Archaeopteryx)
排在4-7名的四个软件组成了第⼆集团,下⾯逐⼀为⼤家介绍。
Dendroscope:⼀⼿掌握⽆限⼤
image
Dendroscope是由德国图宾根⼤学(University of Tübingen)的Daniel Huson团队开发的⼀款优秀进化树作图软件。现在出到了第三版。该软件标志性特征就是handle超⼤型树的能⼒⾮常强悍,这在⼀
定程度上弥补了其对作树美观性不⾜的缺憾。另外该软件有趣的放⼤镜功能,也很好地配合了处理⼤型树的特点。所以,如果你的树集结了过多的基因或物种,以⾄于在其他软件中不能正常显⽰的话,不妨试⼀试Dendroscope!
TreeGraph:惜君⽣晚不逢时
TreeGraph的开发⼈员来⾃德国明斯特⼤学的Kai F Müller实验室。⼩编认为该软件作图还是⾮常精美的,操作也很简洁。不过为什么只排在这个位次呢?⼩编认为原因有三。⼀是时间晚了(真正意义上⽐较⽅便的第⼆版在2010年才发表),输给了Figtree。⼆是,平台⼀般,发表在BMC Bioinformatics上,不像MEGA可以在Molecular Biology and Evolution上反复“弄潮”。三就是⼈脉不⾜,开发者(们)不像前⾯⼏位早就在业内享有⿍⿍⼤名。总之,天时地利⼈和都输了,排名不尽如意也不⾜为奇。
image
该软件对Newick,Neuxs和PhyloXML三种格式都可以很好地⽀持,允许⽤户对树进⾏添加、修改等操作(包括如上图所⽰的五⾓星等注释),根据branch length等特征⾃动上⾊或修改(如上图所⽰),还具有将不同树的⽀持度叠加,⽐如最⼤似然法,邻接法(NJ)或贝叶斯法等不同⽅法得到的树的⾃展值bootstrap或后验概率(见下图)叠加显⽰。其主要缺点是对树的展⽰同Figtree相⽐变化较少,⽐如不⽀持环形(circular)或三⾓形的树,也不可以像MEGA或Figtree那样collapse clades。
image
[4]
DensiTree:树在虚⽆缥缈间
DensiTree是⼀款⼗分有特⾊的作图软件,虽然引⽤量不⼤,但其凭借着独特的绘
画画教程视频
图功能在作图软件⾥还是抢得⼀席之地:每当你的manuscript⾥出现诸如下图的进化树时,⼤概都少不了⼀个对R.R. Bouckaert DensiTree: making sense of sets of phylogenetic treesBioinformatics, 26 (2010), pp. 1372-1373这篇⽂章的引⽤。类似的图其实是⼤量的树叠加的产物,可以是consensus tree,也可以把体数据结合起来。
image
Archaeopteryx:鸟随鸾凤飞腾远
第三集团:****TreeView,NJplot,PHYLIP
顾名思义,第三集团分为两个部分。TreeView,NJplot,PHYLIP(其中的DRADIAGRAM 和DRAWTREE两个程序),这三款软件都可以追溯到上个世纪,故并成为“上古三神器”。⼤家千万不要因落后的排名⼩觑了这三⼤神器,要知道,这三⼤神器在当年那个物资匮乏的时代,为系统发育学和基因组学的发展⽴下了汗马功勋,让我们默默地向上古三神器和它们的开发者们致敬。
然⽽,时代在发展,⽣物学在进步。尽管总引⽤数,这三款软件和其他⼏款软件⼀样,排在积分榜的末端,甚⾄险些在“四⼤”杂志中⽆⼀斩获(所谓“四⼤皆空”)。
最后,请⼤家注意,这次的排名并不完全意味着排在后⾯的软件被时代的马车所抛弃,⽽只能说明⼩编挑选的这⼏本杂志(四⼤或六⼤)的作者们对它们不太感冒。具体⽤什么软件,怎么⽤,还要取决于使⽤者⾃⼰和实验的需求。此外,⼩编的统计是针对发表的进化树图⽽⾔,相信⼤家在⼤多数情况下作图都并⾮是就是为了直接发表,在⾮publication作图的情况下,⼩编的统计显然有⼀定局限,⽐如,⼩编和⾝边的⼀些朋友都会⽤到TreeView对⼀棵树“⼤致扫描”,其短⼩精悍的特点即使在今天依然令其保持有⼀定的⽇常使⽤率,只不过在发表⽂章的时候⼤家更青睐figtree等新时代软件。
到这⾥,本期的⽂章将要告⼀段落。下期将带来在线⼯具的⽐拼结果。更多精彩内容,请锁定⽣信⼈!
参考资料
1. Ke HM et al. Comparative genomics of Vibrio campbellii strains and core species of the Vibrio harveyi clade. Sci. Rep. 7,
41394 (2017)