一、取序列
一般自己通过测序得到一段序列(已知或未知的都可以),通NCBI的BLAST取相似性高的一序列,下保存FASTA格式。用BIOEDIT等编辑序列名,注意PHYLIP在DOS下行,文件名不能超10位,超截留前面10位。
二、多序列比
目前一般CLASTAL X行,注意出格式PHY格式。生成的指导树文件(DND文件)可以直接用TREEVIEW打开编辑,形式上和最生成的树类似,但是注意不是正的
三、
1.N-J法建
依次PHYLIP件中的SEQBOOT.EXE、DNADIST.EXE、NEIGHBOR.EXE和CONSENSE.EXE打。具体步如下:
(1)打
入文件名:CLASTAL X生成的PHY文件(*.phy)。
Rbootstrap的次,一般1000 (设你输入的值为M,即下DNADIST.EXE、NEIGHBOR.EXE中的M1000)
odd number: (4N+1)(eg: 1、5、9…)
改好了y
得到outfile(在phylip文件夹内
改名2
(2)打Dnadist.EXE
2
修改M,再按D,然后1000(M
y
得到outfile(在phylip文件夹内
改名3
(3)打Neighboor.EXE
3
M=1000(M
按Y
得到outfile和outtree(在phylip文件夹内
改outtree4,outfile改402
(4)打
4
y
得到outfile和outtree(在phylip文件夹内
Outfile可以改*.txt文件,用事本打开阅读
四、树编辑阅读
outtree可改*.tre文件,直接双击treeview里看;也可以不改文件展名,直接用treeview、PHYLODRAW、NJPLOT等件打开编辑TREEVIEW可以BOOTSTRAN,序列多(60以上)的候打直接示有明的重,可以在打印预览示,或EMF WMF片文件看,但是序列BOOTSTRAN示位置比较乱,和序列名有重
PHYLODRAW的编辑功能强,可以自由调节X、Y度。出格式BMP、PS格式。缺点是不能直接BOOTSTRAN,包括打TREEVIEW出的NEX文件,而且出的BMP文件不全,似截文件,我用PHOTOSHOP接合成,添加BOOTSTRAN和注解符等。据也可以PS文件用事本打,改其中的字,然后通ADOBE DI
STRILLORPSPDF,就可以解决问题。如果发现还有重,可以再次改PS文件中的字大小,直到合适止。
NJPLOT可以BOOTSTRAN和分值长度。但是不能调节图X、Y度。
建MP,ML树将Dnadist和Neighboot步分Dnapars和Dnaml,其余步相同。据ML法序列多是非常,我尝试。因我的序列多。
也可以用CLASTAL X中的BOOTSTRAN N-J TREE法生成TREE菜单输出格式选项OUTPUT FORMAT OPTION)中的BOOTSTRAN LABELS ON NODE(点)。在treeview里,选择tree菜 ,然后把show internal edge lables 的选项打勾了,直接打生成的文件bootstrap的就可以示出
下面介绍几个软件的使用首先是 PHYLIP。其是多个软件的压缩包
双击则自动解压当你解压后就挥发现PHYLIP 的功能极其强大主要包括五
个方面的功能软件i,DNA 和蛋白质序列数据的分析软件ii,序列数据转变
成距离数据后对距离数据分析的软件 iii,对基因频率和连续的元素分析的
软件iv,把序列的每个碱基/氨基酸独立看待碱基/氨基酸只有01状态
对序列进行分析的软件v,按照 DOLLO 简约性算法对序列进行分析的软
vi,绘制和修改进化树的软件在此我主要对前两种功能软件进行说明
   们现在有几个序列如下
Mo3      ATGTATTTCGTACATTACTGCCAGCCACCATGAATATTGCACGGTACCAT
Mo5      ATGTATTTCGTACATTACTGCCAGCCACCATGAATATTGTACGGTACCAT
Mo6      ATGTATTTCGTACATTACTGCCAGCCACCATGAATATTGTACGGTACCAT
Mo7      ATGTATTTCGTACATTACTGCCAGCCACCATGAATATTGTACAGTACCAT
Mo8      ATGTATTTCGTACATTACTGCCAGCCACCATGAATATTGTACAGTACCAT
Mo9      ATGTATCTCGTACATTACTGCCAGCCACCATGAATATTGTACGGTACCAT
Mo12      ATGTATTTCGTACATTACTG CCAGCCACCATGAATATTGTACGGTACCAT
Mo13      ATGTATCTCGTACATTACTGCCAGCCACCATGAATATTGTACGGTACCAT
对这8个序列进行进化树分析按照上面的步首先用 CLUSTALX排列序
输出格式为 *.PHY。记事本打开如下图
图中的 8 50 别表示 8 个序列和每个序列有 50 个碱基然后开软件
SEQBOOT,如下
按路径输入刚才生成的 *.PHY文件并在Random number seed (must be odd) ?
的下面输入一个4N+1 数字后屏幕显示如下
图中的 D、J、R、I、O、1、2 代表可选择的选项键入这些字母程序的条件
会发生改变D选项无须改变J 选项有三种条件可以选择别是Bootstrap、
Jackknife Permute。文章上面提到用 Bootstraping 对进化树进行评估
Bootstraping 法就是从整个序列的碱基氨基酸中任意选取一半剩下的一半
序列随机补齐组成一个新的序列这样个序列就可以变成了许多序列
多序列组也就可以变成许多个多序列组根据某种算法最大简约性法最大可
bootstrap 软件能性法权配对法或邻位相连法个多序列组都可以生成一个进化树将生
成的许多进化树进行比较按照多数规则majority-rule)们就会得到一个最
进化树Jackknife则是另外一种随机选取序列的方法它与Bootstrap
法的区别是不将剩下的一半序列补齐只生成一个缩短了一半的新序列Permute
是另外一种取样方法其目的 BootstrapJackknife法不同这里不再介绍
R 选项让使用者输入 republicate 数目 republicate 就是用 Bootstrap 法生
成的一个多序列组根据多序列中所含的序列的数目的不同可以选取不同的
republicate。当我们设置好条件后键入 Y按回得到一个文件outfile 
Outfile记事本打开如下
这个文件包括了100republicate。
DNAPARS(最大简约性法DNAML(最大可能性法软件将刚才生
成的outfile文件更名后输入如下
选项O让使用者设定一个序列作为outgroup。一般选择一个亲缘关系与所分析
序列组很接近的序列作为outgroup(本例子不outgroup),outgroup 选择的好坏
将直接影响到最后的进化树的好坏选项 M 输入刚才设置的 republicate
设置好条件后键入 Y按回生成两个文件outfiletreefile。
Outfile开如下图
该文件包括了227个进化树Treefile可以用TREEVIEW 软件打开同样包含了这
227个进化树
CONSENSE 软件将刚才生成的treefile文件更名后输入如下
键入 Y 按回生成两个文件 outfile treefile。Treefile TREEVIEW
如下
Outfile开如下图
们看出两个树是同样的但在 outfile 树上的数字表示该枝条的 Bootstrap
持率除以100.6)。现在8个序列的进化树分析最大简约法经完成
  如果要用邻位相连法对这 8 个序列进行分析的话也首先执行 SEQBOOT
将这8个序列变成100republicate。然后DNADIST软件SEQBOOT
生成的文件输入如下
选项 D 有四种距离模式可以选择别是 Kimura 2-parameter、Jin/Nei、
Maximum-likelihood Jukes-Cantor。选项 T 一般键入一个 15-30 间的数字
选项M 键入100。运行后生成文件如下图
这个文件包含了与输入文件相同的100republicate,只不过每个 republicate
两两序列的进化距离来表示文件中的每republicate都省略了第一排的Mo3
Mo5  Mo6   Mo7   Mo8  Mo9   Mo12   Mo13。这个输出文件为输入文件
执行NEIGHBOR 软件如下
选项 M 键入 100。生成两个文件 outfile treefile 记事本和 TREEVIEW
发现这两个文件都含有 100 个进化树 treefile 文件更名后输入
CONSENSE 软件又得到两个文件 outfiletreefile,这就是最后的结果以上
DNA序列的分析如果要对蛋白质序列进行分析PROTDIST、PROTPARS
软件其他软件的用法可以参照PHYLIP documents。