KEGG数据库中文教程
快速导航
1. 这篇教程介绍了什么?
2. KEGG数据库里面有什么?
3. 我如何查询某一特定的代谢途径(pathway)的信息,例如Glycolysis / Gluconeogenesis?
4. 我如何查询某一化合物的信息,例如Pyruvate?
5. 我如何查询Pyruvate涉及了哪些生化反应?
6. 我如何查询某一基因的信息,例如gltA ?
7. 我如何知道Bacillus subtilis是否有gltA?
8. 我如何查询gltA在其他物种中的同源基因?
9. 我如何列出某一代谢途径中涉及的所有的酶?例如cytrate cycle pathway(TCA循环)
10. 我如何知道人类的cytrate cycle中pyruvate carboxylase这种酶有多少化合物与其发生相互作用?
11. 我如何查询人类由Citrate生成Acetyl-CoA的可能步骤?
12. 我有一条未知的序列,如何查询KEGG数据库中是否有基因或酶与其对应?
一. 简介
代谢(Metabolism)是指细胞内发生的各种化学反应的总称。一个代谢途径(Metabolic pathway)包括一系列互相联系的反应(reaction),反应中的酶( enzyme)以及反应中的前体或者产物(substrate) 。随着现代生物信息学的进展,我们可以通过计算机来展示,以至预测细胞内的代谢途径。
现在常用的查询代谢途径的数据库主要包括:KEGG(jp/kegg/), GenMAPP(/), BioRag(/) 等。本教程主要介绍KEGG 数据库的使用方法。
KEGG(Kyoto Encyclopedia of Genes and Genomes)是由日本京都大学和东京大学联合开发的数据库,可以用来查询代谢途径,酶(或编码酶的基因),产物等,也可以通过BLA ST比对查询未知序列的代谢途径信息。KEGG主要通过Web界面进行访问,同样也可以通过本地运行的Perl或java程序进行访问,使用很方便。
本教程将结合实例来介绍KEGG数据库的使用方法,希望能您能通过本教程了解KEGG数据库的基本使用方法。
二. 使用方法
1.首页
打开KEGG的首页,我们可以看到KEGG提供的四个主要的数据库(图1箭头所示)。
●PATHWAY (代谢途径数据库),可以查询各种代谢途径。
●BRITE (代谢通路及同源基因数据库),这个数据与PATHWAY数据库不同的是,可以查
询酶和底物之间的关系,也可以查询某种酶的同源基因。
●GENES (基因数据库),可以查询不同的基因或基因组的信息。
●LIGAND (配体数据库),可以查询反应中各种化合物的信息。
图1. KEGG数据库首页
如果点击KEGG2——KEGG Table of Contents这个链接,则会出现一个类似于网站地图的页面,在这个页面上,我们可以查询各数据库的更新信息,也可快速访问KEGG提供的各个数据库。
点击KEGG Organisms会列出KEGG对各物种的代码。KEGG使用三个英文小写字母来代表各个物种,例如人类Homo sapiens,代码是hsa。再如小鼠Mus Musculus则是mmu。
2. PATHW AY数据库的使用
在首页上点击PA THWAY的链接(或者先选择KEGG2,再在出现的表格中Database选项下选择KEGG PA THWAY)。您就会看到KEGG收录的所有代谢途径信息(图2)。
图2. P A THWAY数据库界面
例如如果想要查询Glycolysis / Gluconeogenesis这个代谢途径(图2)。
1)从首页,或者KEGG2的表格界面中进入PA THWA Y数据库
go2map地图北京
2)点击Carbohydrate Metabolism中的Glycolysis / Gluconeogenesis
新页面即显示出此途径的信息(图3A)。方框中表示的是反应中的酶,例如2.7.1.41,这是酶的EC number,国际酶学委员会的编号。小圆圈代表的是反应中的化合物,例如α-D-Glucose-1P。箭头代表的是反应的方向。虚线表示此反应可以通过中间产物与其他途径发生联系。
或者您也可以通过Search PATHWAY for这个选项直接搜索Glycolysis / Gluconeogenesis 的信息。搜索的结果中会显示出满足条件的所有物种的pathway。