Kettle安装及使用说明
1. 什么Kettle
Kettle是一个开源的ETLExtract-Transform-Load的缩写,即数据抽取、转换、装载的过程)项目,项目名很有意思,水壶。按项目负责人Matt的说法:把各种数据放到一个壶里,然后呢,以一种你希望的格式流出。Kettle包括三大块:
  Spoon——数据库实例名是什么意思转换/工作(transform/job)设计工具 (GUI方式)
Kitchen——工作(job)执行器 (命令行方式)
     Span——转换(trasform)执行器 (命令行方式)
Kettle是一款国外开源的etl工具,纯java编写,绿无需安装,数据抽取高
效稳定。Kettle中有两种脚本文件,transformationjobtransformation完成针对数据的基础转换,job则完成整个工作流的控制。
2. Kettle简单例子
2.1 下载及安装Kettle
下载地址:sourceforge/projects/pentaho/files
现在最新的版本是3.6,为了统一版本,建议下载3.2,即下载这个文件pdi-ce-3.2.0-stable.zip
解压下载下来的文件,把它放在D\下面。在D:\data-integration文件夹里,我们就可以看到Kettle的启动文件Spoon.bat
2.2  启动Kettle
点击D:\data-integration\下面的Spoon.bat,过一会儿,就会出现Kettle的欢迎界面:
稍等几秒,就会出现Kettle的主界面:
2.3  创建transformation过程
a.配置数据环境
在做这个例子之前,我们需要先配置一下数据源,这个例子中,我们用到了三个数据库,分别是:OracleMySqlSQLServer,以及一个文本文件。而且都放置在不同的主机上。