DataX教程(02)-IDEA运行DataX完整流程(填完所有的坑)--688IT编程网

DataX教程（02）-IDEA运⾏DataX完整流程（填完所有的坑）

⽂章⽬录

01 引⾔

关于DataX，在前⾯的博⽂已经介绍过，因为官⽅没有IDEA运⾏的⽰例⽂档，⽹上的资料参差不齐，所以本⽂主要讲解如何在IDEA的环境下跑起DataX，⼀次填完所有的坑。

我使⽤的环境是（没必要安装python）：

jdk1.8

macos操作系统（这个不重要，windows系统⼀样的操作）

02 IDEA下运⾏DataX

在IDEA下运⾏DataX，我们必须先知道流程，下⾯我画了⼀张流程图：

下⾯按步骤操作讲解。

2.1 步骤1：clone源码

我们使⽤IDEA导⼊，“File - > New -> Project from ”：

输⼊源代码地址：

根据提⽰打开，等待依赖完成，直⾄导⼊完成，如果这⾥导⼊太慢，可以在maven⾥的l配置阿⾥云的镜像地址，如下：

<id>alimaven</id>

<name>aliyun maven</name>

<url>maven.aliyun/nexus/content/groups/public/</url>

<mirrorOf>central</mirrorOf>

</mirror>

注意：如果项⽬提⽰某个包没有，可以不⽤管它，直接跳到下⼀步，因为这个包不⼀定是我们需要的。

2.2 步骤2：编译源码

想了解maven的assembly⾃定义打包的内容可以参考我的博客

注意DataX使⽤的是assembly⾃定义结构打包，所以可以使⽤命令打包，在项⽬根节点下，控制台运⾏maven脚本:

mvn clean package -DskipTests assembly:assembly

或者直接使⽤IDEA的按着control键选择clean（清理）和package（打包），然后Run Maven Build运

⾏，等待编译。

编译完成后，我们可以看到项⽬⽬录即/core下⽣成了⼀个target⽂件夹，这个编译后的包⾥，我们需要的只有下⾯红框datax⾥⾯的内容。

为了⽅便理解，我把它编译后的datax⽂件夹复制到我的桌⾯（地址：/Users/⽤户名/Desktop/datax）：

2.3 步骤3：配置编译后的包

我们可以看到datax编译后的包⾥⾯的⽬录结构如下：

我们需要配置的是conf⽂件夹⾥⾯的core.json⽂件⾥⾯的ansport.speed.byte，只要不为-1就可以了，值可以任意写，如下图（如果这⾥不改，后续跑程序的时候会报错），我把byte设置为2000000了，表⽰单个channel的⼤⼩改为2MB:

2.4 步骤4：复制⽤到的插件

到这⾥编译后的包配置完成了，我们看下job⽂件夹下的job.json⽂件⾥⾯的内容：

{

"job":{

"setting":{

"speed":{

"byte":10485760

"errorLimit":{

"record":0,

"percentage":0.02

}

"content":[

{

"reader":{

"name":"streamreader",

"parameter":{

"column":[

{

"value":"DataX",

"type":"string"

idea debug

{

"value":19890604,

"type":"long"

{

"value":"1989-06-04 00:00:00",

"type":"date"

{

"value":true,

"type":"bool"

{

"value":"test",

"type":"bytes"

}

"sliceRecordCount":100000

}

"writer":{

"name":"streamwriter",

"parameter":{

"print":false,

"encoding":"UTF-8"

}

]

}

688IT编程网

DataX教程(02)-IDEA运行DataX完整流程(填完所有的坑)

发表评论

推荐文章

Linux怎么直接执行PHP脚本文件

php文件写入或追加数据

php中实现文件上传的函数

php文件上传类程序代码

413 request entity too large 解决方法 -回复

热门文章

卡乐恒温恒湿控制器介绍

Lovegate病毒(爱情后门)的症状及清除方法

UGNX8.0最详细图示安装方法(图文教程)

BT3教程

ctft题目二进制数据解密

速达8.75安装说明

PGP安装使用图解

捡了我的手机看不了我的秘密

德语助手破解

--BT3BT4破解资料

破解禁用U盘的四大绝招

如何将EXE安装文件脱壳和破解

Windows主题破解通用补丁教程

ERDAS 9.2下载安装破解

电脑文件加密和解密技巧

Total Recorder破解版

数据加密技术在计算机网络安全中的应用意义

教你如何破解别人无线网密码,无线上网技术秘籍

BackTrack3解除WIFI无线网络密码

怎样到自己想要的“密码”

最新文章

Linux怎么直接执行PHP脚本文件

php文件写入或追加数据

php文件上传类程序代码

php上传文件类型

详解PHP文件上传漏洞

CD发烧碟刻录对音质是否有影响

标签列表

688IT编程网

DataX教程(02)-IDEA运行DataX完整流程(填完所有的坑)

发表评论

推荐文章

Linux怎么直接执行PHP脚本文件

php文件写入或追加数据

php中实现文件上传的函数

php文件上传类程序代码

413 request entity too large 解决方法 -回复

热门文章

卡乐恒温恒湿控制器介绍

Lovegate病毒(爱情后门)的症状及清除方法

UGNX8.0最详细图示安装方法(图文教程)

BT3教程

ctft题目二进制数据解密

速达8.75安装说明

PGP安装使用图解

捡了我的手机看不了我的秘密

德语助手破解

--BT3BT4破解资料

破解禁用U盘的四大绝招

如何将EXE安装文件脱壳和破解

Windows主题破解通用补丁教程

ERDAS 9.2下载 安装 破解

电脑文件加密和解密技巧

Total Recorder破解版

数据加密技术在计算机网络安全中的应用意义

教你如何破解别人无线网密码,无线上网技术秘籍

BackTrack3解除WIFI无线网络密码

怎样到自己想要的“密码”

最新文章

Linux怎么直接执行PHP脚本文件

php文件写入或追加数据

php文件上传类程序代码

php上传文件类型

详解PHP文件上传漏洞

CD发烧碟刻录对音质是否有影响

标签列表

ERDAS 9.2下载安装破解