一,KETTLE介绍
Kettle是 (Extract, Transform and Load抽取、转换、加载)一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。其中,Spoon是Kettle中的一个组件,其他组件有PAN,CHEF,Encr和KITCHEN等。
Spoon通过图形化的页面,方便直观的让你完成数据转换的操作。
二、Kettle下载
可到开源官网(https://community.hds.com)下载;
Data Integration(or Kettle) 8版本下载: pdi-ce-8.0.0.0-28
三、java JDK 安装与部署
1)首先到官网下载对应JDK包,JDK1.8或以上版本就行;
2)安装JDK;
3)配置环境变量。
具体步骤请百度
四:Kettle环境配置
1)因Kettle是开源工具,下载的压缩包直接解压到本地路径即可。
2)打开环境变量的设置窗口。右击“我的电脑”,在弹出的快捷菜单中选择“属性”选项,进入“系统属性”对话框。选择“高级”标签,进入“高级”选项卡,再单击“环境变量”按钮,进入“环境变量”对话框。
3)在“系统变量”栏“新建”系统变量,变量名输入:KETTLE_HOME;变量值输入Kettle解压路径(...\data-integtation)。点击“确定”完成环境变量设置。
五:Kettle运行
进入到Kettle目录,双击运行spoon.bat文件,出现如下界面及说明kettle成功部署。
六:出现问题
1)若kettle启动spoon提示 A Java Exception has occurred,则说明jdk与当前kettle版本不匹配。(注:jdk1.8版本可支持Kettle7.0以后版本,1.7版本不支持)
7、建立转换
在文件->新建装换。
新建转换后在左边的主对象树中建立DB连接用以连接数据库。如图所示:
建立数据库连接的过程与其他数据库管理软件连接数据库类似。
注意:在数据库链接的过程中,可能会报某个数据库连接找不到的异常。那是因为你没有对应的数据库链接驱动,请下载对应驱动后,别忘记在链接数据库时先将数据库驱动包放入Spoon的lib文件夹下。
8 简单的数据表插入\更新
(1)新建表插入
在左边的面板中选择“核心对象”,在核心对象里面选择“输入->表输入”,用鼠标拖动到右边面板。如图所示:
双击拖过来的表,可以编辑表输入。
选择数据库连接和编辑sql语句,在这一步可以点击预览,查看自己是否连接正确。
(2)通过插入\更新输出到表。
在左边面板中选择核心对象、选择“输出->插入\更新”如图所示:
编辑插入更新:
首先:表输入连接插入更新。
选中表输入,按住shift键,拖向插入更新
然后:双击插入更新,编辑它。
到这里基本上,这个转换就要做完了,可以点击运行查看效果,看是否有误,这个要先保存了才能运行,可以随意保存到任何一个地方。
检查数据库表test1是否已有数据:
无数据的原因是:
再次执行转换:
9, 使用作业控制上面装换执行。
使用作业可以定时或周期性的执行转换,新建一个作业。并从左边面板拖入start 和转换。
双击start可以编辑,可以设置执行时间等等
点开转换,可以设置需要执行的转换任务,比如可以执行上面我们做的转换,XXX.ktr
开始 连接 转换
选中START ,按住shift键,拖向转换。
由于之前单独执行测试公转换是否设置正确,先删除表test1的数据:
执行作业:
执行成功。查看数据库表test1是否有数据:
原文地址:https://www.cnblogs.com/wyl89/p/8761309.html