写在前面一:
数据仓库ETL工具有很多,基于大数据环境下的分析,Hive用的多些。本文介绍国外的 一款开源ETL工具——Kettle。
写在前面二:
所用软件说明:
一、什么是Kettle
Kettle是一款国外开源的ETL工具,纯java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
二、Kettle安装配置
2.1、安装jdk
2.2、下载Kettle
2.3、解压缩
cd /home/yujianxin/kettle/
unzip pdi-ce-5.0.1-stable.zip
安装完成后,可以看到生成一个新的文件夹data-integration,则/home/yujianxin/kettle/data-integration即是kettle的安装和执行目录
2.4、配置kettle环境变量
2.5、验证Kettle是否安装成功
cd $KETTLE_HOME
执行./kitchen.sh,出现如下提示,则说明kettle安装成功
三、使用Kettle
3.1、启动kettle
cd $KETTLE_HOME
执行 ./spoon.sh,即可弹出kettle的操作界面
3.2、使用Kettle
关于Kettle的使用,欢迎qq(1152596901)交流。
详细图解 快速入门kettle,布布扣,bubuko.com
时间: 2024-10-27 13:27:56