资源库的作用:资源库是用来保存操作步骤和相关的日志,转换,JOB 等信息。用户通过图形界面创建的的转换任务可以保存在资源库中。资源库可以是各种常见的数据库,用户通过用户名/ 密码来访问资源库中的资源,默认的用户名/ 密码是admin/admin. 资源库并不是必须的,如果没有资源库,用户还可以把转换任务保存在 xml 文件中。
转换文件以ktr为扩展名,作业文件以kjb为扩展名。
kettle的资源库包括数据库资源库和文件资源库,在文件和数据库的基础上的封装,实现org.pentaho.di.repository.Repository接口。
kettle资源库配置
1.启动Spoon.bat,点击+,弹出下图1窗口。
2.选择this repository uses a central relational database to store ETL metadata。弹出下图2窗口
2.选择this repository uses a central relational database to store ETL metadata。弹出下图2窗口
4点击测试,测试是否配置正确,是否能连接上资源数据库。如下图4
5.点击OK按钮保存资源
6.点击执行,执行sql语句在数据库中创建表和相关信息。创建完成后点击清除缓存。
7.选择配置好的资源库,使用admin登陆。
配置JOB,转换,日志信息就会保存到数据库中。
注意:
1.点击Spoon.bat一闪而过,可能是因为没有配置KETTLE_HOME环境变量
2.在配置资源库的数据连接时,点击测试报错如图,是因为缺少数据库连接的驱动,将对应数据库驱动的jar包放到下kettle的目录:data-integration\libext\JDBC下。 重现 启动Spoon.bat
2.在配置资源库的数据连接时,点击测试报错如图,是因为缺少数据库连接的驱动,将对应数据库驱动的jar包放到下kettle的目录:data-integration\libext\JDBC下。 重现 启动Spoon.bat