kettle组件-输入

1：文本文件输入
     包含六个页签：文件，内容，错误处理，过滤，字段，其他输出字段
     文件：用于选中文件或目录，可以使用正则表达式
     内容：文件类型---保持默认CSV即可
    分隔符----指文本文件每个字段间的分区标志，不可见分隔符的输入方法：$[01]
    文本限定符----指当文本字段中有分隔符作为字段内容一部分时就需要文本限定符
    逃逸符-----针对文本限定符而言，当文本字段中出现文本限定符了，需要使用逃逸符
    头部-------规定字段行
    过滤：将包含有输入字符串的一行去除预览，若过滤字符串与过滤器位置不匹配，将不能去除预览
    字段：当点击自动获取时，会将内容中指定的头部以字段形式展出。

2：生成记录

用于自定义字段，类型，（若为时间类型还可设置格式），（若为数字类型还可设置长度和精度），值。

限制----用于限制展示的行数，设置单行值后若限制为多行，则会重复输出。

若设置为空串，则值即使定义了也不会预览到。

若字段定义为date类型，则格式必须选择。

3：生成随机数

手动填写字段

手动选择类型：可以生成随机数字，随机整数，随机字符串，UUID,UUID4,还有两种不认识的类型。

4：自定义常量数据

自定义常量数据要与生成记录区分开，生成记录只有一个页签，字段的定义和值在同一个页签，而自定义常量有两个页签，分别是元数据和数据，元数据用于设置字段的信息，若字段定义为date类型，则格式必须选择，而数据用于为定义的字段填充数据，用法类似于数据库中的建表并插入数据，此用法相比于生成记录要灵活很多。在元数据中定义的字段，会在数据中自动生成供填充数据。

5：获取表名

用于获取所连接数据中的所有表名，若勾选了包含数据库名称，则或将连接IP地址下的所有数据库名也输出，也可勾选存过，视图，还有，可以包含模式（具体啥意思，待后续再研究）。

输出字段中包含：

名称字段---设置中勾选内容的具体名称；

类型字段----用于说明类型(是表，还是数据库)；

表示是否为系统级字段----一般是系统级别；

sql语句字段----用于展示建表语句，试了一下，建库语句为NULL

6：表输入

连接数据库，获取sql语句，从而展示对应查询中的数据。

允许简易转换：主要针对大字段的延迟转换(延迟转换性能更高，采用byte方式处理，否则就是string方式-----自动转换，提高性能)

替换sql语句中的变量：若sql查询语句中包含有变量，勾选此项将job工作中的变量替换为此变量，注意参数命名不要和系统参数命名冲突。

从步骤中插入数据是结合替换sql中的变量使用的，插入数据所代表的变量要和sql语句中的变量顺序一致。

执行每一行：对一列进行多条件判断，例如从步骤中插入数据中某一字段是sql查询中的变量，但是该列有多行数据，此时一个sql查询会逐一进行判断，并将判断的结果都返回。类似于数据库中的in查询。

原文地址：https://www.cnblogs.com/zja001/p/10050096.html

时间： 2024-10-12 06:54:38

kettle组件-输入

kettle组件-输入的相关文章

kettle组件-流程

利用kettle组件导入excel文件到数据库

kettle组件-查询

kettle组件-转换

Component组件输入日志标题

kettle组件-分组

ETL工具kettle的几个小组件（剪切字符串，增加常量，计算器）

kettle将Excel数据导入oracle

KETTLE：mongdb与mysql互传数据