kettle组件-分组

分组:
   步骤名称:在单一转换中名称唯一。
   分组字段:指定分组的字段。
   聚合:指定需要聚合的字段,方法以及新字段结果的名称。
   包含所有的行:如果选择该项,输出中就包含所有的行,不仅仅是聚合。
   临时文件目录:临时文件存储的目录。
   临时文件前缀:指定命名临时文件时的文件前缀。
   添加行号,每一个分组重启:如果想添加行号,就选择该项。
   字段名行号:指定行号将插入的字段名称。
   名称:做聚合之后结果数据所对应的字段。
   Subject:做聚合操作的字段。
   类型:选择聚合函数。
   值:定义常量值。

原文地址:https://www.cnblogs.com/zja001/p/10084485.html

时间: 2024-11-09 03:51:29

kettle组件-分组的相关文章

kettle组件-流程

1:空操作  该操作什么都不做,主要作用是,想测试的时候充当一个占位符.  例如:两个文本文件输入,同时连接到流查询步骤中,但是流查询仅仅能从一个流中查询信息,所以可以在同时连接流查询之前,           将两个文本文件输入连接到空操作,然后再让空操作去连接流查询.         空操作组件具有合并记录的作用. 2:过滤记录  该步骤通过条件和比较符来过滤记录.  发送ture数据给步骤:指定条件返回true的数据将发送到此步骤  发送false数据给步骤:指定条件返回false的数据将

利用kettle组件导入excel文件到数据库

1.     实现目标 把excel文件内容导入到目标表中:然后用java调用kettle的转换.excel文件的内容仅仅有两列,示比例如以下: watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbmV3ZWFzdHN1bg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" > 数据库表的结构例如以下: watermark/2/text/aHR0

kettle组件-查询

1:数据库查询     数据库连接:所要连接的数据库  模式名称:一般选取用户模式  表名:所要查询的表名  是否使用缓存:指定是否使用数据库缓存查询结果.  缓存大小:指定缓存的大小.  从表中加载所有数据:选中该项,缓存将不被利用. 查询所需的关键字:   表字段:表示所选中的表中的字段.   比较操作符:对选中字段进行判断.   字段1/2:流中的其他(表字段中可选的字段在该选项中不能选择)字段. 查询表返回的值:   查询表返回的字段,类型,可以通过新名称对返回字段该名称.  排序:指定

kettle组件-转换

1:列转行2:列转行3:去除重复记录      步骤名称:保持唯一性      增加计数器到输出?:当勾选了此项,并在计数器字段后给予了名称,则将会在该字段下显示去掉的重复行数.      字段名称:用来去重的字段,可选多个字段,表示多个字段都相同时表示重复.      该功能类似与sql中的distinct关键字. 4:增加序列      一个序列是在某个起始值和增量的基础之上,经常改变的整数值.可以使用数据库定义好的序列,也可以使用kettle决定的序列.      kettle序列在同一个

kettle组件-输入

1:文本文件输入     包含六个页签:文件,内容,错误处理,过滤,字段,其他输出字段     文件:用于选中文件或目录,可以使用正则表达式     内容:文件类型---保持默认CSV即可    分隔符----指文本文件每个字段间的分区标志,不可见分隔符的输入方法:$[01]    文本限定符----指当文本字段中有分隔符作为字段内容一部分时就需要文本限定符    逃逸符-----针对文本限定符而言,当文本字段中出现文本限定符了,需要使用逃逸符    头部-------规定字段行    过滤:将

ETL工具kettle的几个小组件(剪切字符串,增加常量,计算器)

接下来几天给大家介绍下几个常用的kettle组件1.剪切字符串所谓的剪切字符串,就类似于Oracle的substr函数,具体位置在某个转换的核心对象-转换中,如图使用方法为--双击打开组件,选择你要裁剪的流字段(必须),输出字段(选填),输入初始和结束位置,这样就好了:2.增加常量所谓的增加常量就是增加x个字段,而这每个字段的值都是常量(这里的x是个大于等于0的自然数),具体位置在某个转换的核心对象-转换中,如图使用方法是双击组件,按自己的需要填写参数,如图我们经常需要填写的有名称,类型,格式,

kettle将Excel数据导入oracle

导读 Excel数据导入Oracle数据库的方法: 1.使用PL SQL 工具附带的功能,效率比较低 可参考这篇文章的介绍:http://www.2cto.com/database/201212/176777.html 2.使用Kettle工具,免费,相比之下功能更丰富,可实现一定的业务逻辑,推荐使用 Kettle将Excel数据导入Oracle过程记录如下: 1.准备Excel文件: 注意:Excel文件要有字段名称说明:如这里的id,name,age 2.打开Kettle,文件-->新建--

Kettle之数据抽取、转换、装载

Kettle 官网 ETL利器Kettle实战应用解析系列 利用kettle组件导入excel文件到数据库 kettle中实现动态SQL查询 java中调用kettle转换文件

Pentaho BIServer Community Edtion 6.1 使用教程 第三篇 发布和调度Kettle(Data Integration) 脚本 Job & Trans

Pentaho BIServer Community Edtion 6.1 集成了 Kettle 组件,可以运行Kettle 程序脚本.但由于Kettle没有直接发布到 BIServer-ce 服务的程序,所以,在本地(Windows环境)通过图形化界面开发完成的ETL 脚本 (.ktr & .kjb) ,需要上传到BIServer-ce 管理的资源库,才能被BIServer-ce 运行和调度. 重点:Kettle 资源库 与 BIServer-ce 资源库 建立一致的目录管理ETL脚本文件.