Informatica 常用组件Aggregator之二 分组依据端口

  聚合转换允许您为聚合定义组,而不是在所有的输入数据间执行聚合。例如,您可以查找按地区分组的总销量,而不是查找总的公司销量。

要为聚合表达式定义组,请选择聚合转换中的相应输入、输入/输出、输出和变量端口。您可以选择多个分组依据端口,为每个组的唯一组合创建新组。PowerCenter 随后将为每个组执行已定义的聚合。

对值分组后,PowerCenter 会为每个组生成一行。如果不对值分组,PowerCenter 则会为所有输入行返回一行。PowerCenter 通常将每个组的最后一行(或接收的最后行)以及聚合结果一起返回。但是,如果您指定要返回特定行(例如,通过使用 FIRST 函数指定),PowerCenter 则会返回特定行。

在聚合转换中选择多个分组依据端口时,PowerCenter 会使用端口顺序确定其分组的顺序。由于分组顺序会影响您的结果,排列分组依据端口将确保适当的分组。例如,根据先 ITEM_ID 后 QUANTITY 的分组方式所得出的结果与根据先 QUANTITY 后 ITEM_ID 的分组方式得出的结果可能不同,因为数量的数值不必唯一。

以下聚合转换按先 STORE_ID 后 ITEM 方式分组:

非聚合表达式

可以使用分组依据端口中的非聚合表达式修改或替换组。例如,如果要在分组前替换 ‘AAA battery‘,您可以使用以下表达式创建新的名为 CORRECTED_ITEM 的分组依据输出端口:

  IIF( ITEM = ‘AAA battery‘, battery, ITEM )

默认值

可以在分组依据端口中使用默认值来替换空输入值。例如,如果您在下面的 ITEM 列中定义默认值为 ‘Misc‘,则 PowerCenter Server 会用 ‘Misc‘ 替换空组。这样能让 PowerCenter Server 在聚合中包括空项目组。

时间: 2024-10-09 04:04:03

Informatica 常用组件Aggregator之二 分组依据端口的相关文章

Informatica 常用组件Aggregator之一 聚合表达式

转换类型:已连接.主动        聚合转换允许您执行聚合计算,比如平均值和总和.聚合转换与表达式转换不同,您可以使用聚合转换对多组执行计算.而表达式转换只允许您逐行地执行计算.        使用转换语言来创建聚合转换时,您可以使用条件子句过滤行,这比 SQL 语言更为灵活.        PowerCenter 执行其读取的聚合计算并存储聚合高速缓存中必需的数据组和行数据.         创建包含聚合转换的会话后,您可启用会话选项和增量聚合.当 PowerCenter Server 执行

Informatica 常用组件Aggregator之三 使用排序输入

可以使用排序输入选项改善聚合转换性能.使用排序输入时,PowerCenter 会假定所有数据已按组排序.PowerCenter 读取某组的行时,它将执行聚合计算.需要时,它会将组信息存储在存储器中.要使用排序输入选项,您必须将已排序数据传递至聚合转换.配置具有多个分区的会话时,您可以通过已排序端口增进性能. 不使用排序输入时,PowerCenter 会执行其读取的聚合计算.但是,由于未排序数据,PowerCenter 将为每组存储数据直到它读取整个源,从而确保所有聚合计算准确. 例如,聚合转换具

Informatica 常用组件Source Qualifier之 使用排序端口

使用已排序端口时,PowerCenter 将添加端口至默认查询中的 ORDER BY 子句.PowerCenter Server 将添加配置的端口号,从源限定符转换的顶部开始.在映射中包括以下任何转换时,您可以使用已排序端口来提高性能: 聚合.为已排序输入配置聚合转换时,您可以使用已排序端口发送已排序的数据.聚合转换中的分组依据端口必须与源限定符转换中的已排序端口顺序相匹配. 联接.为已排序输入配置联接转换时,您可以使用已排序端口发送已排序的数据.按与源限定符转换中相同的方式来配置已排序端口的顺

Informatica 常用组件Aggregator之四 创建聚合转换

在 Mapping Designer 中选择"转换-创建".选择聚合转换. 为聚合输入一个名称,并单击"创建".然后单击"完成". Designer 创建聚合转换. 将所需端口拖到聚合转换. Designer 将为您包括的每个端口创建输入/输出端口. 双击转换标题栏,以打开"编辑转换"对话框. 选择"端口"选项卡. 单击您希望聚合在创建组时所使用的每列的分组依据选项. 可以选择输入默认值来替换空组. 如果您

Informatica 常用组件Lookup之二 已连接和未连接的查找

可以配置一个已连接的查找转换,以从映射管道中直接接收输入:您也可以配置一个未连接的查找转换,以从其它转换的表达式结果中接收输入. 已连接的查找 未连接的查找 直接从管道接收输入值. 从其它转换的 :LKP 表达式结果接收输入值. 可以使用动态或静态高速缓存. 可以使用静态高速缓存. 高速缓存包括映射中用到的所有查找列(即,包括在查找条件中的查找源列,以及作为输出端口链接至其它转换的查找源列). 高速缓存包括查找条件中的所有查找/输出端口和查找/返回端口. 可以从相同的行返回多列,或插入到动态查找

Informatica 常用组件Lookup缓存之二 使用永久查找高速缓存

可以将"查找"转换配置为使用非永久或永久高速缓存.基于"查找高速缓存永久"属性的会话成功后,PowerCenter 将保存或删除查找高速缓存文件. 如果查找表在会话间没有更改,则可以将"查找"转换配置为使用永久查找高速缓存.PowerCenter 在会话期间保存并重新使用高速缓存文件,消除了读取查找表所需的时间. 使用非永久高速缓存 默认情况下,在"查找"转换中启用高速缓存时,PowerCenter 将使用非永久高速缓存.在会

Informatica 常用组件Source Qualifier之 外部联接

可以使用源限定符和应用程序源限定符转换在相同的数据库中执行两个源的外部联接.当 PowerCenter 执行外部联接时,它将返回其中一个源表的所有行和另一个源表中匹配联接条件的行. 如果您需要联接两个表并返回其中一个表的所有行,可使用外部联接.例如,当您希望联接注册客户表和每月购买情况表以确定注册客户的购买行为是否活跃时,您就可以执行外部联接.使用外部联接,您可以联接注册客户表和每月购买情况表,并返回注册客户表中的所有行,包括上个月无购买行为的客户.如果您执行正常联接,PowerCenter 将

Informatica 常用组件Lookup缓存之一 概述

可以配置查找转换以高速缓存查找表.PowerCenter 将在处理高速缓存查找转换中的第一个数据行时在存储器中建立高速缓存.它将根据您在转换或会话特性中配置的数量来分配高速缓存区内存.PowerCenter 会将条件值存储在索引高速缓存区中,而将输出值存储到数据高速缓存区.PowerCenter 将查询进入转换的每行的高速缓存. 默认情况下,PowerCenter 还将在 $PMCacheDir 中创建高速缓存文件.如果数据在存储器高速缓存区中放不下,PowerCenter 会将溢出值存储在高速

Informatica 常用组件Lookup之三 关系和平面文件查找

创建查找转换时,您可以选择使用关系表或平面文件作为查找源. 关系查找 使用关系表作为查找源来创建查找转换时,您可以使用 ODBC 连接到查找源并导入表定义作为查找转换的结构. 仅可对关系查找使用以下选项: 如果需要添加 WHERE 子句或查询多个表,则可以覆盖默认的 SQL 语句. 您可以对关系查找使用动态查找高速缓存. 平面文件查找 使用平面文件作为查找源时,可以使用资料库中的任何平面文件定义,或导入平面文件定义.如果导入平面文件查找源,Designer 将调用平面文件向导. 仅可对平面文件查