Informatica 常用组件Aggregator之四 创建聚合转换

  • 在 Mapping Designer 中选择"转换-创建"。选择聚合转换。
  • 为聚合输入一个名称,并单击"创建"。然后单击"完成"。

Designer 创建聚合转换。

  • 将所需端口拖到聚合转换。

Designer 将为您包括的每个端口创建输入/输出端口。

  • 双击转换标题栏,以打开"编辑转换"对话框。
  • 选择"端口"选项卡。
  • 单击您希望聚合在创建组时所使用的每列的分组依据选项。

  可以选择输入默认值来替换空组。

  如果您要使用非聚合表达式来修改组,请单击"添加"按钮并输入名称和端口的数据类型。清除"输入 (I)",使此端口成为输出端口。单击"表达式"字段的右角,使用其中一个输入端口输入非聚合表达式,然后单击"确定"。选择"分组依据"。

  • 单击"添加"并为聚合表达式端口输入名称和数据类型。清除"输入 (I)",使此端口成为输出端口。单击"表达式"字段的右角打开表达式编辑器。输入聚合表达式,依次单击"验证"和"确定"。

  关闭表达式编辑器前确保验证表达式。

  • 根据需要添加特定端口的默认值。

  如果某个端口可能包含空值且目标数据库不处理空值,您可能要指定默认值。

  • 选择"属性"选项卡。

  根据需要选择并修改这些选项:

 

聚合设置

说明

Cache Directory

PowerCenter Server 创建索引和数据高速缓存文件的本地目录。默认情况下,PowerCenter Server 会将 Workflow Manager 中输入的目录用于服务器变量 $PMCacheDir。如果输入新的目录,请确保目录存在并包含聚合高速缓存所需的足够磁盘空间。

Tracing Level

显示在此转换的会话日志中的细节量。

Sorted Input

指示已按组预排序输入数据。只有当映射将已排序数据传递至聚合转换时,才选择此选项。

Aggregator Data Cache Size

转换的数据高速缓存大小。默认的高速缓存大小为 2,000,000 字节。如果会话配置的总高速缓存大小为 2 GB(2,147,483,648 字节)或以上,您必须在 64 位 PowerCenter Server 上运行会话。

Aggregator Index Cache Size

转换的索引高速缓存大小。默认的高速缓存大小为 1,000,000 字节。如果会话配置的总高速缓存大小为 2 GB(2,147,483,648 字节)或以上,您必须在 64 位 PowerCenter Server 上运行会话。

Transformation Scope

指定 PowerCenter Server 如何将转换逻辑应用于接收数据:

  • Transaction。将转换逻辑应用于事务中的所有行。如果数据行取决于同一事务中的所有行,但与其它事务中的行无关,则选择 "Transaction"。
  • All Input。将事务逻辑应用于所有传入数据。选择 "All Input" 时,PowerCenter 将放弃接收事务边界。如果数据行取决于源中的所有行,请选择 All Input。

有关转换作用域的详细信息,请参阅《工作流管理指南》中的"了解提交点"。

  • 单击"确定"。
  • 选择"资料库-保存"以保存对映射所做的更改。
时间: 2024-08-29 16:43:53

Informatica 常用组件Aggregator之四 创建聚合转换的相关文章

Informatica 常用组件Aggregator之一 聚合表达式

转换类型:已连接.主动        聚合转换允许您执行聚合计算,比如平均值和总和.聚合转换与表达式转换不同,您可以使用聚合转换对多组执行计算.而表达式转换只允许您逐行地执行计算.        使用转换语言来创建聚合转换时,您可以使用条件子句过滤行,这比 SQL 语言更为灵活.        PowerCenter 执行其读取的聚合计算并存储聚合高速缓存中必需的数据组和行数据.         创建包含聚合转换的会话后,您可启用会话选项和增量聚合.当 PowerCenter Server 执行

Informatica 常用组件Aggregator之二 分组依据端口

聚合转换允许您为聚合定义组,而不是在所有的输入数据间执行聚合.例如,您可以查找按地区分组的总销量,而不是查找总的公司销量. 要为聚合表达式定义组,请选择聚合转换中的相应输入.输入/输出.输出和变量端口.您可以选择多个分组依据端口,为每个组的唯一组合创建新组.PowerCenter 随后将为每个组执行已定义的聚合. 对值分组后,PowerCenter 会为每个组生成一行.如果不对值分组,PowerCenter 则会为所有输入行返回一行.PowerCenter 通常将每个组的最后一行(或接收的最后行

Informatica 常用组件Lookup之四 查找组件

在映射中配置查找转换时,请定义以下组件: 查找源 端口 属性 条件 元数据扩展 查找源         您可以使用平面文件或关系表作为查找源.创建查找转换时,您可以从以下位置导入查找源: 资料库中的任何关系源或目标定义 资料库中的任何平面文件源或目标定义 PowerCenter Server 和 PowerCenter Client 机器都可以连接到的任何表或文件 查找表可以是单个表,您也可以使用查找 SQL 覆盖以将相同数据库中的多个表联接起来.PowerCenter 为所有传入查找转换的行,

Informatica 常用组件Aggregator之三 使用排序输入

可以使用排序输入选项改善聚合转换性能.使用排序输入时,PowerCenter 会假定所有数据已按组排序.PowerCenter 读取某组的行时,它将执行聚合计算.需要时,它会将组信息存储在存储器中.要使用排序输入选项,您必须将已排序数据传递至聚合转换.配置具有多个分区的会话时,您可以通过已排序端口增进性能. 不使用排序输入时,PowerCenter 会执行其读取的聚合计算.但是,由于未排序数据,PowerCenter 将为每组存储数据直到它读取整个源,从而确保所有聚合计算准确. 例如,聚合转换具

Informatica 常用组件Filter之 创建FIL

在 Designer 中,切换到 Mapping Designer 并打开映射. 选择"转换-创建". 选择"过滤器转换",然后输入新的转换名称.过滤器转换的命名惯例是 FIL_TransformationName.单击"创建",然后单击"完成". 从源限定符或其它转换选择并拖动所有所需的端口以将其添加至过滤器转换. 选择并拖动端口后,这些端口的副本将出现在过滤器转换中.每列都同时具有输入和输出端口. 双击新转换的标题栏. 单

Informatica 常用组件Expression之 创建EXP组件

在 Mapping Designer 中选择"转换-创建".选择表达式转换.为它输入一个名称(惯例为 EXP_TransformationName)并单击"确定". 创建输入端口. 如果您有可用输入转换,则可以从"版面"菜单中选择链接列,然后单击计算中所使用的每个端口并拖动至表达式转换.使用这种方法,Designer 可将端口复制到新的转换并在两个端口间创建连接.或者,您也可以打开转换并手动创建每个端口. 注: 如果您希望此转换可再用,则必须在转

Informatica 常用组件Source Qualifier之 使用排序端口

使用已排序端口时,PowerCenter 将添加端口至默认查询中的 ORDER BY 子句.PowerCenter Server 将添加配置的端口号,从源限定符转换的顶部开始.在映射中包括以下任何转换时,您可以使用已排序端口来提高性能: 聚合.为已排序输入配置聚合转换时,您可以使用已排序端口发送已排序的数据.聚合转换中的分组依据端口必须与源限定符转换中的已排序端口顺序相匹配. 联接.为已排序输入配置联接转换时,您可以使用已排序端口发送已排序的数据.按与源限定符转换中相同的方式来配置已排序端口的顺

Informatica 常用组件Lookup缓存之一 概述

可以配置查找转换以高速缓存查找表.PowerCenter 将在处理高速缓存查找转换中的第一个数据行时在存储器中建立高速缓存.它将根据您在转换或会话特性中配置的数量来分配高速缓存区内存.PowerCenter 会将条件值存储在索引高速缓存区中,而将输出值存储到数据高速缓存区.PowerCenter 将查询进入转换的每行的高速缓存. 默认情况下,PowerCenter 还将在 $PMCacheDir 中创建高速缓存文件.如果数据在存储器高速缓存区中放不下,PowerCenter 会将溢出值存储在高速

Informatica 常用组件Lookup之一 概述

转换类型:被动.已连接/未连接 在映射中使用查找转换以从平面文件或关系表.视图或同义词查找数据.您可以从 PowerCenter Client 和 PowerCenter Server 均连接至的任何平面文件或关系数据库中导入查找定义.您可以在一个映射中使用多个查找转换. PowerCenter 基于转换中的查找端口来查询查找源.它基于查找条件将查找转换端口值与查找源列值相比较.将查找结果传递至其它转换和目标. 您可以使用查找转换执行多项任务,包括: 获取相关值.例如,源包括员工标识,但您需要在