值映射

功能:
用于处理流数据中某个字段里的值,映射成另外的值。例如:A系统,1,男性; 2,女性 B系统 a,男性;b,女性。
将性别字段: 1 -> a, 2 -> b。

* 使用的字段名 从流字段从获取。* 目标字段(空=覆盖) 保持源目标数据不变,新增一个字段,按映射规则映射值。
列拆分为多行

功能:
将字符传以某个字符分割,按分割符拆分为多行。

* 分割符是一个正则表达式
剪切字符串

功能:
根据指定起始位置,结束位置 截取字符串。

* 输入流字段 要剪切的字段名称。默认值为空* 输出流字段 剪切后的新字段名称。默认值为空* 起始位置 表示剪切的起始位置,位置从0开始计算。不能为负数,当为负数时,剪切失效,原字段输出。* 结束位置 表示结束对字符串剪切的位置,默认值为空,不包含结束位置字符。
增加常量
用于在流数据中,增加一列固定值。

排序记录

功能:
用于根据流数据当中字段进行排序。有些组件,在输入前需要多流数据进行排序,否则会出现结果不正确
* java.io.tmpdir获取操作系统缓存的临时目录,不同操作系统的缓存临时目录不一样,在Windows的缓存目录为:C:\Users\登录用户~1\AppData\Local\Temp\Linux:/tmp
行扁平化
功能;
处理一组流数据,只有一列不一样,其他列相同情况下。 将数据多行转出一行。
流数据必须排序,可以根据偏平化的列进行排序。

列转行

说明:列就是 |,行 ——
功能:
将数据按某字段内容数据作为新增字段,将列数据转换成功行。
列转换输入数据必须先排序。不然可能导致结果不正确。

* 关键字段 按数据转成新字段的列。* 分组 按某列分组,决定转出行数。* 目标字段 定义新字段,与关键字段内容相匹配。* 关键字值 关键字段数据
行转列
功能:
将几个字段数据转换成一列数据。

* key字段 定义被转换字段,转换后列字段名称* 字段名称 所有需要转成列的字段名称* key值 定义字段转成列后,在行中对应的值* Value字段 定义被转换字段的值对应的列的字段名称
字段选择

功能
用于修改流数据字段名称和过滤不需要的字段专递到下一个组件中。

