场景举例

同步的数据五花八门,有些数据本应该为每一位同学创建一条数据记录,但有些老师偏偏犯懒,在一条数据中的学生姓名字段中填写了多个姓名。如下。

  • 本应为:

姓名

|

年龄

|

性别

张三

|

18

|

李四

|

19

|

王五

|

18

|

刘六

|

18

|

  • 犯懒的老师偏偏写成:

姓名

|

年龄

|

性别

王五,张三

|

18

|

李四

|

19

|

刘六

|

18

|

解决问题

这时在数据同步时就需要把王五,张三拆成两条记录。

在Kettle中需要用到【Transform】中的【Split field to rows】,图标如下:Kettle2023082501.png打开配置窗口,如图:

Kettle2023082502.png

需要配置的信息:Step name(步骤名称)、Field to split(需要拆分的字段名)、Delimiter(分隔符)、New field name(分隔后的记录中新的字段名)。

参考

kettle开发篇-列拆分为多行-Day14