场景举例
同步的数据五花八门,有些数据本应该为每一位同学创建一条数据记录,但有些老师偏偏犯懒,在一条数据中的学生姓名字段中填写了多个姓名。如下。
- 本应为:
姓名
|
年龄
|
性别
张三
|
18
|
男
李四
|
19
|
女
王五
|
18
|
男
刘六
|
18
|
女
- 犯懒的老师偏偏写成:
姓名
|
年龄
|
性别
王五,张三
|
18
|
男
李四
|
19
|
女
刘六
|
18
|
女
解决问题
这时在数据同步时就需要把王五,张三拆成两条记录。
在Kettle中需要用到【Transform】中的【Split field to rows】,图标如下:
打开配置窗口,如图:

需要配置的信息:Step name(步骤名称)、Field to split(需要拆分的字段名)、Delimiter(分隔符)、New field name(分隔后的记录中新的字段名)。
参考
kettle开发篇-列拆分为多行-Day14