Kettle(二)"/>
Kettle(二)
目录
1、Concat fields
2、值映射
3、增加常量
4、增加序列
5、字段选择
6、计算器
7、字符串剪切、替换、操作
8、去除重复记录、排序记录
9、唯一行(哈希值)
10、拆分字段
11、列拆分为多行
12、列转行
13、行转列
14、行扁平化
1、Concat fields
concat fields就是多个字段连接起来形成一个新的字段。
拼接成新的字段name,将firstname和lastname进行拼接。
2、值映射
将f的值映射为female,m的值映射为male
3、增加常量
增加常量就是在本身的数据流里面添加一列数据,该列的数据都是相同的值。
案例:从Excel读取数据,增加一个新列language值为en,把数据保存在Excel中
成功增加新的一列。
4、增加序列
增加序列就是给数据流添加一个序列字段。
案例:从Excel读取数据,并添加序列,把数据保存到Excel。
5、字段选择
字段选择是从数据流中选择字段、改变名称、修改数据类型。
案例:从Excel读取数据,移除sex,并把name改为quancheng,id改为key。
修改字段名称
删除字段
6、计算器
计算器:一个函数集合来创建新的字段,还可以设置字段是否移除(临时字段)。
案例:从Excel中读取数据,生成name,quarter,week_of_day,account,列,把数据存在Excel表中
略
7、字符串剪切、替换、操作
剪切字符串:指定输入流字段剪切的位置剪切出新的字段。
字符串操作:去除字符串两端的空格和大小写的切换,并生成新的字段。
案例:从Excel中读取数据,获取title的首位字符,生成title_begin字段,把description中you改为starry生成desc字段,去除author两边的空格,字符变大写,生成author_update,保存到Excel
剪切字符串:
字符串替换
字符串操作
输入的Excel
输出的Excel
8、去除重复记录、排序记录
去除重复记录是去除数据流里面相同的数据行。(注意:必须先对数据流进行排序。)
9、唯一行(哈希值)
唯一行(哈希值)就是删除数据流重复的行。
输入的Excel
输出的Excel
10、拆分字段
拆分字段就是把字段按照分隔符拆分成两个或多个字段。
注意:拆分字段后,原字段就不存在于数据流中。
案例:把name拆分为FirstName和LastName,并保存数据到Excel中
拆分字段:
11、列拆分为多行
列拆分为多行就是把指定分隔符的字段进行拆分为多行。
csv文件输入:
列拆分为多行
拆分前:
拆分后:
12、列转行
案例:从Excel中读取数据,按照姓名进行分组,把星期、工作小时从列转化为行,并保存在Excel中
列转行:
输入的Excel:
输出的Excel
13、行转列
略
14、行扁平化
更多推荐
Kettle(二)
发布评论