目录
一.Tsv介绍
二.案例介绍
三.案例实现
1.建立转换
2.配置控件
四.运行结果
一.Tsv介绍
TSV是Tab-separated values的缩写,即制表符分隔值。使用制表符分隔数据字段的文件被称为制表符文件。制表符文件中的数据以表格结构储存,每一行储存一条记录,每条记录的各个字段间使用制表符分隔。大多数的操作系统和常用文本编辑器中,按一次“Tab”键表示默认插入一个制表符。
二.案例介绍
通过Kettle工具抽取TSV文件tsv_extract.tsv中的数据保存至数据库extract中的数据表tsv中。
三.案例实现
数据准备:
现有一个名为tsv_extract.tsv的TSV文件,该文件的内容如图所示。
1.建立转换
2.配置控件
文本文件输入控件:双击进入控件,点击浏览选择要处理的tsv文件,选择好后,点击
增加,具体如下。
单击“内容”选项卡,清除分隔符处默认分隔符“;”并单击【Insert TAB】按钮,在分隔符处插
入一个制表符,取消勾选“头部”复选框,具体如下。
单击字段选项卡,点击获取变量快速添加字段,具体如下:
预览记录:
表输出控件:双击表输出控件,连接好数据库后(我的数据库连接的名字是随便起的),选择目标表,具体如下:
建表语句:
CREATE TABLE `tsv` (`id` int(11) NOT NULL,`name` varchar(20) DEFAULT NULL,`data` varchar(20) CHARACTER SET utf8 COLLATE utf8_bin DEFAULT NULL,PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8
勾选指定数据库字段,点击右侧输入字段映射,进行映射匹配,匹配后的图片如下: