Kettle的下载安装教程和使用简介(内含第一个kettle转换案例)

article/2025/10/13 13:39:12

本文首先介绍Kettle工具的安装及基本概念,然后通过一个案例实操介绍Kettle工具的使用。

本文重要的内容如下:

Kettle的安装

1.Java的安装

  • 登录Java的官网后,进入到下载页面:http://www.oracle.com/technetwork/java/javase/downloads/index.html,选择当前最新的Java版本下载安装。
  • 本章以Win10操作系统安装Java10为例进行介绍。
  • 下载jdk-10_windows-x64_bin.exe完毕后,双击该文件,一路选择next,直接到安装完毕。
  • 本书的安装路径为C:\Program Files\Java\jdk-10。

2.Java环境变量的配置


右键点击“我的电脑”,在弹出的选项栏中点击“属性”

 点击“高级系统设置”。

点击“环境变量(N)…”。

 点击“系统变量(S)”栏目下的“新建(W)…”。

以新建的方式配置JAVA_HOME环境变量。在“变量名(N):”填入JAVA_HOME, 在“变量值(V):”填入C:\Program Files\Java\jdk-10。填写完毕后,点击“确定” 完成新建环境变量JAVA_HOME的配置。

 参考JAVA_HOME环境变量的配置操作完成CLASSPATH环境变量的配置。CLASSPATH环境变量的值为 .;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar,填写完毕后,点击“确定”,完成新建环境变量CLASSPATH的配置。

 在“系统变量(S)”栏目中,点击Path环境变量,接着点击“编辑(I)…”按钮,以追加的方式开始配置Path环境变量。

在“编辑环境变量”弹框中,点击“新建(N)”按钮

 在光标位置,增添.;%JAVA_HOME%\bin;%JAVA_HOME%\jre\bin,点击“确定”完成Path的配置。配置完毕后,点击所有弹框的“确定”按钮,关闭所有弹框,返回到桌面。

在命令窗口中输入java –versionjavac命令,有如下输出提示,则Java 的环境变量配置正确。

 

 3.Kettle的下载安装与spoon启动

  • Kettle作为一个独立的压缩包发布,可以从https://sourceforge.net/projects/pentaho/files/ 选择最新的版本下载安装。下载完毕后,解压下载的文件,点击spoon.bat即可使用。
  • 为了方便使用,可以为spoon.bat创建一个 Windows桌面快捷方式。创建快捷方式后,右键单击新创建的快捷文件,在弹出菜单中选择属性。打开的属性对话框里显示了快捷方式标签。在这个标签下“更改图标”按钮可以为这个快捷方式选中一个容易识别的图标,一般选择 Kettle目录下的spoon.ico文件。

修改spoon.bat的图标

 

 Kettle的使用简介

  • 转换是ETL解决方案中最主要的部分,它负责处理抽取、转换、加载各阶段对数据行的各种操作。转换包括一个或多个步骤,如读取文件、过滤输出行、数据清洗或将数据加载到数据库。
  • 转换里的步骤通过跳来连接,跳定义了一个单向通道,允许数据从一个步骤向另一个步骤流动。在Kettle里,数据的单位是行,数据流就是数据行从一个步骤到另一个步骤的移动。数据流的另一个同义词就是记录流。
  • 除了步骤和跳,转换还包括了注释,注释是一个小的文本框,可以放在转换流程图的任何位置。注释的主要目的是使转换文档化。

        步骤是转换里的基本组成部分。它是一个图形化的组件,可以通过配置步骤的参数,使得它完成相应的功能。例子显示了两个步骤,分别为“表输入”和“Microsoft Excel 输出”。配置“表输入”步骤的参数,可以使得这个步骤从指定的数据库中读取指定关系表的数据;配置“Microsoft Excel 输出” 步骤的参数,可以使得这个步骤向指定的路径创建一个Excel表格,并写入数据。当这两个步骤用跳(箭头连接线)连接起来的时候,“表输入”步骤读取的数据,通过跳,传输给了“Microsoft Excel 输出”步骤。最终,“Microsoft Excel 输出”步骤把“表输入”所读取的数据,写入到Excel表格中。这个跳,对“表输入”而言,是个输出跳;对“Microsoft Excel 输出”而言,是个输入跳。 

  • 转换的跳就是步骤之间带箭头的连线,跳定义了步骤之间进行数据传输的单向通道。
  • 从程序执行的角度看,跳实际上是两个步骤线程之间进行数据行传输的缓存。这个缓存被称为行集,行集的大小可以在转换的设置里定义。当行集满了,向行集写数据的步骤将停止写入,直到行集里又有了空间。当行集空了,从行集读取数据的步骤停止读取,直到行集里又有可读的数据行。
  • 注意:因为在转换里每个步骤都依赖前一个步骤获取字段值,所以当创建新跳的时候,跳的方向是单向的,不能是双向循环的。

第一个转换案例

1、运行Spoon.bat后,Kettle将启动Spoon,进入可视化编程界面。

2、如下所示,创建一个转换文件。(注:“作业”包括一个或多个作业项,作业项由转换构成。) 

3、点击下图圈出的“图片”图标,重命名该转换文件,保存在某个指定的路径 

 4、在“核心对象”标签中,点击“输入”文件夹展开输入类型的所有步骤。按住鼠标左键拖拽“表输入”步骤到画布中。这样,在画布中就创建了一个新步骤。

 

5、在“核心对象”标签中,点击“输出”文件夹展开输出类型的所有步骤。点击“Microsoft Excel 输出”步骤,按住鼠标左键拖拽到画布中。 

6、转换里的步骤通过跳定义一个单向通道来连接。点击“表输入”步骤,按住鼠标左键,将箭头一直拖到“Microsoft Excel 输出”,待箭头变成绿色时,松开鼠标左键,即可建立两个步骤之间的跳。 注:右键点击跳的箭头符号,在菜单栏上选择相关的操作设置该跳的一些属性,包括“使节点连接时效”,“删除节点连接”等。

 

7、双击“表输入”步骤进行配置,在弹出的配置对话框中,点击“新建”按钮配置数据库的连接信息

 

8、配置数据库连接 

9、配置数据库连接后,“表输入”弹框中会显示新建的数据库连接

 

10、在“表输入”弹框中,点击“获取SQL语句”按钮,将弹出“数据库浏览器” 

11、选择“学生”表后,“表输入”弹框会显示“学生”表的查询语句

 

12、选择预览的记录数量,点击“确定”后,将可以查看学生表的数据记录信息。此时,已完成了“表输入”步骤的配置。

13、 双击“Microsoft Excel 输出”步骤进行配置。在弹出的配置对话框中,点击选定“文件&工作表”进行配置。

14、在“Microsoft Excel 输出”步骤的配置对话框中,点击选定“内容”进行配置。 点击“获取字段”按钮,获取上个步骤输出的数据字段。     获取后,在“字段”的表格中,显示了已获取的字段。这些字段将在C:\Users\45812\Desktop\etl\ktr\outfile.xlsx文件中输出。 

15、点击“右三角”开始运行程序,在弹出的对话框中,选择“启动”按钮运行程序

 16、执行完毕后,输出的文件保存在“Microsoft Excel 输出”步骤设置的路径下。该转换的输出路径及文件为C:\Users\45\Desktop\etl\ktr\outfile.xlsx

 对于Kettle而言,执行的一系列结果在右下方的“执行结果”状态栏中显示。也就是说,“执行结果”状态栏是对转换、作业执行过程的监控。


http://chatgpt.dhexx.cn/article/fZH2N2hi.shtml

相关文章

kettle Hello World教程

kettle Hello World教程 1、HelloWorld 示例 通过这个例子,介绍kettle的一些基础知识及应用: n 使用Spoon工具 n 转换的创建 n 步骤及连线 n 预定义变量 n 在Spoon中预览和执行 n 使用pan工具在终端窗口执行转换 概述 我们要实现的目标是…

kettle入门

目录 前言 一、kettle是什么 二、kettle 安装与基本使用 2.1 kettle 安装 2.2 kettle的基础使用 2.21 做一个简单的转换样例 2.2.2 小技巧 三、转换常用组件使用 3.1 输入模块 3.1.1 生成记录 3.1.2 表输入 3.2 输出模块 3.2.1表输出 3.3.2 插入/更新 3.3.3 更新 …

最新版kettle安装教程!!!

终于又想起来要把ketlle装好了,原先我是在虚拟机用的kettle,可是切换还是太麻烦了,今天想说装一个mac版的。进到官网发现它已经换地址了。。。 好巧不巧,刚好是6月5号换的。sad。 1、下载kettle 其实kettle的下载文件是mac和wi…

Kettle使用教程(一)

Kettle自己有三个主要组件:Spoon,Kitchen,Pan。其中Spoon是一个图形化的界面,用于windows的时候,先设置环境变量:pentaho_java_home,例如:C:\Program Files\Java\jdk1.7.0_25&…

Kettle — 安装和部署

前提 Kettle是纯Java编写的ETL开源工具,目前Kettle7和Kettle8都需要Java8或者以上才能正常运行。所以开运行Kettle前先检查Java环境是否正确配置,Java版本是否是8或者以上。 Kettle安装 1)创建Kettle的目录,并将Kettle的zip包解…

kettle实战教程-纯实战开发

kettle实战教程-纯实战开发 欢迎关注笔者的公众号: java大师, 每日推送java、kettle运维等领域干货文章,关注即免费无套路附送 100G 海量学习、面试资源哟!!个人网站: http://www.javaman.cn/kettle/kettle-actual Kettle简介:Ket…

Kettle安装及配置

安装环境说明 jdk 采用 jdk-8u102-windows-x64 kettle采用kettle 8.2 文末,博主会将kettle下载地址附上,还包含其他版本(作为本专栏开博小福利)。kettle9.0版本以下,本教程都适用,kettle9.0及更新的其他版本…

Kettle的安装和使用

Kettle简介 Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。 Kettle是“Kettle E.T.T.L. Envirnonment“只取首字母的缩写,这意味着它被设计用来帮助你实现你的 ETTL 需要&#…

Kettle 使用详解

第0章 ETL简介 ETL (Extract-Transform-Load 的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种ETL工具的使用,必不可…

Kettle基础操作

目录 Kettle基础操作 1 启动Kettle 2 创建本地资源库 3 基础操作 3.1 新建转换 3.2 新建作业 3.3 节点连接 4 导入/导出资源库 5 创建数据库连链接 Kettle基础操作 1 启动Kettle 前置环境:JDK 1.7以上、IE浏览器升级至IE10以上(Kettle7.0以下…

kettle(一)kettle介绍

kettle介绍及组成 一、kettle 是什么 kettle 是一个ETL工具,ETL(Extract-Transform-Load,数据抽取、转换、装载); kettle 是java编写,绿色无需安装,抽取高效稳定; kettle 主要用来…

Kettle下载与安装教程【保姆版】

Kettle简介 Kettle最早是一个开源的ETL(Extract-Transform-Load的缩写)工具,全称为KDE Extraction, Transportation, Transformation and Loading Environment。后来Kettle重命名为Pentaho Data Integration 。它由Java开发,支持…

kettle基础教程-kettle9教程

kettle是啥? 一款免费开源的、功能强大的ETL工具,纯 java 开发。可以在 Linux、windows、unix 中运行。有图形界面,也有命令脚本还可以二次开发。 一.安装部署 1.JDK1.8安装及环境变量的配置 https://blog.csdn.net/weixin_39549656/artic…

kettle 简介及入门

介绍 kettle 是纯 java 开发,开源的 ETL工具,用于数据库间的数据迁移 。可以在 Linux、windows、unix 中运行。有图形界面,也有命令脚本还可以二次开发。 kettle 的官网是 https://community.hitachivantara.com/docs/DOC-1009855&#xff…

kettle 使用教程(入门)

文章目录 前言一、下载、安装二、启动软件三、转换的使用教程四、作业的使用教程总结 前言 Kettle简介:Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶&…

kettle 教程(一):简介及入门

介绍 kettle 是纯 java 开发,开源的 ETL工具,用于数据库间的数据迁移 。可以在 Linux、windows、unix 中运行。有图形界面,也有命令脚本还可以二次开发。 kettle 的官网是 https://community.hitachivantara.com/docs/DOC-1009855&#xff0…

kettle入门教程

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工…

kettle使用教程(超详细)

今天详细详细说一下kettle 的安装,安装的版本: jdk:jdk-8u152-windows--x64 kettle:KETTLE-5.4 一、环境部署 1、安装JDK,按默认值安装即可 2、设置环境变量,如图下图 具体步骤: 1.右击我的电脑-属性-高级系统设置-环境变量-系统变量-新建…

HMC5883L地磁传感器驱动

霍尼韦尔 HMC5883L 是一种表面贴装的高集成模块,并带有数字接口的弱磁传感器芯片,应用于低成本罗盘和磁场检测领域。HMC5883L 包括最先进的高分辨率 HMC118X 系列磁阻传感器,并附带霍尼韦尔专利的集成电路包括放大器、自动消磁驱动器、偏差校…

Arduino Uno + HMC5883L电子罗盘 实验

实现 HMC5883L 电子罗盘 简单的数据读取实验 实验效果 本实验&#xff0c;简单显示从HMC5883L 读取到的数据 BOM表 Arduino Uno * 1 HMC5883L&#xff08;gy-273&#xff09; * 1 跳线若干 接线图 Arduino Uno <----> HMC5883L 5v …