kettle(一)kettle介绍

article/2025/10/13 14:45:14

kettle介绍及组成

一、kettle 是什么

kettle 是一个ETL工具,ETL(Extract-Transform-Load,数据抽取、转换、装载);
kettle 是java编写,绿色无需安装,抽取高效稳定;
kettle 主要用来对不同数据库的数据,不同来源的数据进场处理;
kettle 提供图形化的用户界面,用来使用户使用时描述 想做什么,而不是想要怎么做;
kettle 有两种脚本文件 transformationjob;transformation 是转换,job 是对多个转换构建的整个工作流的抽象和控制;

kettle 的概念模型
请添加图片描述
执行分为两个层析:job和transformation

二、kettle 的组成

kettle 的结构由两部分组成:Spoon 和 Data Integration Server

  • Spoon:
    • 是构建ETL Jobs和Transformations的工具。
    • 是以拖拽图形化进行设计转换和作业。
    • 可以通过Spoon调用数据集成引擎或者集群;

  • Data Integration Server:
    • 是专用的ETL Server
    • 执行:执行ETL的作业和转换
    • 安全性:管理用户、角色、集成的安全性
    • 内容管理:提供一个集中的资源库。管理ETL的转换和作业。资源库包含所有内容和特质的历史版本
    • 时序安排:向spoon 提供管理Data Integration Server 上活动的时序和监控的服务

  • kettle 的核心组件
    • spoon:通过图形接口,编辑作业和转换的桌面应用
    • pan:一个独立的命令行程序,用于执行由spoon编写完成的转换和作业
    • kitchen:一个独立的命令行程序,用于执行由spoon编辑的作业
    • carte:轻量级的web容器,用于建立专用、远程的ETL Server

三、kettle 的核心概念

转换:转换是 kettle 中最基础的,主要的部分;进行抽取数据、转换数据、加载数据、输出数据等等操作;
作业:由一个或者多个 转换或者作业组成,作业运行时,按照自定义的顺序执行。
:是步骤之间的链接,定义了步骤之间的数据通路。
步骤:组成转换的基本部分,由一个或者多个步骤组成转换,步骤之间都是独立的线程,可以并发执行;


补充:
  • kettle 设计的核心概念是可视化的编程,以图形化的方式,定义复杂的ETL程序和工作流;
  • 转换包含一个或者多个步骤,这些步骤可以通过跳来连接
  • 转换里的步骤有多个,每个步骤都是独立的线程,所以一个转换里的全部步骤可以并发运行
  • 输入步骤 ——> 跳 ——> 输出步骤(表输入——>Excel输出),两个步骤同时启动运行。
  • 每个步骤都有一个名字,并且名字在这个转换范围内唯一
  • 跳定义了两个步骤之间的一个单向的通道,使得数据以数据流的形式从一个步骤流向另一个步骤。
  • 大多数的步骤都可以有一个或者多个输出跳,数据的发送可以被设置为分发和复制。分发使得输出步骤轮流接收数据。
  • 跳是两个步骤之间的传输数据的,被称之为行集的数据行缓存集,这个缓存的大小可以自定义。
    • 例如:当输入步骤是数据库,读取速度快,输出步骤是Excel,写入速度慢,这时将行数据缓存在跳(缓存集)中。
    • 当跳的行集满了,输入步骤将停止向跳写入数据,直到跳中又有了空间。
    • 当跳的行集空了,输出步骤将停止从跳读取数据,直到跳中又有了数据。
  • 数据是以行为单位,作为数据行,从一个步骤流向另一个步骤的。这个过程数据流,也叫做记录流
  • 数据行是0到多个字段的集合,用来对字段进行的描述,称之为数据行的元数据
  • 跳的行集缓存机制,与步骤的并发,允许数据以最小消耗内存的数据流的方式进行被处理。
  • 由于在一个转换内的步骤全部是并行执行的,所以转换内是没有执行顺序的。
  • 一个转换中,全部步骤里,输入跳中不再有数据,就终止这个步骤。当全部步骤终止,就终止整个转换。
  • 想使得数据在处理的过程有顺序,则将处理步骤定义在不同的转换里,再将转换连接成作业。

引用部分资料,侵权私QQ:1445319214
图片来源哔哩哔哩视屏资料PPT
CSDN:kettle知识点梳理:https://blog.csdn.net/mindn_1982/article/details/107418524
哔哩哔哩 kettle 视屏:https://www.bilibili.com/video/BV1jE411B7J8
百度百科:kettle
部分个人观点,欢迎评论指错。


http://chatgpt.dhexx.cn/article/g5ZysDtQ.shtml

相关文章

Kettle下载与安装教程【保姆版】

Kettle简介 Kettle最早是一个开源的ETL(Extract-Transform-Load的缩写)工具,全称为KDE Extraction, Transportation, Transformation and Loading Environment。后来Kettle重命名为Pentaho Data Integration 。它由Java开发,支持…

kettle基础教程-kettle9教程

kettle是啥? 一款免费开源的、功能强大的ETL工具,纯 java 开发。可以在 Linux、windows、unix 中运行。有图形界面,也有命令脚本还可以二次开发。 一.安装部署 1.JDK1.8安装及环境变量的配置 https://blog.csdn.net/weixin_39549656/artic…

kettle 简介及入门

介绍 kettle 是纯 java 开发,开源的 ETL工具,用于数据库间的数据迁移 。可以在 Linux、windows、unix 中运行。有图形界面,也有命令脚本还可以二次开发。 kettle 的官网是 https://community.hitachivantara.com/docs/DOC-1009855&#xff…

kettle 使用教程(入门)

文章目录 前言一、下载、安装二、启动软件三、转换的使用教程四、作业的使用教程总结 前言 Kettle简介:Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶&…

kettle 教程(一):简介及入门

介绍 kettle 是纯 java 开发,开源的 ETL工具,用于数据库间的数据迁移 。可以在 Linux、windows、unix 中运行。有图形界面,也有命令脚本还可以二次开发。 kettle 的官网是 https://community.hitachivantara.com/docs/DOC-1009855&#xff0…

kettle入门教程

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工…

kettle使用教程(超详细)

今天详细详细说一下kettle 的安装,安装的版本: jdk:jdk-8u152-windows--x64 kettle:KETTLE-5.4 一、环境部署 1、安装JDK,按默认值安装即可 2、设置环境变量,如图下图 具体步骤: 1.右击我的电脑-属性-高级系统设置-环境变量-系统变量-新建…

HMC5883L地磁传感器驱动

霍尼韦尔 HMC5883L 是一种表面贴装的高集成模块,并带有数字接口的弱磁传感器芯片,应用于低成本罗盘和磁场检测领域。HMC5883L 包括最先进的高分辨率 HMC118X 系列磁阻传感器,并附带霍尼韦尔专利的集成电路包括放大器、自动消磁驱动器、偏差校…

Arduino Uno + HMC5883L电子罗盘 实验

实现 HMC5883L 电子罗盘 简单的数据读取实验 实验效果 本实验&#xff0c;简单显示从HMC5883L 读取到的数据 BOM表 Arduino Uno * 1 HMC5883L&#xff08;gy-273&#xff09; * 1 跳线若干 接线图 Arduino Uno <----> HMC5883L 5v …

【模块学习】关于磁力计HMC5883L型号探索

关于磁力计HMC5883L型号探索 一&#xff0e;序言 在众多磁力计中&#xff0c;HMC5883L因为其廉价实用而受到大多数嵌入式开发小白的追捧。然而某宝上不仅仅有HMC5883L这一款&#xff0c;还有QMC5883和HMC5983&#xff0c;常有商家搞不清芯片就出售&#xff0c;导致提供的数据手…

HMC5883Lnbsp;磁力计校准

原文地址&#xff1a;HMC5883L 磁力计校准 作者&#xff1a;WalkAnt 这里针对 HMC5883L 磁力计 的校准&#xff0c;做一个简单讲解。欢迎交流&#xff0c;新浪长沙WalkAnt。 先看看这篇文章&#xff1a;http://blog.sina.com.cn/s/blog_8240cbef0101i7gn.html 如果磁力计在含有…

【51单片机快速入门指南】4.4:I2C 读取HMC5883L / QMC5883L 磁力计

目录 硬知识简介操作模式HMC5883L连续测量模式单次测量模式闲置模式 QMC5883L连续测量模式待命模式 主要差异寄存器寄存器列表HMC5883LQMC5883L 配置寄存器HMC5883L配置寄存器 A配置寄存器 B模式寄存器 QMC5883L控制寄存器1控制寄存器2SET/RESET Period Register 数据输出寄存器…

ESP32设备驱动-HMC5883L磁场传感器驱动

HMC5883L磁场传感器驱动 1、HMC5883L介绍 霍尼韦尔 HMC5883L 是一款表面贴装、多芯片模块,专为低场磁场传感而设计,具有数字接口,适用于低成本罗盘和磁力计等应用。 HMC5883L 包括我们先进的高分辨率 HMC118X 系列磁阻传感器和一个 ASIC,该 ASIC 包含放大、自动消磁带驱动…

STM32读取HMC5883L的偏航角数据

HMC5883L是一种IIC通信的电子罗盘芯片&#xff0c;输出与北的角度偏差&#xff0c;数值是0-360度&#xff0c;靠西方向增长&#xff0c;可以理解为逆时针为正。配合GPS模块简直就是四轴飞行器的铁杆标配。 5883的初始化 HMC5883L也是一个IIC器件&#xff0c;具体的操作方式和…

HMC5883L 磁力计校准

原文地址&#xff1a; http://blog.sina.com.cn/s/blog_402c071e0102v8ie.html 这里针对 HMC5883L 磁力计 的校准&#xff0c;做一个简单讲解。欢迎交流&#xff0c;新浪长沙WalkAnt。 先看看这篇文章&#xff1a;http://blog.sina.com.cn/s/blog_8240cbef0101i7gn.html 如果磁…

使用Arduino和HMC5883L磁力计的数字罗盘

原文&#xff1a;https://circuitdigest.com/microcontroller-projects/digital-compass-with-arduino-and-hmc5883l-magnetometer 使用Arduino和HMC5883L磁力计的数字罗盘 ARDUINO的 经过**阿斯温斯拉吉(Aswinth Raj)** 2018年11月6日 人脑由复杂的结构层构成&#xff0c…

地磁计HMC5883L

信方式&#xff1a;IIC 工作电压&#xff1a;2.16~3.6V 工作电流&#xff1a;100uA 罗盘航向精度&#xff1a;1~2 当达到预定的最大输出频率&#xff0c;才需要监控DRDY中断引脚 I2C接口 装置包含一个7-bits串行地址&#xff0c;并且支持标注和快速模式&#xff08;100kHZ和400…

3轴数字罗盘IC HMC5883L介绍

3轴数字罗盘IC HMC5883L简介 霍尼韦尔 HMC5883L 是一种表面贴装的高集成模块&#xff0c;并带有数字接口的弱磁传感器芯片&#xff0c;应用于低成本罗盘和磁场检测领域。HMC5883L 包括最先进的高分辨率HMC118X 系列磁阻传感器&#xff0c;并附带霍尼韦尔专利的集成电路包括放大…

HMC5883L

霍尼韦尔 HMC5883L 是一种表面贴装的高集成模块&#xff0c;并带有数字接口的弱磁传感器芯片&#xff0c;应用于低成本罗盘和磁场检测领域。HMC5883L 包括最先进的高分辨率 HMC118X 系列磁阻传感器&#xff0c;并附带霍尼韦尔专利的集成电路包括放大器、自动消磁驱动器、偏差校…

STM32模拟I2C协议获取HMC5883L电子罗盘磁角度数据 (HAL)

STM32模拟I2C协议获取HMC5883L电子罗盘磁角度数据(HAL) HMC5883L 传感器采用霍尼韦尔各向异性磁阻(AMR)技术&#xff0c;应用于罗盘和三轴磁场角度检测领域&#xff0c;常用于水平物体转动的角度识别。HMC5883L 采用I2C总线接口&#xff0c;2.16~3.6V供电范围&#xff0c;带有…