spoon入门教程

article/2025/10/14 5:50:28

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

kettle的最新下载地址:http://jaist.dl.sourceforge.net/project/pentaho/Data%20Integration/6.0/pdi-ce-6.0.1.0-386.zip

  1. 此软件运行需要JDK环境,所以电脑没装JDK的话,先下载安装。
  2. Kettle解压到英文路径的文件夹中就可以了,不需要安装。
  3. 点击data-integration文件夹中的Spoon.bat就能打开了。


下面是图文教程:

进入解压的目录,找到Spoon.bat,先别着急双击打开,如果你本机的数据库是oracle,就先把oracle的驱动放进spoon解压目录的lib目录下;如果本机装的是mysql数据库,同理把mysql的驱动放到lib目录下,然后再启动spoon。否则当你启动的时候会报如下错误

Driver class 'oracle.jdbc.driver.OracleDriver' could not be found, make sure the 'Oracle' driver (jar file) is installed.
oracle.jdbc.driver.OracleDriver

这里写图片描述

这里写图片描述 

打开spoon后点击左上角的主对象树,右键DB连接新建。

这里写图片描述 

 输入数据库连接信息

这里写图片描述

输入完成后先点击测试一下,看看连接是否正常。

这里写图片描述 

下面开始新建转换。

这里写图片描述 

点开左侧栏的输入,找到表输入,并用鼠标把表输入拖向右边空白区域。

这里写图片描述 

这里写图片描述 

双击拖进来的表输入,编辑表输入里面的信息。

这里写图片描述 

点开左侧栏的输出,找到插入/更新,并用鼠标把插入/更新拖向右边空白区域。

这里写图片描述 

摁住shift键不放,鼠标点击表输入,然后拖向旁边的插入/更新,这样就把两个动作连接起来了。

这里写图片描述 

双击插入/更新,编辑插入/更新里面的信息。最后把该转换保存,这里保存成test.ktr。

这里写图片描述 

接下来开始创建作业

这里写图片描述 

创建作业和创建转换操作都差不多。

这里写图片描述 

双击START,对START进行编辑,可以让作业按每天、每周、每月定时调用。

这里写图片描述 

双击装换进行编辑,找到前面保存的test.ktr 转换文件。

这里写图片描述 

到这一步就可以开始点击运行了

这里写图片描述 

下图是运行结果

这里写图片描述 

tb_user是源表

这里写图片描述 

tb_user2是目标表,没运行作业前它是没有数据的。

这里写图片描述 

运行作业后,数据成功导入到tb_user2表里。

这里写图片描述 

根据上面的教程,可以尝试着把oracle数据库中的表的数据插入到mysql等其它数据库中的表里面去。 


http://chatgpt.dhexx.cn/article/3O5Dg8xe.shtml

相关文章

Spoon工具使用(kettle进行实时同步数据)

文章目录 Spoon工具使用(kettle进行实时同步数据)安装相关概念转换DB连接步骤和节点连接 作业DB连接作业项目 Spoon工具使用(kettle进行实时同步数据) 安装 解压完Spoon安装包后,双击.bat文件打开 相关概念 转换…

Kettle Spoon入门教程

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。其中,Spoon是Kettle中的一个组件,其他组件有PAN,CHEF,Encr和KITCHEN等。 Spoon通过图形化的页…

nethogs查看每个进程流量

sudo nethogs 找到每个进程消耗流量的pid 通过ps -ef | grep pid 来查看对应的任务。 再如: datanode带宽打满,会导致dn写数据非常慢 参考链接:每天学习一个命令:使用 nethogs 查看每个进程流量

NetHogs下载和监控

转自:http://blog.csdn.net/testcs_dn/article/details/40506225 CentOS6.5下使用NetHogs监控进程网络使用情况 分类: CentOS2014-10-27 13:54 5789人阅读 评论(3) 收藏 举报 目录(?)[] Nethogs 是一个终端下的网络流量监控工具,它的特别之处…

Centos7 部署 Nethogs

可用来按进程或程序实时统计网络带宽使用率 安装依赖包 yum install libpcap libpcap-devel epel-release -y 安装epel源 yum install epel-release -y 安装Nethogs yum install nethogs -y 运行测试 查看版本 nethogs -V version 0.8.5 直接执行nethogs界面如下 监控…

linux 查看使用网络的程序,linux下nethogs查看各程序的网络占用量

一、概述 inux下的流量查看工具很多,如:iptraf、nload、ifstat、sar等。当然每个工具都有各自的优势。不过以上所有工具有没一款都针对服务进程所占用的流量的具体情况给出结果。(我是不知道,如果有以上工具有这方面的功能,麻烦一…

nethogs-iftop等网络监控软件---Linux

一、Linux系统 1、nethogs 1)centos7.1下nethogs安装方法 (1)先安装epel,使用的命令是:rpm -Uvh https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm (2)yum install net…

CentOS下使用NetHogs监控进程网络使用情况

Nethogs 是一个终端下的网络流量监控工具,它的特别之处在于可以显示每个进程的带宽占用情况,这样可以更直观获取网络使用情况。它支持 IPv4 和 IPv6 协议、支持本地网卡及 PPP 链接。 下载: 从Github上下载nethogs-0.8.1.tar.gz 使用wget下…

nethogs命令

性能监测与优化 《Linux就该这么学》是一本基于最新Linux系统编写的入门必读书籍,内容面向零基础读者,由浅入深渐进式教学,销量保持国内第一,年销售量预期超过10万本。点此免费在线阅读。 有很多适用于Linux系统的开源网络监视工…

Linux学习准备,nethogs,htop,nmon,dstat用法

Nethogs用法: 在基于RedHat系统下键入如下命令启动NetHogs工具. # nethogs 要执行NetHogs你必须拥有root权限,即如图所示用sudo命令 $ sudo nethogs 以下就是NetHogs命令行的参数,用’-d’来添加刷新频率参数,device name 用来检测给定的某个或者某些设备的带宽(默认…

nethogs和nload流量监控工具

nethogs和nload流量监控工具 nethogs流量监控工具NetHogs安装NetHogs命令参数 nload流量监控工具nload安装内容解释:参数:实例: nethogs流量监控工具 工具存在部分局限性,如果网卡存在大量网络连接会导致nethogs卡死 NetHogs安装 …

redhad安装nethogs

工作需要监控linux下的进程宽带占有量,从网上找了资料,很多不能成功,现在整理一下 安装 Debian/Ubuntu下安装很简单,执行:apt-get install nethogs 就可以安装。 CentOS/RHEL下建议先安装EPEL,再执行&…

nethogs安装部署

Ubuntu安装部署 apt-get -y install ncurses* apt-get -y install libpcap-dev libncurses5-dev wget -c https://github.com/raboof/nethogs/archive/v0.8.1.tar.gz tar xvf v0.8.1.tar.gz cd nethogs-0.8.1 make && make install centos安装部署 wget https://gi…

nethogs

下载地址:https://github.com/raboof/nethogs/releases 安装基础包 Debian/Ubuntu apt-get install build-essential libncurses5-dev libpcap-devYum-based distros yum install gcc-c libpcap-devel.x86_64 libpcap.x86_64 "ncurses*"Getting the so…

Linux系统调优详解(七)——网络状态查看命令nethogs

今天继续给大家介绍Linux运维相关知识,本文主要内容是网络状态查看命令nethogs。 一、nethogs命令安装 nethogs工具可以帮助我们很方便的查看当前系统中的进程使用网络的情况,这有助于我们找到当前系统中的网络瓶颈。nethogs命令需要首先安装&#xff…

【超详细】Linux系统之nethogs命令

1.简介 NetHogs是一个小型的net top工具,不像大多数工具那样拖慢每个协议或者是每个子网的速度而是依照进程进行带宽分组。 NetHogs不需要依赖载入某个特殊的内核模块。 假如发生了网络堵塞你能够使用NetHogs立即看到哪个PID形成的这种情况。 这样就很容易找出哪…

Linux工具之nethogs命令

一、nethogs命令简介 NetHogs是一个小型的net top工具,不像大多数工具那样拖慢每个协议或者是每个子网的速度而是按照进程进行带宽分组。NetHogs不需要依赖载入某个特殊的内核模块。如果发生了网络阻塞你可以启动NetHogs立即看到哪个PID造成的这种状况。这样就很容易…

(嵌入式系统开发)stm32串口通信与RS-232

本篇主要叙述串口协议和RS-232标准,以及RS232电平与TTL电平的区别;了解"USB/TTL转232"模块(以CH340芯片模块为例)的工作原理。 目录 一、串口协议与RS-232标准 1.串口通信协议 2. RS-232标准 1. RS232电平与TTL电平…

STM32与K210串口通信

目录 1.前言 2.接线部分 3.代码部分 1.k210部分 1.调用自带的库文件 2.将I/O18设置为UART1_TX功能并设置串口 3.数据发送函数 4.主函数 4.程序现象 2.STM32部分 1主函数 2.串口接收程序 3.程序现象 4.完整代码 5.总结 1.前言 这篇文章是为了填上一篇k210的简单PID…

八、STM32串口通信

目录 一、串口通信 1.1串口通信物理层 1.2USB转串口模块 1.3串口通信的其他应用 1.4串口数据包的基本组成 二、串口的结构体与函数讲解 2.1串口讲解 2.2结构体讲解 2.3串口初始化函数讲解 三、串口发送字符 3.1如何配置串口的发送 3.2项目实战 四、串口的中断接收 …