备忘录

Kettle学习笔记

2021-04-30 · 2 min read

Kettle目录文件

  • classes:生命周期监听、注册表扩展、日志的配置文件
  • Data Integration.app:数据集成应用
  • Data Service JDBC Driver:JDBC驱动程序的数据服务docs:文档
  • launcher:Kettle的启动配置
  • lib:支持库jar包
  • libswt: Kettle图形库jar
  • plugins:插件
  • pwd:kettle集群配置文件
  • samples:自带例子
  • simple-jndi:jndi连接配置
  • system:系统目录
  • ui:软件界面
  • Carte:启动集群命令(可以启动对应远程服务器)
  • Encr:kettle提供的加密算法
  • lmport:导入命令
  • Kitchen:运行Job的命令
  • Pan:运行转换的命令
  • purge-utility:清空资料库文件
  • runSamples:运行sample文件夹里面的文件
  • set-pentaho-env:设置环境变量脚本
  • Spoon:启动KettleUI界面
  • SpoonConsole/SpoonDebug:这二个spoon运行时候会打印对应的信息或者日志

Kettle核心组件

  • Spoon:通过图形接口,用于编辑作业和转换的桌面应用。
  • Pan:一个独立的命令行程序,用于执行由Spoon编辑的转换和作业。
  • Kitchen:一个独立的命令行程序,用于执行由Spoon编辑的作业。
  • carte:一个轻量级的Web容器,用于建立专用、远程的ETL Server。

Kettle模型概念
分为Job和transformation