文档章节

集成Kettle须知

hengbao5
 hengbao5
发布于 2017/09/06 17:31
字数 446
阅读 275
收藏 2

第一次完成本文的时间:2017年9月6日17:32:43

[TOC]

官网

然后,你就会发现:官网上面的内容非常混乱,如果我们想搞懂kettle,我们还需要关注Pentaho的GitHub:

在这里,提供了一个叫pdi-sdk-plugins的项目,看上去好像是工具包,实际上是demo示例。有了这些前提,我们可以说一个还可以接受的学习思路……

学习思路

  1. 学习官网提供的示例。比如:Pentaho Data Integration - Java API Examples
  2. 阅读开发者帮助手册:Latest Pentaho Data Integration (aka Kettle) Documentation
  3. 逛官方的论坛:Pentaho Community Forums
  4. 从GitHub上寻找嵌入开发的蛛丝马迹。
  5. 开启谷歌之旅(国内的开发者所分享的内容大都惨不忍睹,且国内引擎搜索这样的时新的项目非常吃力,所以建议学习者可以尝试谷歌搜索)。

国内相关项目推荐(排名不分先后)

  • ukettle:非常高兴可以看到国内有人精心地基于4.4的版本进行开发嵌入到javaweb项目之中,时至2017年9月6日17:22:38,我并没有发现该项目的正常运行的方式。但是,整个项目的代码还是可以参考的,写得比较好看。
  • 傲飞商智:这是基于kettle4而制作的一个商业软件,因为开发途中的各种艰辛而打算放弃的人们可以看这里。
  • kettletest:如果你只是想体验一下调用kettle的乐趣,这个项目小巧而实用!

© 著作权归作者所有

共有 人打赏支持
hengbao5
粉丝 6
博文 142
码字总数 15284
作品 0
朝阳
程序员
私信 提问
Kettle 与 Talend Open Studio 的 ETL 比较

Pentaho Data Integration (Kettle)是Pentaho生态系统中默认的ETL工具。通过非常直观的图形化编辑器(Spoon),您可以定义以XML格式储存的流程。在Kettle运行过程中,这些流程会以不同的方法...

ychenETL
2011/06/13
0
0
开源ETL工具在数据集成中的应用研究

大数据环境下,ETL负责将分散的、异构数据源中的数据如关系数据、平面文件数据等集成到数据仓库或数据集市的关键步骤,是后期联机分析处理、数据挖掘的基础环节。本课题以开源的ETL软件Kettl...

freeBryant24
2014/02/12
613
0
Win7下Kettle-7.0安装部署

1、Kettle概念 Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。 Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种...

zisheng_wang_data
2017/03/10
0
0
Kettle 调用方式

在使用Kettle执行Job或者转换的时候有多种方式,例如: 一:通过命令行来执行 kitchen.sh来执行指定的Job,例如: 通过"Pan.bat"来执行指定的转换,例如: 二:通过Java API 接口在代码中执行...

mybabe0312
2017/04/06
0
0
Kettle 6.x 源码开发环境搭建

1、引言 Data Integration - Kettle 作为免费开源的ETL工具,可以通过其桌面程序进行ETL步骤的开发并执行。kettle以插件形式来实现每个转换步骤的工作,发行版中已经提供了常用的转换清洗插件...

空山苦水禅人
2016/11/02
2.9K
6

没有更多内容

加载失败,请刷新页面

加载更多

SpringBoot源码:启动过程分析(二)

接着上篇继续分析 SpringBoot 的启动过程。 SpringBoot的版本为:2.1.0 release,最新版本。 一.时序图 一样的,我们先把时序图贴上来,方便理解: 二.源码分析 回顾一下,前面我们分析到了下...

Jacktanger
昨天
0
0
Apache防盗链配置,Directory访问控制,FilesMatch进行访问控制

防盗链配置 通过限制referer来实现防盗链的功能 配置前,使用curl -e 指定referer [root@test-a test-webroot]# curl -e "http://www.test.com/1.html" -x127.0.0.1:80 "www.test.com/1.jpg......

野雪球
昨天
2
0
RxJava threading

因为Rx针对异步系统设计,并且Rx也自然支持多线程,所以新的Rx开发人员有时会假设Rx默认是多线程的。在其他任何事情之前,重要的是澄清Rx默认是单线程的。 除非另有说明,否则每次调用onNex...

woshixin
昨天
0
0
Python的安装及文件类型、变量

一、为什么学习python 服务于大数据、人工智能、自动化运维。 简单易学 代码简洁 薪资高 近几年越来越火 二、Python的安装 linux 系统默认安装, CentOS7 默认安装了python2.7 安装ipython y...

枫叶云
昨天
1
0
JeeSite 4.x 树形结构的表设计和用法

有些同仁对于 JeeSite 4 中的树表设计不太了解,本应简单的方法就可实现,却写了很多复杂的语句和代码,所以有了这篇文章。 在 JeeSite 4 中的树表设计我还是相对满意的,这种设计比较容易理...

ThinkGem
昨天
28
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部