文档章节

集成Kettle须知

hengbao5
 hengbao5
发布于 2017/09/06 17:31
字数 446
阅读 231
收藏 2

第一次完成本文的时间:2017年9月6日17:32:43

[TOC]

官网

然后,你就会发现:官网上面的内容非常混乱,如果我们想搞懂kettle,我们还需要关注Pentaho的GitHub:

在这里,提供了一个叫pdi-sdk-plugins的项目,看上去好像是工具包,实际上是demo示例。有了这些前提,我们可以说一个还可以接受的学习思路……

学习思路

  1. 学习官网提供的示例。比如:Pentaho Data Integration - Java API Examples
  2. 阅读开发者帮助手册:Latest Pentaho Data Integration (aka Kettle) Documentation
  3. 逛官方的论坛:Pentaho Community Forums
  4. 从GitHub上寻找嵌入开发的蛛丝马迹。
  5. 开启谷歌之旅(国内的开发者所分享的内容大都惨不忍睹,且国内引擎搜索这样的时新的项目非常吃力,所以建议学习者可以尝试谷歌搜索)。

国内相关项目推荐(排名不分先后)

  • ukettle:非常高兴可以看到国内有人精心地基于4.4的版本进行开发嵌入到javaweb项目之中,时至2017年9月6日17:22:38,我并没有发现该项目的正常运行的方式。但是,整个项目的代码还是可以参考的,写得比较好看。
  • 傲飞商智:这是基于kettle4而制作的一个商业软件,因为开发途中的各种艰辛而打算放弃的人们可以看这里。
  • kettletest:如果你只是想体验一下调用kettle的乐趣,这个项目小巧而实用!

© 著作权归作者所有

共有 人打赏支持
hengbao5
粉丝 5
博文 119
码字总数 10770
作品 0
朝阳
程序员
Kettle 与 Talend Open Studio 的 ETL 比较

Pentaho Data Integration (Kettle)是Pentaho生态系统中默认的ETL工具。通过非常直观的图形化编辑器(Spoon),您可以定义以XML格式储存的流程。在Kettle运行过程中,这些流程会以不同的方法...

ychenETL
2011/06/13
0
0
开源ETL工具在数据集成中的应用研究

大数据环境下,ETL负责将分散的、异构数据源中的数据如关系数据、平面文件数据等集成到数据仓库或数据集市的关键步骤,是后期联机分析处理、数据挖掘的基础环节。本课题以开源的ETL软件Kettl...

freeBryant24
2014/02/12
613
0
kettle之旅--kettle的发展史简述

简述 kettle(Pentaho Data Integratio)是一套开源的ETL解决方案,诞生于2003年(完成第一个版本的开发),由比利时BI工程师Matt Casters(马特.卡斯特)完成,后续被Pentaho公司收购(收购...

cimenbi
07/28
0
0
Win7下Kettle-7.0安装部署

1、Kettle概念 Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。 Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种...

zisheng_wang_data
2017/03/10
0
0
几款开源的ETL工具及ELT初探

几款开源的ETL工具及ELT初探 作者:佚名来源:开源中国|2017-02-13 21:32 ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(lo...

yuanwx0328
2017/11/15
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

使用esp8266制作wifi干扰器

概述 这个东西,说真的对现在的无线网络环境影响其实不是很大了,首先它只能玩2.4ghz的无线,其次这个模块不是特别的可靠,运行的时候温度会很高,买来玩玩还是可以的 什么是esp8266 ESP8266...

bboysoulcn
18分钟前
2
0
以太坊总结

一、概念说明 1.以太坊(Ethereum blockchain)由V神(Vitalik Buterin)发明,是一个交易记录的永久数据库,它以一个“无信任”的交易系统来运行,不需要任何第三方信任机构即可进行点对点的...

盼望明天
42分钟前
1
0
Java并发工具类——AtomicInteger

基本类型int的递增等操作并不是线程安全的,加上synchronized又会影响性能,因此在并发情况下我们应该使用AtomicInteger,下面通过一个例子验证一哈。 public class TestAtomicInteger {...

东都大狼狗
44分钟前
3
0
基于CentOS7.2系统对RabbitMQ单机版安装过程

准备虚拟机系统 我的系统如下 系统版本7.2 安装perl yum install perl 安装wget工具 yum install -y wget 安装相关依赖工具 yum install ncurses ncurses-base ncurses-devel ncurses-libs ...

凌晨一点
48分钟前
2
0
Maven常用命令

Maven常用命令 说到命令,则不得不提一下环境变量,在之前的博文中简单提了一下环境变量的配置,这里具体说一下。说完环境变量的配置,然后就是Maven的常用命令,这里说的是常用的几个命令,...

星汉
今天
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部