有关Data Integration

原创
2017/02/19 23:38
阅读数 42

    

 

 

         

    DI:Data Integration,数据整合DI社区对它的定义是:Data integration involves combining data from several disparate sources, which are stored using various technologies and provide a unified view of the data.大体意思为:数据整合包含:从不同的数据源(这些数据可以使被各式各样的技术存储)获取数据将其结合到一起,并形成统一的数据视图。

   BI:Business Intelligence,商业智能定义为:Business Intelligence (BI) is a set of tools supporting the transformation of raw data into useful information which can support decision making.大体意思为:商业智能是一套支持将原始数据转换为有用信息的一套工具,可以帮助人们做出(商业)决定。

    ETL:Extract-Transform-Load,抽取-转换-加载ETL comes from Data Warehousing and stands for Extract-Transform-Load. ETL covers a process of how the data are loaded from the source system to the data warehouse. 大体意思为:ETL来自数据仓库,代表着抽取-转换-加载,包含着数据从从源系统到数据仓库的一套加载流程。

    MDM:Master Data Management. 主数据管理Master Data Management (MDM) represents a set of tools and processes used by an enterprise to consistently manage their non-transactional data.主数据管理是企业用于管理他们非事务型数据的一套工具和流程。

    对于DI,常用工具,Kettle(有工具包和源码两种),工具包:data-integration6.1,直接打开桌面工具,就像一个桌面客户端。源码:  pentaho-kettle-7.0.0.0-R,可以用于编译。

    对于BI,常用工具是pentaho-server,这是一个自带Tomcat的web项目,需要在浏览器中访问,进去之后我们会发现这里面就是一些报表类型的东西,现在对我来说还看不是很懂,希望继续学习能把他弄懂。

    对于ETL,ETL工具不少,主要分收费和开源两派,

    收费派有: Ab InitioIBM InfoSphere DataStageInformaticaOracle Data Integrator and SAP Data Integrator.

    开源派有:ApatarCloverETLPentaho and Talend.

    在我们老师的带领下,选择的是Pentaho。现在还不清楚更多的,希望继续加油!

    

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部