加载中
Flink教程(三)——基本API定义

Flink程序是实现分布式集合上的转换的通用程序(比如这几个函数,filtering,mapping,updating state, joining,grouping,defining windows,aggregating)。集合是数据源初始化时创建的(比如,...

Flink教程(二)——事件时间

事件时间/处理时间/摄入时间 Flink支持流程序中的不同的时间通知。 处理时间:处理时间是指执行操作的机器系统时间。 当流程序运行在处理时间上时,所有的和时间相关的操作(比如时间窗口)...

在大型集群中数据丢失的可能性

许多分布式的存储系统(比如Cassandra,Riak,HDFS,MongoDB,Kafka等)使用复制来保证数据的持久性。一般的,他们都是建立在JBOD(Just a Bunch of Disks)的配置之上——也就是说,没有使用...

Hadoop:它是什么?它怎样工作?以及它可以做什么?

Cloudera CEO迈克奥尔森在讲述Hadoop架构和它的数据应用时提出 原文出自詹姆斯滕纳尔

Flink VS Spark

这个世界需要其他的大数据处理系统吗?当我第一次听说Apache Flink时冒出来的想法。在大数据领域我们缺少足够的框架。但是我们确实缺少能够解决我们不同的数据处理需求的聚合平台。Apache sp...

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部