加载中
我手搓了个“自动生成标书”的开源大模型工具

最近我写开源商业文章明显更新少了,不是我不写文章了,而是开源商业化进展很顺利,我写文章的时间都被各种写标书占满了。作为一个开源原生的商业公司,白鲸开源公司的员工几乎都是程序员,而...

首个国人主导的数据集成项目 SeaTunnel 从 Apache 基金会正式毕业!

北京时间 2023 年 6 月 1 日,全球最大的开源软件基金会 Apache Software Foundation(以下简称 ASF)正式宣布 Apache SeaTunnel 毕业成为 Apache 顶级项目(TLP, Top Level Project)。这是首...

数据同步工具调研选型:SeaTunnel 与 DataX 、Sqoop、Flume、Flink CDC 对比

产品概述 Apache SeaTunnel 是一个非常易用的超高性能分布式数据集成产品,支持海量数据的离线及实时同步。每天可稳定高效同步万亿级数据,已应用于数百家企业生产,也是首个由国人主导贡献到...

从架构原理到落地实践:Apache SeaTunnel×Cloudberry数据集成全解读

在数据驱动的数字时代,企业正面临前所未有的数据增长与系统复杂性。数据分布在不同系统、格式与平台中,导致“信息孤岛”问题日益严重。打破这些孤岛,实现数据的高效整合与共享,成为推动企...

可视化任务编排&拖拉拽 | Scaleph 基于 Apache SeaTunnel的数据集成

这次在 6月 Meetup 为大家带来的是Scaleph 基于 Apache SeaTunnel (Incubating) 的数据集成介绍,希望你有所收获。 本次演讲主要包括五个部分: 关于Scaleph Scaleph架构&功能简介 SeaTunne...

解读重要功能特性:新手入门 Apache SeaTunnel CDC

引言 点亮 ⭐️ Star · 照亮开源之路 https://github.com/apache/incubator-seatunnel 为什么说 CDC 是SeaTunnel平台中的一个重要功能特性?今天这篇文章跟大家分享一下 CDC 是什么?目前市...

ELT已死,EtLT才是现代数据处理架构的终点!

提到数据处理,经常有人把它简称为“ETL”。但仔细说来,数据处理经历了ETL、ELT、XX ETL(例如,Reverse ETL、Zero-ETL)到现在流行的EtLT架构几次更迭。目前大家使用大数据Hadoop时代,主要...

SeaTunnel二次开发进阶:企业级复杂场景下的亿万级数据处理与智能容错机制

作者:史德昇 随着数据来源的不断复杂化及业务需求的快速演进,通用的数据集成框架在实际落地过程中往往面临诸多挑战:数据结构不规范、字段缺失、敏感信息混杂、数据语义不清等问题频繁出现...

万字长文 | Apache SeaTunnel 分离集群模式部署 K8s 集群实践

文章作者:雷宝鑫 整理排版:白鲸开源 曾辉 Apache SeaTunnel官网链接: https://seatunnel.apache.org/ Apache SeaTunnel(以下简称SeaTunnel)是一款新一代高性能、分布式的数据集成同步工具...

大模型时代的程序员:不会用AIGC编程,未来5年将被淘汰?

作者 | 郭炜 策划 | 凌敏 前言 下面是一段利用 Co-Pilot 辅助开发的小视频,这是 Apache SeaTunnel 开发者日常开发流程中的一小部分。如果你还没有用过 Co-Pilot、ChatGPT 或者私有化大模型帮...

DeepSeek R1的崛起已经势不可挡,而开源商业化在中国到底行不行?

缘起及背景 在科技行业蓬勃发展的浪潮中,开源商业化宛如一颗闪耀却又充满争议的新星,备受瞩目。开源商业化在中国到底行不行? 这是一个不仅被开源圈讨论了很久的话题,也是被行业讨论了很多...

全面解析 SeaTunnel API 源码:从入门到精通数据集成

引言 随着大数据技术的发展,数据集成和数据流处理需求日益增长。Apache SeaTunnel 作为一款开源的数据集成框架,不仅支持多种数据源和目标,还提供了灵活的 API 来满足各种复杂的业务需求。...

基于 SeaTunnel 构建 CDC 流式应用

点击蓝字 关注我们 背景 目前参与的项目属于公司里面数据量大、计算密集的一个重要业务项目,需要提供高效且准确的 OLAP 服务,并提供灵活且实时的报表。业务数据存储在 MySQL 中,数据增长多...

马蜂窝毕博:分析完这9点工作原理,我们最终选择了 Apache SeaTunnel!

点亮 ⭐️ Star · 照亮开源之路 https://github.com/apache/incubator-seatunnel 讲师简介 毕博 马蜂窝 数据工程师 在10月15日,Apache SeaTunnel& IoTDB 联合 Meetup 期间,马蜂窝网数据工...

自然语言×数据集成新范式:SeaTunnel MCP深度解读 | 附视频讲解

此前,社区推出一篇文章《Apache SeaTunnel MCP Server:让AI成为你的ETL助手》介绍了即将推出的SeaTunnel MCP Server 能力,受到了大家的热烈反响。为了让大家更加深入地了解这个项目,社区...

【异常总结】SeaTunnel集群脑裂配置优化方法

集群配置 异常问题 4月份以来,出现了3次集群脑裂现象,均为某节点脑裂/自动关闭。 核心日志如下: Master节点 出现Hazelcast监控线程打印的Slow Operation日志 Hazelcast 心跳超时60s后,会...

被热议的“DataOps”是炒作?

在数字化时代,数据已成为企业最宝贵的资产之一。随着数据量的爆炸性增长,企业面临着如何有效管理和利用这些数据的挑战。DataOps,或数据运营,应运而生,旨在解决这一挑战。 DataOps是一种...

3 分钟部署 SeaTunnel Zeta 单节点 Standalone 模式环境

部署环境(MacOS/Linux) 1.安装JDK环境 目前SeaTunnel支持运行在JDK8及以上的环境。用户需要自行安装JDK环境。 2.下载安装包 目前SeaTunnel的最新版本是2.3.1版本。这里我们安装部署2.3.1版...

Apache SeaTunnel Web 功能正式发布!

Apache SeaTunnel Web 功能正式发布! 在大数据技术的不断进步之下,Apache SeaTunnel 成为了众多开发者和企业关注的焦点。今天,我们很高兴地宣布:Apache SeaTunnel Web功能已正式发布,带...

Apache SeaTunnel 及 Web 功能部署指南(小白版)

在大数据处理领域,Apache SeaTunnel 已成为一款备受青睐的开源数据集成平台,它不仅可以基于Apache Spark和Flink,而且还有社区单独开发专属数据集成的Zeta引擎,提供了强大的数据处理能力。...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部