Fluid 携手 Vineyard,打造 Kubernetes 上的高效中间数据管理

作者:曹野 车漾 背景介绍和面临的挑战 随着 Kubernetes 在 AI/大数据领域的普及和业务场景变得越来越复杂,数据科学家在研发效率和运行效率上遇到了新的挑战。当下的应用,往往需要使用端到...

今天 11:50
11
0
2024 最热门开源 GitOps 工具盘点

GitOps 是一种侧重于自动化、协作和持续交付的基础设施管理现代方法。它的核心理念是将 Git 作为配置和代码的唯一真理源。在 GitOps 实践中,对基础设施的任何更改都必须通过 Pull Request(...

今天 11:22
7
0
探究网络延迟对事务的影响

1.背景概述 最近在做数据同步测试,需要通过DTS将kafka中的数据同步到数据库中,4G的数据量同步到数据库用了大约4个多小时,这看起来并不合理;此时查看数据库所在主机的CPU,IO的使用率都不...

今天 09:26
34
0
Apache Doris 支持 Arrow Flight SQL 协议,数据传输效率实现百倍飞跃

近年来,随着数据科学、数据湖分析等场景的兴起,对数据读取和传输速度提出更高的要求。而 JDBC/ODBC 作为与数据库交互的主流标准,在应对大规模数据读取和传输时显得力不从心,无法满足高性...

昨天 18:33
60
0
一口气搞懂分库分表 12 种分片算法,大厂都在用

大家好,我是小富~ 前言 本文是《ShardingSphere5.x分库分表原理与实战》系列的第五篇文章,我们一起梳理下ShardingSphere框架中的核心部分分片策略和分片算法,其内部针为我们提供了多种分...

昨天 18:28
436
0
PolarDB-X 最佳实践:如何设计一张订单表

本文主要内容是如何使用全局索引与CO_HASH分区算法(CO_HASH),实现高效的多维度查询。 1. 淘宝订单号中的秘密 有一个很有趣的事情。 打开你的淘宝客户端或者PC端的淘宝,点开订单列表,打开...

昨天 14:27
69
0
知识图谱推理算法综述(上):基于距离和图传播的模型

背景 知识图谱系统的建设需要工程和算法的紧密配合,在工程层面,去年蚂蚁集团联合OpenKG开放知识图谱社区,共同发布了工业级知识图谱语义标准OpenSPG并开源;算法层面,蚂蚁从知识融合,知识...

昨天 14:26
259
0
一文带你完整了解Go语言IO基础库

作者 | 百度小程序团队 导读 introduction 对于刚接触Golang学习的同学,估计比较难掌握的知识点之一就是文件IO处理,光在基础库里会发现 golang除了io包提供文件处理外,os包,http包,emb...

昨天 14:05
51
0
无人不识又无人不迷糊的this

本文分享自华为云社区《3月阅读周·你不知道的JavaScript | 无人不识又无人不迷糊的this》,作者: 叶一一。 关于this this关键字是JavaScript中最复杂的机制之一。它是一个很特别的关键字,...

昨天 11:23
132
0
GaussDB SQL调优:建立合适的索引

背景 GaussDB是华为公司倾力打造的自研企业级分布式关系型数据库,该产品具备企业级复杂事务混合负载能力,同时支持优异的分布式事务,同城跨AZ部署,数据0丢失,支持1000+扩展能力,PB级海量...

昨天 09:50
227
0
【干货】Apache DolphinScheduler2.0升级3.0版本方案

升级背景 因项目需要使用数据质量模块功能,可以为数仓提供良好的数据质量监控功能。故要对已有2.0版本升级到3.0版本以上,此次选择测试了3.0.1 和 3.1.1 两个版本,对进行同数据等任务调度暂...

昨天 09:29
44
0
分布式数据库技术的演进和发展方向

这些年大家都在谈分布式数据库,各大企业也纷纷开始做数据库的分布式改造。那么,所谓的分布式数据库到底是什么?采用什么架构?优势在哪?为什么越来越多企业选择它?分布式数据库技术会向什...

昨天 09:26
487
0
替代 Redis 的开源项目「GitHub 热点速览」

近日,知名开源项目 Redis 宣布修改开源协议,从原来的「BSD 3-Clause 开源协议」改成「RSALv2 和 SSPLv1 双重许可证」。新的许可证主要是限制托管 Redis 产品的云服务商,比如 Redis 云数据...

昨天 09:09
154
0
再聊SPI机制

前言 去年更新了一系列和SPI相关的内容,最近因为业务需要,我又基于业务场景,实现了一版。对于什么是spi,很久之前有写过一篇文章,java之spi机制简介感兴趣的朋友可以蛮看一下 需求分析 ...

昨天 09:08
466
0
用three.js做一个3D汉诺塔游戏(上)

本文由孟智强同学原创,主要介绍了如何利用 three.js 开发 3D 应用,涵盖 3D 场景搭建、透视相机、几何体、材质、光源、3D 坐标计算、补间动画以及物体交互实现等知识点。 入门 three.js 也有...

前天 17:15
161
0
Paper Digest|基于在线聚类的自监督自蒸馏序列推荐模型

论文标题:Leave No One Behind: Online Self-Supervised Self-Distillation for Sequential Recommendation 作者姓名:韦绍玮、吴郑伟、李欣、吴沁桐、张志强、周俊、顾立宏、顾进杰 组织单...

前天 15:18
431
1
【官宣】2024 DTC数据技术嘉年华全议程发布:汇聚行业精英,共襄年度盛宴

龙腾四海内,风云际会时。由墨天轮数据社区和中国数据库联盟(ACDU)主办的第十三届数据技术嘉年华 将于2024年4月12日至13日在北京新云南皇冠假日酒店盛大召开。本次大会的主题是“智能·云原...

前天 11:48
364
0
工具分享丨分析GreatSQL Binglog神器

在GreatSQL中,Binlog可以说是 GreatSQL 中比较重要的日志了,在日常开发及运维过程中经常会遇到。Binlog即Binary Log,二进制日志文件,也叫作变更日志(Update Log)。 详细Binglog日志介绍...

前天 10:31
167
0
四高内核底座+两大架构创新,看 openGauss 如何创数据库新未来

3 月 16 日,北京站 · 第101期 OSC 源创会在北京圆满举办。本期源创会以“数据库,2024 开炫”为主题,汇聚 openGauss、TDengine、Apache Doris、MatrixOne、Apache IoTDB 五大数据库。会上...

03/22 18:09
3.2K
0
Elasticsearch:块大小如何影响语义检索结果

在自然语言处理和人工智能领域,分块(chunking)是一项至关重要的技术,它将大块文本分解成更小、更易于管理的片段。 在使用大型语言模型 (LLM) 和语义检索系统时,此过程尤其重要,因为它直...

03/22 16:54
718
0
返回顶部
顶部