加载中
轻松搞定平稳运行,数据库平台 DBStack 帮助 DBA 运维不同基础设施上的各类数据库

为了满足不同类型业务的需求,企业的 IT 系统中往往会同时部署多种类型的数据,并运行着数量庞大的数据库实例。 同时,由于业务出海或者高可用的需要,这些数据库将被同时部署于不同品牌的云...

基于PP-ShiTuv2新增PaddleX图像识别模型产线,显著提升商品识别等细粒度开放域产业场景检索性能

01 背景介绍 图像识别一直都是计算机视觉领域最基础的任务,也是生活中最为广泛应用的技术,从自动化身份核验中的人脸识别,到无人零售中的商品识别,其背后均有图像识别技术的应用,然而想要...

基于GPU的ANN检索

导读 近似最近邻(ANN)向量检索的CPU方案已被广泛地应用于在线检索等多种场景中并取得了不错的效果。GPU相比CPU拥有更强大的并行计算能力,如何将GPU引入ANN检索获取更大收益,成为了业界重...

维度爆炸背景下uv计算在Feed业务的高效实践

导读 本文介绍了优化大数据计算中多维度用户数统计的方法,通过数据打标的方式避免数据膨胀,提高性能并减少计算成本。首先分析了大数据计算中遇到的多维度数据统计问题,然后提出了利用数据...

数据湖系列之四 | 数据湖存储加速方案的发展和对比分析

本文按照数据湖存储加速方案的不同发展阶段铺开,比较了各类方案之间的异同,并深度剖析了这类方案的技术本质。 我们期望本文能够帮助读者对大数据和 AI 场景下的「数据湖存储加速」这个主题...

大模型时代,云原生数据底座的创新和实践

大模型毫无疑问是当前技术发展的热点,成为大家默认的提升生产力工具。 但是,大模型训练主要使用互联网上的公开数据为主,没有企业内部的数据,所以大模型本质上自带的都是一些通用智能。 ...

百度沧海·存储统一技术底座架构演进

随着 AI 时代的快速发展,对存储技术提出了更高的要求,尤其是在大规模、高性能和低成本方面。为了应对这些挑战,百度沧海·存储打造了一个高度可复用的统一技术底座。我们在这个统一的技术底...

计算不停歇,百度沧海数据湖存储加速方案 2.0 设计和实践

数据湖这个概念,从 2012 年产生到现在已经有十余年的时间,每家公司对它内涵的解读都不太一样。但是数据湖的主要存储底座有从传统的 HDFS 向对象存储演进的趋势。 传统的大数据计算场景,比...

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部