加载中
Kube Queue:Kubernetes 任务排队的利器

批处理作业(Batch Job)常应用于数据处理、仿真计算、科学计算和人工智能等领域,主要用于执行一次数据处理或模型训练任务。由于这类任务往往需要消耗大量计算资源,因此必须根据任务的优先...

云原生网关哪家强:Sealos 网关血泪史

Sealos 公有云(https://cloud.sealos.io)几乎打爆了市面上所有主流的开源网关,本文可以给大家很好的避坑,在网关选型方面做一些参考。 Sealos Cloud 的复杂场景 Sealos 公有云上线以来,用...

Koordinator v1.4 正式发布!为用户带来更多的计算负载类型和更灵活的资源管理机制

背景 Koordinator 作为一个积极发展的开源项目,自 2022 年 4 月发布 v0.1.0 版本以来,经历了多次迭代,持续为 Kubernetes 生态系统带来创新和增强。项目的核心是提供混部工作负载编排、混部...

百万并发,API 网关抗住了亚运会流量高峰

1.背景 2023 年杭州亚运会给大家留下了美好的回忆,当时各种线上线下的活动和赛事也将如火如荼地展开,与亚运会相关的应用和服务迎来流量高峰。作为亚运会所有核心流量的入口,阿里云 API 网...

大语言模型推理提速,TensorRT-LLM 高性能推理实践

1.TensorRT-LLM 如何提升 LLM 模型推理效率 大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型。底层转换器是一组神经网络,这些神经网络由具有 self...

秒级弹性!探索弹性调度与虚拟节点如何迅速响应瞬时算力需求?

前言 在前面的文章《弹性调度助力企业灵活应对业务变化,高效管理云上资源》中,我们介绍了阿里云容器服务 ACK 弹性调度为了帮助客户解决在使用云上弹性资源时,面对的“难以差异化控制业务资...

解读 EventBridge Transform,数据转换和处理的灵活能力

阿里云 EventBridge 提供了强大而灵活的事件总线服务,它可以连接应用程序、阿里云云服务和阿里云 Serverless 服务来快速构建 EDA(Event-driven Architectures)事件驱动架构,驱动应用与应...

从 13 个企业关心的问题看懂用云范式的改变

今天,容器和 K8s 已经成为应用研发运维的新标准,行业调研数据显示,2022 年有 64% 的最终用户在生产环境中使用了 K8s;2022 年托管在云上的 K8s 集群增速达到了 127%。我们也看到云托管的 ...

Sentinel 新版本发布,提升配置灵活性以及可观测配套

基本介绍 Sentinel 是阿里巴巴集团开源的,面向分布式、多语言异构化服务架构的流量治理组件,承接了阿里巴巴近 15 年的双十一大促流量的核心场景,例如秒杀、冷启动、消息削峰填谷、集群流量...

成本更低、更可控,云原生可观测新计费模式正式上线

在上云开始使用云产品过程中,企业一定遇见过两件“讨厌”事: 难以理解的复杂计费逻辑,时常冒出“这也能收费”的感叹; 某个配置参数调节之后,云产品使用成本不可预估的暴涨。 可观测作为...

进击的 Serverless:Java 应用如何从容地面对突增流量

让我们从一个十分常见的业务场景说起。 移动互联网时代,许许多多的业务都有着流量的周期性变化,无论是直播、游戏、点单系统、电商平台等等,都会存在着流量的高峰与波谷。如果采用固定的计...

走出大模型部署新手村!小明这样用魔搭×函数计算

前文介绍了魔搭 ModelScope 社区模型服务 SwingDeploy 服务。开发者可以将模型从魔搭社区的模型库一键部署至阿里云函数计算,当选择模型并部署时,系统会选择对应的机器配置。按需使用可以在...

基于 Megatron-Core 的稀疏大模型训练工具:阿里云MoE大模型最佳实践

概述 随着大模型技术的不断发展,模型结构和参数量级快速演化。大模型技术的应用层出不穷。大模型展现惊人效果,但训练和推理成本高,一直是巨大挑战。模型稀疏化能降低计算和存储消耗。近期...

十年后数据库还是不敢拥抱NUMA - 续篇

背景 十年后数据库还是不敢拥抱NUMA, 这篇经典的纠正大家对NUMA 认知的文章一晃发布快3年了,这篇文章的核心结论是: 之所以有不同的NUMA Node 是不同的CPU Core 到不同的内存距离远近不一样...

PolarDB-X 最佳实践系列(四):如何设计一张订单表

本文主要内容是如何使用全局索引与CO_HASH分区算法(CO_HASH),实现高效的多维度查询。 淘宝订单号中的秘密 有一个很有趣的事情。 打开你的淘宝客户端或者PC端的淘宝,点开订单列表,打开几...

云原生离线工作流编排利器 - 分布式工作流 Argo 集群

在现代的软件开发和数据处理领域,批处理作业(Batch)扮演着重要的角色。它们通常用于数据处理,仿真计算,科学计算等领域,往往需要大规模的计算资源。随着云计算的兴起,阿里云批量计算和...

Consul 留给你的时间不多了

HashiCorp BSL license 变更 在今年的 8 月份 HashiCorp 宣布所有产品和多个库的未来版本将从 Mozilla 公共许可证 v2.0 (MPL 2.0) 过渡到 Business Source License(BSL 或 BUSL)v1.1[1]。 ...

定向减免!函数计算让轻量 ETL 数据加工更简单,更省钱

业内较为常见的高频短时 ETL 数据加工场景,即频率高时延短,一般均可归类为调用密集型场景。此场景有着高并发、海量调用的特性,往往会产生高额的计算费用,而业内推荐方案一般为攒批处理,...

秒速出图!体验 TensorRT 加速 Stable Diffusion 图像创作

TensorRT 如何加速 Stable Diffusion? 生成式 AI 图像内容生成技术近年来发展迅速,可以根据人类语言描述生成图片,在时尚、建筑、动漫、广告、游戏等领域有着广泛应用。 Stable Diffusion...

阿里云 SAE 2.0 正式商用:极简易用、百毫秒弹性效率,降本 40%

本文主要介绍阿里云 Serverless 应用引擎(以下简称 SAE )如何帮助企业跨越技术鸿沟,从传统应用架构无感升级到 Serverless 架构,以更高效、更经济的方式进行转型,快速进入云原生快车道,...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部