加载中
基于 Megatron-Core 的稀疏大模型训练工具:阿里云MoE大模型最佳实践

概述 随着大模型技术的不断发展,模型结构和参数量级快速演化。大模型技术的应用层出不穷。大模型展现惊人效果,但训练和推理成本高,一直是巨大挑战。模型稀疏化能降低计算和存储消耗。近期...

十年后数据库还是不敢拥抱NUMA - 续篇

背景 十年后数据库还是不敢拥抱NUMA, 这篇经典的纠正大家对NUMA 认知的文章一晃发布快3年了,这篇文章的核心结论是: 之所以有不同的NUMA Node 是不同的CPU Core 到不同的内存距离远近不一样...

PolarDB-X 最佳实践系列(四):如何设计一张订单表

本文主要内容是如何使用全局索引与CO_HASH分区算法(CO_HASH),实现高效的多维度查询。 淘宝订单号中的秘密 有一个很有趣的事情。 打开你的淘宝客户端或者PC端的淘宝,点开订单列表,打开几...

云原生离线工作流编排利器 - 分布式工作流 Argo 集群

在现代的软件开发和数据处理领域,批处理作业(Batch)扮演着重要的角色。它们通常用于数据处理,仿真计算,科学计算等领域,往往需要大规模的计算资源。随着云计算的兴起,阿里云批量计算和...

Consul 留给你的时间不多了

HashiCorp BSL license 变更 在今年的 8 月份 HashiCorp 宣布所有产品和多个库的未来版本将从 Mozilla 公共许可证 v2.0 (MPL 2.0) 过渡到 Business Source License(BSL 或 BUSL)v1.1[1]。 ...

定向减免!函数计算让轻量 ETL 数据加工更简单,更省钱

业内较为常见的高频短时 ETL 数据加工场景,即频率高时延短,一般均可归类为调用密集型场景。此场景有着高并发、海量调用的特性,往往会产生高额的计算费用,而业内推荐方案一般为攒批处理,...

秒速出图!体验 TensorRT 加速 Stable Diffusion 图像创作

TensorRT 如何加速 Stable Diffusion? 生成式 AI 图像内容生成技术近年来发展迅速,可以根据人类语言描述生成图片,在时尚、建筑、动漫、广告、游戏等领域有着广泛应用。 Stable Diffusion...

阿里云 SAE 2.0 正式商用:极简易用、百毫秒弹性效率,降本 40%

本文主要介绍阿里云 Serverless 应用引擎(以下简称 SAE )如何帮助企业跨越技术鸿沟,从传统应用架构无感升级到 Serverless 架构,以更高效、更经济的方式进行转型,快速进入云原生快车道,...

3分钟畅玩!一键部署幻兽帕鲁联机服务器

《幻兽帕鲁》火爆,如何快速拥有一个可以跟小伙伴们愉快玩耍的服务器呢?本教程将指引您在阿里云上快速完成幻兽帕鲁专用服务器部署,仅需点几下鼠标,2~3分钟左右就能可完成搭建,全程无需手...

魔搭×函数计算:一键部署,缩短大模型选型到生产的距离

引言 面对魔搭 ModelScope[1]社区提供的海量模型,用户希望快速进行选型并生产使用起来,但在此之前,却一定会面临算力管理难、模型部署难等一系列问题,那么能否实现快速把选定的模型部署在...

弹性调度助力企业灵活应对业务变化,高效管理云上资源

01 什么是弹性调度 云计算时代,企业可以通过云平台获得大量计算资源,并根据业务发展和流量需求的实时变化,灵活调整使用的资源类型与资源量。阿里云提供了多种弹性资源,如云服务器 ECS 和...

可观测实践丨如何利用 AI 算法解决告警配置三大难题?

每个运维工程师都躲不开的噩梦 为了更代入感地解读业务场景,这里我们以运维工程师小 A 的视角来开始今天的解读。 年轻有为的运维工程师 小 A 刚接手公司最核心业务系统的稳定性保障工作。但...

从内核的视角观测容器 — SysOM 容器监控

01 背景 容器化现阶段已经是构建企业 IT 架构的最佳实践。云原生容器化的部署架构,相较于传统 IDC 部署架构的 IT 架构方案,已经成为兼具高效运维及成本控制的业界事实标准。 但容器化带来的...

Nacos 2.3.0 正式版发布,Nacos Controller 项目开源

新版本发布 Nacos 2.3.0-BETA 版本经过 1 个多月的社区测试,修复了部分的问题并对部分新功能的使用进行了少量优化后,于 2023 年 12 月 7 日正式发布。 Nacos 2.3.0 版本基于 2.3.0-BETA 版...

从方法论到最佳实践,深度解析企业云原生 DevSecOps 体系构建

01 引言 安全一直是企业上云关注的核心问题。随着云原生对云计算基础设施和企业应用架构的重定义,传统的企业安全防护架构已经不能够满足新时期下的安全防护要求。为此企业安全人员需要针对云...

考试查分场景重保背后,我们如何进行可用性测试

随着通过互联网音视频与知识建立连接的新学习方式在全国范围内迅速普及,在线教育/认证考试的用户规模呈井喷式增长。但教育容不得半点马虎与妥协,伴随用户规模不断增长,保证系统稳定性、有...

Mixtral 8X7B MoE 模型基于阿里云人工智能平台PAI实践合集

Mixtral 8x7B大模型是Mixtral AI推出的基于decoder-only架构的稀疏专家混合网络(Mixture-Of-Experts,MOE)开源大语言模型。这一模型具有46.7B的总参数量,对于每个token,路由器网络选择八...

解密最受欢迎的开源 Serverless 框架:流量篇

对于 web 应用来说,通过请求流量的并发数、qps、rt 等指标,可以很好的衡量当前的 web 服务质量。Knative 中提供了基于请求驱动的 Serverless 能力,包括多版本管理流量,流量访问,基于流量...

Mixtral 8X7B MoE 模型在阿里云PAI平台的微调部署实践

引言 Mixtral 8x7B 是Mixtral AI最新发布的大语言模型,在许多基准测试上表现优于 GPT-3.5,是当前最为先进的开源大语言模型之一。阿里云人工智能平台PAI是面向开发者和企业的机器学习/深度学...

调研 7 个开源项目后,这家数据合规平台如何构建高性能网关

用九智汇介绍 用九智汇是一家面向企业提供数据合规、隐私保护相关产品和解决方案的数据合规公司,致力于帮助客户在合法合规、充分保护用户隐私的基础上发挥数据的最大价值,已服务众多世界 ...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部