加载中
MegEngine 11-12 双月报:新版本发布,开发者福利课程,MegEngine 使用技巧,精彩不容错过!

● v1.13.3 新版本发布 https://github.com/MegEngine/MegEngine/releases/tag/v1.13.3 ●「MegEngine 开发者说」-编译器上手指南,算子开发及开源项目指导手册 https://www.bilibili.com/v...

01/05 18:10
55
MegEngine 版本最新发布!新增支持寒武纪思元系列 AI 芯片训练和推理

近日,MegEngine 在 v1.13.3 正式完成了与国内 AI 芯片独角兽寒武纪旗下云端人工智能处理器芯片的兼容性适配。MegEngine 与 寒武纪目前完成了常见 cv 模型的算子适配,这也标志着寒武纪端云一...

01/02 15:57
1.2K
MegEngine 优化 dataloader 使用体验!data monitor 帮助更好定位性能瓶颈

业务模型训练中 Data 部分可能是瓶颈所在 在训练业务模型过程中,如果我们发现模型的训练速度不符合预期,往往会下意识地认为网络本身出了问题。但实际上,大多数时候问题发生在模型的数据供...

2023/12/19 16:10
53
MegEngine 正式支持 XLA 啦!

XLA(Accelerated Linear Algebra)是 Google 提出的一个神经网络编译器,可以用于加速 AI 模型的训练和推理。MegEngine 1.13.1 中也已经支持了 XLA,在训练模型时可以选择开启此项功能,不同...

CPU 程序性能优化

一个程序首先要保证正确性,在保证正确性的基础上,性能也是一个重要的考量。要编写高性能的程序,第一,必须选择合适的算法和数据结构;第二,应该编写编译器能够有效优化以转换成高效可执行...

MegEngine 使用小技巧:Profiler使用手册

0.写在前面 “xx,R 那边反应多机训练速度慢,你看一下什么情况” “xxx,为什么 MGE 更新之后,xxx 网络训练变慢了,你看一下” 这是组内日常对话 然后有人日常背锅 组员的状态是:提性能,...

2023/08/30 15:35
49
MegEngine Python 层模块串讲(下)

在前面的文章中,我们简单介绍了在 MegEngine imperative 中的各模块以及它们的作用。对于新用户而言可能不太了解各个模块的使用方法,对于模块的结构和原理也是一头雾水。Python 作为现在深...

MegEngine 动态执行引擎 Imperative Runtime 架构解析

在之前的文章中我们介绍过 MegEngine 的 Imperative Runtime 以及它与 MegBrain、MegDNN 的关系,这篇文章中我们将介绍 Imperative 中包含的常用组件。 在 MegEngine 中,从用户在 python 层...

2023/06/16 23:10
84
MegEngine 使用小技巧:如何做 MegCC 的模型性能评测

MegCC 是一个深度学习模型编译器,具有以下特点: 极轻量级运行时:只在二进制文件中保留所需的计算内核。例如,MobileNet v1 的81KB运行时间 高性能:每个操作都经过专家精心优化 便携:只生...

MegEngine 动态执行引擎-Imperative Runtime 概述

当我们谈论 MegEngine 时,我们在谈论什么 众所周知,开源深度学习框架旷视天元(MegEngine)是旷视自主研发的国产工业级深度学习框架 ,是旷视新一代 AI 生产力平台 Brain++ 的最核心组件,...

MegEngine 使用小技巧:如何解读 MegCC 编译模型几个阶段 Pass 的作用

MegCC 是一个真真实实的深度学习模型编译器,具备极其轻量的 Runtime 二进制体积,高性能,方便移植,极低内存使用以及快启动等核心特点。用户可在 MLIR 上进行计算图优化,内存规划,最后通...

2023/05/30 15:44
64
MegEngine 使用小技巧:用 mperf 进行安卓 opencl 算子的 roofline 分析

前言 roofline 分析是一种简单评估当前计算任务对当前平台计算/访存能力的利用情况的方法,可以帮助分析算子的优化方向和优化潜力。mperf 实现了安卓 mali/adreno 两种 gpu 平台的 roofline...

MegEngine 使用小技巧:量化

常见神经网络模型所用的 Tensor 数据类型 一般是 float32 类型, 而工业界出于对特定场景的需求(极少的计算资源,极致的推理速度),需要把模型的权重和或激活值转换为位数更少的数值类型(...

2023/04/25 17:47
58
MegEngine 使用小技巧:借助 DataLoader 获取分批数据

在使用 MegEngine 进行模型训练时,首先要进行的是数据加载和预处理。在此过程中,MegEngine 中的megengine.data模块,提供了数据分批功能,其内部实现流程如下图: 通过使用 Dataloader,我...

2023/03/09 10:31
94
MegEngine 使用小技巧:使用 Netron 实现模型可视化

近期社区有多个同学问,如何查看 MegEngine 训练出的模型网络结构。其实在去年 8 月,MegEngine 就已经集成到了 Netron 平台上。 目前 Netron 已支持 MegEngine 模型:TracedModule 及 C++ ...

2023/02/24 09:42
111
深度学习快速上手——基于 MegEngine 的 LeNet 快速训练与部署

|本文转载自 @嘿呀嘿 个人 blog。 1. 前言 Megengine 是旷视科技开发的一款训练推理一体化的深度学习框架,类似于 pytorch,tensorflow。 使用 Megengine 可以快速实现常见的深度学习模型,...

2023/02/07 14:11
76
A100 买不到了,只有小显卡怎么训大模型

为了达到更好的训练效果,通常炼丹师们会使用更大的模型和更大的 Batch size,但因此带来的大显存占用,却成为不可避免的硬伤。 尤其是如今 GPU 越来越贵,甚至还可能买不到...... MegEngin...

2023/02/06 10:34
82
MegCC 新版本来啦!新增 Benchmark 等工具,性能大幅提升!有奖征文活动同步启动

最新版 MegCC 新鲜出炉,新工具,新体验,本次版本针对用户使用体验以及模型推理性能进行全面提升,主要的提升包括: 新增 Benchmark 工具, 用于用于快速 Benchmark 常用模型的推理性能并可...

实录 | MegEngine 大 Kernel 卷积工程优化实践

从卷积到矩阵乘 矩阵乘(GEMM)具有计算密度大和易并行等优良特点,传统领域例如芯片产业和高性能计算领域往往将 GEMM 作为 benchmark 并已经将其优化到接近硬件理论峰值。 为了获得更好的性...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部