加载中
MegEngine 使用小技巧:如何解读 MegCC 编译模型几个阶段 Pass 的作用

MegCC 是一个真真实实的深度学习模型编译器,具备极其轻量的 Runtime 二进制体积,高性能,方便移植,极低内存使用以及快启动等核心特点。用户可在 MLIR 上进行计算图优化,内存规划,最后通...

05/30 15:44
22
MegEngine 使用小技巧:用 mperf 进行安卓 opencl 算子的 roofline 分析

前言 roofline 分析是一种简单评估当前计算任务对当前平台计算/访存能力的利用情况的方法,可以帮助分析算子的优化方向和优化潜力。mperf 实现了安卓 mali/adreno 两种 gpu 平台的 roofline...

05/16 17:15
54
MegEngine 使用小技巧:量化

常见神经网络模型所用的 Tensor 数据类型 一般是 float32 类型, 而工业界出于对特定场景的需求(极少的计算资源,极致的推理速度),需要把模型的权重和或激活值转换为位数更少的数值类型(...

04/25 17:47
22
MegEngine 使用小技巧:借助 DataLoader 获取分批数据

在使用 MegEngine 进行模型训练时,首先要进行的是数据加载和预处理。在此过程中,MegEngine 中的megengine.data模块,提供了数据分批功能,其内部实现流程如下图: 通过使用 Dataloader,我...

03/09 10:31
45
MegEngine 使用小技巧:使用 Netron 实现模型可视化

近期社区有多个同学问,如何查看 MegEngine 训练出的模型网络结构。其实在去年 8 月,MegEngine 就已经集成到了 Netron 平台上。 目前 Netron 已支持 MegEngine 模型:TracedModule 及 C++ ...

02/24 09:42
46
深度学习快速上手——基于 MegEngine 的 LeNet 快速训练与部署

|本文转载自 @嘿呀嘿 个人 blog。 1. 前言 Megengine 是旷视科技开发的一款训练推理一体化的深度学习框架,类似于 pytorch,tensorflow。 使用 Megengine 可以快速实现常见的深度学习模型,...

02/07 14:11
30
A100 买不到了,只有小显卡怎么训大模型

为了达到更好的训练效果,通常炼丹师们会使用更大的模型和更大的 Batch size,但因此带来的大显存占用,却成为不可避免的硬伤。 尤其是如今 GPU 越来越贵,甚至还可能买不到...... MegEngin...

02/06 10:34
29
MegCC 新版本来啦!新增 Benchmark 等工具,性能大幅提升!有奖征文活动同步启动

最新版 MegCC 新鲜出炉,新工具,新体验,本次版本针对用户使用体验以及模型推理性能进行全面提升,主要的提升包括: 新增 Benchmark 工具, 用于用于快速 Benchmark 常用模型的推理性能并可...

01/12 15:50
117
实录 | MegEngine 大 Kernel 卷积工程优化实践

从卷积到矩阵乘 矩阵乘(GEMM)具有计算密度大和易并行等优良特点,传统领域例如芯片产业和高性能计算领域往往将 GEMM 作为 benchmark 并已经将其优化到接近硬件理论峰值。 为了获得更好的性...

01/09 11:30
122
如何写一个深度学习编译器

编译器本质上是一种提高开发效率的工具,将高级语言转换为低级语言(通常是二进制机器码),使得程序员不需要徒手写二进制。转换过程中,首要任务是保证正确性,同时需要进行优化以提升程序的...

2022/12/27 21:04
36
MegEngine Windows Python wheel 包减肥之路

作者:张浩龙 | 旷视科技 MegEngine 架构师 写在之前 本文的目的 通过讲述在支持 MegEngine Windows Python wheel 过程中遇到的问题以及解决问题的流程,此文最后的解决方法可能不是最优,欢...

BaseDet: 走过开发的弯路

作者:王枫 | 旷视算法研究员 收到 MegEngine 团队的邀请来写这篇稿子,本意是想让我介绍一下 BaseDet(一个基于 MegEngine 写成的目标检测仓库,类似 detectron2 之于 pytorch)。因为大部分...

2022/12/15 15:44
33
圆桌实录 | 为什么不约而同选择了大 Kernel

在 3.19 日的 “Large Kernel Makes CNN Great Again” 专题 Meetup 中,我们组织了一次圆桌讨论,希望能通过讨论一些比较有共性的问题,碰撞出更多新想法。本篇为文字实录,enjoy~ 视频回顾...

2022/12/12 11:22
36
深度学习框架新手快速上手指南

新手入门深度学习框架怎么办?快速、可拓展、易于使用且支持自动求导的深度学习框架-MegEngine 配备了新手入门文档,助力初学者快速上手框架。文档借助了一系列的代码实战,有利于循序渐进地...

Awesome MegEngineer 英雄招募帖,开源社区专属权益等你来领

MegEngine 社区优秀贡献者荣誉体系 —— “Awesome MegEngineer”上线啦!诚邀同样热爱开源的你加入! 什么是 “Awesome MegEngineer“ Awesome MegEngineer 是 MegEngine 社区中一群有突出成...

2022/11/17 10:32
52
使用 C++ 部署深度学习模型快速上手方案

本文将从获取一个训练好的 shufflenet_v2 模型出发, 讲解如何使用 MegEngine Lite 的 C++ 接口将其部署到 CPU(Linux x86 / Android Arm)环境下运行。主要分为以下小节: 导出已经训练好的...

2022/11/14 15:48
74
AI 模型编译器 MegCC 开源,解决推理引擎体积问题

目前社区已经有多个移动端深度学习推理框架,如:NCNN、MNN... 这些推理引擎都给社区的用户带来了在移动端上部署深度学习非常多的便利,但是他们也都有一个共性问题:随着不断地迭代以及性能...

开源 2 年半,除了性能优化我们啥也没做

性能优化是个十分广泛的话题,它涉及 CPU、内存、磁盘、网络等方面。MegEngine 作为一个训推一体的深度学习框架,也在持续不断探索性能优化的最优解。 本篇整理了 Bot 过往发布的相关文章,希...

2022/10/08 13:11
994
MegPeak——让你更懂你的处理器

作者:陈其友 | 旷视 MegEngine 架构师 MegPeak 介绍 在这个算力需求爆炸的大背景下,如何发挥出已有硬件的最大算力变得非常重要,直观一点是:我们需要对现有算法针对特定的处理器进行极致的...

2022/12/05 16:13
48

没有更多内容

加载失败,请刷新页面

返回顶部
顶部