加载中
MegCC 新版本来啦!新增 Benchmark 等工具,性能大幅提升!有奖征文活动同步启动

最新版 MegCC 新鲜出炉,新工具,新体验,本次版本针对用户使用体验以及模型推理性能进行全面提升,主要的提升包括: 新增 Benchmark 工具, 用于用于快速 Benchmark 常用模型的推理性能并可...

01/12 15:50
82
实录 | MegEngine 大 Kernel 卷积工程优化实践

从卷积到矩阵乘 矩阵乘(GEMM)具有计算密度大和易并行等优良特点,传统领域例如芯片产业和高性能计算领域往往将 GEMM 作为 benchmark 并已经将其优化到接近硬件理论峰值。 为了获得更好的性...

01/09 11:30
36
如何写一个深度学习编译器

编译器本质上是一种提高开发效率的工具,将高级语言转换为低级语言(通常是二进制机器码),使得程序员不需要徒手写二进制。转换过程中,首要任务是保证正确性,同时需要进行优化以提升程序的...

2022/12/27 21:04
36
MegEngine Windows Python wheel 包减肥之路

作者:张浩龙 | 旷视科技 MegEngine 架构师 写在之前 本文的目的 通过讲述在支持 MegEngine Windows Python wheel 过程中遇到的问题以及解决问题的流程,此文最后的解决方法可能不是最优,欢...

BaseDet: 走过开发的弯路

作者:王枫 | 旷视算法研究员 收到 MegEngine 团队的邀请来写这篇稿子,本意是想让我介绍一下 BaseDet(一个基于 MegEngine 写成的目标检测仓库,类似 detectron2 之于 pytorch)。因为大部分...

2022/12/15 15:44
23
圆桌实录 | 为什么不约而同选择了大 Kernel

在 3.19 日的 “Large Kernel Makes CNN Great Again” 专题 Meetup 中,我们组织了一次圆桌讨论,希望能通过讨论一些比较有共性的问题,碰撞出更多新想法。本篇为文字实录,enjoy~ 视频回顾...

2022/12/12 11:22
29
深度学习框架新手快速上手指南

新手入门深度学习框架怎么办?快速、可拓展、易于使用且支持自动求导的深度学习框架-MegEngine 配备了新手入门文档,助力初学者快速上手框架。文档借助了一系列的代码实战,有利于循序渐进地...

Awesome MegEngineer 英雄招募帖,开源社区专属权益等你来领

MegEngine 社区优秀贡献者荣誉体系 —— “Awesome MegEngineer”上线啦!诚邀同样热爱开源的你加入! 什么是 “Awesome MegEngineer“ Awesome MegEngineer 是 MegEngine 社区中一群有突出成...

2022/11/17 10:32
35
使用 C++ 部署深度学习模型快速上手方案

本文将从获取一个训练好的 shufflenet_v2 模型出发, 讲解如何使用 MegEngine Lite 的 C++ 接口将其部署到 CPU(Linux x86 / Android Arm)环境下运行。主要分为以下小节: 导出已经训练好的...

2022/11/14 15:48
68
AI 模型编译器 MegCC 开源,解决推理引擎体积问题

目前社区已经有多个移动端深度学习推理框架,如:NCNN、MNN... 这些推理引擎都给社区的用户带来了在移动端上部署深度学习非常多的便利,但是他们也都有一个共性问题:随着不断地迭代以及性能...

开源 2 年半,除了性能优化我们啥也没做

性能优化是个十分广泛的话题,它涉及 CPU、内存、磁盘、网络等方面。MegEngine 作为一个训推一体的深度学习框架,也在持续不断探索性能优化的最优解。 本篇整理了 Bot 过往发布的相关文章,希...

2022/10/08 13:11
801
MegPeak——让你更懂你的处理器

作者:陈其友 | 旷视 MegEngine 架构师 MegPeak 介绍 在这个算力需求爆炸的大背景下,如何发挥出已有硬件的最大算力变得非常重要,直观一点是:我们需要对现有算法针对特定的处理器进行极致的...

2022/12/05 16:13
28
MegEngine Inference 卷积优化之 Im2col 和 winograd 优化

作者:于雄雄 陈其友 | 旷视 MegEngine 架构师 背景 在 CV 领域中,卷积计算是扩充像素的感受野的有效方法,模型大多数的计算量都是卷积操作贡献的。因此在 CV 模型的推理性能优化中,最重要...

2022/11/30 17:28
228
提速还能不掉点!深度解析 MegEngine 4 bits 量化开源实现

作者:周瑞亮 | 旷视 MegEngine 架构师 随着深度学习的发展,其应用场景也越发的广泛与多样。这些多样化的场景往往会对实际的部署提出更加“定制化”的限制。例如,自动驾驶汽车对人体识别的...

A100 买不到了,只有小显卡怎么训大模型

为了达到更好的训练效果,通常炼丹师们会使用更大的模型和更大的 Batch size,但因此带来的大显存占用,却成为不可避免的硬伤。 尤其是如今 GPU 越来越贵,甚至还可能买不到...... MegEngin...

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部