如何把Go调用C的性能提升10倍?
如何把Go调用C的性能提升10倍?
LinkerLin 发表于2个月前
如何把Go调用C的性能提升10倍?
  • 发表于 2个月前
  • 阅读 4428
  • 收藏 79
  • 点赞 4
  • 评论 25

腾讯云 学生专属云服务套餐 10元起购>>>   

目前,当Go需要和C/C++代码集成的时候,大家最先想到的肯定是CGO。毕竟是官方的解决方案,而且简单。

但是CGO是非常慢的。因为CGO其实一个桥接器,通过自动生成代码,CGO在保留了C/C++运行时的情况下,搭建了一个桥来沟通C/C++世界和Go的世界。这就意味着,兼容性很好,但是对C的函数的调用,必须先把当前的goroutine挂起,并切换执行栈到当前的线程M的主栈(大小2MB)。如果不做这个操作,那么只能在goroutine的栈上执行C函数调用,可是,goroutine的栈一般都很小,很容易就导致了栈溢出了。

调用C函数的时候,必须切换当前的栈为线程的主栈,这带来了两个比较严重的问题:

  1. 线程的栈在Go运行时是比较少的,受到P/M数量的限制,一般可以简单的理解成受到GOMAXPROCS限制;
  2. 由于需要同时保留C/C++的运行时,CGO需要在两个运行时和两个ABI(抽象二进制接口)之间做翻译和协调。这就带来了很大的开销。

minio项目的一个副产品是 c2goasm 项目,这个项目也被 go-cv-simd 项目使用获得了很好的效果。

c2goasm 的角色是一个 汇编语言转换器,输入是 clang输出的amd64汇编,输出是go汇编。而clang的输入是C/C++语言。限制是不能有RTTI和异常。也就是说不能有C/C++运行时提供的高级功能。

c2goasm输出的go汇编,交给go的工具链可以直接生成go的可执行代码。

c2goasm和CGO比,最大的改进就是:

  1. 不再有C/C++运行时,也就没了在两者之间不停转换的逻辑开销;
  2. 不需要切换到线程的主栈来执行函数,因为c2goasm生成的是纯正的go函数,不需要线程的主栈就可以执行;

由此就极大的改进了性能,代价是兼容性和可移植性损失了。

标签: go 汇编 clang c2goasm C
共有 人打赏支持
LinkerLin
粉丝 65
博文 51
码字总数 10199
作品 1
评论 (25)
青萍之末
好东西,顶一下
开源大帅逼
正好需要
Mok
ffmpeg就转不了
ddatsh
今天想尝试下转sqlite行不行
小蠢兔
如何把Go调用C的性能提升100倍?
kernel64
inline op code
BlueStragglers

引用来自“小蠢兔”的评论

如何把Go调用C的性能提升100倍?
先写一个很慢很慢的实现,然后再优化
SHIHUAMarryMe
这么折腾为什么不直接C/C++呢........
冰力
说到头还是讲Go性能太差
shitalpig
写go不如写cpp,make install 还方便
LinkerLin

引用来自“shitalpig”的评论

写go不如写cpp,make install 还方便

回复@shitalpig : cpp不错啊,我前经常写。
LinkerLin

引用来自“冰力”的评论

说到头还是讲Go性能太差

回复@冰力 : Go的性能不差啊
shitalpig

引用来自“LinkerLin”的评论

引用来自“冰力”的评论

说到头还是讲Go性能太差

回复@冰力 : Go的性能不差啊

go性能还不如java呢
LinkerLin

引用来自“shitalpig”的评论

引用来自“LinkerLin”的评论

引用来自“冰力”的评论

说到头还是讲Go性能太差

回复@冰力 : Go的性能不差啊

go性能还不如java呢

回复@shitalpig : Go的纯内存计算性能不如Java,但是在多协程并发等方面要好的多。
Antmanler
作者怎么不提限制呢。。。
nullref
我就喜欢看一本正经的胡说八道。c/c++都没有运行时。
不会飞的猪
很厉害~ mark
LinkerLin

引用来自“nullref”的评论

我就喜欢看一本正经的胡说八道。c/c++都没有运行时。

回复@nullref : C/C++ 都有运行时的,C的运行时很简单但也不能忽略。说C++没有运行时那就是没看过Clang源码啦。
nullref

引用来自“LinkerLin”的评论

引用来自“nullref”的评论

我就喜欢看一本正经的胡说八道。c/c++都没有运行时。

回复@nullref : C/C++ 都有运行时的,C的运行时很简单但也不能忽略。说C++没有运行时那就是没看过Clang源码啦。
兄台说的可是运行时库?别强要面子了,兄台连运行时的概念都没有!
解释型,半静态语言才能称有运行时。例如C#/java/js/py/lua等
LinkerLin

引用来自“nullref”的评论

引用来自“LinkerLin”的评论

引用来自“nullref”的评论

我就喜欢看一本正经的胡说八道。c/c++都没有运行时。

回复@nullref : C/C++ 都有运行时的,C的运行时很简单但也不能忽略。说C++没有运行时那就是没看过Clang源码啦。
兄台说的可是运行时库?别强要面子了,兄台连运行时的概念都没有!
解释型,半静态语言才能称有运行时。例如C#/java/js/py/lua等

回复@nullref : C/C++当然有runtime了,你可以去看下clang的源码。
×
LinkerLin
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: