【翻译】为什么 goroutine 的栈内存无穷大?

原创
2013/07/13 23:35
阅读数 2.2W

一些 Go 语言的新学习者总是会对 goroutine 栈内存占用大小感到非常好奇。这一般是由于程序员进行无限的函数循环调用导致的。为了说明这个问题,请思考以下代码示例(为使问题更加清晰而使用相对刻意的写法):

package main

import "fmt"

type S struct {
        a, b int
}

// String 实现了接口 fmt.Stringer
func (s *S) String() string {
        return fmt.Sprintf("%s", s) // 调用 Sprintf 时会默认调用 s.String()
}

func main() {
        s := &S{a: 1, b: 2}
        fmt.Println(s)
}

尽管我不建议你这样做,但当你尝试运行这段代码的时候,你会发现你的机器正在进行大量的运算,甚至变得无响应而使你不得不使用 ctrl + c 来中断执行,以免程序最终达到无药可救的地步;因为我知道你会这样做,所以我为你做好了这一步,你可以直接在 playground 执行这段代码。

许多程序员都曾经写过类似的代码而导致函数的无限循环调用,并使得他们的程序崩溃,但一般情况下并不足以对他们的机器造成毁灭性破坏。问题是,为什么 Go 的程序就特殊一点的呢?

goroutine 的一个主要特性就是它们的消耗;创建它们的初始内存成本很低廉(与需要 1 至 8MB 内存的传统 POSIX 线程形成鲜明对比)以及根据需要动态增长和缩减占用的资源。这使得 goroutine 会从 4096 字节的初始栈内存占用开始按需增长或缩减内存占用,而无需担心资源的耗尽。

为了实现这个目标,链接器(5l、6l 和 8l)会在每个函数前插入一个序文,这个序文会在函数被调用之前检查判断当前的资源是否满足调用该函数的需求(备注 1)。如果不满足,则调用 runtime.morestack 来分配新的栈页面(备注 2),从函数的调用者那里拷贝函数的参数,然后将控制权返回给调用者。此时,已经可以安全地调用该函数了。当函数执行完毕,事情并没有就此结束,函数的返回参数又被拷贝至调用者的栈结构中,然后释放无用的栈空间。

通过这个过程,有效地实现了栈内存的无限使用。假设你并不是不断地在两个栈之间往返,通俗地讲叫栈分割,则代价是十分低廉的。

但是我一直注意到一个问题,当你的程序存在函数的无限循环调用而即将导致你的操作系统内存枯竭,而此时又恰好需要分配新的栈页面,则会从堆中分配内存。

当你的函数无止尽地调用着自己,新的栈页面会不断地从堆中分配,继而使得函数又能够继续调用自己。我相信这很快就会使程序用光你机器所有空余的物理内存,交换存储器也会被大量使用,最终导致你的系统变得非常不稳定。

可以被 Go 使用的堆内存取决于许多方面,包括你的 CPU 架构以及操作系统,但一般依赖于你机器可用的物理内存,因此你的机器会在即将使用完堆内存之前进行大量交换存储器的操作。

对于 Go 1.1,许多人都希望可以提升 32 位以及 64 位平台上堆内存使用的最大限制,这个问题会在某些情况下变得更加严重。比如说,你的机器不太可能拥有 128GB 的物理内存(备注 3)。

最后要说的是,这里有一些 issue 已经涉及到这个问题(issue1issue2),但仍未找到在不损失性能的情况下能够处理该问题的一个好的解决方案。

备注:
1. 同样适用于方法,但方法的接收者本质上就是函数的第一个参数,当讨论有关 Go 的分段栈的问题时,没有必要将它们区别对待。
2. 使用页面这个词不代表每次分配的内存额度是固定的 4096 字节,必要时会调用 runtime.morestack 来进行新的分配,但我猜测会与页面值的倍数相接近。
3. 由于 Go 1.1 的改动,64 位 Windows 平台的堆内存被限制在 32GB 之内。

原文地址:http://dave.cheney.net/2013/06/02/why-is-a-goroutines-stack-infinite

 

展开阅读全文
打赏
2
45 收藏
分享
加载中
无闻博主

引用来自“Xsank”的评论

Go routine 不会出现stackoverflow是因为它们的context都是在堆上开辟的吧
你说的挺有道理!
2015/06/22 14:12
回复
举报
Go routine 不会出现stackoverflow是因为它们的context都是在堆上开辟的吧
2015/06/22 10:15
回复
举报
无闻博主

引用来自“sunvim”的评论

为了实现这个目标,链接器(5l、6l 和 8l)会在每个函数前插入一个序文,这个序文会在函数被调用之前检查判断当前的资源是否满足调用该函数的需求(备注 1)。如果不满足,则调用 runtime.morestack 来分配新的栈页面(备注 2),从函数的调用者那里拷贝函数的参数,然后将控制权返回给调用者。此时,已经可以安全地调用该函数了。当函数执行完毕,事情并没有就此结束,函数的返回参数又被拷贝至调用者的栈结构中,然后释放无用的栈空间。

没看懂,是为何可以无限使用栈内存的。A栈调用A栈?
就是资源不够的时候会不停地扩张申请范围,直到函数执行完,最后才会释放
2014/10/18 02:31
回复
举报
为了实现这个目标,链接器(5l、6l 和 8l)会在每个函数前插入一个序文,这个序文会在函数被调用之前检查判断当前的资源是否满足调用该函数的需求(备注 1)。如果不满足,则调用 runtime.morestack 来分配新的栈页面(备注 2),从函数的调用者那里拷贝函数的参数,然后将控制权返回给调用者。此时,已经可以安全地调用该函数了。当函数执行完毕,事情并没有就此结束,函数的返回参数又被拷贝至调用者的栈结构中,然后释放无用的栈空间。

没看懂,是为何可以无限使用栈内存的。A栈调用A栈?
2014/10/17 13:40
回复
举报
直接递归和间接递归的区别而已
2014/01/17 05:49
回复
举报
无闻博主

引用来自“ChinLeon”的评论

引用来自“无闻”的评论

引用来自“ChinLeon”的评论

函数循环调用, 一般翻译为函数递归调用吧

不是只有递归才会循环调用,A->B,B->A

这个也是叫做递归吧

好吧
2013/07/26 13:56
回复
举报

引用来自“无闻”的评论

引用来自“ChinLeon”的评论

函数循环调用, 一般翻译为函数递归调用吧

不是只有递归才会循环调用,A->B,B->A

这个也是叫做递归吧
2013/07/26 11:23
回复
举报
无闻博主

引用来自“ChinLeon”的评论

函数循环调用, 一般翻译为函数递归调用吧

不是只有递归才会循环调用,A->B,B->A
2013/07/24 18:24
回复
举报
函数循环调用, 一般翻译为函数递归调用吧
2013/07/24 14:51
回复
举报
求教....
2013/07/23 18:25
回复
举报
更多评论
打赏
16 评论
45 收藏
2
分享
返回顶部
顶部