Go函数闭包底层实现
函数闭包对于大多数读者而言并不是什么高级词汇,那什么是闭包呢?这里摘自Wiki上的定义:
a closure is a record storing a function together with an environment.The environment is a mapping associating each free variable of the function (variables that are used locally, but defined in an enclosing scope) with the value or reference to which the name was bound when the closure was created.
简而言之,闭包是一个由函数和引用环境而组合的实体。闭包在实现过程中,往往是通过调用外部函数返回其内部函数来实现的。在这其中,引用环境是指的外部函数中自由变量(内部函数使用,但是却定义于外部函数中)的映射。内部函数通过引入外部的自由变量,使得这些变量即使离开了外部函数的环境也不会被释放或删除,在返回的内部函数仍然持有这些信息。
这段话可能不太好理解,我们直接用看例子。
1package main
2
3import "fmt"
4
5func outer() func() int {
6 x := 1
7 return func() int {
8 x++
9 return x
10 }
11}
12
13func main() {
14 closure := outer()
15 fmt.Println(closure())
16 fmt.Println(closure())
17}
18
19// output
202
213
可以看到,Go中的两条特性(函数是一等公民,支持匿名函数)使其很容易实现闭包。
在上面的例子中,closure
是闭包函数,变量x就是引用环境,它们的组合就是闭包实体。x
本是outer
函数之内,匿名函数之外的局部变量。在正常函数调用结束之后,x
就会随着函数栈的销毁而销毁。但是由于匿名函数的引用,outer
返回的函数对象会一直持有x
变量。这造成了每次调用闭包closure
,x
变量都会得到累加。
这里和普通的函数调用不一样:局部变量x
并没有随着函数的调用结束而消失。那么,这是为什么呢?
实现原理
我们不妨从汇编入手,将上述代码稍微修改一下
1package main
2
3func outer() func() int {
4 x := 1
5 return func() int {
6 x++
7 return x
8 }
9}
10
11func main() {
12 _ := outer()
13}
得到编译后的汇编语句如下。
1$ go tool compile -S -N -l main.go
2"".outer STEXT size=181 args=0x8 locals=0x28
3 0x0000 00000 (main.go:3) TEXT "".outer(SB), ABIInternal, $40-8
4 ...
5 0x0021 00033 (main.go:3) MOVQ $0, "".~r0+48(SP)
6 0x002a 00042 (main.go:4) LEAQ type.int(SB), AX
7 0x0031 00049 (main.go:4) MOVQ AX, (SP)
8 0x0035 00053 (main.go:4) PCDATA $1, $0
9 0x0035 00053 (main.go:4) CALL runtime.newobject(SB)
10 0x003a 00058 (main.go:4) MOVQ 8(SP), AX
11 0x003f 00063 (main.go:4) MOVQ AX, "".&x+24(SP)
12 0x0044 00068 (main.go:4) MOVQ $1, (AX)
13 0x004b 00075 (main.go:5) LEAQ type.noalg.struct { F uintptr; "".x *int }(SB), AX
14 0x0052 00082 (main.go:5) MOVQ AX, (SP)
15 0x0056 00086 (main.go:5) PCDATA $1, $1
16 0x0056 00086 (main.go:5) CALL runtime.newobject(SB)
17 0x005b 00091 (main.go:5) MOVQ 8(SP), AX
18 0x0060 00096 (main.go:5) MOVQ AX, ""..autotmp_4+16(SP)
19 0x0065 00101 (main.go:5) LEAQ "".outer.func1(SB), CX
20 0x006c 00108 (main.go:5) MOVQ CX, (AX)
21 ...
首先,我们发现不一样的是 x:=1
会调用 runtime.newobject
函数(内置new
函数的底层函数,它返回数据类型指针)。在正常函数局部变量的定义时,例如
1package main
2
3func add() int {
4 x := 100
5 x++
6 return x
7}
8
9func main() {
10 _ = add()
11}
我们能发现 x:=100
是不会调用 runtime.newobject
函数的,它对应的汇编是如下
1"".add STEXT nosplit size=58 args=0x8 locals=0x10
2 0x0000 00000 (main.go:3) TEXT "".add(SB), NOSPLIT|ABIInternal, $16-8
3 ...
4 0x000e 00014 (main.go:3) MOVQ $0, "".~r0+24(SP)
5 0x0017 00023 (main.go:4) MOVQ $100, "".x(SP) // x:=100
6 0x001f 00031 (main.go:5) MOVQ $101, "".x(SP)
7 0x0027 00039 (main.go:6) MOVQ $101, "".~r0+24(SP)
8 ...
留着疑问,继续往下看。我们发现有以下语句
1 0x004b 00075 (main.go:5) LEAQ type.noalg.struct { F uintptr; "".x *int }(SB), AX
2 0x0052 00082 (main.go:5) MOVQ AX, (SP)
3 0x0056 00086 (main.go:5) PCDATA $1, $1
4 0x0056 00086 (main.go:5) CALL runtime.newobject(SB)
我们看到 type.noalg.struct { F uintptr; "".x *int }(SB)
,这其实就是定义的一个闭包数据类型,它的结构表示如下
1type closure struct {
2 F uintptr // 函数指针,代表着内部匿名函数
3 x *int // 自由变量x,代表着对外部环境的引用
4}
之后,在通过 runtime.newobject
函数创建了闭包对象。而且由于 LEAQ xxx yyy
代表的是将 xxx
指针,传递给 yyy
,因此 outer
函数最终的返回,其实是闭包结构体对象指针。在《详解逃逸分析》一文中,我们详细地描述了Go编译器的逃逸分析机制,对于这种函数返回暴露给外部指针的情况,很明显,闭包对象会被分配至堆上,变量x也会随着对象逃逸至堆。这就很好地解释了为什么x
变量没有随着函数栈的销毁而消亡。
我们可以通过逃逸分析来验证我们的结论
1$ go build -gcflags '-m -m -l' main.go
2# command-line-arguments
3./main.go:6:3: outer.func1 capturing by ref: x (addr=true assign=true width=8)
4./main.go:5:9: func literal escapes to heap:
5./main.go:5:9: flow: ~r0 = &{storage for func literal}:
6./main.go:5:9: from func literal (spill) at ./main.go:5:9
7./main.go:5:9: from return func literal (return) at ./main.go:5:2
8./main.go:4:2: x escapes to heap:
9./main.go:4:2: flow: {storage for func literal} = &x:
10./main.go:4:2: from func literal (captured by a closure) at ./main.go:5:9
11./main.go:4:2: from x (reference) at ./main.go:6:3
12./main.go:4:2: moved to heap: x // 变量逃逸
13./main.go:5:9: func literal escapes to heap // 函数逃逸
至此,我相信读者已经明白为什么闭包能持续持有外部变量的原因了。那么,我们来思考上文中留下的疑问,为什么在x:=1
时会调用 runtime.newobject
函数。
我们将上文中的例子改为如下,即删掉 x++
代码
1package main
2
3func outer() func() int {
4 x := 1
5 return func() int {
6 return x
7 }
8}
9
10func main() {
11 _ = outer()
12}
此时,x:=1
处的汇编代码,将不再调用 runtime.newobject
函数,通过逃逸分析也会发现将x
不再逃逸,生成的闭包对象中的x
的将是值类型int
1type closure struct {
2 F uintptr
3 x int
4}
这其实就是Go编译器做得精妙的地方:当闭包内没有对外部变量造成修改时,Go 编译器会将自由变量的引用传递优化为直接值传递,避免变量逃逸。
总结
函数闭包一点也不神秘,它就是函数和引用环境而组合的实体。在Go中,闭包在底层是一个结构体对象,它包含了函数指针与自由变量。
Go编译器的逃逸分析机制,会将闭包对象分配至堆中,这样自由变量就不会随着函数栈的销毁而消失,它能依附着闭包实体而一直存在。因此,闭包使用的优缺点是很明显的:闭包能够避免使用全局变量,转而维持自由变量长期存储在内存之中;但是,这种隐式地持有自由变量,在使用不当时,会很容易造成内存浪费与泄露。
在实际的项目中,闭包的使用场景并不多。当然,如果你的代码中写了闭包,例如你写的某回调函数形成了闭包,那就需要谨慎一些,否则内存的使用问题也许会给你带来麻烦。
------------------- End -------------------
往期精彩文章推荐:
欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持
想加入Go学习群请在后台回复【入群】
万水千山总是情,点个【在看】行不行