go pprof令(Go语言性能分析令)完全攻略
性能分析首先需要使用 runtime.pprof 包嵌入到待分析程序的入口和结束处。runtime.pprof 包在运行时对程序进行每秒 100 次的采样,最少采样 1 秒。然后将生成的数据输出,让开发者写入文件或者其他媒介上进行分析。
go pprof 工具链配 Graphviz 图形化工具可以将 runtime.pprof 包生成的数据转换为 PDF 格式,以图片的方式展示程序的性能分析结果。
安装第三方图形化显式分析数据工具(Graphviz)
Graphviz 是一套通过文本描述的方法生成图形的工具包。描述文本的语言叫做 DOT。在 www.graphviz网站站点" rel="nofollow" />
$ yum install graphiviz
安装第三方性能分析来分析代码包
runtime.pprof 提供基础的运行时分析的驱动,但是这套接口使用起来还不是太方便,例如:
输出数据使用 io.Writer 接口,虽然扩展性很强,但是对于实际使用不够方便,不支持写入文件。
默认配置项较为复杂。
很多第三方的包在系统包 runtime.pprof 的技术上进行便利性封装,让整个测试过程更为方便。这里使用 githu网站站点" rel="nofollow" /> $ go get githu网站站点" rel="nofollow" /> package main import ( "githu网站站点" rel="nofollow" /> $ go tool pprof --pdf cpu cpu.pprof > cpu.pdf 代码说明如下: 第 1 行将 cpu.go 编译为可执行文件 cpu。 第 2 行运行可执行文件,在当前目录输出 cpu.pprof 文件。
$ ./cpu
第 3 行,使用 go tool 工具链输入 cpu.pprof 和 cpu 可执行文件,生成 PDF 格式的输出文件,将输出文件重定向为 cpu.pdf 文件。这个过程中会调用 Graphviz 工具,Windows 下需将 Graphviz 的可执行目录添加到环境变量 PATH 中。
最终生成 cpu.pdf 文件,使用 PDF 查看器打开文件,观察后发现下图所示的某个地方可能存在瓶颈。

图:性能分析
图中的每一个框为一个函数调用的路径,第 3 个方框中 joinSlice 函数耗费了 50% 的 CPU 时间,存在性能瓶颈。重新优化代码,在已知切片元素数量的情况下直接分配内存,代码如下:
func joinSlice() []string {
const count = 100000
var arr []string = make([]string, count)
for i := 0; i < count; i++ {
arr[i] = "arr"
}
return arr
}
代码说明如下:
第 5 行,将切片预分配 count 个数量,避免之前使用 append() 函数的多次分配。
第 8 行,预分配后,直接对每个元素进行直接赋值。
重新运行上面的代码进行性能分析,最终得到的 cpu.pdf 中将不会再有耗时部分。