Go的性能优化建议

2023-06-27 08:48:27

前言: \textcolor{Green}{前言:} 前言:

💞这个专栏就专门来记录一下寒假参加的第五期字节跳动训练营
💞从这个专栏里面可以迅速获得Go的知识

性能优化对于一个系统来说是非常重要的,因为我们在编写代码结束的时候有可能不会对性能有过多的关注,但是对于用户来说性能是非常重要的,我们肯定希望使用的系统是流畅的。这是一个速度决定一切的年代,只要我们的还继续在这个时代中,线下的流程与系统就在持续向线上转移,我们就会碰到性能问题。

3 性能优化建议

简介

  • 性能优化的前提是满足正确可靠、简洁清晰等质量因素
  • 性能优化是综合评估,有时候时间效率和空间效率可能对立
  • 针对 Go 语言特性,介绍 Go 相关的性能优化建议

3.1 性能优化建议 - Benchmark

如何使用

  • 性能表现需要实际数据衡量
  • Go 语言提供了支持基准性能测试的 benchmark 工具
  • go test -bench=. -benchmen
// from fib.go
func Fib(n int) int {
    if n < 2 {
        return n
    }
    return Fib(n - 1) + Fib(n - 2)
}

// from fib_test.go
func BenchmarkFib10(b *testing.B) {
    // run the Fib function b.N times
    for n := 0; n < b.N; n++ {
        Fib(10)
    }
}

结果说明

在这里插入图片描述

  • BenchmarkFib10-8:BenchmarkFib10是测试函数名,-8 表示 GOMAXPROCS 的值为8
  • 1855870:表示一共执行 1855870次, 即 b.N 的值
  • 602.5 ns/op:表示每次执行花费 602.5 ns
  • 0 B/op:表示每次执行申请多大的内存
  • 0 allocs/op:表示每次执行申请几次内存

GOMAXPROCS 1.5版本后,默认值为CPU核数,https://pkg.go.dev/runtime#GOMAXPROCS

3.2 性能优化建议 - slice

slice 预分配内存

  • 尽可能在使用 make() 初始化切片时提供容量信息

查看下面的代码,可以发现,提供容量信息后数据明显好

func NoPreAlloc(size int) {
    data := make([]int, 0)
    for k := 0; k < size; k++ {
        data = append(data, k)
    }
}

func PreAlloc(size int) {
    data := make([]int, 0, size)
    for k := 0; k < size; k++ {
        data = append(data, k)
    }
}
BenchmarkNoPreAlloc-83529980331.1 ns/op2040 B/op8 allocs/op
BenchmarkPreAlloc-811171086107.1 ns/op896 B/op1 allocs/op

在这里插入图片描述
此时我们明白了

  • 切片本质是一个数组片段的描述
    • 包括数组指针
    • 片段长度
    • 片段的容量(不改变内存分配情况下的最大长度)
  • 切片操作并不复制切片指向的元素
  • 创建一个新的切片会复用原来切片的底层数组
  •  type slice struct {
         array unsafe.Pointer
         len int
         cap int
     }
    

另一个陷阱:大内存未释放

  • 在已有切片基础上创建切片,不会创建新的底层数组
  • 场景:
    • 原切片较大,代码在原切片基础上新建小切片
    • 原底层数组在内存中有引用,得不到释放
  • 可使用 copy 替代 re-slice
func GetLastBySlice(origin []int) []int {
    return origin[len(origin)-2:]
}
func GetLastByCopy(origin []int) []int {
    result := make([]int, 2)
    copy(result, origin[len(origin)-2:])
    return result
}
func testGetLast(t *testing.T, f func([]int) []int) {
    result := make([][]int, 0)
    for k := 0; k < 100; k++ {
        origin := generateWithCap(128 * 1024) // 1M
        result = append(result, f(origin))
    }
    printMem(t)
    _ = result
}

可以查看链接直达

3.3 性能优化建议 - Map

map 预分配内存

func NoPreAlloc(size int) {
    data := make(map[int]int)
    for k := 0; k < size; k++ {
        data[i] = 1
    }
}

func PreAlloc(size int) {
    data := make(map[int]int, size)
    for k := 0; k < size; k++ {
        data[i] = 1
    }
}
BenchmarkNoPreAlloc-82269951972ns/op82327B/op9 allocs/op
BenchmarkPreAlloc-81234189622ns/op40984B/op2 allocs/op

分析:

  • 不断向 map 中添加元素的操作会触发 map 的扩容
  • 提前分配好空间可以减少内存拷贝和 Rehash 的消耗
  • 建议根据实际需求提前预估好需要的空间

3.4 性能优化建议 - 字符串处理

  • 常见的字符串拼接方式
func Plus(n int, str string) string {
    s := ""
    for i := 0; i < n; i++ {
        s += str
    }
}
func StrBuilder(n int, str string) string {
    var bulider strings.Builder
    for i := 0; i < n; i++ {
        builder.WriteString(str)
    }
    return builder.String()
}

使用 strings.Builder

func ByteBuffer(n int, str string) string {
    buf := new(bytes.Buffer)
    for i := 0; i < n; i++ {
        buf.WriteString(str)
    }
    return buf.String()
}
BenchmarkPlus-84318280260ns/op3212595 B/op999 allocs/op
BenchmarkStrBulider-82692572392 ns/op26744 B/op15 allocs/op
BenchmarkByteBuffer-82092785699 ns/op25008 B/op9 allocs/op
  • 使用 + 拼接性能最差,strings.Builder,bytes.Buffer 相近,strings.Buffer 更快
  • 分析
    • 字符串在 Go 语言中是不可变类型,占用内存大小是固定的
    • 使用 + 每次都会重新分配内存
    • strings.Builder,bytes.Buffer 底层都是 []byte 数组
    • 内存扩容策略,不需要每次拼接重新分配内存

注意看下面的

  • bytes.Buffer 转换为字符串时重新申请了一块空间
  • strings.Builder 直接将底层的 []byte 转换成了字符串类型返回
// to build strings more efficiently, see the strings.Builder type.
func (b *Buffer) String() string {
    if b == nil {
        // Special case, useful in debugging.
        return "<nil>"
    }
    return string(b.buf[b.off:])
}

// String returns the accumulated string
func (b *Builder) String() string {
    return *(*string)(unsafe.Pointer(&b.buf))
}
func PreStrBuilder(n int, str string) string {
    var bulider strings.Builder
    builder.Grow(n * len(str))
    for i := 0; i < n; i++ {
        builder.WriteString(str)
    }
    return builder.String()
}
func PreByteBuilder(n int, str string) string {
    buf := new(bytes.Buffer)
    buf.Grow(n * len(str))
    for i := 0; i < n; i++ {
        buf .WriteString(str)
    }
    return buf .String()
}

这五个进行对比

BenchmarkPlus-84272279704 ns/op3212596 B/op999 allocs/op
BenchmarkStrBulider-82687474405 ns/op26744 B/op15 allocs/op
BenchmarkByteBuffer-846705670 ns/op25008 B/op9 allocs/op
BenchmarkPreStrBulider-839383938 ns/op6144 B/op1 allocs/op
BenchmarkPreByteBuffer-845784578 ns/op12288 B/op2 allocs/op

3.5 性能优化建议 - 空结构体

使用空结构体节省内存

  • 空结构体 struct{} 实例不占据任何的内存空间
  • 可作为各种场景下的占位符使用
    • 节省资源
    • 空结构体本身具备很强的语义,即这里不需要任何值,仅作为占位符
func EmptyStructMap(n int) {
    m := make(map[int]struct{})
    for i := 0; i < n; i++ {
        m[i] = struct{}{}
    }
}

func BoolMap(n int){
    m := make(map[int]bool)
    for i := 0; i < n; i++ {
        m[i] = false
    }
}
BenchmarkEmptyStructMap-82372505970 ns/op378864 B/op133 allocs/op
BenchmarkBoolMap-82266526095 ns/op412362 B/op165 allocs/op
  • 实现 Set,可以考虑用 map 来代替
  • 对于这个场景,只需要用到 map 的键,而不需要值
  • 即使是将 map 的值设置为 bool类型,也会多占据 1 个字节空间

一个开源实现:https://github.com/deckarep/golang-set/blob/main/threadunsafe.go

3.6 性能优化建议 - atomic包

如何使用 atomic 包

type atomicCounter struct {
    i int32
}
func AtomicAddOne(c *atomicCounter) {
    atomic.AddInt32(&c, i, 1)
}
type mutexCounter struct {
    i int32
    m sync.Mutex
}
func MutexAddOne(c *mutexCounter) {
    c.m.Lock()
    c.i++
    c.m.Unlock()
}
BenchmarkAtomicAddOne-81418243728.045 ns/op4 B/op1 allocs/op
BenchmarkNutexAddOne-86048704421.73 ns/op16 B/op1 allocs/op

使用 atomic 包

  • 锁的实现是通过操作系统来实现,属于系统调用
  • atomic 操作是通过硬件实现的,效率比锁高
  • sync.Mutex 应该用来保护一段逻辑,不仅仅用于保护一个变量
  • 对于非数值操作,可以使用 atomic.Value,能承载一个 interface{}

性能优化建议小结

  • 避免常见的性能陷阱可以保证大部分程序的性能
  • 普通应用代码,不要一昧的追求程序的性能
  • 越高级的性能优化手段越容易出现问题
  • 在满足正常可靠、简洁清晰的质量要求的前提下提高程序性能
更多推荐

【初阶数据结构】树(tree)的基本概念——C语言

目录一、树(tree)1.1树的概念及结构1.2树的相关概念1.3树的表示1.4树在实际中的运用(表示文件系统的目录树结构)二、二叉树的概念及结构2.1二叉树的概念2.2现实中真正的二叉树2.3特殊的二叉树2.4二叉树的性质2.5二叉树的存储结构一、树(tree)1.1树的概念及结构树是一种非线性的数据结构,它是由n(

Softing物联网(IoT)方案之OT/IT数据集成

一利用数据提高效率和绩效多年以来数据集成和工业物联网一直在推动着市场的发展,目前我们已经能够集成并成功使用先进的技术、大量的传感器和复杂的数据格式等。而在工业物联网或工业4.0中,还有运营技术(OT)和信息技术(IT)它们之间的无缝数据交换对于企业提升竞争力而言同样非常重要。将生产和业务数据深度集成到IT层中可为新的利

【Oracle】Oracle系列--Oracle数据类型

文章目录前言1.字符类型2.数字类型3.大对象类型4.时间及时间间隔类型5.其他类型前言ORACLE基本数据类型,又叫内置数据类型(built-indatatypes)可以按类型分为:字符串类型、数字类型、大对象类型(LOB类型)、日期类型、LONGRAW&RAW类型、ROWID&UROWID类型。1.字符类型数据类型

浅说 MySQL 数据库日志有哪些?作用是什么?

目录1.MySQL日志有哪些?2.各种日志分析2.1错误日志2.2二进制日志2.3通用查询日志2.4慢查询日志2.5中继日志2.6数据定义语句日志2.7补充点3.日志有什么用(优点)4.日志的弊端1.MySQL日志有哪些?MySQL数据库为我们提供了很多种不同类型的日志文件,用来存储不同类型的日志。主要有错误日志,二进

Redis+SpringBoot企业版集群实战------【华为云版】

目录安装复制及集群bgsaverdbaofSpringBoot+Redis操作操作string操作hash操作set操作sortedset获取所有key&删除设置key的失效时间SpringDataRedis整合使用哨兵机制安装下载地址Redis上传至服务器解压tarzxvfredis-5.0.3.tar.gz安装依赖

JS Ajax 封装

ajax封装一、什么是Ajax?二、Ajax的优缺点?2.1优点2.2缺点三、Ajax的使用3.1状态码3.2xhr的基本使用3.3ajax原生封装:3.3.1触发GET请求:3.3.2调用POST请求:四、Ajax的约束一、什么是Ajax?Ajax(AsynchronousJavaScriptAndXML)是2005

【C++杂货铺】国庆中秋特辑——多态由浅入深详细总结

文章目录一、多态的概念二、多态的定义及实现2.1多态的构成条件2.2虚函数2.3虚函数的重写2.4虚函数重写的两个例外2.4.1协变(基类与派生类虚函数返回值类型不同)2.4.2析构函数的重写(基类与派生类析构函数的名字不同)2.5C++11override和final2.5.1final:修饰虚函数,表示该虚函数不能

ORB-SLAM2_RGBD_DENSE_MAP编译、问题解决、离线加载TUM数据和在线加载D435i相机数据生成稠密地图

文章目录0引言1安装依赖1.1其他库安装1.2pcl库安装2编译ORB-SLAM2_RGBD_DENSE_MAP2.1build.sh2.2build_ros.sh3运行ORB-SLAM2_RGBD_DENSE_MAP3.1build.sh编译版本3.2build_ros.sh编译版本0引言ORB-SLAM2_RGBD

什么是集成测试?集成测试方法有哪些?

1、基本概念:将软件集成起来后进行测试。集成测试又叫子系统测试、组装测试、部件测试等。集成测试主要是针对软件高层设计进行测试,一般来说是以模块和子系统为单位进行测试。2、集成测试包含的层次:1.模块内的集成,主要是测试模块内各个接口间的交互集成关系;2.子系统内的集成,测试子系统内各个模块间的交互关系;3.系统集成,测

学习Node js:raw-body模块源码解析

raw-body是什么raw-body的主要功能是处理HTTP请求体的原始数据。它提供了以下核心功能:解析请求体:可以从HTTP请求中提取原始数据,包括文本和二进制数据。配置选项:通过配置项,可以设置请求体的大小限制、编码方式等参数。异常处理:模块能够处理异常情况,如请求体超出限制。编码转换:支持将原始数据解码为指定编

Android 网络请求方式

前言最近需要将Android项目接入物联网公司提供的接口,所以顺便给大家分享一下Android中我们常用的网络请求吧!提醒大家一下,我们遇到接口需求,一定要先在Postman上测试接口是否正确,然后再去项目上写程序来请求接口;否则,请求出问题,你都不确定是你程序写的有问题还是接口本身提供的有问题。Android网络请求

热文推荐