Skip to content

并发编程详解

本文档深入介绍Go语言的并发编程模型,包括Goroutine、Channel、同步机制等核心概念和实践技巧。

📋 目录

Go并发模型概述

Go语言从设计之初就将并发作为核心特性,采用了CSP(Communicating Sequential Processes)并发模型。

核心理念

"不要通过共享内存来通信,而要通过通信来共享内存"

Don't communicate by sharing memory; share memory by communicating.

并发 vs 并行

概念定义特点
并发(Concurrency)同时处理多个任务的能力逻辑上同时进行
并行(Parallelism)同时执行多个任务的能力物理上同时进行
go
// 并发示例:多个任务交替执行
func concurrentExample() {
    go task1()  // 任务1
    go task2()  // 任务2
    go task3()  // 任务3
    // 三个任务可能在单核上交替执行
}

Goroutine深入理解

Goroutine特性

Goroutine是Go并发的核心,具有以下特点:

特性Goroutine传统线程
内存开销2KB起始栈2MB固定栈
创建成本极低较高
调度方式协作式抢占式
数量限制数十万个数千个

创建和使用Goroutine

基本语法

go
go functionName(parameters)

实践示例

go
package main

import (
    "fmt"
    "runtime"
    "time"
)

func say(s string) {
    for i := 0; i < 5; i++ {
        runtime.Gosched()  // 主动让出CPU时间片
        fmt.Printf("%s: %d\n", s, i)
    }
}

func main() {
    // 启动并发执行
    go say("goroutine")  // 在新的goroutine中执行
    say("main")          // 在主goroutine中执行
    
    // 等待goroutine完成
    time.Sleep(time.Second)
}

输出示例:

main: 0
goroutine: 0
main: 1
goroutine: 1
main: 2
goroutine: 2
main: 3
goroutine: 3
main: 4
goroutine: 4

Goroutine生命周期

go
func goroutineLifecycle() {
    fmt.Println("主goroutine开始")
    
    go func() {
        fmt.Println("子goroutine开始")
        time.Sleep(2 * time.Second)
        fmt.Println("子goroutine结束")
    }()
    
    fmt.Println("主goroutine继续执行")
    time.Sleep(3 * time.Second)  // 等待子goroutine完成
    fmt.Println("主goroutine结束")
}

运行时管理

Go运行时提供了一些有用的函数来管理goroutine:

go
import "runtime"

func runtimeExample() {
    // 获取当前goroutine数量
    fmt.Printf("当前goroutine数量: %d\n", runtime.NumGoroutine())
    
    // 获取CPU核心数
    fmt.Printf("CPU核心数: %d\n", runtime.NumCPU())
    
    // 设置最大使用的CPU核心数
    runtime.GOMAXPROCS(runtime.NumCPU())
    
    // 主动让出CPU时间片
    runtime.Gosched()
    
    // 强制进行垃圾回收
    runtime.GC()
}

默认情况下,在Go 1.5将标识并发系统线程个数的`runtime.GOMAXPROCS`的初始值由1改为了`运行环境的CPU核数`

但在Go 1.5以前调度器仅使用单线程,也就是说只实现了并发。想要发挥多核处理器的并行,需要程序中显式调用 `runtime.GOMAXPROCS(n)` 告诉调度器同时使用多个线程。`GOMAXPROCS` 设置了同时运行逻辑代码的系统线程的最大数量,并返回之前的设置。如果`n < 1`,不会改变当前设置。

## channels

`goroutine`运行在相同的地址空间,因此访问共享内存必须做好同步。那么`goroutine`之间如何进行数据的通信呢,Go提供了一个很好的通信机制`channel``channel`可以与`Unix shell` 中的双向管道做类比:可以通过它发送或者接收值。这些值只能是特定的类型:`channel类型`。定义一个`channel`时,也需要定义发送到`channel`的值的类型。注意,必须使用`make` 创建`channel`

```go
ci := make(chan int)
cs := make(chan string)
cf := make(chan interface{})

channel通过操作符<-来接收和发送数据

go
ch <- v    // 发送v到channel ch.
v := <-ch  // 从ch中接收数据,并赋值给v

把这些应用到例子中来:

go
package main
import "fmt"
func sum(a []int, c chan int) {
    total := 0
    for _, v := range a {
        total += v
    }
    c <- total  // send total to c
}
func main() {
    a := []int{7, 2, 8, -9, 4, 0}
    c := make(chan int)
    go sum(a[:len(a)/2], c)
    go sum(a[len(a)/2:], c)
    x, y := <-c, <-c  // receive from c
    fmt.Println(x, y, x + y)
}

默认情况下,channel接收和发送数据都是阻塞的,除非另一端已经准备好,这样就使得Goroutines同步变的更加的简单,而不需要显式的lock。所谓阻塞,也就是如果读取(value := <-ch)它将会被阻塞,直到有数据接收。其次,任何发送(ch<-5)将会被阻塞,直到数据被读出。无缓冲channel是在多个goroutine之间同步很棒的工具。

Buffered Channels

上面介绍了默认的非缓存类型的channel,不过Go也允许指定channel的缓冲大小,很简单,就是channel可以存储多少元素。ch:= make(chan bool, 4),创建了可以存储4个元素的bool 型channel。在这个channel 中,前4个元素可以无阻塞的写入。当写入第5个元素时,代码将会阻塞,直到其他goroutine从channel 中读取一些元素,腾出空间。

go
ch := make(chan type, value)

value = 0 时,channel 是无缓冲阻塞读写的,当value > 0 时,channel 有缓冲、是非阻塞的,直到写满 value 个元素才阻塞写入。

看一下下面这个例子,可以在自己本机测试一下,修改相应的value值

go
package main
import "fmt"
func main() {
    c := make(chan int, 2)//修改2为1就报错,修改2为3可以正常运行
    c <- 1
    c <- 2
    fmt.Println(<-c)
    fmt.Println(<-c)
}
//修改为1报如下的错误:
//fatal error: all goroutines are asleep - deadlock!

Range和Close

上面这个例子中,需要读取两次c,这样不是很方便,Go考虑到了这一点,所以也可以通过range,像操作slice或者map一样操作缓存类型的channel,请看下面的例子

go
package main
import (
    "fmt"
)
func fibonacci(n int, c chan int) {
    x, y := 1, 1
    for i := 0; i < n; i++ {
        c <- x
        x, y = y, x + y
    }
    close(c)
}
func main() {
    c := make(chan int, 10)
    go fibonacci(cap(c), c)
    for i := range c {
        fmt.Println(i)
    }
}

for i := range c能够不断的读取channel里面的数据,直到该channel被显式的关闭。上面代码看到可以显式的关闭channel,生产者通过内置函数close关闭channel。关闭channel之后就无法再发送任何数据了,在消费方可以通过语法v, ok := <-ch测试channel是否被关闭。如果ok返回false,那么说明channel已经没有任何数据并且已经被关闭。

记住应该在生产者的地方关闭channel,而不是消费的地方去关闭它,这样容易引起panic

另外记住一点的就是channel不像文件之类的,不需要经常去关闭,只有确实没有任何发送数据了,或者想显式的结束range循环之类的

Select

上面介绍的都是只有一个channel的情况,那么如果存在多个channel的时候,该如何操作呢,Go里面提供了一个关键字select,通过select可以监听channel上的数据流动。

select默认是阻塞的,只有当监听的channel中有发送或接收可以进行时才会运行,当多个channel都准备好的时候,select是随机的选择一个执行的。

go
package main
import "fmt"
func fibonacci(c, quit chan int) {
    x, y := 1, 1
    for {
        select {
        case c <- x:
            x, y = y, x + y
        case <-quit:
            fmt.Println("quit")
            return
        }
    }
}
func main() {
    c := make(chan int)
    quit := make(chan int)
    go func() {
        for i := 0; i < 10; i++ {
            fmt.Println(<-c)
        }
        quit <- 0
    }()
    fibonacci(c, quit)
}

select里面还有default语法,select其实就是类似switch的功能,default就是当监听的channel都没有准备好的时候,默认执行的(select不再阻塞等待channel)。

go
select {
case i := <-c:
    // use i
default:
    // 当c阻塞的时候执行这里
}

超时

有时候会出现goroutine阻塞的情况,那么如何避免整个程序进入阻塞的情况呢?可以利用select来设置超时,通过如下的方式实现:

go
func main() {
    c := make(chan int)
    o := make(chan bool)
    go func() {
        for {
            select {
                case v := <- c:
                    println(v)
                case <- time.After(5 * time.Second):
                    println("timeout")
                    o <- true
                    break
            }
        }
    }()
    <- o
}

runtime goroutine

runtime包中有几个处理goroutine的函数:

  • Goexit : 退出当前执行的goroutine,但是defer函数还会继续调用

  • Gosched: 让出当前goroutine的执行权限,调度器安排其他等待的任务运行,并在下次某个时候从该位置恢复执行。

  • NumCPU : 返回 CPU 核数量

  • NumGoroutine: 返回正在执行和排队的任务总数

  • GOMAXPROCS : 用来设置可以并行计算的CPU核数的最大值,并返回之前的值。

基于 MIT 许可发布