golang协程池设计详解

why pool

go自从出生就身带“高并发”的标签，其并发编程就是由groutine实现的，因其消耗资源低，性能高效，开发成本低的特性而被广泛应用到各种场景，例如服务端开发中使用的http服务,在golang net/http包中,每一个被监听到的tcp链接都是由一个groutine去完成处理其上下文的，由此使得其拥有极其优秀的并发量吞吐量

for {
    // 监听tcp
    rw, e := l.accept()
    if e != nil {
      .......
    }
    tempdelay = 0
    c := srv.newconn(rw)
    c.setstate(c.rwc, statenew) // before serve can return
    // 启动协程处理上下文
    go c.serve(ctx)
}

虽然创建一个groutine占用的内存极小(大约2kb左右，线程通常2m左右)，但是在实际生产环境无限制的开启协程显然是不科学的，比如上图的逻辑，如果来几千万个请求就会开启几千万个groutine,当没有更多内存可用时,go的调度器就会阻塞groutine最终导致内存溢出乃至严重的崩溃，所以本文将通过实现一个简单的协程池，以及剖析几个开源的协程池源码来探讨一下对groutine的并发控制以及多路复用的设计和实现。

一个简单的协程池

过年前做过一波小需求，是将主播管理系统中信息不完整的主播找出来然后再到其相对应的直播平台爬取完整信息并补全，当时考虑到每一个主播的数据都要访问一次直播平台所以就用应对每一个主播开启一个groutine去抓取数据，虽然这个业务量还远远远远达不到能造成groutine性能瓶颈的地步，但是心里总是不舒服，于是放假回来后将其优化成从协程池中控制groutine数量再开启爬虫进行数据抓取。思路其实非常简单，用一个channel当做任务队列，初始化groutine池时确定好并发量，然后以设置好的并发量开启groutine同时读取channel中的任务并执行, 模型如下图

实现

type simplepool struct {
  wg  sync.waitgroup
  work chan func() //任务队列
}

func newsimplepoll(workers int) *simplepool {
  p := &simplepool{
    wg:  sync.waitgroup{},
    work: make(chan func()),
  }
  p.wg.add(workers)
  //根据指定的并发量去读取管道并执行
  for i := 0; i < workers; i++ {
    go func() {
      defer func() {
        // 捕获异常 防止waitgroup阻塞
        if err := recover(); err != nil {
          fmt.println(err)
          p.wg.done()
        }
      }()
      // 从workchannel中取出任务执行
      for fn := range p.work {
        fn()
      }
      p.wg.done()
    }()
  }
  return p
}
// 添加任务
func (p *simplepool) add(fn func()) {
  p.work <- fn
}

// 执行
func (p *simplepool) run() {
  close(p.work)
  p.wg.wait()
}

测试

测试设定为在并发数量为20的协程池中并发抓取一百个人的信息, 因为代码包含较多业务逻辑所以sleep 1秒模拟爬虫过程，理论上执行时间为5秒

func testsimplepool(t *testing.t) {
  p := newsimplepoll(20)
  for i := 0; i < 100; i++ {
    p.add(parsetask(i))
  }
  p.run()
}

func parsetask(i int) func() {
  return func() {
    // 模拟抓取数据的过程
    time.sleep(time.second * 1)
    fmt.println("finish parse ", i)
  }
}

这样一来最简单的一个groutine池就完成了

go-playground/pool

上面的groutine池虽然简单，但是对于每一个并发任务的状态，pool的状态缺少控制，所以又去看了一下的源码实现，先从每一个需要执行的任务入手，该库中对并发单元做了如下的结构体，可以看到除工作单元的值，错误，执行函数等，还用了三个分别表示，取消，取消中，写的三个并发安全的原子操作值来标识其运行状态。

// 需要加入pool 中执行的任务
type workfunc func(wu workunit) (interface{}, error)

// 工作单元
type workunit struct {
  value   interface{}  // 任务结果 
  err    error     // 任务的报错
  done    chan struct{} // 通知任务完成
  fn     workfunc  
  cancelled atomic.value  // 任务是否被取消
  cancelling atomic.value  // 是否正在取消任务
  writing  atomic.value  // 任务是否正在执行
}

接下来看pool的结构

type limitedpool struct {
  workers uint      // 并发量 
  work  chan *workunit // 任务channel
  cancel chan struct{}  // 用于通知结束的channel
  closed bool      // 是否关闭
  m    sync.rwmutex  // 读写锁，主要用来保证 closed值的并发安全
}

初始化groutine池, 以及启动设定好数量的groutine

// 初始化pool,设定并发量
func newlimited(workers uint) pool {
  if workers == 0 {
    panic("invalid workers '0'")
  }
  p := &limitedpool{
    workers: workers,
  }
  p.initialize()
  return p
}

func (p *limitedpool) initialize() {
  p.work = make(chan *workunit, p.workers*2)
  p.cancel = make(chan struct{})
  p.closed = false
  for i := 0; i < int(p.workers); i++ {
    // 初始化并发单元
    p.newworker(p.work, p.cancel)
  }
}

// passing work and cancel channels to newworker() to avoid any potential race condition
// betweeen p.work read & write
func (p *limitedpool) newworker(work chan *workunit, cancel chan struct{}) {
  go func(p *limitedpool) {

    var wu *workunit

    defer func(p *limitedpool) {
      // 捕获异常，结束掉异常的工作单元，并将其再次作为新的任务启动
      if err := recover(); err != nil {

        trace := make([]byte, 1<<16)
        n := runtime.stack(trace, true)

        s := fmt.sprintf(errrecovery, err, string(trace[:int(math.min(float64(n), float64(7000)))]))

        iwu := wu
        iwu.err = &errrecovery{s: s}
        close(iwu.done)

        // need to fire up new worker to replace this one as this one is exiting
        p.newworker(p.work, p.cancel)
      }
    }(p)

    var value interface{}
    var err error

    for {
      select {
      // workchannel中读取任务
      case wu = <-work:

        // 防止channel 被关闭后读取到零值
        if wu == nil {
          continue
        }

        // 先判断任务是否被取消
        if wu.cancelled.load() == nil {
          // 执行任务
          value, err = wu.fn(wu)
          wu.writing.store(struct{}{})
          
          // 任务执行完在写入结果时需要再次检查工作单元是否被取消，防止产生竞争条件
          if wu.cancelled.load() == nil && wu.cancelling.load() == nil {
            wu.value, wu.err = value, err
            close(wu.done)
          }
        }
      // pool是否被停止
      case <-cancel:
        return
      }
    }

  }(p)
}

往pool中添加任务,并检查pool是否关闭

func (p *limitedpool) queue(fn workfunc) workunit {
  w := &workunit{
    done: make(chan struct{}),
    fn:  fn,
  }

  go func() {
    p.m.rlock()
    if p.closed {
      w.err = &errpoolclosed{s: errclosed}
      if w.cancelled.load() == nil {
        close(w.done)
      }
      p.m.runlock()
      return
    }
    // 将工作单元写入workchannel, pool启动后将由上面newworker函数中读取执行
    p.work <- w
    p.m.runlock()
  }()

  return w
}

在go-playground/pool包中， limitedpool的批量并发执行还需要借助batch.go来完成

// batch contains all information for a batch run of workunits
type batch struct {
  pool  pool     // 上面的limitedpool实现了pool interface
  m    sync.mutex  // 互斥锁，用来判断closed
  units  []workunit  // 工作单元的slice， 这个主要用在不设并发限制的场景，这里忽略
  results chan workunit // 结果集,执行完后的workunit会更新其value,error,可以从结果集channel中读取
  done  chan struct{} // 通知batch是否完成
  closed bool
  wg   *sync.waitgroup
}

// go-playground/pool 中有设置并发量和不设并发量的批量任务，都实现pool interface，初始化batch批量任务时会将之前创建好的pool传入newbatch
func newbatch(p pool) batch {
  return &batch{
    pool:  p,
    units:  make([]workunit, 0, 4), // capacity it to 4 so it doesn't grow and allocate too many times.
    results: make(chan workunit),
    done:  make(chan struct{}),
    wg:   new(sync.waitgroup),
  }
}

// 往批量任务中添加workfunc任务
func (b *batch) queue(fn workfunc) {

  b.m.lock()
  if b.closed {
    b.m.unlock()
    return
  }
  //往上述的limitpool中添加workfunc
  wu := b.pool.queue(fn)

  b.units = append(b.units, wu) // keeping a reference for cancellation purposes
  b.wg.add(1)
  b.m.unlock()
  
  // 执行完后将workunit写入结果集channel
  go func(b *batch, wu workunit) {
    wu.wait()
    b.results <- wu
    b.wg.done()
  }(b, wu)
}

// 通知批量任务不再接受新的workfunc, 如果添加完workfunc不执行改方法的话将导致取结果集时done channel一直阻塞
func (b *batch) queuecomplete() {
  b.m.lock()
  b.closed = true
  close(b.done)
  b.m.unlock()
}

// 获取批量任务结果集
func (b *batch) results() <-chan workunit {
  go func(b *batch) {
    <-b.done
    b.m.lock()
    b.wg.wait()
    b.m.unlock()
    close(b.results)
  }(b)
  return b.results
}

测试

func sendmail(int int) pool.workfunc {
  fn := func(wu pool.workunit) (interface{}, error) {
    // sleep 1s 模拟发邮件过程
    time.sleep(time.second * 1)
    // 模拟异常任务需要取消
    if int == 17 {
      wu.cancel()
    }
    if wu.iscancelled() {
      return false, nil
    }
    fmt.println("send to", int)
    return true, nil
  }
  return fn
}

func testbatchwork(t *testing.t) {
  // 初始化groutine数量为20的pool
  p := pool.newlimited(20)
  defer p.close()
  batch := p.batch()
  // 设置一个批量任务的过期超时时间
  t := time.after(10 * time.second)
  go func() {
    for i := 0; i < 100; i++ {
      batch.queue(sendmail(i))
    }
    batch.queuecomplete()
  }()
  // 因为 batch.results 中要close results channel 所以不能将其放在loop中执行
  r := batch.results()
loop:
  for {
    select {
    case <-t:
    // 登台超时通知
      fmt.println("recived timeout")
      break loop
   
    case email, ok := <-r:
    // 读取结果集
      if ok {
        if err := email.error(); err != nil {
          fmt.println("err", err.error())
        }
        fmt.println(email.value())
      } else {
        fmt.println("finish")
        break loop
      }
    }
  }
}

接近理论值5s, 通知模拟被取消的work也正常取消

go-playground/pool在比起之前简单的协程池的基础上，对pool, worker的状态有了很好的管理。但是，但是问题来了，在第一个实现的简单groutine池和go-playground/pool中，都是先启动预定好的groutine来完成任务执行，在并发量远小于任务量的情况下确实能够做到groutine的复用，如果任务量不多则会导致任务分配到每个groutine不均匀，甚至可能出现启动的groutine根本不会执行任务从而导致浪费，而且对于协程池也没有动态的扩容和缩小。所以我又去看了一下ants的设计和实现。

ants

是一个受启发的高性能协程池, fasthttp号称是比go原生的net/http快10倍，其快速高性能的原因之一就是采用了各种池化技术（这个日后再开新坑去读源码), ants相比之前两种协程池，其模型更像是之前接触到的数据库连接池，需要从空余的worker中取出一个来执行任务, 当无可用空余worker的时候再去创建，而当pool的容量达到上线之后，剩余的任务阻塞等待当前进行中的worker执行完毕将worker放回pool, 直至pool中有空闲worker。 ants在内存的管理上做得很好，除了定期清除过期worker(一定时间内没有分配到任务的worker)，ants还实现了一种适用于大批量相同任务的pool, 这种pool与一个需要大批量重复执行的函数锁绑定，避免了调用方不停的创建，更加节省内存。

先看一下ants的pool 结构体 (pool.go)

type pool struct {
  // 协程池的容量 (groutine数量的上限)
  capacity int32
  // 正在执行中的groutine
  running int32
  // 过期清理间隔时间
  expiryduration time.duration
  // 当前可用空闲的groutine
  workers []*worker
  // 表示pool是否关闭
  release int32
  // lock for synchronous operation.
  lock sync.mutex
  // 用于控制pool等待获取可用的groutine
  cond *sync.cond
  // 确保pool只被关闭一次
  once sync.once
  // worker临时对象池，在复用worker时减少新对象的创建并加速worker从pool中的获取速度
  workercache sync.pool
  // pool引发panic时的执行函数
  panichandler func(interface{})
}

接下来看pool的工作单元 worker (worker.go)

type worker struct {
  // worker 所属的poo;
  pool *pool
  // 任务队列
  task chan func()
  // 回收时间，即该worker的最后一次结束运行的时间
  recycletime time.time
}

执行worker的代码 (worker.go)

func (w *worker) run() {
  // pool中正在执行的worker数+1
  w.pool.incrunning()
  go func() {
    defer func() {
      if p := recover(); p != nil {
        //若worker因各种问题引发panic, 
        //pool中正在执行的worker数 -1，     
        //如果设置了pool中的panichandler，此时会被调用
        w.pool.decrunning()
        if w.pool.panichandler != nil {
          w.pool.panichandler(p)
        } else {
          log.printf("worker exits from a panic: %v", p)
        }
      }
    }()
    
    // worker 执行任务队列
    for f := range w.task {
      //任务队列中的函数全部被执行完后，
      //pool中正在执行的worker数 -1， 
      //将worker 放回对象池
      if f == nil {
        w.pool.decrunning()
        w.pool.workercache.put(w)
        return
      }
      f()
      //worker 执行完任务后放回pool 
      //使得其余正在阻塞的任务可以获取worker
      w.pool.revertworker(w)
    }
  }()
}

了解了工作单元worker如何执行任务以及与pool交互后，回到pool中查看其实现， pool的核心就是取出可用worker提供给任务执行 (pool.go)

// 向pool提交任务
func (p *pool) submit(task func()) error {
  if 1 == atomic.loadint32(&p.release) {
    return errpoolclosed
  }
  // 获取pool中的可用worker并向其任务队列中写入任务
  p.retrieveworker().task <- task
  return nil
}


// **核心代码** 获取可用worker
func (p *pool) retrieveworker() *worker {
  var w *worker

  p.lock.lock()
  idleworkers := p.workers
  n := len(idleworkers) - 1
 // 当前pool中有可用worker, 取出(队尾)worker并执行
  if n >= 0 {
    w = idleworkers[n]
    idleworkers[n] = nil
    p.workers = idleworkers[:n]
    p.lock.unlock()
  } else if p.running() < p.cap() {
    p.lock.unlock()
    // 当前pool中无空闲worker,且pool数量未达到上线
    // pool会先从临时对象池中寻找是否有已完成任务的worker,
    // 若临时对象池中不存在，则重新创建一个worker并将其启动
    if cacheworker := p.workercache.get(); cacheworker != nil {
      w = cacheworker.(*worker)
    } else {
      w = &worker{
        pool: p,
        task: make(chan func(), workerchancap),
      }
    }
    w.run()
  } else {
    // pool中没有空余worker且达到并发上限
    // 任务会阻塞等待当前运行的worker完成任务释放会pool
    for {
      p.cond.wait() // 等待通知， 暂时阻塞
      l := len(p.workers) - 1
      if l < 0 {
        continue
      }
      // 当有可用worker释放回pool之后， 取出
      w = p.workers[l]
      p.workers[l] = nil
      p.workers = p.workers[:l]
      break
    }
    p.lock.unlock()
  }
  return w
}

// 释放worker回pool
func (p *pool) revertworker(worker *worker) {
  worker.recycletime = time.now()
  p.lock.lock()
  p.workers = append(p.workers, worker)
  // 通知pool中已经获取锁的groutine, 有一个worker已完成任务
  p.cond.signal()
  p.lock.unlock()
}

在批量并发任务的执行过程中，如果有超过5纳秒(ants中默认worker过期时间为5ns)的worker未被分配新的任务，则将其作为过期worker清理掉，从而保证pool中可用的worker都能发挥出最大的作用以及将任务分配得更均匀
(pool.go)

// 该函数会在pool初始化后在协程中启动
func (p *pool) periodicallypurge() {
  // 创建一个5ns定时的心跳
  heartbeat := time.newticker(p.expiryduration)
  defer heartbeat.stop()

  for range heartbeat.c {
    currenttime := time.now()
    p.lock.lock()
    idleworkers := p.workers
    if len(idleworkers) == 0 && p.running() == 0 && atomic.loadint32(&p.release) == 1 {
      p.lock.unlock()
      return
    }
    n := -1
    for i, w := range idleworkers {
      // 因为pool 的worker队列是先进后出的，所以正序遍历可用worker时前面的往往里当前时间越久
      if currenttime.sub(w.recycletime) <= p.expiryduration {
        break
      }  
      // 如果worker最后一次运行时间距现在超过5纳秒，视为过期，worker收到nil, 执行上述worker.go中 if n == nil 的操作
      n = i
      w.task <- nil
      idleworkers[i] = nil
    }
    if n > -1 {
      // 全部过期
      if n >= len(idleworkers)-1 {
        p.workers = idleworkers[:0]
      } else {
      // 部分过期
        p.workers = idleworkers[n+1:]
      }
    }
    p.lock.unlock()
  }
}

测试

func testants(t *testing.t) {
  wg := sync.waitgroup{}
  pool, _ := ants.newpool(20)
  defer pool.release()
  for i := 0; i < 100; i++ {
    wg.add(1)
    pool.submit(sendmail(i, &wg))
  }
  wg.wait()
}

func sendmail(i int, wg *sync.waitgroup) func() {
  return func() {
    time.sleep(time.second * 1)
    fmt.println("send mail to ", i)
    wg.done()
  }
}

这里虽只简单的测试批量并发任务的场景，如果大家有兴趣可以去看看ants的压力测试， ants的吞吐量能够比原生groutine高出n倍，内存节省10到20倍，可谓是协程池中的神器。