探究在C++程序并发时保护共享数据的问题

2020-01-06 13:20:20王旭

我们启动了5个线程来增加计数器的值,每个线程增加了100次,然后在线程结束时打印计数器的值。

但我们运行这个程序的时候,我们是希望它会答应500,但事实不是如此,没人能确切知道程序将打印什么结果,下面是在我机器上运行后打印的数据,而且每次都不同:

 

 
  1. 442  500 
  2. 477  400 
  3. 422  487 

问题的原因在于改变计数器值并不是一个原子操作,需要经过下面三个操作才能完成一次计数器的增加:

首先读取 value 的值

然后将 value 值加1

将新的值赋值给 value

但你使用单线程来运行这个程序的时候当然没有任何问题,因此程序是顺序执行的,但在多线程环境中就有麻烦了,想象下下面这个执行顺序:

Thread 1 : 读取 value, 得到 0, 加 1, 因此 value = 1

Thread 2 : 读取 value, 得到 0, 加 1, 因此 value = 1

Thread 1 : 将 1 赋值给 value,然后返回 1

Thread 2 : 将 1 赋值给 value,然后返回 1

这种情况我们称之为多线程的交错执行,也就是说多线程可能在同一个时间点执行相同的语句,尽管只有两个线程,交错的现象也很明显。如果你有更多的线程、更多的操作需要执行,那么这个交错是必然发生的。

有很多方法来解决线程交错的问题:

信号量 Semaphores

原子引用 Atomic references

Monitors

Condition codes

Compare and swap

在这篇文章中我们将学习如何使用信号量来解决这个问题。信号量也有很多人称之为互斥量(Mutex),同一个时间只允许一个线程获取一个互斥对象的锁,通过 Mutex 的简单属性就可以用来解决交错的问题。

使用 Mutex 让计数器程序是线程安全的

在 C++11 线程库中,互斥量包含在 mutex 头文件中,对应的类是 std::mutex,有两个重要的方法 mutex:lock() 和 unlock() ,从名字上可得知是用来锁对象以及释放锁对象。一旦某个互斥量被锁,那么再次调用 lock() 返回堵塞值得该对象被释放。