转自:http://blog.csdn.net/morewindows/article/details/7429155
上一篇《多线程--第一次亲密接触 CreateThread与_beginthreadex本质区别》中讲到一个多线程报数功能。为了描述方便和代码简洁起见,我们可以只输出最后的报数结果来观察程序是否运行出错。这也非常类似于统计一个网站每天有多少用户登录,每个用户登录用一个线程模拟,线程运行时会将一个表示计数的变量递增。程序在最后输出计数的值表示有今天多少个用户登录,如果这个值不等于我们启动的线程个数,那显然说明这个程序是有问题的。整个程序代码如下:
1 #include <stdio.h> 2 #include <process.h> 3 #include <windows.h> 4 volatile long g_nLoginCount; //登录次数 5 unsigned int __stdcall Fun(void *pPM); //线程函数 6 const int THREAD_NUM = 10; //启动线程数 7 unsigned int __stdcall ThreadFun(void *pPM) 8 { 9 Sleep(100); //some work should to do 10 g_nLoginCount++; 11 Sleep(50); 12 return 0; 13 } 14 int main() 15 { 16 g_nLoginCount = 0; 17 18 HANDLE handle[THREAD_NUM]; 19 for (int i = 0; i < THREAD_NUM; i++) 20 handle[i] = (HANDLE)_beginthreadex(NULL, 0, ThreadFun, NULL, 0, NULL); 21 22 WaitForMultipleObjects(THREAD_NUM, handle, TRUE, INFINITE); 23 printf("有%d个用户登录后记录结果是%d\n", THREAD_NUM, g_nLoginCount); 24 return 0; 25 }
程序中模拟10个用户登录,运行结果如下:
和上一篇的线程报数程序一样,程序输出的结果好象并没什么问题。下面我们增加点用户来试试,现在模拟50个用户登录,为了便于观察结果,在程序中将10个用户登录过程重复20次,代码如下:
1 #include <stdio.h> 2 #include <process.h> 3 #include <windows.h> 4 volatile long g_nLoginCount; //登录次数 5 unsigned int __stdcall Fun(void *pPM); //线程函数 6 const int THREAD_NUM = 50; //启动线程数 7 unsigned int __stdcall ThreadFun(void *pPM) 8 { 9 Sleep(100); //some work should to do 10 g_nLoginCount++; 11 Sleep(50); 12 return 0; 13 } 14 int main() 15 { 16 int num = 20; 17 while(num --) 18 { 19 g_nLoginCount = 0; 20 21 HANDLE handle[THREAD_NUM]; 22 for (int i = 0; i < THREAD_NUM; i++) 23 handle[i] = (HANDLE)_beginthreadex(NULL, 0, ThreadFun, NULL, 0, NULL); 24 25 WaitForMultipleObjects(THREAD_NUM, handle, TRUE, INFINITE); 26 printf("有%d个用户登录后记录结果是%d\n", THREAD_NUM, g_nLoginCount); 27 } 28 return 0; 29 }
运行结果如下:
现在结果水落石出,明明有50个线程执行了g_nLoginCount++;操作,但结果输出是不确定的,有可能为50,但也有可能小于50。
要解决这个问题,我们就分析下g_nLoginCount++;操作。在VC6.0编译器对g_nLoginCount++;这一语句打个断点,再按F5进入调试状态,然后按下Debug工具栏的Disassembly按钮,这样就出现了汇编代码窗口。可以发现在C/C++语言中一条简单的自增语句其实是由三条汇编代码组成的,如下图所示。
讲解下这三条汇编意思:
第一条汇编将g_nLoginCount的值从内存中读取到寄存器eax中。
第二条汇编将寄存器eax中的值与1相加,计算结果仍存入寄存器eax中。
第三条汇编将寄存器eax中的值写回内存中。
引起问题的原因应该是:A执行到第二句,执行B,假设B执行结束后,继续执行A,其实寄存器eax是会恢复到A最后的值,这样导致的结果是线程B的执行结果被A覆盖,相当于B没有执行。
注:每个线程的寄存器是私有的,切换线程时会保存各寄存器中的值。
因此在多线程环境中对一个变量进行读写时,我们需要有一种方法能够保证对一个值的递增操作是原子操作——即不可打断性,一个线程在执行原子操作时,其它线程必须等待它完成之后才能开始执行该原子操作。这种涉及到硬件的操作会不会很复杂了,幸运的是,Windows系统为我们提供了一些以Interlocked开头的函数来完成这一任务(下文将这些函数称为Interlocked系列函数)。
下面列出一些常用的Interlocked系列函数:
1.增减操作
LONG__cdecl InterlockedIncrement(LONG volatile* Addend); LONG__cdecl InterlockedDecrement(LONG volatile* Addend); 返回变量执行增减操作之后的值。
LONG__cdec InterlockedExchangeAdd(LONG volatile* Addend, LONG Value); 返回运算后的值,注意!加个负数就是减。
2.赋值操作
LONG__cdecl InterlockedExchange(LONG volatile* Target, LONG Value); Value就是新值,函数会返回原先的值。
在本例中只要使用InterlockedIncrement()函数就可以了。将线程函数代码改成:
1 unsigned int __stdcall ThreadFun(void *pPM) 2 { 3 Sleep(100);//some work should to do 4 //g_nLoginCount++; 5 InterlockedIncrement((LPLONG)&g_nLoginCount); 6 Sleep(50); 7 return 0; 8 }
再次运行,可以发现结果会是唯一的。
因此,在多线程环境下,我们对变量的自增自减这些简单的语句也要慎重思考,防止多个线程导致的数据访问出错。更多介绍,请访问MSDN上Synchronization Functions这一章节。