Posted on 02-02-2012
Filed Under (技术) by waterlin

在 C/C++ 多线程编程下,如果不注意,采用普通变量传递参数值给线程会有一些误区,需要特别小心。

下面浏忙绪绪就举两个例子来说明一下。

char* 参数在多线程下出现的怪异现象

最近在用 Boost 库写多线程程序时,需要启动若干个线程,这些线程分别处理不同的事情,线程会获取一个字符串参数,用来标识内容。在编写代码的时候,出现了一个很怪异的现象,例子代码如下:

const int tNum = 4;//并发线程数
vector<boost::thread*> tBox;

for (int i=0; i < tNum; i++ )
{
    char strThread[20];
    sprintf(strThread, "thread%d",i);
    //strThread 字符串是传入的 const char* 类型
    boost::thread* thread_0 = new boost::thread( StreamProcesser,
                                                 param1,
                                                 param2,
                                                 strThread);

    tBox.push_back(thread_0);

    boost::xtime xt;
    boost::xtime_get(&xt, boost::TIME_UTC);
    xt.sec += 2;
    boost::thread::sleep(xt);
}

for (int i=0; i < tNum; i++ )
{
    boost::thread* thread_0 = tBox[i];
    thread_0->join();
    delete thread_0;
}

在线程函数启动参数中,有一个参数是 const char* 类型。如果我在线程中,没有先对 char 字符串拷贝一个副本,则当4个线程都跑起来后,再去读取这个参数,很有可能会读到同一个字符串。

这是因为编译器把 strThread 的地址编码为同一个内存地址造成的,所以,所有的线程读取的都是最后一次设置 strThread 的值。

结论:

  1. 传入 char* 后,一定要对 char 字符串拷贝一个副本,否则这个指针指向的内容很有可能被改变;
  2. 多用 C++ 的 string,少用 char 或是 char*,用值拷贝的方式比单纯传递一个指针要更安全;
  3. 最安全的做法,应该是动态分配一个空间,用来保存传递给线程的参数值,在线程结束后再销毁该值。

int 参数在多线程下被重复赋值的怪异现象

同样,如果传入参数是整型或是其它类型的时候,也会有上述类似的问题。拿 Win32 的 CreateThread 函数来说,同样需要保证传入的参数不被修改,例如下面的代码就非常危险:

DWORD WINAPI CloseThreadFun( LPVOID param)
{
    int* pHandle = (int*)param;
    const int handle = *pHandle;

    //打印句柄
    printf("get handle is %d", handle);

    return 0;
}

int _tmain(int argc, _TCHAR* argv[])
{
    const int THREAD_NUM = 4;

    HANDLE* lphandle = new HANDLE[THREAD_NUM];
    for (int j = 0; j < THREAD_NUM; j++)
    {
        HANDLE hthread;
        hthread = CreateThread(NULL, 0, CloseThreadFun, (LPVOID)&j, 0, NULL);
        lphandle[j] = hthread;
    }

    WaitForMultipleObjects(THREAD_NUM, lphandle, TRUE, INFINITE);

    delete [] lphandle;

    return 0;
}

在调用 CloseThreadFun 来启动一个线程后,j 的值很有可能已经被修改掉了:线程启动总是需要时间的,而参数指针指向地址的内容,很有可能在此期间被修改了。比如,上面的代码,运行后,打印的内容如下:

get handle is 3
get handle is 4
get handle is 4
get handle is 4

这就说明了 j 值被重复修改后,会导致线程参数不对的现象。

解决办法:用一个 int 数组把需要传入到各个线程的参数缓存起来,尽量保证地址不一样。

结论

传入线程的参数,应该尽量采用动态分配内存的方式来生成。否则如果采用临时变量,则随着变量生命周期的消逝,该变量的指针,很有可能会变成一个毫无意义的指针(或是被新的值覆盖,或是被成为一个遗留数)。

采用动态分配的变量作为线程启动时的参数,在线程结束后再销毁这个动态分配的变量,则是一个安全法则。

© 2012, 浏忙大爆炸. All rights reserved.
除非注明,浏忙大爆炸文章均为原创,转载请以链接形式标明本文地址。

(1) Comment    (1,664) Views    Read More   

Comments

iceman on 16 December, 2012 at 2:25 pm #

刚也出现这问题。。坑爹啊,一开始理解错了还以为是没有设置同步

[Reply]


Post a Comment
Name:
Email:
Website:
Comments: