Linux进程间通信与线程间同步详解(全面详细)

引用:http://community.csdn.net/Expert/TopicView3.asp?id=4374496
linux下进程间通信的几种主要手段简介:

1. 管道(Pipe)及有名管道(named pipe):管道可用于具有亲缘关系进程间的通信,有名管道克服了管道没有名字的限制,因此,除具有管道所具有的功能外,它还允许无亲缘关系进程间的通信;
   2. 信号(Signal):信号是比较复杂的通信方式,用于通知接受进程有某种事件发生,除了用于进程间通信外,进程还可以发送信号给进程本身;linux除了支持Unix早期信号语义函数sigal外,还支持语义符合Posix.1标准的信号函数 sigaction(实际上,该函数是基于BSD的,BSD为了实现可靠信号机制,又能够统一对外接口,用sigaction函数重新实现了signal 函数);
   3. 报文(Message)队列(消息队列):消息队列是消息的链接表,包括Posix消息队列system V消息队列。有足够权限的进程可以向队列中添加消息,被赋予读权限的进程则可以读走队列中的消息。消息队列克服了信号承载信息量少,管道只能承载无格式字节流以及缓冲区大小受限等缺点。
   4. 共享内存:使得多个进程可以访问同一块内存空间,是最快的可用IPC形式。是针对其他通信机制运行效率较低而设计的。往往与其它通信机制,如信号量结合使用,来达到进程间的同步及互斥。
   5. 信号量(semaphore):主要作为进程间以及同一进程不同线程之间的同步手段。
   6. 套接口(Socket):更为一般的进程间通信机制,可用于不同机器之间的进程间通信。起初是由Unix系统的BSD分支开发出来的,但现在一般可以移植到其它类Unix系统上:Linux和System V的变种都支持套接字。

线程的最大特点是资源的共享性,但资源共享中的同步问题是多线程编程的难点。linux下提供了多种方式来处理线程同步,最常用的是互斥锁、条件变量和信号量。

1)互斥锁(mutex)

通过锁机制实现线程间的同步。同一时刻只允许一个线程执行一个关键部分的代码。

int pthread_mutex_init(pthread_mutex_t *mutex,const pthread_mutex_attr_t *mutexattr);

int pthread_mutex_lock(pthread_mutex *mutex);

int pthread_mutex_destroy(pthread_mutex *mutex);

int pthread_mutex_unlock(pthread_mutex *

(1)先初始化锁init()或静态赋值pthread_mutex_t mutex=PTHREAD_MUTEX_INITIALIER

attr_t有:

PTHREAD_MUTEX_TIMED_NP:其余线程等待队列

PTHREAD_MUTEX_RECURSIVE_NP:嵌套锁,允许线程多次加锁,不同线程,解锁后重新竞争

PTHREAD_MUTEX_ERRORCHECK_NP:检错,与一同,线程请求已用锁,返回EDEADLK;

PTHREAD_MUTEX_ADAPTIVE_NP:适应锁,解锁后重新竞争

(2)加锁,lock,trylock,lock阻塞等待锁,trylock立即返回EBUSY

(3)解锁,unlock需满足是加锁状态,且由加锁线程解锁

(4)清除锁,destroy(此时锁必需unlock,否则返回EBUSY,//Linux下互斥锁不占用内存资源

示例代码

  1. #include <cstdio>
  2. #include <cstdlib>
  3. #include <unistd.h>
  4. #include <pthread.h>
  5. #include "iostream"
  6. using namespace std;
  7. pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;
  8. int tmp;
  9. void* thread(void *arg)
  10. {
  11. cout << "thread id is " << pthread_self() << endl;
  12. pthread_mutex_lock(&mutex);
  13. tmp = 12;
  14. cout << "Now a is " << tmp << endl;
  15. pthread_mutex_unlock(&mutex);
  16. return NULL;
  17. }
  18. int main()
  19. {
  20. pthread_t id;
  21. cout << "main thread id is " << pthread_self() << endl;
  22. tmp = 3;
  23. cout << "In main func tmp = " << tmp << endl;
  24. if (!pthread_create(&id, NULL, thread, NULL))
  25. {
  26. cout << "Create thread success!" << endl;
  27. }
  28. else
  29. {
  30. cout << "Create thread failed!" << endl;
  31. }
  32. pthread_join(id, NULL);
  33. pthread_mutex_destroy(&mutex);
  34. return 0;
  35. }

编译: g++ -o thread testthread.cpp -lpthread

说明:pthread库不是Linux系统默认的库,连接时需要使用静态库libpthread.a,所以在使用pthread_create()创建线程,以及调用pthread_atfork()函数建立fork处理程序时,需要链接该库。在编译中要加 -lpthread参数。

2)条件变量(cond)

利用线程间共享的全局变量进行同步的一种机制。条件变量上的基本操作有:触发条件(当条件变为 true 时);等待条件,挂起线程直到其他线程触发条件。

int pthread_cond_init(pthread_cond_t *cond,pthread_condattr_t *cond_attr);

int pthread_cond_wait(pthread_cond_t *cond,pthread_mutex_t *mutex);

int pthread_cond_timewait(pthread_cond_t *cond,pthread_mutex *mutex,const timespec *abstime);

int pthread_cond_destroy(pthread_cond_t *cond);

int pthread_cond_signal(pthread_cond_t *cond);

int pthread_cond_broadcast(pthread_cond_t *cond);  //解除所有线程的阻塞

(1)初始化.init()或者pthread_cond_t cond=PTHREAD_COND_INITIALIER(前者为动态初始化,后者为静态初始化);属性置为NULL

(2)等待条件成立.pthread_wait,pthread_timewait.wait()释放锁,并阻塞等待条件变量为真,timewait()设置等待时间,仍未signal,返回ETIMEOUT(加锁保证只有一个线程wait)

(3)激活条件变量:pthread_cond_signal,pthread_cond_broadcast(激活所有等待线程)

(4)清除条件变量:destroy;无线程等待,否则返回EBUSY

对于

int pthread_cond_wait(pthread_cond_t *cond, pthread_mutex_t *mutex);

int pthread_cond_timedwait(pthread_cond_t *cond, pthread_mutex_t *mutex, const struct timespec *abstime);

一定要在mutex的锁定区域内使用。

如果要正确的使用pthread_mutex_lock与pthread_mutex_unlock,请参考

pthread_cleanup_push和pthread_cleanup_pop宏,它能够在线程被cancel的时候正确的释放mutex!

另外,posix1标准说,pthread_cond_signal与pthread_cond_broadcast无需考虑调用线程是否是mutex的拥有者,也就是说,可以在lock与unlock以外的区域调用。如果我们对调用行为不关心,那么请在lock区域之外调用吧。

说明:

(1)pthread_cond_wait 自动解锁互斥量(如同执行了pthread_unlock_mutex),并等待条件变量触发。这时线程挂起,不占用CPU时间,直到条件变量被触发(变量为ture)。在调用 pthread_cond_wait之前,应用程序必须加锁互斥量。pthread_cond_wait函数返回前,自动重新对互斥量加锁(如同执行了pthread_lock_mutex)。

(2)互斥量的解锁和在条件变量上挂起都是自动进行的。因此,在条件变量被触发前,如果所有的线程都要对互斥量加锁,这种机制可保证在线程加锁互斥量和进入等待条件变量期间,条件变量不被触发。条件变量要和互斥量相联结,以避免出现条件竞争——个线程预备等待一个条件变量,当它在真正进入等待之前,另一个线程恰好触发了该条件(条件满足信号有可能在测试条件和调用pthread_cond_wait函数(block)之间被发出,从而造成无限制的等待)。

(3)pthread_cond_timedwait 和 pthread_cond_wait 一样,自动解锁互斥量及等待条件变量,但它还限定了等待时间。如果在abstime指定的时间内cond未触发,互斥量mutex被重新加锁,且pthread_cond_timedwait返回错误 ETIMEDOUT。abstime 参数指定一个绝对时间,时间原点与 time 和 gettimeofday 相同:abstime = 0 表示 1970年1月1日00:00:00 GMT。

(4)pthread_cond_destroy 销毁一个条件变量,释放它拥有的资源。进入 pthread_cond_destroy 之前,必须没有在该条件变量上等待的线程。

(5)条件变量函数不是异步信号安全的,不应当在信号处理程序中进行调用。特别要注意,如果在信号处理程序中调用 pthread_cond_signal 或pthread_cond_boardcast 函数,可能导致调用线程死锁。

示例程序1

  1. #include <stdio.h>
  2. #include <pthread.h>
  3. #include "stdlib.h"
  4. #include "unistd.h"
  5. pthread_mutex_t mutex;
  6. pthread_cond_t cond;
  7. void hander(void *arg)
  8. {
  9. free(arg);
  10. (void)pthread_mutex_unlock(&mutex);
  11. }
  12. void *thread1(void *arg)
  13. {
  14. pthread_cleanup_push(hander, &mutex);
  15. while(1)
  16. {
  17. printf("thread1 is running\n");
  18. pthread_mutex_lock(&mutex);
  19. pthread_cond_wait(&cond,&mutex);
  20. printf("thread1 applied the condition\n");
  21. pthread_mutex_unlock(&mutex);
  22. sleep(4);
  23. }
  24. pthread_cleanup_pop(0);
  25. }
  26. void *thread2(void *arg)
  27. {
  28. while(1)
  29. {
  30. printf("thread2 is running\n");
  31. pthread_mutex_lock(&mutex);
  32. pthread_cond_wait(&cond,&mutex);
  33. printf("thread2 applied the condition\n");
  34. pthread_mutex_unlock(&mutex);
  35. sleep(1);
  36. }
  37. }
  38. int main()
  39. {
  40. pthread_t thid1,thid2;
  41. printf("condition variable study!\n");
  42. pthread_mutex_init(&mutex,NULL);
  43. pthread_cond_init(&cond,NULL);
  44. pthread_create(&thid1,NULL,thread1,NULL);
  45. pthread_create(&thid2,NULL,thread2,NULL);
  46. sleep(1);
  47. do
  48. {
  49. pthread_cond_signal(&cond);
  50. }while(1);
  51. sleep(20);
  52. pthread_exit(0);
  53. return 0;
  54. }

示例程序2:

  1. #include <pthread.h>
  2. #include <unistd.h>
  3. #include "stdio.h"
  4. #include "stdlib.h"
  5. static pthread_mutex_t mtx = PTHREAD_MUTEX_INITIALIZER;
  6. static pthread_cond_t cond = PTHREAD_COND_INITIALIZER;
  7. struct node
  8. {
  9. int n_number;
  10. struct node *n_next;
  11. } *head = NULL;
  12. /*[thread_func]*/
  13. static void cleanup_handler(void *arg)
  14. {
  15. printf("Cleanup handler of second thread./n");
  16. free(arg);
  17. (void)pthread_mutex_unlock(&mtx);
  18. }
  19. static void *thread_func(void *arg)
  20. {
  21. struct node *p = NULL;
  22. pthread_cleanup_push(cleanup_handler, p);
  23. while (1)
  24. {
  25. //这个mutex主要是用来保证pthread_cond_wait的并发性
  26. pthread_mutex_lock(&mtx);
  27. while (head == NULL)
  28. {
  29. //这个while要特别说明一下,单个pthread_cond_wait功能很完善,为何
  30. //这里要有一个while (head == NULL)呢?因为pthread_cond_wait里的线
  31. //程可能会被意外唤醒,如果这个时候head != NULL,则不是我们想要的情况。
  32. //这个时候,应该让线程继续进入pthread_cond_wait
  33. // pthread_cond_wait会先解除之前的pthread_mutex_lock锁定的mtx,
  34. //然后阻塞在等待对列里休眠,直到再次被唤醒(大多数情况下是等待的条件成立
  35. //而被唤醒,唤醒后,该进程会先锁定先pthread_mutex_lock(&mtx);,再读取资源
  36. //用这个流程是比较清楚的/*block-->unlock-->wait() return-->lock*/
  37. pthread_cond_wait(&cond, &mtx);
  38. p = head;
  39. head = head->n_next;
  40. printf("Got %d from front of queue/n", p->n_number);
  41. free(p);
  42. }
  43. pthread_mutex_unlock(&mtx); //临界区数据操作完毕,释放互斥锁
  44. }
  45. pthread_cleanup_pop(0);
  46. return 0;
  47. }
  48. int main(void)
  49. {
  50. pthread_t tid;
  51. int i;
  52. struct node *p;
  53. //子线程会一直等待资源,类似生产者和消费者,但是这里的消费者可以是多个消费者,而
  54. //不仅仅支持普通的单个消费者,这个模型虽然简单,但是很强大
  55. pthread_create(&tid, NULL, thread_func, NULL);
  56. sleep(1);
  57. for (i = 0; i < 10; i++)
  58. {
  59. p = (struct node*)malloc(sizeof(struct node));
  60. p->n_number = i;
  61. pthread_mutex_lock(&mtx); //需要操作head这个临界资源,先加锁,
  62. p->n_next = head;
  63. head = p;
  64. pthread_cond_signal(&cond);
  65. pthread_mutex_unlock(&mtx); //解锁
  66. sleep(1);
  67. }
  68. printf("thread 1 wanna end the line.So cancel thread 2./n");
  69. //关于pthread_cancel,有一点额外的说明,它是从外部终止子线程,子线程会在最近的取消点,退出
  70. //线程,而在我们的代码里,最近的取消点肯定就是pthread_cond_wait()了。
  71. pthread_cancel(tid);
  72. pthread_join(tid, NULL);
  73. printf("All done -- exiting/n");
  74. return 0;
  75. }

3)信号量

如同进程一样,线程也可以通过信号量来实现通信,虽然是轻量级的。

信号量函数的名字都以"sem_"打头。线程使用的基本信号量函数有四个。

#include <semaphore.h>

int sem_init (sem_t *sem , int pshared, unsigned int value);

这是对由sem指定的信号量进行初始化,设置好它的共享选项(linux 只支持为0,即表示它是当前进程的局部信号量),然后给它一个初始值VALUE。

两个原子操作函数:

int sem_wait(sem_t *sem);

int sem_post(sem_t *sem);

这两个函数都要用一个由sem_init调用初始化的信号量对象的指针做参数。

sem_post:给信号量的值加1;

sem_wait:给信号量减1;对一个值为0的信号量调用sem_wait,这个函数将会等待直到有其它线程使它不再是0为止。

int sem_destroy(sem_t *sem);

这个函数的作用是再我们用完信号量后都它进行清理。归还自己占有的一切资源。

示例代码:

  1. #include <stdlib.h>
  2. #include <stdio.h>
  3. #include <unistd.h>
  4. #include <pthread.h>
  5. #include <semaphore.h>
  6. #include <errno.h>
  7. #define return_if_fail(p) if((p) == 0){printf ("[%s]:func error!/n", __func__);return;}
  8. typedef struct _PrivInfo
  9. {
  10. sem_t s1;
  11. sem_t s2;
  12. time_t end_time;
  13. }PrivInfo;
  14. static void info_init (PrivInfo* thiz);
  15. static void info_destroy (PrivInfo* thiz);
  16. static void* pthread_func_1 (PrivInfo* thiz);
  17. static void* pthread_func_2 (PrivInfo* thiz);
  18. int main (int argc, char** argv)
  19. {
  20. pthread_t pt_1 = 0;
  21. pthread_t pt_2 = 0;
  22. int ret = 0;
  23. PrivInfo* thiz = NULL;
  24. thiz = (PrivInfo* )malloc (sizeof (PrivInfo));
  25. if (thiz == NULL)
  26. {
  27. printf ("[%s]: Failed to malloc priv./n");
  28. return -1;
  29. }
  30. info_init (thiz);
  31. ret = pthread_create (&pt_1, NULL, (void*)pthread_func_1, thiz);
  32. if (ret != 0)
  33. {
  34. perror ("pthread_1_create:");
  35. }
  36. ret = pthread_create (&pt_2, NULL, (void*)pthread_func_2, thiz);
  37. if (ret != 0)
  38. {
  39. perror ("pthread_2_create:");
  40. }
  41. pthread_join (pt_1, NULL);
  42. pthread_join (pt_2, NULL);
  43. info_destroy (thiz);
  44. return 0;
  45. }
  46. static void info_init (PrivInfo* thiz)
  47. {
  48. return_if_fail (thiz != NULL);
  49. thiz->end_time = time(NULL) + 10;
  50. sem_init (&thiz->s1, 0, 1);
  51. sem_init (&thiz->s2, 0, 0);
  52. return;
  53. }
  54. static void info_destroy (PrivInfo* thiz)
  55. {
  56. return_if_fail (thiz != NULL);
  57. sem_destroy (&thiz->s1);
  58. sem_destroy (&thiz->s2);
  59. free (thiz);
  60. thiz = NULL;
  61. return;
  62. }
  63. static void* pthread_func_1 (PrivInfo* thiz)
  64. {
  65. return_if_fail (thiz != NULL);
  66. while (time(NULL) < thiz->end_time)
  67. {
  68. sem_wait (&thiz->s2);
  69. printf ("pthread1: pthread1 get the lock./n");
  70. sem_post (&thiz->s1);
  71. printf ("pthread1: pthread1 unlock/n");
  72. sleep (1);
  73. }
  74. return;
  75. }
  76. static void* pthread_func_2 (PrivInfo* thiz)
  77. {
  78. return_if_fail (thiz != NULL);
  79. while (time (NULL) < thiz->end_time)
  80. {
  81. sem_wait (&thiz->s1);
  82. printf ("pthread2: pthread2 get the unlock./n");
  83. sem_post (&thiz->s2);
  84. printf ("pthread2: pthread2 unlock./n");
  85. sleep (1);
  86. }
  87. return;
  88. }

通 过执行结果后,可以看出,会先执行线程二的函数,然后再执行线程一的函数。它们两就实现了同步。在上大学的时候,虽然对这些概念知道,可都没有实践过,所 以有时候时间一久就会模糊甚至忘记,到了工作如果还保持这么一种状态,那就太可怕了。虽然现在外面的技术在不断的变化更新,可是不管怎么变,其核心技术还 是依旧的,所以我们必须要打好自己的基础,再学习其他新的知识,那时候再学新的知识也会觉得比较简单的。信号量代码摘自http://blog.csdn.net/wtz1985/article/details/3835781

参考:

【1】 http://www.cnblogs.com/feisky/archive/2009/11/12/1601824.html

【2】 http://www.cnblogs.com/mydomain/archive/2011/07/10/2102147.html

【3】 线程函数介绍

http://www.unix.org/version2/whatsnew/threadsref.html

【4】 http://www.yolinux.com/TUTORIALS/LinuxTutorialPosixThreads.html

【5】 线程常用函数简介

http://www.rosoo.net/a/201004/8954.html

【6】 条件变量

http://blog.csdn.net/hiflower/article/details/2195350

【7】条件变量函数说明

http://blog.csdn.net/hairetz/article/details/4535920

本文来自博文:

http://www.cnblogs.com/mydomain/archive/2011/08/14/2138455.html

Linux进程间通信与线程间同步详解(全面详细)

时间: 2024-08-27 03:13:03

Linux进程间通信与线程间同步详解(全面详细)的相关文章

java多线程同步以及线程间通信详解&amp;消费者生产者模式&amp;死锁&amp;Thread.join()(多线程编程之二)

本篇我们将讨论以下知识点: 1.线程同步问题的产生 什么是线程同步问题,我们先来看一段卖票系统的代码,然后再分析这个问题: [java] view plain copy print? package com.zejian.test; /** * @author zejian * @time 2016年3月12日 下午2:55:42 * @decrition 模拟卖票线程 */ public class Ticket implements Runnable { //当前拥有的票数 private 

linux进程间通信之Posix 信号量用法详解代码举例

Posix信号量不同于System V信号量的信号量集,Posix信号量是单一的信号量,分为有名信号量和无名信号量.Posix有名信号量是使用Posix IPC名字标示的信号量,可用于进程和线程间的同步:Posix无名信号量是指基于内存的信号量,存放在共享内存区中,用于进程与线程间的同步. Posix有名信号量可以是内核维护,也可以在文件系统中维护,这取决于信号量对应的路径名是否映射到了真正的磁盘文件上,如果有映射到则在文件系统中维护,否则在内核中维护,Posix有名信号量由函数sem_open

linux线程间同步方式汇总

抽空做了下linux所有线程间同步方式的汇总(原生的),包含以下几个: 1, mutex 2, condition variable 3, reader-writer lock 4, spin lock 5, barrier mutex是最常用的线程间同步方式,主要目的是保护共享的资源可以被原子地访问. 个人感觉condition variable是除了mutex之外的第二常用的线程间同步方式,可以用来以同步的方式使用一个线程来通知另一个线程某个事件已经发生.可以理解为线程间的信号. reade

Linux的进程/线程间通信方式总结

Linux系统中的进程间通信方式主要以下几种: 同一主机上的进程通信方式 * UNIX进程间通信方式: 包括管道(PIPE), 有名管道(FIFO), 和信号(Signal) * System V进程通信方式:包括信号量(Semaphore), 消息队列(Message Queue), 和共享内存(Shared Memory) 网络主机间的进程通信方式 * RPC: Remote Procedure Call 远程过程调用 * Socket: 当前最流行的网络通信方式, 基于TCP/IP协议的通

Linux用户态程序计时方式详解

前言 良好的计时器可帮助程序开发人员确定程序的性能瓶颈,或对不同算法进行性能比较.但要精确测量程序的运行时间并不容易,因为进程切换.中断.共享的多用户.网络流量.高速缓存访问及转移预测等因素都会对程序计时产生影响. 本文将不考虑这些影响因素(相关资料可参考<深入理解计算机系统>一书),而仅仅关注Linux系统中用户态程序执行时间的计算方式.除本文所述计时方式外,还可借助外部工具统计耗时,如<Linux调试分析诊断利器——strace>一文中介绍的strace. 本文示例代码的运行环

进程间通信与线程间通信

序 今天被问及进程间通信的问题,发现自己了解的并不够,所以,对此好好总结一番~ 操作系统的主要任务是管理计算机的软件.硬件资源.现代操作系统的主要特点是多用户和多任务,也就是程序的并行执行,windows如此linux也是如此.所以操作系统就借助于进程来管理计算机的软.硬件资源,支持多任务的并行执行.要并行执行就需要多进程.多线程.因此多进程和多线程间为了完成一定的任务,就需要进行一定的通信.而线程间通信又和进程间的通信不同.由于进程的数据空间相对独立而线程是共享数据空间的,彼此通信机制也很不同

Linux环境下线程消息同步的陷阱

我们程序中常常会使用到线程间的消息同步处理,比如以下一段伪码 var message = "": void func()  {   1. 启动线程Thread(该线程中填充message的内容):   2. 阻塞,直到等待到完成message填充的事件:   3. 处理message:   .... } void Thread()  {   1. 通过某种处理填充message:   2. 触发func中的阻塞事件: } 我们通常会使用条件变量来完成类似情况的线程同步处理 比如wind

线程间同步之信号量实现环形buf

一.概述: 信号量是一个非负整数的计数器,它通过计数器来实现多线程对临界资源的顺序访问,从而实现线程间的同步.它与进程间通信的信号量不同,进程间通信的信号量是一个信号量集,而线程间同步的信号量是一个信号.还有一点,就是对信号量的操作是原子的. 信号量与互斥锁的区别: (1).互斥锁的值只能是0或1,而信号量的值为非负整数. (2).互斥锁用与实现线程间的互斥,而信号量用于实现线程间的同步. (3).互斥锁的加锁和解锁必须由同一个线程分别对应使用,而信号量可以由一个线程得到,另一个线程释放. 下面

Linux 查看系统硬件信息(实例详解)

cpu lscpu命令,查看的是cpu的统计信息. [email protected]:~$ lscpu Architecture: i686 #cpu架构 CPU op-mode(s): 32-bit, 64-bit Byte Order: Little Endian #小尾序 CPU(s): 4 #总共有4核 On-line CPU(s) list: 0-3 Thread(s) per core: 1 #每个cpu核,只能支持一个线程,即不支持超线程 Core(s) per socket: