多线程的那点儿事(基础篇)

多线程编程是现代软件技术中很重要的一个环节。要弄懂多线程,这就要牵涉到多进程?当然,要了解到多进程,就要涉及到操作系统。不过大家也不要紧张,听我慢慢道来。这其中的环节其实并不复杂。

(1)单CPU下的多线程

在没有出现多核CPU之前,我们的计算资源是唯一的。如果系统中有多个任务要处理的话,那么就需要按照某种规则依次调度这些任务进行处理。什么规则呢?可以是一些简单的调度方法,比如说

1)按照优先级调度

2)按照FIFO调度

3)按照时间片调度等等

当然,除了CPU资源之外,系统中还有一些其他的资源需要共享,比如说内存、文件、端口、socket等。既然前面说到系统中的资源是有限的,那么获取这些资源的最小单元体是什么呢,其实就是进程。

举个例子来说,在linux上面每一个享有资源的个体称为task_struct,实际上和我们说的进程是一样的。我们可以看看task_struct(linux 0.11代码)都包括哪些内容,

[cpp] view plaincopy

  1. struct task_struct {
  2. /* these are hardcoded - don‘t touch */
  3. long state; /* -1 unrunnable, 0 runnable, >0 stopped */
  4. long counter;
  5. long priority;
  6. long signal;
  7. struct sigaction sigaction[32];
  8. long blocked;   /* bitmap of masked signals */
  9. /* various fields */
  10. int exit_code;
  11. unsigned long start_code,end_code,end_data,brk,start_stack;
  12. long pid,father,pgrp,session,leader;
  13. unsigned short uid,euid,suid;
  14. unsigned short gid,egid,sgid;
  15. long alarm;
  16. long utime,stime,cutime,cstime,start_time;
  17. unsigned short used_math;
  18. /* file system info */
  19. int tty;        /* -1 if no tty, so it must be signed */
  20. unsigned short umask;
  21. struct m_inode * pwd;
  22. struct m_inode * root;
  23. struct m_inode * executable;
  24. unsigned long close_on_exec;
  25. struct file * filp[NR_OPEN];
  26. /* ldt for this task 0 - zero 1 - cs 2 - ds&ss */
  27. struct desc_struct ldt[3];
  28. /* tss for this task */
  29. struct tss_struct tss;
  30. };

每一个task都有自己的pid,在系统中资源的分配都是按照pid进行处理的。这也就说明,进程确实是资源分配的主体。

这时候,可能有朋友会问了,既然task_struct是资源分配的主体,那为什么又出来thread?为什么系统调度的时候是按照thread调度,而不是按照进程调度呢?原因其实很简单,进程之间的数据沟通非常麻烦,因为我们之所以把这些进程分开,不正是希望它们之间不要相互影响嘛。

假设是两个进程之间数据传输,那么需要如果需要对共享数据进行访问需要哪些步骤呢,

1)创建共享内存

2)访问共享内存->系统调用->读取数据

3)写入共享内存->系统调用->写入数据

要是写个代码,大家可能就更明白了,

[cpp] view plaincopy

  1. #include <unistd.h>
  2. #include <stdio.h>
  3. int value = 10;
  4. int main(int argc, char* argv[])
  5. {
  6. int pid = fork();
  7. if(!pid){
  8. Value = 12;
  9. return 0;
  10. }
  11. printf("value = %d\n", value);
  12. return 1;
  13. }

上面的代码是一个创建子进程的代码,我们发现打印的value数值还是10。尽管中间创建了子进程,修改了value的数值,但是我们发现打印下来的数值并没有发生改变,这就说明了不同的进程之间内存上是不共享的。

那么,如果修改成thread有什么好处呢?其实最大的好处就是每个thread除了享受单独cpu调度的机会,还能共享每个进程下的所有资源。要是调度的单位是进程,那么每个进程只能干一件事情,但是进程之间是需要相互交互数据的,而进程之间的数据都需要系统调用才能应用,这在无形之中就降低了数据的处理效率。

(2)多核CPU下的多线程

没有出现多核之前,我们的CPU实际上是按照某种规则对线程依次进行调度的。在某一个特定的时刻,CPU执行的还是某一个特定的线程。然而,现在有了多核CPU,一切变得不一样了,因为在某一时刻很有可能确实是n个任务在n个核上运行。我们可以编写一个简单的open mp测试一下,如果还是一个核,运行的时间就应该是一样的。

[cpp] view plaincopy

  1. #include <omp.h>
  2. #define MAX_VALUE 10000000
  3. double _test(int value)
  4. {
  5. int index;
  6. double result;
  7. result = 0.0;
  8. for(index = value + 1; index < MAX_VALUE; index +=2 )
  9. result += 1.0 / index;
  10. return result;
  11. }
  12. void test()
  13. {
  14. int index;
  15. int time1;
  16. int time2;
  17. double value1,value2;
  18. double result[2];
  19. time1 = 0;
  20. time2 = 0;
  21. value1 = 0.0;
  22. time1 = GetTickCount();
  23. for(index = 1; index < MAX_VALUE; index ++)
  24. value1 += 1.0 / index;
  25. time1 = GetTickCount() - time1;
  26. value2 = 0.0;
  27. memset(result , 0, sizeof(double) * 2);
  28. time2 = GetTickCount();
  29. #pragma omp parallel for
  30. for(index = 0; index < 2; index++)
  31. result[index] = _test(index);
  32. value2 = result[0] + result[1];
  33. time2 = GetTickCount() - time2;
  34. printf("time1 = %d,time2 = %d\n",time1,time2);
  35. return;
  36. }

(3)多线程编程

为什么要多线程编程呢?这其中的原因很多,我们可以举例解决

1)有的是为了提高运行的速度,比如多核cpu下的多线程

2)有的是为了提高资源的利用率,比如在网络环境下下载资源时,时延常常很高,我们可以通过不同的thread从不同的地方获取资源,这样可以提高效率

3)有的为了提供更好的服务,比如说是服务器

4)其他需要多线程编程的地方等等

多线程的那点儿事(基础篇)

时间: 2024-08-08 04:08:25

多线程的那点儿事(基础篇)的相关文章

Linux C 程序设计多线程基础篇

   Linux C 程序设计多线程基础篇 题记:因为 Linux 网络入侵检测系统的设计与实现希望使用多线程,因此希望系统的学习一下 Linux C程序设计多线程的知识 注意事项:因为 pthraed 库不是 Linux 系统默认的库,因此在进行多线程开发的时候,需要加上头文件#include <pthread.h>,编译时要加参数 -lpthread;了:gcc thread.c -o thread -lpthread. 进程和线程: 进程是程序执行,资源分配的基本单位,每个进程都拥有自己

多线程(基础篇1)

在多线程这一系列文章中,我们将讲述C#语言中多线程的相关知识,在多线程(基础篇)中我们将学习以下知识点: 创建线程 中止线程 线程等待 终止线程 确定线程的状态 线程优先级 前台线程和后台线程 向线程传递参数 使用C#的lock关键字锁定线程 使用Monitor锁定线程 处理异常 一.创建线程 在整个系列文章中,我们主要使用Visual Studio 2015作为线程编程的主要工具.在C#语言中创建.使用线程只需要按以下步骤编写即可: 1.启动Visual Studio 2016,新建一个控制台

多线程(基础篇3)

在上一篇多线程(基础篇2)中,我们主要讲述了确定线程的状态.线程优先级.前台线程和后台线程以及向线程传递参数的知识,在这一篇中我们将讲述如何使用C#的lock关键字锁定线程.使用Monitor锁定线程以及线程中的异常处理. 九.使用C#的lock关键字锁定线程 1.使用Visual Studio 2015创建一个新的控制台应用程序. 2.双击打开"Program.cs"文件,然后修改为如下代码: 1 using System; 2 using System.Threading; 3 u

多线程(基础篇1)转载

在多线程这一系列文章中,我们将讲述C#语言中多线程的相关知识,在多线程(基础篇)中我们将学习以下知识点: 创建线程 中止线程 线程等待 终止线程 确定线程的状态 线程优先级 前台线程和后台线程 向线程传递参数 使用C#的lock关键字锁定线程 使用Monitor锁定线程 处理异常 一.创建线程 在整个系列文章中,我们主要使用Visual Studio 2015作为线程编程的主要工具.在C#语言中创建.使用线程只需要按以下步骤编写即可: 1.启动Visual Studio 2016,新建一个控制台

Spark性能优化指南——基础篇

前言 在大数据计算领域,Spark已经成为了越来越流行.越来越受欢迎的计算平台之一.Spark的功能涵盖了大数据领域的离线批处理.SQL类处理.流式/实时计算.机器学习.图计算等各种不同类型的计算操作,应用范围与前景非常广泛.在美团•大众点评,已经有很多同学在各种项目中尝试使用Spark.大多数同学(包括笔者在内),最初开始尝试使用Spark的原因很简单,主要就是为了让大数据计算作业的执行速度更快.性能更高. 然而,通过Spark开发出高性能的大数据计算作业,并不是那么简单的.如果没有对Spar

Java中的多线程你只要看这一篇就够了

Java中的多线程你只要看这一篇就够了 引 如果对什么是线程.什么是进程仍存有疑惑,请先Google之,因为这两个概念不在本文的范围之内. 用多线程只有一个目的,那就是更好的利用cpu的资源,因为所有的多线程代码都可以用单线程来实现.说这个话其实只有一半对,因为反应"多角色"的程序代码,最起码每个角色要给他一个线程吧,否则连实际场景都无法模拟,当然也没法说能用单线程来实现:比如最常见的"生产者,消费者模型". 很多人都对其中的一些概念不够明确,如同步.并发等等,让我

美团Spark性能优化指南——基础篇

http://tech.meituan.com/spark-tuning-basic.html 前言 在大数据计算领域,Spark已经成为了越来越流行.越来越受欢迎的计算平台之一.Spark的功能涵盖了大数据领域的离线批处理.SQL类处理.流式/实时计算.机器学习.图计算等各种不同类型的计算操作,应用范围与前景非常广泛.在美团?大众点评,已经有很多同学在各种项目中尝试使用Spark.大多数同学(包括笔者在内),最初开始尝试使用Spark的原因很简单,主要就是为了让大数据计算作业的执行速度更快.性

问道python之基础篇【一】 认识python

问道python之基础篇[一] 认识python 1.python的简介 1.1.什么是python? Python是一种面向对象.解释型计算机程序设计语言,由Guido van Rossum于1989年发明,第一个公开发行版发行于1991年. Python语法简洁清晰,特色之一是强制用空白符作为语句缩进. Python具有丰富和强大的库.它常被昵称为胶水语言,能够用其他语言制作的各种模块(尤其是C++)很轻松地联结在一起. 1.2.python的特点 简单,易学,免费.开源,高层语言,移植性,

【转载】 Spark性能优化指南——基础篇

前言 开发调优 调优概述 原则一:避免创建重复的RDD 原则二:尽可能复用同一个RDD 原则三:对多次使用的RDD进行持久化 原则四:尽量避免使用shuffle类算子 原则五:使用map-side预聚合的shuffle操作 原则六:使用高性能的算子 原则七:广播大变量 原则八:使用Kryo优化序列化性能 原则九:优化数据结构 资源调优 调优概述 Spark作业基本运行原理 资源参数调优 写在最后的话 前言 在大数据计算领域,Spark已经成为了越来越流行.越来越受欢迎的计算平台之一.Spark的