《读书笔记》程序员的自我修养之线程基础

1、线程是程序执行流的最小单位。

2、线程的组成:线程ID、当前指令指针(PC)、寄存器集合、堆栈。

3、进程与线程的关系:

一个进程包含一个或多个线程,每个线程之间共享程序的内存空间及一些进程级的资源(如打开文件和信号)。这里的内存空间包括代码段、数据段、堆栈等。

4、多线程优点:

—某个操作可能会陷入长时间的等待,多线程执行可以有效利用等待的时间。(例子:等待网络响应)

—某个操作(如:计算)会消耗大量的时间,如果只有一个线程,程序和用户之间的交互会中断。多线程可以让一个线程负责交互,另一个线程负责计算。—程序逻辑本身要求并发操作(如:一个多段下载软件,比如Bittorrent)

—多CPU或多核计算机,本身就具备多个线程同时执行的能力。

—相对于进程,多线程在数据共享方面效率更高。

5、线程的访问权限

线程可以访问进程内存里的所有数据,甚至包括其他线程的堆栈(如果某个线程知道另一个线程的堆栈地址即可)

线程也有自己的私有空间,如下:

  • 线程局部存储(Thread Local Storage,TLS)
  • 寄存器(包括PC寄存器),其是执行流的基本数据,为线程私有

小结:

  • 属于线程私有的有:局部变量、函数的参数、TLS数据
  • 线程之间可共享(进程所有)的有:全局变量、堆上的数据、函数里的静态变量、程序代码、打开的文件(A线程打开的文件可以由B线程读写)

6进程与线程的一个简单解释(非常贴切)

转载:http://www.cricode.com/2410.html

  1. 计算机的核心是CPU,它承担了所有的计算任务。它就像一座工厂,时刻在运行。
  2. 假定工厂的电力有限,一次只能供给一个车间使用。也就是说,一个车间开工的时候,其他车间都必须停工。背后的含义就是,单个CPU一次只能运行一个任务。
  3. 进程就好比工厂的车间,它代表CPU所能处理的单个任务。任一时刻,CPU总是运行一个进程,其他进程处于非运行状态。
  4. 一个车间里,可以有很多工人。他们协同完成一个任务。
  5. 线程就好比车间里的工人。一个进程可以包括多个线程。
  6. 车间的空间是工人们共享的,比如许多房间是每个工人都可以进出的。这象征一个进程的内存空间是共享的,每个线程都可以使用这些共享内存。
  7. 可是,每间房间的大小不同,有些房间最多只能容纳一个人,比如厕所。里面有人的时候,其他人就不能进去了。这代表一个线程使用某些共享内存时,其他线程必须等它结束,才能使用这一块内存。
  8. 一个防止他人进入的简单方法,就是门口加一把锁。先到的人锁上门,后到的人看到上锁,就在门口排队,等锁打开再进去。这就叫“互斥锁”(Mutual exclusion,缩写 Mutex),防止多个线程同时读写某一块内存区域。
  9. 还有些房间,可以同时容纳n个人,比如厨房。也就是说,如果人数大于n,多出来的人只能在外面等着。这好比某些内存区域,只能供给固定数目的线程使用。
  10. 这时的解决方法,就是在门口挂n把钥匙。进去的人就取一把钥匙,出来时再把钥匙挂回原处。后到的人发现钥匙架空了,就知道必须在门口排队等着了。这种做法叫做“信号量”(Semaphore),用来保证多个线程不会互相冲突。

不难看出,mutex是semaphore的一种特殊情况(n=1时)。也就是说,完全可以用后者替代前者。但是,因为mutex较为简单,且效率高,所以在必须保证资源独占的情况下,还是采用这种设计。

7、操作系统的设计,因此可以归结为三点:

(1)以多进程形式,允许多个任务同时运行;

(2)以多线程形式,允许单个任务分成不同的部分运行;

(3)提供协调机制,一方面防止进程之间和线程之间产生冲突,另一方面允许进程之间和线程之间共享资源。

8、线程状态及状态转移

(1)就绪:此时线程可以立刻运行,但CPU已经被占用

(2)运行:此时线程正在执行

(3)等待(阻塞):此时线程正在等待某一事件(通常是I/O或同步)的发生,无法执行

1)就绪——运行:对就绪状态的进程,当进程调度程序按一种选定的策略从中选中一个就绪进程,为之分配了处理机后,该进程便由就绪状态变为执行状态;

2)运行——等待:正在执行的进程因发生某等待事件而无法执行,则进程由执行状态变为等待状态,如:进程提出输入/输出请求而变成等待外部设备传输信息的状态,进程申请资源(主存空间或外部设备)得不到满足时变成等待资源状态,进程运行中出现了故障(程序出错或主存储器读写错等)变成等待干预状态等等;

3)等待——就绪:处于等待状态的进程,在其等待的事件已经发生,如输入/输出完成,资源得到满足或错误处理完毕时,处于等待状态的进程并不马上转入执行状态,而是先转入就绪状态,然后再由系统进程调度程序在适当的时候将该进程转为执行状态;

4)运行——就绪:正在执行的进程,因时间片用完而被暂停执行,或在采用抢先式优先级调度算法的系统中,当有更高优先级的进程要运行而被迫让出处理机时,该进程便由执行状态转变为就绪状态。

9、线程调度方法

—优先级调度

—轮转法

10WindowsLinux关于多线程的区别

区别:

--Windows内核有明确的线程和进程的概念。

在Windows API中,可以使用CreateProcess和CreateThread来创建进程和线程,并有一系列的API来操纵它们。

--Linux内核中并不存在真正意义上的线程概念。

Linux将所有的执行实体(不管是线程还是进程)都称之为任务(Task),每一个任务概念上都类似于一个单线程的进程,具有内存空间、执行实体、文件资源等。

Linux的不同任务之间,可以有选择的共享内存空间,因而从实际意义上来看,共享了同一个内存空间的多个任务构成一个进程,这些任务也就构成了这个进程里的线程。

11Linux创建一个新任务的方法:

--fork:复制当前进程

--exec:使用新的可执行映像覆盖当前可执行映像

--clone:创建子进程并从指定位置开始执行

fork代码如下:

pid_t pid;

if(pid = fork())

{

...

}

fork函数产生一个和当前进程完全一样的新进程,并和当前进程一样从fork函数里返回,只是本任务的fork将返回新任务的pid,而新任务的fork将返回0。

注意:fork并不复制原任务的内存空间,而是和原任务一起共享一个写时复制(Copy on Write,COW)的内存空间

注解:什么是写时复制(COW)?

写时复制指的是两个任务可以同时自由的读取内存,但任意一个任务试图对内存进行修改时,内存就会复制一份提供给修改方单独使用,避免影响其他任务的使用。

  • fork只能产生本任务的镜像,要启动别的新任务,需要exec的配合。
  • exec可以用新的可执行映像替换当前的可执行映像。
  • 当fork产生一个新任务后,新任务可调用exec来执行新的可执行文件。
  • fork和exec用于产生新任务,而要产生新线程,则使用clone。

clone函数原型如下:

int clone(int (*fn) (void*), void* child_stack, int flags, void* arg)

使用clone可以产生一个新的任务,从指定位置开始执行,并且(可选的)共享当前进程的内存空间和文件。

时间: 2024-08-25 16:59:27

《读书笔记》程序员的自我修养之线程基础的相关文章

读书笔记:程序员的自我修养-----第一章(综述)

题前:30--45天读完,一周至少3篇读书笔记.不能坚持,不再联系,不再找你. 一. hello world 程序引出的问题,看40天后,再回来看看自己的答案,提升多少. Q1:程序为什么要被编译器编译之后才可以运行?   A1 : 系统执行的机器语言,即二进制文件,程序是文本文件需要编译之后,由链接器链接需要的基本库生成二进制文件. Q2: 编译器在把C语言程序转换成可以执行的机器码的过程中作了什么,怎么做的?   A2: 预处理,汇编器生成汇编文件,编译器生成目标文件,链接器链接生成可执行文

【读书笔记】程序员的自我修养总结(六)

[读书笔记]程序员的自我修养总结(六) 声明:引用请注明出处http://blog.csdn.net/lg1259156776/ 说明:这是程序员的自我修养一书的读书总结,随着阅读的推进,逐步增加内容. 本文主要介绍可执行文件的装载与进程 程序与进程的区别 程序是静态的,指的是一些预先编译好的指令和数据集合的一个文件:而进程实际上就是运行着的程序,是动态的. 虚拟地址空间 程序运行起来后将拥有独立的虚拟地址空间 virtual address space,其大小由计算机的硬件平台决定,具体地说是

【读书笔记】程序员的自我修养总结(二)

程序员的自我修养总结(二) 声明:引用请注明出处http://blog.csdn.net/lg1259156776/ 说明:这是程序员的自我修养一书的读书总结,随着阅读的推进,逐步增加内容. 由源文件到可执行文件 分为四个步骤: 预处理 处理源代码中以#开始的预编译指令,进行宏定义展开,处理所有条件预编译指令,将被包含文件插入到预编译指令的位置,删除所有注释,添加行号及文件标识,保留#pragma编译器指令,因为编译器需用到. 编译 进行一系列词法分析,语法分析,语义分析及优化后生成汇编代码文件

读书笔记:程序员的自我修养-----第三章(目标文件)

一 .目标文件格式 1. PE(Portabel Executable) 2. ELF (Executable Linkable Format) : 可重定位.可执行.共享目标文件.核心转储文件 思考: 弱符号和弱引用   VS   回调函数 __attrbute__ ((weakref)) void foo( ); int main() { if( foo ) foo(); } 可以被用户的强符号覆盖: 读书笔记:程序员的自我修养-----第三章(目标文件)

C++程序员的自我修养–读书笔记

 1:注意不要反回指向栈内存的指针或引用,因为在函数返回时改内存已经被销毁了 2:C/C++没有办法知道指针所指的内存容量大小 当数组作为参数传递时,数组将退化成相同类型的指针 不要指望要指针参数去申请动态内存,因为函数会为产生一个临时变量指向参数的内存,当函数内分配内存时,将内存的地址赋给了临时参数,而没有给实参赋值,所有实参没有发生任何变化,应该修改的是指针所指的内容,而不是修改指针的指向,所有可以用指向指针的指针 3:重载和内联机制既可用于全局函数也可用于类的成员函数,const和vi

读书笔记第三周《程序员的自我修养》

第三周读书笔记 <程序员的自我修养> ??计划对这本书是精读,这周读了3,4章. 第三章 目标文件里有什么 ?? 首先介绍了目标文件的格式,Windows下是pe-coff,linux下是elf,他们都源于coff,这与操作系统的发展历史有关,而且不仅可执行文件按这种格式存储,动态链接库(.dll),静态链接库(.lib)都是如此存储. ?? 在目标文件中,信息以段的形式存储(微机原理讲过),总体被分为指令与数据两部分.代码编译后的机器指令放在代码段(.text),全局变量与局部静态变量放在数

《程序员的自我修养》读书笔记 -- 第三章

第三章 目标文件里有什么 3.1 目标文件的格式 1.目标文件就是源代码编译后还未进行链接的中间文件.因为目标文件与可执行文件的内容和结构很相似,所以一般跟可执行文件的存储形式相同,Linux下统称为ELF可执行文件.动态链接库与动态链接库也使用可执行文件格式存储. 2.ELF文件标准里面把ELF文件归为4类: l  可重定位文件(这类文件包含代码和数据,可被用来链接成可执行文件,静态链接库属于此类.如linux下的.o文件和windows下的.obj ) l  可执行文件(这类文件包含可直接执

程序员的自我修养 学习笔记(1)

本文源自在学习<程序员的自我修养>中的心得体会. 对于底层系统程序开发者来说,硬件平台可以抽象为三个主要部件,CPU.内存.I/O控制器. 早期的计算机没有复杂的图形功能,CPU和内存之间的频率差异不大,它们都是连接在同一个bus上面的.其他I/O设备,诸如显示设备.键盘.磁盘等速度比内存.CPU慢很多.为了IO设备与CPU.内存之间的协调通讯,一般每个IO设备商都有相应的IO控制器,早期的硬件结构图如下: 随着技术的进步,CPU的频率越来越高,内存跟不上CPU的速度,他们之间就需要一个转换机

程序员的自我修养 学习笔记(4)

可执行文件只有装载到内存以后才能被CPU执行.程序就将是菜谱,CPU就像是厨师,计算机的其他硬件就像是厨具,整个炒菜的过程就是一个进程.同样的一份菜谱,不同人可以做出来不同的味道.这个类比真是巧妙. Linux下面,进程最大使用3G的虚拟空间 Windows下面,进程最大使用2G的虚拟空间 现在计算机,配置超过4G的内存的电脑已经不是不可能了,在这种情况下,32位CPU能够访问到大于4G的空间吗?如果此空间指的是虚拟地址空间,由于32位CPU的指针只能是32位,最大寻址范围是0~4GB.如果此空