1.定义
2.作用
3.和进程的比较
4.多线程(multithreading)的优点和缺陷
5.调度(scheduling)
6.线程相关概念
定义
线程就是最小的可编程指令序列,是进程的子集。一个进程由一个或多个线程组成。
作用
线程的作用就是要加速程序的执行,提高计算机的性能,满足多任务需求。比如word,你可以编辑,同时语法检查也正在进行,至少就是两个线程了。再比如播放电影,视频线程和音频线程同时执行,同时有两种可能,一种是在多核cpu下,每个进程在不同的cpu,是真正的同时执行;另一种是单核cpu,这时可以采用time_sliced策略来实现同时的效果。
和进程的比较
process |
thread |
|
是否独立 |
独立 |
不独立,作为进程的子集存在 |
状态信息 |
更多 |
没进程多,一个进程的thread共享状态信息 |
是否有分隔的地址空间 |
有 |
没有 |
交互 |
process之间通过inter-process communicationmechanisms来交互 |
thread之间的交互通过他们已经共享了的data,code,files |
context switching速度 |
慢 |
快 |
多线程的优点和缺陷
多线程主要用于多任务操作系统中,多线程作为一个广泛使用的编程和执行模型允许多个线程存在于一个单独的进程里。这些线程共享进程的资源,但是能够单独的执行任务。
多线程应用程序有以下优点:
(1)负责任:单线程程序,如果主进程被要执行很久的任务阻塞,那整个应用程序就卡死了。如果是多线程就不存在这个问题,多线程的话,让子线程来执行,就算这个子线程被阻塞了,其他子线程和主线程还可以等待用户输入。
(2)更快的执行:当有多个CPU或多核CPU的情况下,多线程就会是真正的同时执行(每个cpu执行一个thread),而不是time_sliced。
(3)更低的资源消耗:单进程多线程比多进程消耗的资源要少很多。比如,Apache就是利用多个listener
threads来监听请求和多个server
threads来处理请求。
(4)更好的系统利用:比如,一个文件系统用多线程可以达到更高的吞吐量和更低的延迟。因为在更快的中介(比如缓存)里的数据可以被一个线程获取,另外一个线程可以去低速中介(比如硬盘)获取数据而不需要等待其他线程完成操作。
(5)简化共享和交互:线程之间的通信主要通过它们已经共享的数据,代码和文件。
(6)平行化:通过处理让多个任务同时执行。
多线程的缺陷:
(1)同步的麻烦:因为一个进程的多个线程共享地址空间,程序员需要非常小心的来避免race
conditions和其他非直观的行为。为了正确的操作数据,多个线程通常需要及时集合来确保按正确的顺序来处理数据。
这个时候可能需要用锁(更多的用信号量,其实信号量可以看成是多个锁的集合)来阻止同一数据被同时修改或读取当这个数据正在被修改。
(2)一个线程摧毁一个进程:一个线程的非法操作会摧毁整个进程。
调度
操作系统调度线程的两种方式:
(1)抢占式多任务是优先选择的方式。它允许操作系统来决定什么时候切换上下文来让更重要的线程来获得cpu资源。抢占式多任务的缺点:当操作系统切换上下文的时候不合适时,可能会导致不好的结果,比如lock
convoy(多个优先级一样的线程重复竞争同一个锁)
和 priority
inversion(优先级低的线程抢到了cpu资源)。为了避免这个缺陷,于是就有了合作式多线程。
(2)合作式多线程。这个方式依赖于多线程自己来决定在什么点来放弃对cpu资源的控制。
显然,第一种调度方式,主导者是操作系统;第二种调度方式,主导者是多线程。
线程相关概念
green thread:被虚拟机调度的thread。
software thread:被操作系统调度的thread。