进程 & 线程相关知识

不管Java,C++都有进程、线程相关的内容。在这里统一整理吧。

Python的线程,其实是伪线程,不能真正的并发。下面也有讲。

线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈)。

多个线程共享内存。

参考了这篇文章:http://www.cnblogs.com/qiaoconglovelife/p/5319779.html

  • 进程与PCB

    进程:进程是程序的一次执行过程,是系统进行资源分配和调度的一个独立单位。

    进程实体(进程映像):由程序段、相关数据段和PCB三部分构成。进程是动态的,进程实体是静态的。

    PCB(进程控制块):系统利用PCB来描述进程的基本情况和运行状态,进而控制和管理进程;所谓创建进程,实际上是创建进程映像中的PCB;PCB是进程存在的唯一标志。

进程有5种状态,其中前3种是基本状态:

运行态、就绪态、阻塞态(等待态)。另两种是新建态终止态。

  • 进程的创建过程

    (1)分配ID与PCB:为新进程分配一个唯一的进程标识号,并申请一个空白的PCB(PCB是有限的)。若PCB申请失败则创建失败。

    (2)分配资源:为新进程的程序和数据、以及用户栈分配必要的内存空间(在PCB 中体现)。注意:这里如果资源不足(比如内存空间),并不是创建失败,而是处于阻塞态。

    (3)初始化PCB:主要初始化(1)标志信息(2)处理机状态信息(3)处理机控制信息,以及(4)设置进程的优先级等。

    (4)调度:如果进程就绪队列能够接纳新进程,就将新进程插入到就绪队列,等待被调度运行。

    注意,进程的创建是一个原子操作,执行期间不允许中断,它是一个不可分割的基本单位。

  • 进程的终止

    引起进程终止的事件主要有:

    (1)正常结束

    (2)异常结束:如存储区越界、非法指令、I/O故障等

    (3)外界干预:如操作员或操作系统干预、父进程请求、父进程终止。

    操作系统终止进程的过程如下:

    (1)根据被终止进程的ID,检索PCB,从中读出该进程的状态

    (2)若被终止进程处于执行状态,立即终止该进程的执行,将处理机资源分配给其他进程

    (3)若该进程还有子进程,则应将其所有的子进程终止

    (4)将该进程所拥有的资源,或归还给其父进程或归还给操作系统

    (5)将该PCB从所在队列(链表)中删除。

  • 进程之间的切换

    (1)保存处理机上下文,包括程序计数器和其他寄存器。

    (2)更新PCB信息。

    (3)把进程的PCB移入相应的队列,如就绪、在某事件阻塞等队列。

    (4)选择另一个进程执行,并更新其PCB。

    (5)更新内存管理的数据结构。

    (6)恢复处理机上下文。

    注意:“调度”和“切换”的区别:调度是指决定资源分配给哪个进程的行为,是一种决策行为;切换是指实际分配的行为,是执行行为。一般来说,等有资源的调度,再有进程的切换。

  • 线程

    线程是轻量化的进程,是程序执行流的最小单位;由线程ID、程序计数器、寄存器集合和堆栈组成;线程自己不拥有系统资源,只拥有一点在运行中必不可少的资源,但它可与同属一个进程的其他线程共享进程所拥有的全部资源。

  • 进程与线程区别

    (1)一个程序至少有一个进程,一个进程至少有一个线程。线程(Thread)是进程的一个实体,是CPU调度和分派的基本单位;

    (2)进程拥有独立的内存单元,而多个线程共享内存。从而线程效率更高;

    (3)进程有独立的地址空间,一个进程崩溃后,在保护模式下不会对其它进程产生影响,而线程没有单独的地址空间,一个线程死掉就等于整个进程死掉,所以多进程的程序要比多线程的程序健壮;

    (4)进程切换时,耗费资源较大,效率要差一些;

    (5)进程是系统资源分配的基本单位,线程是调度的基本单位。

线程独有的内容:线程上下文,包括线程ID、栈、栈指针、PC(程序计数器)、通用目的寄存器、条件码。

线程共享的内容:文件描述符和整个用户虚拟地址空间,包括只读文本(代码)、静态变量、堆、所有的共享库代码和数据区域组成。

  • 相比进程,线程有什么好处

    (1)易于调度。

    (2)提高并发性。通过线程可方便有效地实现并发性。进程可创建多个线程来执行同一程序的不同部分。

    (3)开销少。创建线程比创建进程要快,所需开销很少。。

    (4)利于充分发挥多处理器的功能。

  • 相比进程,线程有什么缺点

    (1)线程之间的同步和加锁控制比较麻烦

    (2)一个线程的崩溃影响到整个程序的稳定性

    (3)线程多了之后,线程本身的调度也是一个麻烦事儿,需要消耗较多的CPU

  • 分离线程

    • 线程可以是可结合的,或者是可分离的;
    • 可结合的线程能够被其他线程收回其资源和杀死。在被其他线程回收之前,它的存储器资源(例如栈)是没有被释放的,相反一个分离的线程是不能被其他线程回收或杀死的。它的存储器资源在它终止时由系统自动释放;
    • 为避免存储器泄漏,每个可结合线程都应该被其他线程显式地收回,要么通过调用pthread_detach函数被分离;(对应于Java就是 Thread.join和Thread.detach )
    • 默认情况下,线程被创建成可结合的。(注意:可结合是一种状态,要调用join方法来进行结合/释放)

来一个例子:

package com.company;

import static java.lang.Thread.sleep;

class Solution {

}

class MyRunnable implements Runnable {

    int x = 5;
    @Override
    public void run() {
        synchronized(this) {
            for (int i = 0; i < 5; i++) {
                System.out.println("hi " + Thread.currentThread().getName() + ":" + x--);
            }
        }
        System.out.println("here to sleep");
        try {
            sleep(5000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }
}

public class Main {

    public static void main(String[] args) throws InterruptedException {

        MyRunnable mr = new MyRunnable();
        Thread t1 = new Thread(mr, "1");
        Thread t2 = new Thread(mr, "2");
        Thread t3 = new Thread(mr, "3");

        t1.start();
        t2.start();
        t3.start();

        System.out.println();

    }

}

打印结果:

hi 1:5
hi 1:4
hi 1:3
hi 1:2
hi 1:1
here to sleep
hi 3:0
hi 3:-1
hi 3:-2
hi 3:-3
hi 3:-4
here to sleep

hi 2:-5
hi 2:-6
hi 2:-7
hi 2:-8
hi 2:-9
here to sleep

三个线程,同时sleep了5秒钟,然后整个程序才结束。

如果synchronized加在函数上,那么是每个线程分别sleep 5秒钟,一共sleep 15秒钟。

  • IPC方式(进程间通信方式)

    (1)管道:半双工;用于父子、兄弟之间。

    (2)命名管道(FIFO)

    (2)消息队列:消息链表存于内核,每个消息队列由消息队列标识符标识;于管道不同的是,消息队列存放在内核中,只有在内核重启时才能删除一个消息队列;消息队列的大小受限制。

    (3)信号量(semophore):常用来处理临界资源的访问同步问题。临界资源:为某一时刻只能由一个进程或线程操作的资源。

    (4)共享内存:可以说是最有用的进程间通信方式,也是最快的IPC形式。

    (5)套接字:也可用于不同机器之间。

    (6)信号(Signal)

  • 线程同步方式

    (1)临界区:当多个线程访问一个独占性共享资源时,可以使用临界区对象。拥有临界区的线程可以访问被保护起来的资源或代码段,其他线程若想访问,则被挂起,直到拥有临界区的线程放弃临界区为止。

(注:Java的synchronized代码段,也勉强可以算作临界区,只是语言标记互斥的实现方式;要访问代码段,需要获得传给synchronized的Object这个对象的锁。注意,每个java对象都隐含有一把锁

Java GC需要的safe point,为了让多个线程都停下来,标记的区域-其他线程不进来,里面的线程出来了,就开始GC- 跟临界区的思想也有一点像)

    (2)互斥量-mutex:互斥对象和临界区对象非常相似,只是其允许在进程间使用,而临界区只限制与同一进程的各个线程之间使用。

    (3)条件变量:一个线程被挂起,直到某件事件发生。

    (4)信号量:当需要一个计数器来限制可以使用某共享资源的线程数目时,可以使用“信号量”对象。CSemaphore类对象保存了对当前访问某一个指定资源的线程的计数值,该计数值是当前还可以使用该资源的线程数目。如果这个计数达到了零,则所有对这个CSemaphore类对象所控制的资源的访问尝试都被放入到一个队列中等待,直到超时或计数值不为零为止。

    (5)事件:允许一个线程在处理完一个任务后,主动唤醒另外一个线程执行任务。

    (6)套接字

感觉上面这篇文章不错,有一定深度。可以多看看这个博客:http://www.cnblogs.com/qiaoconglovelife/

再来聊一下Python的线程

简单地说就是作为可能是仅有的支持多线程的解释型语言(perl的多线程是残疾,PHP没有多线程),Python的多线程是有compromise的,在任意时间只有一个Python解释器在解释Python bytecode。Ruby也是有thread支持的,而且至少Ruby MRI是有GIL的。

单独开了一篇文章来写,详细内容可以看这篇文章:http://www.cnblogs.com/charlesblc/p/6135819.html

时间: 2024-10-08 09:04:06

进程 & 线程相关知识的相关文章

linux 创建守护进程的相关知识

linux 创建守护进程的相关知识 http://www.114390.com/article/46410.htm linux 创建守护进程的相关知识,这篇文章主要介绍了linux 创建守护进程的相关知识,需要的朋友可以参考下 关键字:linux.守护进程 创建子进程,父进程退出 这是编写守护进程的第一步.由于守护进程是脱离控制终端的,因此,完成第一步后就会在Shell终端里造成一程序已经运行完毕的假象.之后的所有工作都在子进程中完成,而用户在Shell终端里则可以执行其他命令,从而在形式上做到

知识回顾、进程的相关知识和操作

1.编程语言的发展: 机器语言:二进制 汇编语言:指令,命令形式的 高级语言:面向过程(C)面向对象(python,c++,java) 2.操作系统的目标: 为了使用户更方便的使用系统 3.计算机的组成: cpu,主板,存储,输入,输出 4.并行.并发 并发:指两件或多件事情,在同一时间间隔内同时执行(宏观上是并行,微观上是串行) 并行:指两件或多件事情,在同一时间间隔内同时执行 5.进程有三部分组成: 代码段,数据段,PCB(进程控制块) 6.进程的三种基本状态: 就绪状态:除了cpu之外,进

进程的相关知识

1,对多进程的模块:  multiprocess   Process是进程的模块 form multiprocessing import Process从multiprocessing包中导入Process模块 multiprocess是python中的一个操作管理进程的一个包,multi是取自multiple的多功能的意思,在这个包中,几乎包含了和进程操作的所有模块,有与子模块非常多,为了方便大家学习可以分为四个部分:创建进程部分,进程池部分,进程同步部分,进程之间数据共享 2,进程的并行与并

Linux下线程相关知识总结

1.线程的基本介绍 (1)线程的概述 线程与进程类似,也允许应用程序并发执行多个任务的一种机制.一个进程可以包含多个线程,同一程序中的所有线程共享同一份全局内存区域,线程之间没有真正意义的等级之分.同一个进程中的线程可以并发执行,如果处理器是多核的话线程也可以并行执行,如果一个线程因为等待I/O操作而阻塞,那么其他线程依然可以继续运行 (2)线程优于进程的方面 argv,environ 主线程栈 线程3的栈 线程2的栈 线程1的栈 共享函数库共享的内存 堆 未初始化的数据段 初始化数据段 文本

线程 相关知识(二)

6).Java中Runnable和Callable有什么不同? Runnable和Callable都代表那些要在不同的线程中执行的任务.Runnable从JDK1.0开始就有了,Callable是在JDK1.5增加的.它们的主要区别是 (1).Callable的 call() 方法可以返回值和抛出异常,而Runnable的run()方法没有这些功能. (2).Callable可以返回装载有计算结果的Future对象,表示异步计算的结果.它提供了检查计算是否完成的方法,以等待计算的完成,并检索计算

线程 相关知识 (一)

1).什么是线程? 线程是操作系统能够进行运算调度的最小单位,有时被称为轻量级进程,它被包含在进程之中,是进程中的实际运作单位,每一个程序都至少有一个线程,若程序只有一个线程,那就是程序本身. 一个线程可以创建和撤消另一个线程,同一进程中的多个线程之间可以并发执行.由于线程之间的相互制约,致使线程在运行中呈现出间断性.线程也有就绪.阻塞和运行三种基本状态. 就绪状态是指线程具备运行的所有条件,逻辑上可以运行,在等待处理机:运行状态是指线程占有处理机正在运行:阻塞状态是指线程在等待一个事件(如某个

进程的相关知识总结

前几篇博文中我已经介绍过进程的创建以及一些基本知识,这里就不再赘述,本篇博文我主要会涉及进程的终止细节以及父进程对子进程的监控,还有函数组exec() 1.进程的终止 (1)_exec()和exit() 进程终止分俩中情况,一种是收到某种信号异常终止,另一种是调用_exit()正常退出 #include<unistd.h> void _exit(int status); 参数status保存了进程的终止状态,父进程可调用wait()获取该状态 #include<stdio.h> v

Linux进程快照相关知识

查寻内核版本 uname  -a    //  uname  -r 进程快照 ps       report a snapshot of the current processes USER        进程所属用户 PID 进程ID   进程号 %CPU        进程占用CPU百分比 %MEM 进程占用内存的百分比 VSZ 虚拟内存 RSS         真实内存 TTY 终端  terminal STAT 进程的状态 主要状态   (NOTE: 主机状态一条进程只有一个) D  

Python - 进程/线程相关整理

进程池 Pool #检测url状态 from multiprocessing.dummy import Pool as ThreadPool import requests siteList = [] with open("all1.txt") as f: for line in f.readlines(): siteList.append(line) pool = ThreadPool() results = pool.map(requests.get, siteList) for