python学习笔记-(十三)线程、进程、多线程&多进程

为了方便大家理解下面的知识,可以先看一篇文章:http://www.ruanyifeng.com/blog/2013/04/processes_and_threads.html

线程

1.什么是线程?

线程是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。

2.python GIL全局解释器锁(仅需了解)

无论你启多少个线程,你有多少个cpu, Python在执行的时候会淡定的在同一时刻只允许一个线程运行

首先需要明确的一点是GIL并不是Python的特性,它是在实现Python解析器(CPython)时所引入的一个概念。就好比C++是一套语言(语法)标准,但是可以用不同的编译器来编译成可执行代码。有名的编译器例如GCC,INTEL C++,Visual C++等。Python也一样,同样一段代码可以通过CPython,PyPy,Psyco等不同的Python执行环境来执行。像其中的JPython就没有GIL。然而因为CPython是大部分环境下默认的Python执行环境。所以在很多人的概念里CPython就是Python,也就想当然的把GIL归结为Python语言的缺陷。所以这里要先明确一点:GIL并不是Python的特性,Python完全可以不依赖于GIL

这篇文章透彻的剖析了GIL对python多线程的影响,强烈推荐看一下:http://www.dabeaz.com/python/UnderstandingGIL.pdf

3.python threading模块

threading模块建立在_thread 模块之上。thread模块以低级、原始的方式来处理和控制线程,而threading 模块通过对thread 进行二次封装,提供了更方便的 api来处理线程。

线程有两种调用方式,如下:

1)直接调用


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

import threading

import time

 

def sayhi(num): #定义每个线程要运行的函数

 

    print("running on number:%s" %num)

 

    time.sleep(3)

 

if __name__ == ‘__main__‘:

 

    t1 = threading.Thread(target=sayhi,args=(1,)) #生成一个线程实例

    t2 = threading.Thread(target=sayhi,args=(2,)) #生成另一个线程实例

 

    t1.start() #启动线程

    t2.start() #启动另一个线程

 

    print(t1.getName()) #获取线程名

    print(t2.getName())

2)继承调用


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

import threading

import time

 

 

class MyThread(threading.Thread):

    def __init__(self,num):

        threading.Thread.__init__(self)

        self.num = num

 

    def run(self):#定义每个线程要运行的函数

 

        print("running on number:%s" %self.num)

 

        time.sleep(3)

 

if __name__ == ‘__main__‘:

 

    t1 = MyThread(1)

    t2 = MyThread(2)

    t1.start()

    t2.start() 

Python通过两个标准库thread和threading提供对线程的支持。thread提供了低级别的、原始的线程以及一个简单的锁。

thread 模块提供的其他方法:

  • threading.currentThread(): 返回当前的线程变量。
  • threading.enumerate(): 返回一个包含正在运行的线程的list。正在运行指线程启动后、结束前,不包括启动前和终止后的线程。
  • threading.activeCount(): 返回正在运行的线程数量,与len(threading.enumerate())有相同的结果。

除了使用方法外,线程模块同样提供了Thread类来处理线程,Thread类提供了以下方法:

  • run(): 用以表示线程活动的方法。
  • start():启动线程活动。
  • join([time]): 等待至线程中止。这阻塞调用线程直至线程的join() 方法被调用中止-正常退出或者抛出未处理的异常-或者是可选的超时发生。
  • isAlive(): 返回线程是否活动的。
  • getName(): 返回线程名。
  • setName(): 设置线程名。

4.Join & Daemon

join 等待线程执行完后,其他线程再继续执行


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

import  threading,time

 

def run(n,sleep_time):

    print("test...",n)

    time.sleep(sleep_time)

    print("test...done", n)

if __name__ == ‘__main__‘:

 

    t1 = threading.Thread(target=run,args=("t1",2))

    t2 = threading.Thread(target=run,args=("t2",3))

 

    # 两个同时执行,然后等待t1执行完成后,主线程和子线程再开始执行

    t1.start()

    t2.start()

    t1.join()   # 等待t1

 

    print("main thread")

 

# 程序输出

# test... t1

# test... t2

# test...done t1

# main thread

# test...done t2

Daemon 守护进程

t.setDaemon() 设置为后台线程或前台线程(默认:False);通过一个布尔值设置线程是否为守护线程,必须在执行start()方法之后才可以使用。如果是后台线程,主线程执行过程中,后台线程也在进行,主线程执行完毕后,后台线程不论成功与否,均停止;如果是前台线程,主线程执行过程中,前台线程也在进行,主线程执行完毕后,等待前台线程也执行完成后,程序停止


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

import threading,time

 

def run(n):

    print(‘[%s]------running----\n‘ % n)

    time.sleep(2)

    print(‘--done--‘)

 

 

def main():

    for in range(5):

        = threading.Thread(target=run, args=[i, ])

        t.start()

        t.join(1)

        print(‘starting thread‘, t.getName())

 

 

= threading.Thread(target=main, args=[])

m.setDaemon(True)  # 将main线程设置为Daemon线程,它做为程序主线程的守护线程,当主线程退出时,

                    # m线程也会退出,由m启动的其它子线程会同时退出,不管是否执行完任务

m.start()

m.join(timeout=2)

print("---main thread done----")

 

# 程序输出

# [0]------running----

# starting thread Thread-2

# [1]------running----

# --done--

# ---main thread done----

5.线程锁(互斥锁Mutex

我们使用线程对数据进行操作的时候,如果多个线程同时修改某个数据,可能会出现不可预料的结果,为了保证数据的准确性,引入了锁的概念。

例:假设列表A的所有元素就为0,当一个线程从前向后打印列表的所有元素,另外一个线程则从后向前修改列表的元素为1,那么输出的时候,列表的元素就会一部分为0,一部分为1,这就导致了数据的不一致。锁的出现解决了这个问题。

不加锁:


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

import time

import threading

 

 

def addNum():

    global num  # 在每个线程中都获取这个全局变量

    print(‘--get num:‘, num)

    time.sleep(1)

    num -= 1  # 对此公共变量进行-1操作

 

 

num = 100  # 设定一个共享变量

thread_list = []

for in range(100):

    = threading.Thread(target=addNum)

    t.start()

    thread_list.append(t)

 

for in thread_list:  # 等待所有线程执行完毕

    t.join()

 

print(‘final num:‘, num)

加锁:


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

import time

import threading

 

 

def addNum():

    global num  # 在每个线程中都获取这个全局变量

    print(‘--get num:‘, num)

    time.sleep(1)

    lock.acquire()  # 修改数据前加锁

    num -= 1  # 对此公共变量进行-1操作

    lock.release()  # 修改后释放

 

 

num = 100  # 设定一个共享变量

thread_list = []

lock = threading.Lock()  # 生成全局锁

for in range(100):

    = threading.Thread(target=addNum)

    t.start()

    thread_list.append(t)

 

for in thread_list:  # 等待所有线程执行完毕

    t.join()

 

print(‘final num:‘, num)

GIL VS LOCK

机智的同学可能会问到这个问题,就是既然你之前说过了,Python已经有一个GIL来保证同一时间只能有一个线程来执行了,为什么这里还需要lock? 注意啦,这里的lock是用户级的lock,跟那个GIL没关系 ,具体我们通过下图来看一下+配合我现场讲给大家,就明白了。

6.递归锁

说白了就是在一个大锁中还要再包含子锁


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

import threading, time

 

 

def run1():

    print("grab the first part data")

    lock.acquire()

    global num

    num += 1

    lock.release()

    return num

 

 

def run2():

    print("grab the second part data")

    lock.acquire()

    global num2

    num2 += 1

    lock.release()

    return num2

 

 

def run3():

    lock.acquire()

    res = run1()

    print(‘--------between run1 and run2-----‘)

    res2 = run2()

    lock.release()

    print(res, res2)

 

 

if __name__ == ‘__main__‘:

 

    num, num2 = 00

    lock = threading.RLock()

    for in range(10):

        = threading.Thread(target=run3)

        t.start()

 

while threading.active_count() != 1:

    print(threading.active_count())

else:

    print(‘----all threads done---‘)

    print(num, num2)

threading.RLock和threading.Lock 的区别:

RLock允许在同一线程中被多次acquire。而Lock却不允许这种情况。 如果使用RLock,那么acquire和release必须成对出现,即调用了n次acquire,必须调用n次的release才能真正释放所占用的琐。


1

2

3

4

5

6

import threading

lock = threading.Lock()    #Lock对象

lock.acquire()

lock.acquire()  #产生了死琐。

lock.release()

lock.release()


1

2

3

4

5

6

import threading

rLock = threading.RLock()  #RLock对象

rLock.acquire()

rLock.acquire()    #在同一线程内,程序不会堵塞。

rLock.release()

rLock.release()

7.信号量

互斥锁同时只允许一个线程更改数据,而Semaphore是同时允许一定数量的线程更改数据,比如厕所有3个坑,那最多只允许3个人上厕所,后面的人只能等里面有人出来了才能再进去。


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

import threading,time

 

def run(n):

    semaphore.acquire()

    time.sleep(1)

    print("run the thread: %s\n" %n)

    semaphore.release()

 

if __name__ == ‘__main__‘:

 

    num= 0

    semaphore  = threading.BoundedSemaphore(5#最多允许5个线程同时运行

    for in range(20):

        = threading.Thread(target=run,args=(i,))

        t.start()

 

while threading.active_count() != 1:

    pass #print threading.active_count()

else:

    print(‘----all threads done---‘)

    print(num)

8.event

Event是线程间通信最间的机制之一:一个线程发送一个event信号,其他的线程则等待这个信号。用于主线程控制其他线程的执行。 Events 管理一个flag,这个flag可以使用set()设置成True或者使用clear()重置为False,wait()则用于阻塞,在flag为True之前。flag默认为False。

  • Event.wait([timeout]) :堵塞线程,直到Event对象内部标识位被设为True或超时(如果提供了参数timeout)。
  • Event.set() :将标识位设为Ture
  • Event.clear() :将标识伴设为False。
  • Event.isSet() :判断标识位是否为Ture。

当线程执行的时候,如果flag为False,则线程会阻塞,当flag为True的时候,线程不会阻塞。它提供了本地和远程的并发性。


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

import threading,time

import random

def light():

    if not event.isSet():

        event.set() #wait就不阻塞 #绿灯状态

    count = 0

    while True:

        if count < 10:

            print(‘\033[42;1m--green light on---\033[0m‘)

        elif count <13:

            print(‘\033[43;1m--yellow light on---\033[0m‘)

        elif count <20:

            if event.isSet():

                event.clear()

            print(‘\033[41;1m--red light on---\033[0m‘)

        else:

            count = 0

            event.set() #打开绿灯

        time.sleep(1)

        count +=1

def car(n):

    while 1:

        time.sleep(random.randrange(10))

        if  event.isSet(): #绿灯

            print("car [%s] is running.." % n)

        else:

            print("car [%s] is waiting for the red light.." %n)

if __name__ == ‘__main__‘:

    event = threading.Event()

    Light = threading.Thread(target=light)

    Light.start()

    for in range(3):

        = threading.Thread(target=car,args=(i,))

        t.start()

9.队列

Python的Queue模块中提供了同步的、线程安全的队列类,包括FIFO(先入先出)队列Queue,LIFO(后入先出)队列LifoQueue,和优先级队列PriorityQueue。这些队列都实现了锁原语,能够在多线程中直接使用。可以使用队列来实现线程间的同步。

先入先出:


1

2

3

4

5

6

7

8

9

10

11

12

13

14

#先入先出

import queue

= queue.Queue()

for in range(5):

    q.put(i)

while not q.empty():

    print(q.get())

#输出结果

#0

#1

#2

#3

#4

后入先出:


1

2

3

4

5

6

7

8

9

10

11

12

13

#后入先出

import queue

= queue.LifoQueue()

for in range(5):

    q.put(i)

while not q.empty():

    print(q.get())

#输出结果

#4

#3

#2

#1

#0

优先级队列:

10.生产者消费者模型

进程

线程和进程的区别

时间: 2024-10-21 04:01:02

python学习笔记-(十三)线程、进程、多线程&多进程的相关文章

线程 进程 多线程 多进程

进程和线程的主要区别在于多进程每个进程拥有独立存储空间,而多线程共享存储空间.对于单核CPU来讲,如果是阻塞操作,或者不耗时非阻塞操作,多进程/线程不会提高效率,这时候多进程/线程最有用的通常是耗时而又非阻塞的I/O操作. 打个比喻,一个人要看两部电影,可以看完一部再看另一部,也可以同时看,看一眼这个暂停,看一眼那个再暂停看回前一个,快速不停切换,你会觉得因为两部一起看所以先看完吗?理论上两部电影播放时间加起来是一样,所以看完所用时间应该一样.但是实际使用时间反而可能第一种方法快,为什么?切换是

Python学习笔记(二十七)多进程 (进程和线程开始)

摘抄:https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001431927781401bb47ccf187b24c3b955157bb12c5882d000 要让Python程序实现多进程(multiprocessing),我们先了解操作系统的相关知识. Unix/Linux操作系统提供了一个fork()系统调用,它非常特殊.普通的函数调用,调用一次,返回一次,但是fork()调

python学习笔记12 ----线程、进程

进程和线程的概念 进程和线程是操作系统中两个很重要的概念,对于一般的程序,可能有若干个进程,每一个进程有若干个同时执行的线程.进程是资源管理的最小单位,线程是程序执行的最小单位(线程可共享同一进程里的所有资源,进程之间则是独立的). 进程(progress) 直观的说,进程就是正在执行的程序(python中每一个.py文件都可以看作是一个进程),是多任务操作系统中的基本单元,是包含了程序指令和相关资源的集合. 操作系统隔绝了每个进程可以访问的地址空间,如果进程间想要传递信息,可使用进程间通信或者

python学习笔记-Day11 (线程、进程、queue队列、生产消费模型、携程)

线程使用 ###方式一 import threading def f1(arg): print(arg) t = threading.Thread(target=f1, args=(123,)) t.start() # start会调用run方法执行 # t是threading.Thread类的一个对象 # t.start()就会以线程的方式执行函数,可以使用pycharm ctrl选择start方法 # 找到Thread类的start方法,在start方法的注释中就已经写明,会去调用run()

python学习笔记十三 JS,Dom,JQuery(进阶篇)

JS介绍 JavaScript 是属于网络的脚本语言!JavaScript 被数百万计的网页用来改进设计.验证表单.检测浏览器.创建cookies,以及更多的应用:JavaScript 是因特网上最流行的脚本语言. JavaScript 与 Java 是两种完全不同的语言,无论在概念还是设计上. Java(由 Sun 发明)是更复杂的编程语言. ECMA-262 是 JavaScript 标准的官方名称. JavaScript 由 Brendan Eich 发明.它于 1995 年出现在 Net

python学习笔记十三:Flask demo

一.Flask简介 Flask 是一个 Python 实现的 Web 开发微框架.官网:http://flask.pocoo.org/ 二.Demo 1.代码结构 . ├── blog.py ├── static │   ├── css │   │   └── index.css │   ├── images │   │   ├── cat.jpg │   │   └── sheying1229.jpg │   └── js └── templates ├── index.html ├── lo

python 学习笔记十三 jQuery案例(进阶篇)

1.选择器和筛选器 案例1 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Title</title> <style> //定义css样式,自定义 .hide{ display: none; } .coating{ z-index: 1; opacity: 0.5; position: fix

Python学习笔记进阶篇——总览

Python学习笔记——进阶篇[第八周]———进程.线程.协程篇(Socket编程进阶&多线程.多进程) Python学习笔记——进阶篇[第八周]———进程.线程.协程篇(异常处理) Python学习笔记——进阶篇[第八周]———进程.线程.协程篇(多线程与进程池) Python学习笔记——进阶篇[第九周]———线程.进程.协程篇(队列Queue和生产者消费者模型) Python学习笔记——进阶篇[第九周]———协程 Python学习笔记——进阶篇[第九周]———MYSQL操作

OpenCV之Python学习笔记

OpenCV之Python学习笔记 直都在用Python+OpenCV做一些算法的原型.本来想留下发布一些文章的,可是整理一下就有点无奈了,都是写零散不成系统的小片段.现在看 到一本国外的新书<OpenCV Computer Vision with Python>,于是就看一遍,顺便把自己掌握的东西整合一下,写成学习笔记了.更需要的朋友参考. 阅读须知: 本文不是纯粹的译文,只是比较贴近原文的笔记:         请设法购买到出版社出版的书,支持正版. 从书名就能看出来本书是介绍在Pytho

Python学习笔记基础篇——总览

Python初识与简介[开篇] Python学习笔记——基础篇[第一周]——变量与赋值.用户交互.条件判断.循环控制.数据类型.文本操作 Python学习笔记——基础篇[第二周]——解释器.字符串.列表.字典.主文件判断.对象 Python学习笔记——基础篇1[第三周]——set集合 Python学习笔记——基础篇2[第三周]——计数器.有序字典.元组.单(双)向队列.深浅拷贝.函数.装饰器 Python学习笔记——基础篇[第四周]——迭代器&生成器.装饰器.递归.算法.正则表达式 Python