Python之路【第七篇】:线程、进程和协程

Python之路【第七篇】:线程、进程和协程

Python线程

Threading用于提供线程相关的操作,线程是应用程序中工作的最小单元。


1

2

3

4

5

6

7

8

9

10

11

12

13

14

#!/usr/bin/env python

# -*- coding:utf-8 -*-

import threading

import time

 

def show(arg):

    time.sleep(1)

    print ‘thread‘+str(arg)

 

for in range(10):

    = threading.Thread(target=show, args=(i,))

    t.start()

 

print ‘main thread stop‘

上述代码创建了10个“前台”线程,然后控制器就交给了CPU,CPU根据指定算法进行调度,分片执行指令。

更多方法:

  • start            线程准备就绪,等待CPU调度
  • setName      为线程设置名称
  • getName      获取线程名称
  • setDaemon   设置为后台线程或前台线程(默认)
                       如果是后台线程,主线程执行过程中,后台线程也在进行,主线程执行完毕后,后台线程不论成功与否,均停止
                        如果是前台线程,主线程执行过程中,前台线程也在进行,主线程执行完毕后,等待前台线程也执行完成后,程序停止
  • join              逐个执行每个线程,执行完毕后继续往下执行,该方法使得多线程变得无意义
  • run              线程被cpu调度后自动执行线程对象的run方法

 自定义线程类

线程锁(Lock、RLock)

由于线程之间是进行随机调度,并且每个线程可能只执行n条执行之后,当多个线程同时修改同一条数据时可能会出现脏数据,所以,出现了线程锁 - 同一时刻允许一个线程执行操作。

 未使用锁


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

#!/usr/bin/env python

#coding:utf-8

  

import threading

import time

  

gl_num = 0

  

lock = threading.RLock()

  

def Func():

    lock.acquire()

    global gl_num

    gl_num +=1

    time.sleep(1)

    print gl_num

    lock.release()

      

for in range(10):

    = threading.Thread(target=Func)

    t.start()

信号量(Semaphore)

互斥锁 同时只允许一个线程更改数据,而Semaphore是同时允许一定数量的线程更改数据 ,比如厕所有3个坑,那最多只允许3个人上厕所,后面的人只能等里面有人出来了才能再进去。


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

import threading,time

def run(n):

    semaphore.acquire()

    time.sleep(1)

    print("run the thread: %s" %n)

    semaphore.release()

if __name__ == ‘__main__‘:

    num= 0

    semaphore  = threading.BoundedSemaphore(5) #最多允许5个线程同时运行

    for in range(20):

        t = threading.Thread(target=run,args=(i,))

        t.start()

事件(event)

python线程的事件用于主线程控制其他线程的执行,事件主要提供了三个方法 set、wait、clear。

事件处理的机制:全局定义了一个“Flag”,如果“Flag”值为 False,那么当程序执行 event.wait 方法时就会阻塞,如果“Flag”值为True,那么event.wait 方法时便不再阻塞。

  • clear:将“Flag”设置为False
  • set:将“Flag”设置为True

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

#!/usr/bin/env python

# -*- coding:utf-8 -*-

import threading

def do(event):

    print ‘start‘

    event.wait()

    print ‘execute‘

event_obj = threading.Event()

for in range(10):

    = threading.Thread(target=do, args=(event_obj,))

    t.start()

event_obj.clear()

inp = raw_input(‘input:‘)

if inp == ‘true‘:

    event_obj.set()

条件(Condition)

使得线程等待,只有满足某条件时,才释放n个线程


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

import threading

def run(n):

    con.acquire()

    con.wait()

    print("run the thread: %s" %n)

    con.release()

if __name__ == ‘__main__‘:

    con = threading.Condition()

    for in range(10):

        t = threading.Thread(target=run, args=(i,))

        t.start()

    while True:

        inp = input(‘>>>‘)

        if inp == ‘q‘:

            break

        con.acquire()

        con.notify(int(inp))

        con.release()

 

Timer

定时器,指定n秒后执行某操作


1

2

3

4

5

6

7

8

from threading import Timer

def hello():

    print("hello, world")

t = Timer(1, hello)

t.start()  # after 1 seconds, "hello, world" will be printed

Python 进程


1

2

3

4

5

6

7

8

9

10

from multiprocessing import Process

import threading

import time

 

def foo(i):

    print ‘say hi‘,i

 

for in range(10):

    = Process(target=foo,args=(i,))

    p.start()

注意:由于进程之间的数据需要各自持有一份,所以创建进程需要的非常大的开销。

进程数据共享

进程各自持有一份数据,默认无法共享数据

 进程间默认无法数据共享


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

#方法一,Array

from multiprocessing import Process,Array

temp = Array(‘i‘, [11,22,33,44])

def Foo(i):

    temp[i] = 100+i

    for item in temp:

        print i,‘----->‘,item

for in range(2):

    = Process(target=Foo,args=(i,))

    p.start()

#方法二:manage.dict()共享数据

from multiprocessing import Process,Manager

manage = Manager()

dic = manage.dict()

def Foo(i):

    dic[i] = 100+i

    print dic.values()

for in range(2):

    = Process(target=Foo,args=(i,))

    p.start()

    p.join()

 类型对应表

 Code

当创建进程时(非使用时),共享数据会被拿到子进程中,当进程中执行完毕后,再赋值给原值。

 进程锁实例

进程池

进程池内部维护一个进程序列,当使用时,则去进程池中获取一个进程,如果进程池序列中没有可供使用的进进程,那么程序就会等待,直到进程池中有可用进程为止。

进程池中有两个方法:

  • apply
  • apply_async

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

#!/usr/bin/env python

# -*- coding:utf-8 -*-

from  multiprocessing import Process,Pool

import time

 

def Foo(i):

    time.sleep(2)

    return i+100

 

def Bar(arg):

    print arg

 

pool = Pool(5)

#print pool.apply(Foo,(1,))

#print pool.apply_async(func =Foo, args=(1,)).get()

 

for in range(10):

    pool.apply_async(func=Foo, args=(i,),callback=Bar)

 

print ‘end‘

pool.close()

pool.join()#进程池中进程执行完毕后再关闭,如果注释,那么程序直接关闭。

协程

线程和进程的操作是由程序触发系统接口,最后的执行者是系统;协程的操作则是程序员。

协程存在的意义:对于多线程应用,CPU通过切片的方式来切换线程间的执行,线程切换时需要耗时(保存状态,下次继续)。协程,则只使用一个线程,在一个线程中规定某个代码块执行顺序。

协程的适用场景:当程序中存在大量不需要CPU的操作时(IO),适用于协程;

greenlet


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

#!/usr/bin/env python

# -*- coding:utf-8 -*-

from greenlet import greenlet

def test1():

    print 12

    gr2.switch()

    print 34

    gr2.switch()

def test2():

    print 56

    gr1.switch()

    print 78

gr1 = greenlet(test1)

gr2 = greenlet(test2)

gr1.switch()

gevent


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

import gevent

def foo():

    print(‘Running in foo‘)

    gevent.sleep(0)

    print(‘Explicit context switch to foo again‘)

def bar():

    print(‘Explicit context to bar‘)

    gevent.sleep(0)

    print(‘Implicit context switch back to bar‘)

gevent.joinall([

    gevent.spawn(foo),

    gevent.spawn(bar),

])

遇到IO操作自动切换:

Python之路【第七篇】:线程、进程和协程

Python线程

Threading用于提供线程相关的操作,线程是应用程序中工作的最小单元。


1

2

3

4

5

6

7

8

9

10

11

12

13

14

#!/usr/bin/env python

# -*- coding:utf-8 -*-

import threading

import time

 

def show(arg):

    time.sleep(1)

    print ‘thread‘+str(arg)

 

for in range(10):

    = threading.Thread(target=show, args=(i,))

    t.start()

 

print ‘main thread stop‘

上述代码创建了10个“前台”线程,然后控制器就交给了CPU,CPU根据指定算法进行调度,分片执行指令。

更多方法:

  • start            线程准备就绪,等待CPU调度
  • setName      为线程设置名称
  • getName      获取线程名称
  • setDaemon   设置为后台线程或前台线程(默认)
                       如果是后台线程,主线程执行过程中,后台线程也在进行,主线程执行完毕后,后台线程不论成功与否,均停止
                        如果是前台线程,主线程执行过程中,前台线程也在进行,主线程执行完毕后,等待前台线程也执行完成后,程序停止
  • join              逐个执行每个线程,执行完毕后继续往下执行,该方法使得多线程变得无意义
  • run              线程被cpu调度后自动执行线程对象的run方法

 自定义线程类

线程锁(Lock、RLock)

由于线程之间是进行随机调度,并且每个线程可能只执行n条执行之后,当多个线程同时修改同一条数据时可能会出现脏数据,所以,出现了线程锁 - 同一时刻允许一个线程执行操作。

 未使用锁


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

#!/usr/bin/env python

#coding:utf-8

  

import threading

import time

  

gl_num = 0

  

lock = threading.RLock()

  

def Func():

    lock.acquire()

    global gl_num

    gl_num +=1

    time.sleep(1)

    print gl_num

    lock.release()

      

for in range(10):

    = threading.Thread(target=Func)

    t.start()

信号量(Semaphore)

互斥锁 同时只允许一个线程更改数据,而Semaphore是同时允许一定数量的线程更改数据 ,比如厕所有3个坑,那最多只允许3个人上厕所,后面的人只能等里面有人出来了才能再进去。


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

import threading,time

def run(n):

    semaphore.acquire()

    time.sleep(1)

    print("run the thread: %s" %n)

    semaphore.release()

if __name__ == ‘__main__‘:

    num= 0

    semaphore  = threading.BoundedSemaphore(5) #最多允许5个线程同时运行

    for in range(20):

        t = threading.Thread(target=run,args=(i,))

        t.start()

事件(event)

python线程的事件用于主线程控制其他线程的执行,事件主要提供了三个方法 set、wait、clear。

事件处理的机制:全局定义了一个“Flag”,如果“Flag”值为 False,那么当程序执行 event.wait 方法时就会阻塞,如果“Flag”值为True,那么event.wait 方法时便不再阻塞。

  • clear:将“Flag”设置为False
  • set:将“Flag”设置为True

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

#!/usr/bin/env python

# -*- coding:utf-8 -*-

import threading

def do(event):

    print ‘start‘

    event.wait()

    print ‘execute‘

event_obj = threading.Event()

for in range(10):

    = threading.Thread(target=do, args=(event_obj,))

    t.start()

event_obj.clear()

inp = raw_input(‘input:‘)

if inp == ‘true‘:

    event_obj.set()

条件(Condition)

使得线程等待,只有满足某条件时,才释放n个线程


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

import threading

def run(n):

    con.acquire()

    con.wait()

    print("run the thread: %s" %n)

    con.release()

if __name__ == ‘__main__‘:

    con = threading.Condition()

    for in range(10):

        t = threading.Thread(target=run, args=(i,))

        t.start()

    while True:

        inp = input(‘>>>‘)

        if inp == ‘q‘:

            break

        con.acquire()

        con.notify(int(inp))

        con.release()

 

Timer

定时器,指定n秒后执行某操作


1

2

3

4

5

6

7

8

from threading import Timer

def hello():

    print("hello, world")

t = Timer(1, hello)

t.start()  # after 1 seconds, "hello, world" will be printed

Python 进程


1

2

3

4

5

6

7

8

9

10

from multiprocessing import Process

import threading

import time

 

def foo(i):

    print ‘say hi‘,i

 

for in range(10):

    = Process(target=foo,args=(i,))

    p.start()

注意:由于进程之间的数据需要各自持有一份,所以创建进程需要的非常大的开销。

进程数据共享

进程各自持有一份数据,默认无法共享数据

 进程间默认无法数据共享


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

#方法一,Array

from multiprocessing import Process,Array

temp = Array(‘i‘, [11,22,33,44])

def Foo(i):

    temp[i] = 100+i

    for item in temp:

        print i,‘----->‘,item

for in range(2):

    = Process(target=Foo,args=(i,))

    p.start()

#方法二:manage.dict()共享数据

from multiprocessing import Process,Manager

manage = Manager()

dic = manage.dict()

def Foo(i):

    dic[i] = 100+i

    print dic.values()

for in range(2):

    = Process(target=Foo,args=(i,))

    p.start()

    p.join()

 类型对应表

 Code

当创建进程时(非使用时),共享数据会被拿到子进程中,当进程中执行完毕后,再赋值给原值。

 进程锁实例

进程池

进程池内部维护一个进程序列,当使用时,则去进程池中获取一个进程,如果进程池序列中没有可供使用的进进程,那么程序就会等待,直到进程池中有可用进程为止。

进程池中有两个方法:

  • apply
  • apply_async

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

#!/usr/bin/env python

# -*- coding:utf-8 -*-

from  multiprocessing import Process,Pool

import time

 

def Foo(i):

    time.sleep(2)

    return i+100

 

def Bar(arg):

    print arg

 

pool = Pool(5)

#print pool.apply(Foo,(1,))

#print pool.apply_async(func =Foo, args=(1,)).get()

 

for in range(10):

    pool.apply_async(func=Foo, args=(i,),callback=Bar)

 

print ‘end‘

pool.close()

pool.join()#进程池中进程执行完毕后再关闭,如果注释,那么程序直接关闭。

协程

线程和进程的操作是由程序触发系统接口,最后的执行者是系统;协程的操作则是程序员。

协程存在的意义:对于多线程应用,CPU通过切片的方式来切换线程间的执行,线程切换时需要耗时(保存状态,下次继续)。协程,则只使用一个线程,在一个线程中规定某个代码块执行顺序。

协程的适用场景:当程序中存在大量不需要CPU的操作时(IO),适用于协程;

greenlet


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

#!/usr/bin/env python

# -*- coding:utf-8 -*-

from greenlet import greenlet

def test1():

    print 12

    gr2.switch()

    print 34

    gr2.switch()

def test2():

    print 56

    gr1.switch()

    print 78

gr1 = greenlet(test1)

gr2 = greenlet(test2)

gr1.switch()

gevent


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

import gevent

def foo():

    print(‘Running in foo‘)

    gevent.sleep(0)

    print(‘Explicit context switch to foo again‘)

def bar():

    print(‘Explicit context to bar‘)

    gevent.sleep(0)

    print(‘Implicit context switch back to bar‘)

gevent.joinall([

    gevent.spawn(foo),

    gevent.spawn(bar),

])

遇到IO操作自动切换:

时间: 2024-12-26 19:51:18

Python之路【第七篇】:线程、进程和协程的相关文章

哗啦啦Python之路 - 线程,进程,协程

1. 线程锁 如果不控制多个线程对同一资源进行访问的话,会对数据造成破坏,使得线程运行的结果不可预期.因此要引进线程锁. 线程同步能够保证多个线程安全访问竞争资源,最简单的同步机制是引入互斥锁. 互斥锁为资源引入一个状态:锁定/非锁定.某个线程要更改共享数据时,先将其锁定,此时资源的状态为“锁定”,其他线程不能更改:直到该线程释放资源,将 资源的状态变成“非锁定”,其他的线程才能再次锁定该资源.互斥锁保证了每次只有一个线程进行写入操作,从而保证了多线程情况下数据的正确性. 未引入锁前: impo

Python菜鸟之路:Python基础-线程、进程、协程

上节内容,简单的介绍了线程和进程,并且介绍了Python中的GIL机制.本节详细介绍线程.进程以及协程的概念及实现. 线程 基本使用 方法1: 创建一个threading.Thread对象,在它的初始化函数(__init__)中将可调用对象作为参数传入 import threading import time def worker(): time.sleep(2) print("test") for i in range(5): t = threading.Thread(target=

Python之路【第二篇】:Python基础(一)

Python之路[第二篇]:Python基础(一) 入门知识拾遗 一.作用域 对于变量的作用域,执行声明并在内存中存在,该变量就可以在下面的代码中使用. 1 2 3 if 1==1:     name = 'wupeiqi' print  name 下面的结论对吗? 外层变量,可以被内层变量使用 内层变量,无法被外层变量使用 二.三元运算 1 result = 值1 if 条件 else 值2 如果条件为真:result = 值1如果条件为假:result = 值2 三.进制 二进制,01 八进

Python:线程、进程与协程(1)——概念

最近的业余时间主要放在了学习Python线程.进程和协程里,第一次用python的多线程和多进程是在两个月前,当时只是简单的看了几篇博文然后就跟着用,没有仔细去研究,第一次用的感觉它们其实挺简单的,最近这段时间通过看书, 看Python 中文官方文档等等相关资料,发现并没有想想中的那么简单,很多知识点需要仔细去理解,Python线程.进程和协程应该是Python的高级用法.Python的高级用法有很多,看看Python 中文官方文档就知道了,当然有时间看看这些模块是怎么实现的对自己的提高是很有帮

Python:线程、进程与协程(2)——threading模块(1)

上一篇博文介绍了Python中线程.进程与协程的基本概念,通过这几天的学习总结,下面来讲讲Python的threading模块.首先来看看threading模块有哪些方法和类吧. 主要有: Thread :线程类,这是用的最多的一个类,可以指定线程函数执行或者继承自它都可以实现子线程功能. Timer:与Thread类似,但要等待一段时间后才开始运行,是Thread的子类. Lock :原锁,是一个同步原语,当它锁住时不归某个特定的线程所有,这个可以对全局变量互斥时使用. RLock :可重入锁

Python之路【第九篇】:Python操作 RabbitMQ、Redis、Memcache、SQLAlchemy

Python之路[第九篇]:Python操作 RabbitMQ.Redis.Memcache.SQLAlchemy Memcached Memcached 是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载.它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提高动态.数据库驱动网站的速度.Memcached基于一个存储键/值对的hashmap.其守护进程(daemon )是用C写的,但是客户端可以用任何语言来编写,并通过memcached协议与守护进程通信. Memc

Python之路【第九篇】:Python基础(26)——socket server

socketserver Python之路[第九篇]:Python基础(25)socket模块是单进程的,只能接受一个客户端的连接和请求,只有当该客户端断开的之后才能再接受来自其他客户端的连接和请求.当然我 们也可以通过python的多线程等模块自己写一个可以同时接收多个客户端连接和请求的socket.但是这完全没有必要,因为python标准库已经为 我们内置了一个多线程的socket模块socketserver,我们直接调用就可以了,完全没有必要重复造轮子. 我们只需简单改造一下之前的sock

python线程、进程和协程

链接:http://www.jb51.net/article/88825.htm 引言 解释器环境:python3.5.1 我们都知道python网络编程的两大必学模块socket和socketserver,其中的socketserver是一个支持IO多路复用和多线程.多进程的模块.一般我们在socketserver服务端代码中都会写这么一句: server = socketserver.ThreadingTCPServer(settings.IP_PORT, MyServer) Threadi

Python:线程、进程与协程(4)——multiprocessing模块(1)

multiprocessing模块是Python提供的用于多进程开发的包,multiprocessing包提供本地和远程两种并发,通过使用子进程而非线程有效地回避了全局解释器锁. (一)创建进程Process 类 创建进程的类,其源码在multiprocessing包的process.py里,有兴趣的可以对照着源码边理解边学习.它的用法同threading.Thread差不多,从它的类定义上就可以看的出来,如下: class Process(object):     '''     Proces